CN111032871A - 改良的表达蛋白质的菌株 - Google Patents

改良的表达蛋白质的菌株 Download PDF

Info

Publication number
CN111032871A
CN111032871A CN201880054025.6A CN201880054025A CN111032871A CN 111032871 A CN111032871 A CN 111032871A CN 201880054025 A CN201880054025 A CN 201880054025A CN 111032871 A CN111032871 A CN 111032871A
Authority
CN
China
Prior art keywords
host cell
fungal host
protein
leu
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880054025.6A
Other languages
English (en)
Inventor
C·J·A·芬尼斯
P·K·诺德戴德
J·M·麦克劳克兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Biopharma DK AS
Original Assignee
Albumedix AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Albumedix AS filed Critical Albumedix AS
Publication of CN111032871A publication Critical patent/CN111032871A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/104Aminoacyltransferases (2.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y603/00Ligases forming carbon-nitrogen bonds (6.3)
    • C12Y603/02Acid—amino-acid ligases (peptide synthases)(6.3.2)
    • C12Y603/02002Glutamate-cysteine ligase (6.3.2.2)

Abstract

本发明提供一种改良的用于产生期望的蛋白质的宿主菌株。

Description

改良的表达蛋白质的菌株
对序列表的引用
本申请包含纸质和计算机可读形式的序列表。纸质和计算机可读形式的序列表是说明书的一部分或另外并入本文以供参考。
技术领域
本发明主要涉及一种以基本上高于亲本菌株的水平表达蛋白质的真菌菌株的开发。
背景技术
大约30年来,在微生物中已经制备期望的异源蛋白质。尽管已经引入必要的编码序列并获得了表达,然而为了优化商业生产的过程还有很多工作要做。一个感兴趣的领域涉及菌株改良,即寻找或制造宿主微生物的菌株,例如其允许以更高的产量或更好的纯度制备蛋白质。
为了增加产量,一旦已设计了良好的表达系统,可能设想增加编码序列的拷贝数,或者增加mRNA的数量或稳定性,或者改善蛋白质的折叠和/或分泌,或者降低蛋白质的降解。然而,只有针对限制因素时才能看到期望的表达增加的效果。
因此,需要允许期望的蛋白质如异源蛋白质的产量增加的宿主菌株。
本发明人已经令人惊讶地鉴定了真菌细胞中GSH1的突变导致异源蛋白质产量的增加。
酿酒酵母(Saccharomyces cerevisiae)中GSH1基因的产物是γ-谷氨酰半胱氨酸合成酶(Gsh1p)。该酶催化谷胱甘肽(L-γ-谷氨酰半胱氨酸甘氨酸;GSH)合成中的第一步和限速步骤。第二步由谷胱甘肽合成酶(Gsh2p)催化。谷胱甘肽是必不可少的分子,其具有许多重要作用,包括保护细胞抵抗氧化应激,作为几种生物合成途径和排毒反应中的辅助因子以及维持酵母线粒体基因组(Ayer等(2010)Free Radical Biology&Medicine 49 1956-1968)。除非在含有谷胱甘肽的培养基中生长,否则删除了GSH1基因的酵母细胞对一系列应激条件(例如氧化条件和暴露于重金属)高度敏感,最终它们会停止生长(Spector 等(2001)The Journal of Biological Chemistry 276(10)7011-7016)。已知谷胱甘肽在氧化应激时也能保护细胞核(Hatem等(2014)Free Radical Biology&Medicine 67 103-114)。Biterova和Barycki(2009) (The Journal of Biological Chemistry 284,32700-32708)分析了Ghs1 (也称为谷氨酸半胱氨酸连接酶)的晶体结构,以研究谷胱甘肽生物合成的机制,并指出已经观察到人谷氨酸半胱氨酸连接酶的变体(例如R127C、P158L、H370L和P414L)。
之前(PCT/US2016/068239)已经鉴定了NOT4(也称为MOT2) 的突变导致宿主菌株中产生的异源蛋白质产量增加。发明人现已鉴定结合NOT4和GSH1突变令人惊讶地导致产量的进一步增加。
Not4是一种泛素连接酶,并且是Ccr4-Not复合物的一部分。 Ccr4-Not复合物在真核细胞中是保守的,并且在酵母中复合物由9个核心亚基组成:Ccr4、Caf1、Caf40、Caf130、Not1、Not2、Not3、Not4 和Not5(Collart,2003,Global control of gene expression inyeast by the Ccr4–Not complex.Gene 313:1-16;Bai等,1999,The CCR4 and Caf1proteins of the Ccr4–Not complex are physically and functionally separatedfrom Not2,Not4,and Not5.Mol.Cell.Biol.19:6642-6651)。已提议将该复合物作为中央交换机,其可以解释来自环境的信号并协调所有基因的表达水平以经济地响应信号(Collart,2012,The Ccr4-Not complex. Gene 492(1):42-53)。据认为Not4蛋白质(Not1、Not2、Not3、Not4) 是装配RNA聚合酶II复合物所必需的,这表明其在转录调节中具有全局性的作用(Collart,1994,Not1(cdc39),Not2(cdc36),Not3,and Not4 encode a global-negative regulator of transcription that differentially affects tata-elementutilization.Genes&Development 8(5):525-537;Collart, 2012,如上引用)。共晶体结构表明Not4的C-末端区域如何环绕Not1 (Ccr4-Not复合物中的支架蛋白质)的HEAT-重复区域(Bhaskar,2015, Architecture of the ubiquitylation module of the yeast Ccr4-Not complex. Structure 23(5):921-8)。
发明内容
本发明提供一种真菌宿主细胞,其具有:
a.修饰的Gsh1蛋白质或其同系物,和/或
b.修饰的Gsh1蛋白质或其同系物的活性水平,和/或
c.修饰的GSH1基因或其同系物,和/或
d.修饰的GSH1基因或其同系物的表达水平。
本发明还提供一种真菌宿主细胞,其还具有:
e.修饰的Not4蛋白质或其同系物,和/或
f.修饰的Not4蛋白质或其同系物的活性水平,和/或
g.修饰的NOT4基因或其同系物,和/或
h.修饰的NOT4基因或其同系物的表达水平。
本发明还提供一种真菌宿主细胞的培养物,该真菌宿主细胞包含编码期望的蛋白质如异源蛋白质的多核苷酸序列,其特征在于该真菌宿主细胞具有降低的Gsh1蛋白质或其同系物的活性水平和/或表达水平,并且任选地还具有降低的Not4蛋白质或其同系物的活性水平和/ 或表达水平。
本发明还提供一种用于从真菌宿主细胞制备期望的蛋白质如异源蛋白质的方法。
本发明提供一种用于改变来自真菌宿主细胞的期望的蛋白质的产量的方法。
本发明还提供一种期望的蛋白质,如异源蛋白质。白蛋白或其变体、片段、和/或融合物是优选的期望的蛋白质。
本发明还提供一种组合物,如药物组合物,其包含期望的蛋白质。
本发明还提供一种治疗患者的方法,其包括向患者施用有效量的组合物。
本发明还提供一种制备具有上述各项性质的真菌宿主细胞的方法。
本发明还提供Gsh1蛋白质或其同系物,其包含与SEQ ID NO:2 至少50%的同一性以及在对应于选自SEQ ID NO:2的一个或更多个以下位置的位置处的突变:47、48、49、50、51、120、121、122、123、124、125、126、127、128、129、130、409、451、452、453、454和 455。
本发明还提供编码本发明的Gsh1变体的多核苷酸。
本文所述的任何实施方式(包括仅在实施例和/或优选的实施方式部分中描述的那些)意在能够与任何其它实施方式组合,除非明确否认或组合不合适。
附图说明
图1是示出20个氨基酸的分类及其之间的关系的文氏图。
图2示出质粒pDB5438的构建体。
图3示出质粒pDB2305的构建体,“HSA”指重组人白蛋白,“mFL”是前导序列。
图4示出质粒pDB2244的构建体,“rHA”指重组人白蛋白,“FL”是前导序列。
图5示出质粒YCp50的构建体。
图6示出质粒pDB5862的构建体,“白蛋白变体”是编码SEQ ID NO:45的核酸,“mFL”是前导序列。
图7示出质粒pDB3936的构建体。
图8示出质粒pDB5912的构建体,“mFL”是前导序列。
图9示出质粒pDB3029的构建体,“Inv”是前导序列。
定义
白蛋白:术语“白蛋白”是指与人血清白蛋白(HSA)或HSA结构域具有相同和/或非常相似的三级结构并具有与HSA或相关结构域相似的性质的蛋白质。类似的三级结构例如是来自在“亲本白蛋白”下提及的种类的白蛋白的结构。白蛋白的一些主要性质是:i)调节血浆容量的能力(肿胀活性oncotic activity),ii)约19天±5天的长血浆半衰期,iii)与gp60(也称为清蛋白质激活蛋白质(albondin))结合,iv)与FcRn结合,v)配体结合,例如内源性分子如酸性、亲脂性化合物(包括胆红素、脂肪酸、氯化血红素和甲状腺素)的结合(也参见Kragh-Hansen等,2002,Biol.Pharm.Bull.25,695的表1,在此并入本文以供参考),vi)具有酸性或电负性特征的小有机化合物的结合,例如药物如华法林、地西泮、布洛芬和紫杉醇(也参见Kragh-Hansen 等,2002,Biol.Pharm.Bull.25,695的表1,在此并入本文以供参考)。并非所有这些性质都需要满足,以表征蛋白质或片段为白蛋白。例如,如果片段不包含负责结合某些配体或有机化合物的结构域,则预计这种片段的变体也不具有这些性质。
等位基因变体:术语“等位基因变体”是指占据相同染色体位点的基因的两种或多种替代形式中的任何一种。等位基因变体通过突变自然产生,并可能导致种群内的多态性。基因突变可以是沉默的(编码的多肽中没有变化)或者可以编码具有修饰的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
cDNA:术语“cDNA”是指可以通过从获自真核或原核细胞的成熟的、剪接的mRNA分子逆转录而制备的DNA分子。cDNA缺乏可能存在于相应基因组DNA中的内含子序列。最初的初级RNA转录物是通过一系列包括剪接的步骤加工的mRNA的前体,然后作为成熟的剪接mRNA出现。
编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框决定,开放阅读框以起始密码子如ATG、GTG或TTG开始,并以终止密码子如TAA、TAG 或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA、或其组合。
控制序列:术语“控制序列”是指表达编码本发明多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码多肽的多核苷酸可以是本源的(native)(即来自相同的基因)或外来的(即来自不同的基因) 或对于彼此是本源的或外来的。这种控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。为了引入特定的限制性位点,控制序列可以提供有接头,有助于将控制序列与编码多肽的多核苷酸的编码区连接。
表达:术语“表达”包括多肽制备中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达盒:术语“表达盒”是指编码多肽的多核苷酸和提供其表达的上游和下游控制序列。
表达宿主:术语“表达宿主”是指表达期望的蛋白质、特别是异源蛋白质的任何宿主细胞。
表达载体:术语“表达载体”是指包含编码多肽的多核苷酸并与提供其表达的控制序列可操作连接的线性或环状DNA分子。
片段:术语“片段”是指从成熟多肽的氨基和/或羧基末端和/或成熟多肽的内部区域缺失一个或更多个(几个)氨基酸的多肽。片段可以由衍生自多肽的一个不间断序列组成,或者可包含衍生自多肽不同部分的两个或多个序列。关于白蛋白,片段大小可多于约20个氨基酸残基,优选多于30个氨基酸残基,更优选多于40个氨基酸残基,更优选多于50个氨基酸残基,更优选多于75个氨基酸残基,更优选多于100个氨基酸残基,更优选多于200个氨基酸残基,更优选多于300 个氨基酸残基,甚至更优选多于400个氨基酸残基,并且最优选多于 500个氨基酸残基。在一个优选的实施方式中,片段对应于一个或更多个白蛋白结构域。本发明优选的白蛋白结构域是与HSA结构域I具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、 99.5%或100%同一性的结构域,由SEQ ID NO:10的氨基酸残基1至 194±1-15个氨基酸组成;与HSA结构域II具有至少70%、75%、80%、 85%、90%、95%、96%、97%、98%、99%、99.5%或100%同一性的结构域,由SEQ ID NO:10的氨基酸残基192至387±1-15个氨基酸组成;以及与HSA结构域III具有至少70%、75%、80%、85%、90%、 95%、96%、97%、98%、99%、99.5%或100%同一性的结构域,由SEQ ID NO:10的氨基酸残基381至585±1-15个氨基酸组成,或者一个或更多个(几个)这些结构域的组合,例如,结构域I和II,结构域II 和III或者结构域I和III融合在一起。对于白蛋白结构域的确切边界而言,不存在一般公认的惯例,并且这一事实通过以下反映:上述范围内的重叠以及在结构域N-末端和/或C-末端处从氨基酸(优选1至15 个氨基酸,更优选1至10个氨基酸,最优选1至5个氨基酸)起可变长度的限量为正或负1、2、3、4、5、6、7、8、9、10、11、12、13、 14或15,对于每个结构域而言允许长度的总变化至多30个氨基酸,优选至多20个氨基酸,更优选至多10个氨基酸;并且对于属于一个或另一个结构域的结构域之间的边界中的氨基酸残基可能存在一些不同意见。出于同样的原因,可能找到与上述数字不同的白蛋白结构域的氨基酸残基的对照,然而,技术人员将会理解如何基于文献中的教导和上述教导来鉴定白蛋白结构域。非人白蛋白的相应结构域可以通过用如EMBOSS包(EMBOSS:The EuropeanMolecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)中的Needle 程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)与HSA比对来鉴定,优选3.0.0或更高版本,更优选5.0.0或更高版本。使用的可选参数是空位开放罚分10,空位延伸罚分0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。也可以使用替代的比对工具,例如本文所述的MUSCLE。结构域也可以根据Dockal或Kjeldsen定义:Dockal等人(The Journal of Biological Chemistry,1999,Vol.274(41):29303-29310)将HSA的结构域定义为:结构域I:氨基酸1至197,结构域II:SEQID NO:10的氨基酸189 至385,结构域III:SEQ ID NO:10的氨基酸381至585。Kjeldsen等(Protein Expression and Purification,1998,Vol 13:163-169)将结构域定义为:结构域I:氨基酸1至192,结构域II:氨基酸193至382,结构域III:氨基酸383至585。每个结构域本身由两个同源亚结构域构成,即1-105、120-194、195-291、316-387、388-491和512-585,具有包含残基Lys106至Glu119、Glu292至Val1315和Glu492至Ala511 的柔性的子结构域间链接区域。
因此,在本发明中,以下的结构域定义是优选的。氨基酸数字对应于SEQ ID NO:10(HSA)的那些。然而,使用这些数字,技术人员可以鉴定其它白蛋白序列中的相应结构域。结构域I可以起始或可以不起始于氨基酸1处,并且可以终止于或可以不终止于氨基酸192、193、 194、195、196或197中的任一处,优选氨基酸192、194或197中的任一处。结构域II可以起始于或可以不起始于氨基酸189、190、191、 192或193处,优选氨基酸189、192或193中的任一处,并且可以终止于或可以不终止于氨基酸382、383、384、385、386或387处,优选氨基酸382、285或387中任一处。结构域III可以起始于或可以不起始于氨基酸381、382或383处,优选氨基酸381或383处,并且可以终止于或不终止于于氨基酸585处。非人白蛋白中的结构域可以具有与HSA相同或不同的氨基酸长度和/或残基数量。例如,可以使用 HSA和一种或多种(几种)其它白蛋白、片段、衍生物、变体和/或融合物来准备多重比对或成对比对以鉴定对应于HSA结构域I、II和/或 III的结构域。
融合配偶体(partner):在整个说明书中,融合配偶体是可以基因融合至白蛋白或其变体和/或片段的非白蛋白部分。
异源蛋白质:异源蛋白质是不由宿主细胞天然产生的蛋白质,并且优选不包括如选择标志物(例如抗生素抗性标志物,营养缺陷型选择标志物)、分子伴侣、FLP、REP1或REP2的蛋白质。
宿主细胞:术语“宿主细胞”是指用本发明的包含多核苷酸的核酸构建体或表达载体易于转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
成熟多肽:术语“成熟多肽”是指在翻译和任何翻译后修饰如N- 末端加工、C-末端截短、糖基化、磷酸化等后的最终形式的多肽。人白蛋白的成熟序列提供于SEQ ID NO:10中,而未成熟形式的实例提供于SEQ ID NO:12中。
成熟多肽编码序列:术语“成熟多肽编码序列”是指编码成熟多肽的多核苷酸。SEQID NO:9提供了人白蛋白的成熟多肽编码序列的实例,而SEQ ID NO:11提供了未成熟形式人白蛋白的编码序列的实例。
突变体:术语“突变体”是指编码变体的多核苷酸。
核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离,或者以天然不存在或者是合成的方式修饰以包含核酸片段,其包含一种或多个控制序列。
可操作地连接:术语“可操作地连接”是指以下结构:其中控制序列置于相对于多核苷酸的编码序列适当的位置,使得控制序列指导编码序列的表达。
亲本或亲本白蛋白:术语“亲本”或“亲本白蛋白”是指对其进行改变以产生本发明的白蛋白变体的白蛋白。亲本可以是天然存在的 (野生型)多肽或其等位基因或其变体。在一优选的实施方式中,亲本白蛋白是野生型白蛋白,更优选来自智人的野生型白蛋白,如SEQ ID NO:12(UNIPROT:P02768.2)或其成熟序列(SEQ ID NO:10)中公开的。替代的野生型白蛋白可以选自表1中所示的非穷举列表。
表1:来自不同种的野生型白蛋白
Figure BDA0002387856460000091
*如本文所述,使用如EBLOSUM62(EMBOSS程序套件,版本6.1.0)的Needle程序中实施的Needleman-Wunsch算法,使用空位开放罚分为10、空位延伸罚分为0.5计算序列同一性。
亲本白蛋白优选是成熟的白蛋白。在另一个实施方式中,亲本白蛋白与SEQ IDNO:10至少70%、更优选75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或至少99.8%的同一性,并且维持白蛋白至少一个主要特性或与白蛋白(如HAS)相似的三级结构。白蛋白的主要特性总结于Sleep,2015,“Albumin and its application in drug delivery”,ExpertOpinion on Drug Delivery 12(5): 793-812(并入本文以供参考)。
序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列同一性”描述。
为了本发明的目的,两个氨基酸序列之间的序列同一性使用如 EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol. 48:443-453)进行测定,优选版本5.0.0或更高版本。使用的参数是空位开放罚分10,空位延伸罚分0.5和EBLOSUM62(BLOSUM62的 EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作同一性百分比,计算方法如下:
(相同残基x 100)/(比对长度-比对中空位总数)
为了本发明的目的,两个脱氧核糖核苷酸序列之间的序列同一性使用EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,同上)的Needle程序中实施的 Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)进行测定,优选版本5.0.0或更高版本。使用的参数是空位开放罚分10,空位延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得) 用作同一性百分比,计算方法如下:
(相同的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)
变体:术语“变体”是指衍生自亲本多肽的多肽,例如包含一个或更多个(几个)位置处的改变,即取代、插入和/或缺失的白蛋白。取代是指用不同的氨基酸替换占据一个位置的氨基酸;缺失是指除去占据一个位置的氨基酸;插入是指在占据一个位置的氨基酸附近添加 1-3个氨基酸。修饰的多肽(变体)可以通过人类干预通过修饰编码亲本多肽(例如,白蛋白)的多核苷酸序列获得。变体白蛋白优选与SEQ ID NO:10具有至少70%、优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%或至少99.8%的同一性,并且可以或可以不保持亲本白蛋白的至少一种主要特性或者相似的三级结构(如 HSA)。通常,HSA的变体或片段将具有至少10%(优选至少50%、 60%、70%、80%、90%或95%)的HSA配体结合活性(例如胆红素结合),并且至少50%(优选至少70%、80%、90%或95%)的HSA 的肿胀活性,重量对重量。可以通过Hoefs,J.C.(1992)Hepatology 16:396-403(并入本文以供参考)所述的方法测定白蛋白、白蛋白变体或白蛋白片段的肿胀活性(也称为胶体渗透压)。胆红素结合可以通过在527nm处相对于HSA的荧光增强来测量。将胆红素(1.0mg)溶于50μL 1MNaOH中并用去离子水稀释至1.0mL。将胆红素原液在100 mM Tris-HCl(pH 8.5)、1mM EDTA中稀释,在荧光计比色皿中得到 0.6nmol胆红素/mL。通过在HSA:胆红素比率为0-5mol:mol的范围内用HSA滴定期间,通过448nm处的激发和527nm处的发射(10nm 狭缝宽度)测量荧光。与亲本白蛋白相比,该变体可具有对于FcRn的改变的结合亲和力和/或改变的血浆半衰期。
就变体Gsh1蛋白质而言,适用相同的原则,除了活性是Gsh1活性而不是白蛋白活性。亲本Gsh1蛋白质可以与SEQ ID NO:2具有至少50%、60%、70%、80%或90%的同一性,更优选地与SEQ ID NO:2 具有100%的同一性。变体Gsh1蛋白质可以与SEQ ID NO:2具有至少 50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或至少 99%的同一性。
就变体Not4蛋白质而言,适用相同的原则,除了活性是Not4活性而不是白蛋白活性。亲本Not4蛋白质可以与SEQ ID NO:6具有至少50%、60%、70%、80%或90%的同一性,更优选地与SEQ ID NO:6 具有100%的同一性。变体Not4蛋白质可以与SEQ ID NO:6具有至少 50%、60%、70%、80%、85%、90%、95%、96%、97%、98%或至少 99%的同一性。
变体多肽序列优选是非天然存在的序列。
载体:术语“载体”是指包含编码多肽的多核苷酸并且与提供其表达的控制序列可操作连接的线性或环状DNA分子。载体包括质粒。载体包括表达载体。
野生型:术语“野生型”(WT)白蛋白是指具有与在动物或人类中天然存在的白蛋白相同的氨基酸序列的白蛋白。SEQ ID NO:10是来自智人(Homo sapiens)的野生型白蛋白的实例。GenBank登录号 AAA98797.1(Minghetti等人,“Molecular structure of the humanalbumin gene is revealed by nucleotide sequence within q11-22 of chromosome4”, J.Biol.Chem.261(15),6747-6757(1986),并入本文以供参考)给出“野生型”人白蛋白(HSA)序列。表1(上文)提供了野生型白蛋白的实例。
用于氨基酸位置命名的惯例
为了本发明的目的,使用SEQ ID NO:2中公开的多肽来确定Gsh1 蛋白质的同系物中对应的氨基酸残基。将Gsh1蛋白质的同系物的氨基酸序列与SEQ ID NO:2中公开的多肽进行比对,并且基于比对,使用如EMBOSS包(EMBOSS:The European Molecular BiologyOpen Software Suite,Rice等人,2000,Trends Genet.16:276-277)的Needle程序中实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J. Mol.Biol.48:443-453)、优选版本5.0.0或更高版本,测定对应于SEQ ID NO:2中公开的多肽中的任何氨基酸残基的氨基酸位置编号。使用的参数是空位开放罚分10,空位延伸罚分0.5和EBLOSUM62 (BLOSUM62的EMBOSS版本)取代矩阵。基于SEQ ID NO:6,同样的原则也适用于Not4。
Gsh1蛋白质同系物中对应氨基酸残基的鉴定可以通过使用几个计算机程序比对多个多肽序列来测定,所述计算机程序包括但不限于 MUSCLE(基于对数期望的多序列比较(multiple sequence comparison by log-expectation);版本3.5或更高版本;Edgar,2004,Nucleic Acids Research 32:1792-1797),MAFFT(版本6.857或更高版本;Katoh和Kuma,2002,Nucleic Acids Research 30:3059-3066;Katoh等,2005, Nucleic AcidsResearch 33:511-518;Katoh和Toh,2007,Bioinformatics 23:372-374;Katoh等,2009,Methods in Molecular Biology 537:39-64;Katoh和Toh,2010,Bioinformatics 26:1899-1900,和采用ClustalW的 EMBOSS EMMA(1.83或更高版本;Thompson等,1994,NucleicAcids Research 22:4673-4680),使用它们各自的默认参数。基于SEQ ID NO: 6,同样的原则也适用于Not4。
在描述本发明的多肽时,采用下述命名法以便于参考。采用公认的IUPAC单字母或三字母氨基酸缩写。
取代.对于氨基酸取代,使用以下命名法:原始氨基酸,位置,取代的氨基酸。因此,用丙氨酸取代位置226处的苏氨酸命名为“Thr226Ala”或“T226A”。多个突变用加号(“+”)分开,例如“Gly205Arg +Ser411Phe”或“G205R+S411F”表示在位置205和411处的甘氨酸 (G)和丝氨酸(S)分别被精氨酸(R)和苯丙氨酸(F)取代。
缺失.对于氨基酸缺失,使用以下命名法:原始氨基酸,位置,*。因此,位置195处甘氨酸的缺失命名为“Gly195*”或“G195*”。多个缺失用加号(“+”)分开,例如“Gly195*+Ser411*”或“G195*+ S411*”。
插入.如上所公开的,插入可以是占据一个位置(‘命名(或原始) 氨基酸’,‘X’)氨基酸的N-侧(‘上游’,‘X-1’)或C-侧(‘下游’,‘X+1’)。
对于原始氨基酸(‘X’)的C-侧(‘下游’,‘X+1’)的氨基酸插入,使用以下命名法:原始氨基酸,位置,原始氨基酸,插入的氨基酸。因此,位置195处的甘氨酸后插入赖氨酸命名为“Gly195GlyLys”或“G195GK”。插入多个氨基酸命名为[原始氨基酸,位置,原始氨基酸,插入的氨基酸#1,插入的氨基酸#2;等等]。例如,位置195处的甘氨酸后插入赖氨酸和丙氨酸表示为“Gly195GlyLysAla”或“G195GKA”。
在这种情况下,通过向插入的氨基酸残基前面的氨基酸残基的位置号添加小写字母来对插入的氨基酸残基进行编号。因此,在上面的实例中,序列将是:
亲本: 变体:
195 195 195a 195b
G G-K-A
对于原始氨基酸(X)的N-侧(‘上游’,‘X-1’)的氨基酸插入,使用以下命名法:原始氨基酸,位置,插入的氨基酸,原始氨基酸。因此,在位置195处的甘氨酸(G)之前插入赖氨酸(K)命名为“Gly195LysGly”或“G195KG”。插入多个氨基酸命名为[原始氨基酸,位置,插入的氨基酸#1,插入的氨基酸#2;等等,原始氨基酸]。例如,在位置195处甘氨酸之前插入赖氨酸(K)和丙氨酸(A)表示为“Gly195LysAlaGly”或“G195KAG”。在这种情况下,插入的氨基酸残基通过向插入的氨基酸残基之后的氨基酸残基的位置编号处添加具有单引号的小写字母来编号。因此,在上面的实例中,序列将是:
亲本: 变体:
195 195a’195b’195
G K-A-G
多个改变.包含多个改变的多肽通过加号(“+”)分开,例如“Arg170Tyr+Gly195Glu”或“R170Y+G195E”分别表示170和195 位的精氨酸和甘氨酸用酪氨酸和谷氨酸取代。
不同的改变.当在一个位置可以引入不同的改变时,不同的改变用逗号分开,例如“Arg170Tyr,Glu”代表170位的精氨酸用酪氨酸或谷氨酸取代。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体:
“Tyr167Gly+Arg170Gly”,“Tyr167Gly+Arg170Ala”,“Tyr167Ala +Arg170Gly”和“Tyr167Ala+Arg170Ala”。
具体实施方式
本发明的第一方面提供了一种真菌宿主细胞,其具有:
a.修饰的Gsh1蛋白质或其同系物,和/或
b.修饰的Gsh1蛋白质或其同系物的活性水平,和/或
c.修饰的GSH1基因或其同系物,和/或
d.修饰的GSH1基因或其同系物的表达水平。
修饰的Gsh1蛋白质可以相对于参照Gsh1蛋白质如野生型Gsh1 蛋白质例如SEQ IDNO:2进行修饰。优选地,修饰的Gsh1蛋白质或其同系物与SEQ ID NO:2具有至少50%的同一性,更优选与SEQ ID NO:2具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、 99.7%、99.8%或至少99.9%的同一性。修饰的Gsh1蛋白质或其同系物与SEQ ID NO:2具有或不具有至多99.9%、99.8%、99.7%、99.6%、 99.5%、99.4%、99.3%、99.2%、99.1%、99%、98%、97%、96%、95%、 90%、85%、80%、75%、70%、65%或至多60%的同一性。更优选地,修饰的Gsh1蛋白质包含SEQ ID NO:4或由其组成。
优选修饰的Gsh1蛋白质或其同系物水平是Gsh1蛋白质或其同系物的表达水平降低或Gsh1蛋白质或其同系物的活性水平降低。优选地,修饰的,例如降低的水平相对于参照真菌宿主细胞(如Gsh1蛋白质包含SEQ ID NO:2或Gsh1蛋白质由SEQ ID NO:2组成的真菌宿主细胞) 中的水平。参照真菌宿主的Gsh1蛋白质可以是野生型Gsh1序列,如 SEQ ID NO:2。合适的参照真菌宿主细胞是酿酒酵母(S.cerevisiae) S288C或酿酒酵母DXY1。S288C具有基因型MATαSUC2 gal2 mal2 mel flo1 flo8-1 hap1 ho bio1 bio6。DXY1具有基因型leu2-3,leu2-122,can1, pra1,ubc4,ura3:yap3(Kerry-Williams等(1998)Yeast 14:161-169,并入本文以供参考)。其它合适的参照真菌宿主细胞包括除了GSH1 基因或Gsh1蛋白质或其同系物之外与宿主细胞相同的细胞。例如,参照的GSH1基因可以是野生型(例如SEQ IDNO:1),或者参照的GSH1 基因可以编码野生型Gsh1蛋白质(例如SEQ ID NO:2)或者由参照编码的Gsh1蛋白质可以是野生型的(例如SEQ ID NO:2)。优选地,本发明的宿主细胞除GSH1基因或Gsh1蛋白质或其同系物之外与亲本菌株相同。参照真菌宿主也可以称为“对应的”真菌宿主。参照真菌宿主可以是亲本真菌宿主。
Gsh1蛋白质水平或者Gsh1蛋白质活性水平的降低可通过以下方式实现,例如:通过使GSH1基因突变或缺失从而得到突变的Gsh1蛋白质或其同系物或者使Gsh1蛋白质或其同系物完全不存在;通过除去或改变基因的开放阅读框;通过使GSH1基因的控制序列如启动子序列和/或终止子序列突变或改变;例如通过引入合适的干扰RNA如反义mRNA而阻断或减少GSH1基因的转录;通过引入、控制或修饰合适的转录激活子基因或者通过引入阻断Gsh1蛋白质或其同系物的活性水平的试剂。测量蛋白质水平和蛋白质活性的方法是本领域公知的。
修饰的Gsh1蛋白质或其同系物的活性水平可以降低,因此得到亲本或参照真菌宿主细胞(例如野生型真菌宿主细胞)的Gsh1蛋白质或其同系物的活性水平的0%、10%、20%、30%、40%、50%、60%、70%、 80%、90%、95%、96%、97%或98%至10%、20%、30%、40%、50%、 60%、70%、80%、90%、95%、96%、97%、98%或99%。真菌宿主细胞中修饰的、例如降低的Gsh1蛋白质或其同系物的活性水平可以相对于上述参照真菌宿主细胞如亲本真菌宿主细胞或野生型真菌宿主细胞的Gsh1蛋白质或其同系物的活性水平。因此,宿主细胞中Gsh1蛋白质或其同系物的活性水平为参照真菌宿主细胞中Gsh1蛋白质或其同系物的活性水平的至多99%,例如为参照真菌宿主细胞中Gsh1蛋白质或其同系物的活性水平的至多98%、97%、96%、95%、90%、80%、70%、 60%、50%、40%、30%、20%、或至多10%。Gsh1蛋白质或其同系物的活性水平可降至零或基本上为零。
修饰的Gsh1蛋白质或其同系物的表达水平(量)可以降低,因此得到参照真菌宿主细胞(例如野生型真菌宿主细胞)的Gsh1蛋白质或其同系物的表达水平的0%、10%、20%、30%、40%、50%、60%、70%、 80%、90%、95%、96%、97%或98%至10%、20%、30%、40%、50%、 60%、70%、80%、90%、95%、96%、97%、98%或99%。真菌宿主细胞中修饰的、例如降低的Gsh1蛋白质或其同系物的表达水平可以相对于上述参照真菌宿主细胞如亲本真菌宿主细胞或野生型真菌宿主细胞的Gsh1蛋白质或其同系物的表达水平。因此,宿主细胞中Gsh1蛋白质或其同系物的表达水平至多为参照真菌宿主细胞中Gsh1蛋白质或其同系物的表达水平的99%,例如至多为参照真菌宿主细胞中Gsh1蛋白质或其同系物的表达水平的98%、97%、96%、95%、90%、80%、70%、 60%、50%、40%、30%、20%、或至多10%。Gsh1蛋白质或其同系物的表达水平可降至零或基本上为零。
真菌宿主细胞可能缺乏功能性GSH1基因或其同系物或Gsh1蛋白质或其同系物。例如,真菌宿主细胞可含有修饰的GSH1基因,其可导致Gsh1蛋白质或其同系物的表达水平降低,或Gsh1蛋白质或其同系物的活性水平降低。例如,由于缺失,真菌宿主细胞可能缺乏GSH1 基因或其同系物,和/或可能缺乏Gsh1蛋白质或其同系物。
GSH1活性可以通过使用如Volohonsky等,Chemico-Biological Interactions140(2002)49-65(并入本文以供参考)、特别是2.8.1节所公开的测定法来测量。Gsh1表达水平可以例如通过ELISA来测定以确定蛋白质的量或通过定量RT-PCR来测量RNA水平。
真菌宿主细胞可具有修饰的Gsh1蛋白质或其同系物,所述修饰的 Gsh1蛋白质或其同系物在对应于选自SEQ ID NO:2的以下位置的位置处包含突变:47、48、49、50、51、120、121、122、123、124、125、 126、127、128、129、130、409、451、452、453、454和455,优选选自以下位置:
对应于SEQ ID NO:2的位置47、48、49、50和51中任一个,优选对应于位置49;
对应于SEQ ID NO:2的位置120、121、122、123、124、125、126、 127、128、129或130的任一个,优选对应于位置123、124、125、126 或127,更优选对应于位置125;或
对应于SEQ ID NO:2的位置409;
对应于SEQ ID NO:2的位置451、452、453、454或455的任一个,优选对应于位置453。
最优选的是,真菌宿主细胞具有修饰的Gsh1蛋白质或其同系物,其在对应于SEQID NO:2的位置125的位置处包含突变。
该突变可以是一个或更多个(例如几个)位置处的取代、插入和/ 或缺失。优选取代。
真菌宿主细胞可包含编码修饰的Gsh1蛋白质或其同系物的多核苷酸序列,例如SEQ ID NO:3。由于遗传密码的简并性,其它多核苷酸序列也可以编码合适的修饰的Gsh1蛋白质或其同系物。
氨基酸分为各种众所周知的类别。因此,一些氨基酸比其它氨基酸更密切相关。如本文所用,“保守氨基酸取代”是指在同一组内进行的取代,并且其通常基本上不影响蛋白质功能。通过“保守取代”意指在如图1所示的那些组内,图1是一个文氏图,它提供了一个系统,通过这个系统可以看到保守水平。一般而言,低保守性的取代是起始氨基酸与所得取代之间存在许多边界(线)的那些取代。“保守氨基酸取代”包括在同一组内进行的取代,如在以下组内:
芳族氨基酸:F,H,W,Y;
脂肪族氨基酸:I,L,V;
疏水氨基酸:A,C,F,H,I,K,L,M,T,V,W,Y;
带电荷氨基酸:D,E,H,K,R,例如:
带正电氨基酸:H,K,R;或者
带负电氨基酸:D,E;
极性氨基酸:C,D,E,H,K,N,Q,R,S,T,W,Y;
小氨基酸:A,C,D,G,N,P,S,T,V,例如:
微小氨基酸:A,C,G,S。
或者,“保守取代”可以在以下组内:
具有脂肪族侧链的氨基酸:G,A,V,L,I;
具有芳族侧链的氨基酸:F,Y,W;
具有含硫侧链的氨基酸:C,M;
具有脂肪族羟基侧链的氨基酸:S,T;
具有碱性侧链的氨基酸:K,R,H;
酸性氨基酸及其酰胺衍生物:D,E,N,Q。
取代可通过本领域已知的技术得到,如通过美国专利第4,302,386 号(并入本文以供参考)公开的定点诱变。
非保守氨基取代可指从一组到另一组的取代,例如从具有芳族侧链的组到具有脂肪族侧链的组的取代。
真菌宿主细胞可包含修饰的Gsh1蛋白质或其同系物,其中相对于 SEQ ID NO:2,突变是取代为选自A、C、D、E、F、G、H、I、K、L、 M、N、P、Q、R、S、T、V、W和Y的氨基酸,优选取代为非保守氨基酸。
在对应于SEQ ID NO:2的位置125的位置处的突变可以是从天然氨基酸如R取代为非天然氨基酸如A、C、D、E、F、G、H、I、L、 M、N、P、Q、R、S、T、V、W或Y,优选取代为C、D、E或G,更优选取代为G。取代可以是从带正电的氨基酸到脂肪族、芳族、疏水、小、微小、极性或带负电的氨基酸,优选从带负电的氨基酸到微小氨基酸。特别优选的取代是从R到G。不优选取代为K。
在对应于SEQ ID NO:2的位置49的位置处的突变可以是从天然氨基酸例如D取代为非天然氨基酸例如A、C、F、G、H、I、K、L、 M、N、P、Q、R、S、T、V、W或Y,优选取代为H、K或R,更优选取代为R。取代可以是从带负电的氨基酸到带正电的氨基酸。不优选取代为E。
在对应于SEQ ID NO:2的位置409的位置处的突变可以是从天然氨基酸例如H取代为非天然氨基酸例如A、C、D、E、F、G、I、K、 L、M、N、P、Q、R、S、T、V、W或Y,优选取代为A、I、L、V、M、F、W、Y,更优选取代为L。取代可以是从芳族氨基酸到脂肪族氨基酸。特别优选的取代是从H到L。
在对应于SEQ ID NO:2的位置P453的位置处的突变可以是从天然氨基酸例如P取代为非天然氨基酸例如A、C、D、E、F、G、H、I、 K、L、M、N、Q、R、S、T、V、W或Y,优选取代为A、I、L、V、 M、F、W、Y,更优选取代为A、I、L、V,最优选取代为L。取代可以是从芳族氨基酸到脂肪族氨基酸。特别优选的取代是从P到L。
优选的修饰的Gsh1蛋白质在对应于SEQ ID NO:2的R125的位置处包括突变。
优选的修饰的Gsh1蛋白质包含SEQ ID NO:4或由其组成,即包含突变R125G。可以使用编码Gsh1蛋白质的核苷酸序列(例如SEQ ID NO:1)提供这种修饰的Gsh1蛋白质,可以使用例如SEQ ID NO:3提供包括单核苷酸多态性(SNP)A373G的核苷酸序列。
或者,修饰的水平可以是增加的水平。Gsh1蛋白质或其同系物的水平增加或活性水平增加可能会降低期望的蛋白质(如异源蛋白质) 的产量。例如,当期望的蛋白质不利于宿主细胞的生存力时,这种降低的产量可能是期望的。增加的水平可以是参照宿主如亲本宿主中的水平的至少101%、102%、103%、104%、105%、110%、120%、130%、 140%、150%、175%或200%。
建议位置R125与位置D49参与盐桥相互作用。任一氨基酸的突变均可用于破坏这种相互作用。将R125突变为D或E,或将D49突变为R或K可能会导致静电排斥效应,这有望破坏位置125和49之间的相互作用。但是,R125突变为K和/或D49突变为E(谷氨酸) 可能维持相互作用。
Gsh1蛋白质可能是宿主细胞外源的,也可能是宿主细胞内源的。当Gsh1蛋白质对于宿主细胞而言是外源的时,宿主细胞可能会维持或缺少宿主细胞内源性的Gsh1蛋白质。
根据本发明的第一个方面的真菌宿主可还具有:
修饰的Not4蛋白质或其同系物,和/或
修饰的Not4蛋白质或其同系物的活性水平,和/或
修饰的NOT4基因或其同系物,和/或
修饰的NOT4基因或其同系物的表达水平。
NOT4也称为MOT2。修饰的Not4蛋白质可以相对于参照Not4蛋白质如野生型Not4蛋白质例如SEQ ID NO:6进行修饰。优选地,修饰的Not4蛋白质或其同系物与SEQ ID NO:6具有至少70%的同一性,更优选与SEQ ID NO:6具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、 99.7%、99.8%或至少99.9%的同一性。修饰的Not4蛋白质或其同系物与SEQ ID NO:6具有或不具有至多99.9%、99.8%、99.7%、99.6%、 99.5%、99.4%、99.3%、99.2%、99.1%、99%、98%、97%、96%、95%、 90%、85%、80%、75%、70%、65%或至多60%的同一性。更优选地,修饰的Not4蛋白质包含SEQ ID NO:8或由其组成。
优选修饰的Not4蛋白质或其同系物水平是Not4蛋白质或其同系物的表达水平降低或Not4蛋白质或其同系物的活性水平降低。优选地,修饰的,例如降低的水平相对于参照真菌宿主细胞(如Not4蛋白质包含SEQ ID NO:6或由SEQ ID NO:6组成的真菌宿主细胞)的水平。参照真菌宿主的Not4蛋白质可以是野生型Not4序列,如SEQ ID NO:6。合适的参照真菌宿主细胞是如上所述的酿酒酵母S288C或酿酒酵母 DXY1。其它合适的参照真菌宿主细胞包括除了NOT4基因或Not4蛋白质或其同系物之外与宿主细胞相同的细胞。例如,参照的NOT4基因可以是野生型(例如SEQ ID NO:5),或者参照的NOT4基因可以编码野生型Not4蛋白质(例如SEQ ID NO:6)或者参照编码的Not4 蛋白质可以是野生型的(例如SEQ ID NO:6)。优选地,本发明的宿主细胞除NOT4基因或Not4蛋白质或其同系物之外与亲本菌株相同。参照的真菌宿主也可以称为“对应的”真菌宿主。参照的真菌宿主可能是亲本真菌宿主。
Not4蛋白质水平或者Not4蛋白质活性水平的降低可通过以下方式实现,例如:通过使NOT4基因突变或缺失从而导致突变的Not4蛋白质或其同系物或者使Not4蛋白质或其同系物完全不存在;通过使 NOT4基因的控制序列如启动子序列和/或终止子序列突变或改变,而除去或改变基因的开放阅读框;例如通过引入合适的干扰RNA如反义 mRNA,通过引入、控制或修饰合适的转录激活子基因或者通过引入阻断Not4蛋白质或其同系物的活性水平的试剂,而阻断或减少NOT4 基因的转录。测量蛋白质水平的方法是本领域公知的。
Not4蛋白质或其同系物的修饰的活性水平可以降低,因此得到亲本或参照真菌宿主细胞(例如野生型真菌宿主细胞)的Not4蛋白质或其同系物的活性水平的0%、10%、20%、30%、40%、50%、60%、70%、 80%或90%至10%、20%、30%、40%、50%、60%、70%、80%、90%、 95%、96%、97%或98%。真菌宿主细胞中修饰的、例如降低的Not4 蛋白质或其同系物的活性水平可以相对于上述参照真菌宿主细胞如亲本真菌宿主细胞或野生型真菌宿主细胞的Not4蛋白质或其同系物的活性水平。因此,Not4蛋白质或其同系物在宿主细胞中的活性水平可以为参照真菌宿主细胞中Not4蛋白质或其同系物的活性水平的至多 99%,例如为参照真菌宿主细胞中的Not4蛋白质或其同系物的活性水平的至多98%、97%、96%、95%、90%、80%、70%、60%、50%、40%、 30%、20%、或至多10%。Not4蛋白质或其同系物的活性水平可降至零或基本上为零。
Not4蛋白质或其同系物的修饰的表达水平(量)可以降低,因此得到参照真菌宿主细胞(例如野生型真菌宿主细胞)的Not4蛋白质或其同系物的表达水平的0%、10%、20%、30%、40%、50%、60%、70%、 80%或90%至10%、20%、30%、40%、50%、60%、70%、80%、90%、 95%、96%、97%或98%。真菌宿主细胞中修饰的、例如降低的Not4 蛋白质或其同系物的表达水平可以相对于上述参照真菌宿主细胞如亲本真菌宿主细胞或野生型真菌宿主细胞的Not4蛋白质或其同系物的表达水平。因此,宿主细胞中Not4蛋白质或其同系物的表达水平至多可以为参照真菌宿主细胞中Not4蛋白质或其同系物的表达水平的99%,例如至多为参照真菌宿主细胞中Not4蛋白质或其同系物的表达水平的 98%、97%、96%、95%、90%、80%、70%、60%、50%、40%、30%、20%、或至多10%。Not4蛋白质或其同系物的表达水平可降至零或基本上为零。
真菌宿主细胞可能缺乏功能性NOT4基因或其同系物或Not4蛋白质或其同系物。例如,真菌宿主细胞可含有修饰的NOT4基因,其可导致Not4蛋白质或其同系物的表达水平降低,或Not4蛋白质或其同系物的活性水平降低。例如,由于缺失,真菌宿主细胞可能缺乏NOT4 基因或其同系物,和/或可能缺乏Not4蛋白质或其同系物。
可以例如通过ELISA确定蛋白质的量或通过定量RT-PCR测量 RNA水平来测量Not4表达水平。
可以对修饰的Not4蛋白质或其同系物进行突变,从而其与Not1 蛋白质或其同系物的相互作用改变。例如,Not4蛋白质或其同系物的 N-末端区域可以突变,如含有对应于SEQ ID NO:6的位置426至439 处的氨基酸的α-螺旋。
因此,本发明还提供一种还具有Not4蛋白质或其同系物的真菌宿主细胞,与野生型Not4蛋白质(例如SEQ ID NO:6)和野生型Not1 蛋白质(例如SEQ ID NO:13)之间的相互作用相比,所述Not4蛋白质或其同系物与野生型Not1蛋白质之间的相互作用(例如疏水相互作用)较弱。
真菌宿主细胞可具有修饰的Not4蛋白质或其同系物,所述修饰的 Not4蛋白质或其同系物在对应于选自SEQ ID NO:6的以下位置的位置处包含突变:426、427、428、429、430、431、432、433、434、435、 436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、 460、461、462、463、464、465、466、467、468、469或470,优选选自以下位置:
对应于SEQ ID NO:6的位置426、427、428、429、430、431、432、 433、434、435、436、437、438或439,优选位置429、430、434或 437,最优选位置429;
对应于SEQ ID NO:6的位置460、461、462、463、464、465、466、 467、468、469或470,优选位置463、464或466;或者
对应于SEQ ID NO:6的位置438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455或456,优选位置442、445、447或452。
该突变可以是一个或更多个(例如几个)位置处的取代、插入和/ 或缺失。优选取代。
真菌宿主细胞可包含编码修饰的Not4蛋白质或其同系物的多核苷酸序列,例如SEQ ID NO:7。由于遗传密码的简并性,其它多核苷酸序列也可以编码合适的修饰的Not4蛋白质或其同系物。
真菌宿主细胞可包含修饰的Not4蛋白质或其同系物,其中相对于 SEQ ID NO:6,突变是取代为选自A、C、D、E、F、G、H、I、K、L、 M、N、P、Q、R、S、T、V、W和Y的氨基酸,优选为非保守氨基酸。
在对应于SEQ ID NO:6的位置429的位置处的突变可以是从天然氨基酸如F取代为非天然氨基酸如A、C、D、E、F、G、H、I、K、L、 M、N、P、Q、R、S、T、V、W或Y,优选为G、A、V、L或I、更优选为V、L或I,最优选为I。可以取代为非保守氨基酸。可以取代为脂肪族氨基酸。特别优选的取代是从F到I。
在对应于SEQ ID NO:6的位置430的位置处的突变可以是从天然氨基酸例如L取代为任何非天然氨基酸例如A、C、D、E、F、G、H、 I、K、L、M、N、P、Q、R、S、T、V、W或Y。可以取代为非保守氨基酸。
对应于位置434的位置处的突变可以是从天然氨基酸例如L取代为任何非天然氨基酸例如A、C、D、E、F、G、H、I、K、L、M、N、 P、Q、R、S、T、V、W或Y。可以取代为非保守氨基酸。
在对应于SEQ ID NO:6的位置437的位置处的突变可以是从天然氨基酸例如L取代为任何非天然氨基酸例如A、C、D、E、F、G、H、 I、K、L、M、N、P、Q、R、S、T、V、W或Y。可以取代为非保守氨基酸。
优选的修饰的Not4蛋白质在对应于SEQ ID NO:6的F429的位置处包括突变。
优选的修饰的Not4蛋白质包含SEQ ID NO:8或由其组成,即包含突变F429I。可以使用编码Not4蛋白质的核苷酸序列(例如,SEQ ID NO:5)提供这种修饰的Not4蛋白质,该核苷酸序列包括SNP T1285A,例如SEQ ID NO:7。
或者,修饰的水平可以是增加的。Not4蛋白质或其同系物的水平增加或活性增加可能会降低期望的蛋白质(如异源蛋白质)的产量。例如,当期望的蛋白质不利于宿主细胞的生存力时,这种降低的产量可能是期望的。增加的水平可以是参照宿主如亲本宿主中的水平的至少101%、102%、103%、104%、105%、110%、120%、130%、140%、 150%、175%或200%。
Not4蛋白质可以是宿主细胞外源的,也可以是宿主细胞内源的。当Not4蛋白质对于宿主细胞而言是外源的时,宿主细胞可以维持或缺少宿主细胞内源性的Not4蛋白质。
真菌宿主可以具有(1)修饰的Gsh1蛋白质或其同系物的水平和/ 或修饰的Gsh1蛋白质或其同系物的活性水平,和/或修饰的GSH1基因或其同系物和/或修饰的GSH1基因或其同系物的表达水平和(2)修饰的Not4蛋白质或其同系物的水平和/或修饰的Not4蛋白质或其同系物的活性水平,和/或修饰的NOT4基因或其同系物和/或修饰的NOT4基因或其同系物的表达水平。优选地,真菌宿主具有(1)降低的Gsh1 蛋白质或其同系物的水平或降低的Gsh1蛋白质或其同系物的活性水平和/或降低的GSH1基因或其同系物的表达水平和(2)降低的Not4蛋白质或其同系物的水平或者降低的Not4蛋白质或其同系物的活性水平和/或降低的NOT4基因或其同系物的表达水平。或者,真菌宿主可具有(1)降低的Gsh1蛋白质或其同系物的水平或者降低的Gsh1蛋白质或其同系物的活性水平和/或降低的GSH1基因或其同系物的表达水平,和(2)增加的Not4蛋白质或其同系物的水平或者增加的Not4蛋白质或其同系物的活性水平和/或增加的NOT4基因或其同系物的表达水平。或者,真菌宿主可具有(1)增加的Gsh1蛋白质或其同系物的水平或者增加的Gsh1蛋白质或其同系物的活性水平和/或增加的GSH1 基因或其同系物的表达水平,和(2)降低的Not4蛋白质或其同系物的水平或者降低的Not4蛋白质或其同系物的活性水平和/或降低的 NOT4基因或其同系物的表达水平。相同的选项适用于GSH1和NOT4 的表达水平。“增加的”和“降低的”如本文所述。
优选地,修饰的例如降低的Gsh1水平是相对于参照真菌宿主细胞,例如其中Gsh1蛋白质包含SEQ ID NO:2或Gsh1蛋白质由SEQ ID NO: 2组成的真菌宿主细胞中的水平,以及修饰的例如降低的Not4水平是相对于参照真菌宿主细胞,例如其中Not4蛋白质包含SEQID NO:6 或Not4蛋白质由SEQ ID NO:6组成的真菌宿主细胞中的水平。参照真菌宿主的Gsh1蛋白质可以是野生型Gsh1序列,例如SEQ ID NO:2。参照真菌宿主的Not4蛋白质可以是野生型Not4序列,例如SEQ ID NO: 6。合适的参照真菌宿主细胞是如上所述的酿酒酵母S288C或酿酒酵母 DXY1。其它合适的参照真菌宿主细胞包括除了GSH1基因或Gsh1蛋白质或其同系物和NOT4基因或Not4蛋白质或其同系物之外与宿主细胞相同的细胞。例如,参照的GSH1基因可以是野生型(例如SEQ ID NO:1),或者参照的GSH1基因可以编码野生型Gsh1蛋白质(例如 SEQ ID NO:2)或者由参照编码的Gsh1蛋白质可以是野生型的(例如 SEQ IDNO:2)。参照的NOT4基因可以是野生型(例如SEQ ID NO:5),或者参照的NOT4基因可以编码野生型Not4蛋白质(例如SEQ ID NO: 6)或者由参照编码的Not4蛋白质可以是野生型的(例如SEQ ID NO: 6)。优选地,本发明的宿主细胞除GSH1基因或Gsh1蛋白质或其同系物和NOT4基因或Not4蛋白质或其同系物之外与亲本菌株相同。参照真菌宿主也可以称为“对应的”真菌宿主。参照真菌宿主可以是亲本真菌宿主。
真菌宿主细胞可以是重组真菌宿主细胞。
真菌宿主细胞可以是酵母或丝状真菌。如本文所用的“真菌”包括子囊菌门(phylaAscomycota),担子菌门(Basidiomycota),壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如Hawksworth 等,在Ainsworth and Bisby's Dictionary of The Fungi,8th edition,1995, CAB International,University Press,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,同上,第171页中所述) 和所有的有丝分裂真菌(Hawksworth等,1995,同上)。
在优选的方面,真菌宿主细胞是酵母细胞。如本文所用,“酵母”包括产子囊酵母(内孢霉目(Endomycetale)),产担子酵母 (basidiosporogenous yeast)和属于半知菌类(芽生菌纲Blastomycetes) 的酵母。由于酵母的分类可能在未来发生变化,因此为了本发明的目的,酵母应如Biology and Activities of Yeast(Skinner,F.A.,Passmore, S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No: 9,1980,第1-27页)所定义。
在更优选的方面,酵母宿主细胞是念珠菌(Candida),汉逊酵母 (Hansenula),克鲁维酵母(Kluyveromyces),毕赤酵母(Pichia),酵母属(Saccharomyces),裂殖酵母(Schizosaccharomyces)或亚罗酵母(Yarrowia)细胞。
在更优选的方面,酵母宿主细胞是卡尔伯氏酵母(Saccharomycescarlsbergensis),酿酒酵母(Saccharomyces cerevisiae),糖化酵母 (Saccharomycesdiastaticus),道格拉氏酵母(Saccharomyces douglasii),克鲁维酵母(Saccharomyceskluyveri),诺地酵母 (Saccharomyces norbensis),卵形酵母(Saccharomycesoviformis),乳酸克鲁维酵母(Kluyveromyces lactis)或解脂亚罗酵母(Yarrowialipolytica)细胞。酿酒酵母宿主是特别优选的。
酿酒酵母宿主可包含或不包含以下基因型特征中的一种或多种: leu2-3,leu2-122,can1,pra1,ubc4,ura3,yap3::URA3,lys2, hsp150::LYS2,pmt1::URA3(如在WO2014/138371中所定义,并入本文以供参考),例如酿酒酵母BXP10。酿酒酵母优选包含MATa。
酿酒酵母宿主可包含或不包含以下基因型中的一种或多种:MATa, leu2-3,leu2-112,ubc4,ura3,yap3::URA3,lys2,hsp150::LYS2;与在PDI1基因座处整合的PDI1、URA3和YIplac211(Finnis等2010, Microbial Cell Factories 9:87),例如酿酒酵母DP9。
酿酒酵母宿主可包含或不包含以下基因型中的一种或多种: MATα,leu2,pep4-3,例如Finnis等,1993,Eur.J.Biochem,212:201-210 所述的酿酒酵母MT302/28B。
酿酒酵母宿主可包含或不包含以下基因型:MATα,SUC2,gal2, mal2,mel,flo1,flo8-1,hap1,ho,bio1,bio6(Mortimer和Johnston (1986)Genetics 113:35-43),例如酿酒酵母S288C。
优选的酿酒酵母宿主菌株包含MATa,leu2-3,leu2-122,can1,pra1, ubc4,ura3,yap3::URA3,lys2,hsp150::LYS2和pmt1::URA3,或者由其全部组成。
另一优选的酿酒酵母宿主包含:MATα,leu2-3,leu2-112,ubc4, ura3,yap3::URA3,lys2,hsp150::LYS2,与在PDI1基因座处整合的 PDI1,URA3和YIplac211,或者由其全部组成。
另一优选的酿酒酵母宿主包含:MATα,SUC2,gal2,mal2,mel, flo1,flo8-1,hap1,ho,bio1,bio6,或者由其全部组成。
另一优选的酿酒酵母宿主包含MATα,leu2,pep4-3,或者由其全部组成。
宿主可以是多倍体,二倍体或单倍体。优选单倍体或二倍体酵母宿主,优选单倍体。
宿主交配型可以是例如MATa或MATα(Mat-α)。优选酿酒酵母宿主含有编码人白蛋白或其变体、片段和/或融合物的质粒。
“丝状真菌”包括真菌门和卵菌门的亚门的所有丝状体形式(如由Hawksworth等,1995,同上,所定义)。丝状真菌的特征在于由几丁质,纤维素,葡聚糖,壳聚糖,甘露聚糖和其它复合多糖组成的菌丝体壁。营养生长是通过菌丝延长并且碳分解代谢是专性好氧的。相比之下,酵母例如酿酒酵母的营养生长是通过单细胞菌体的出芽生殖并且碳分解代谢可以是发酵性的。
优选的丝状真菌宿主细胞可以包括枝顶孢属(Acremonium),曲霉(Aspergillus),短梗霉(Aureobasidium),烟管霉属(Bjerkandera),拟蜡菌属(Ceriporiopsis),金孢子菌(Chrysosporium),鬼伞属 (Coprinus),采绒革盖菌(Coriolus),隐球菌(Cryptococcus),线黑粉酵母属(Filibasidium),镰孢属(Fusarium),腐质霉属(Humicola),稻瘟病菌(Magnaporthe),毛霉菌(Mucor),毁丝霉属(Myceliophthora),新丽鞭毛属(Neocallimastix),脉孢菌(Neurospora),拟青霉 (Paecilomyces),青霉(Penicillium),毛平革菌(Phanerochaete),射脉菌(Phlebia),瘤胃壶菌属(Piromyces),侧耳属(Pleurotus),裂褶菌(Schizophyllum),踝节菌属(Talaromyces),热子囊菌属(Thermoascus),梭孢壳属(Thielavia),弯颈霉属(Tolypocladium),栓菌属(Trametes)或木霉属(Trichoderma)。
真菌宿主细胞可包含编码期望蛋白质的核苷酸序列。优选地,期望的蛋白质是异源蛋白质。异源蛋白质不是由宿主细胞天然产生的蛋白质,并且优选不包括蛋白质例如选择性标志物,例如抗生素抗性标志物或营养缺陷型标志物,分子伴侣,FLP或FRT。
真菌宿主细胞可以是表达宿主。真菌宿主细胞可包含表达盒,例如编码期望的蛋白质如异源蛋白质。表达盒可以在例如载体如质粒内。真菌宿主细胞可包含表达载体。
期望的蛋白质可以是或不是植物或动物蛋白质或其变体。期望的蛋白质可包含或不包含白蛋白序列,单克隆抗体,依托泊苷,血清蛋白质(如凝血因子),安替斯塔辛(antistasin),壁虱抗凝肽,转铁蛋白质,乳铁蛋白质,内皮抑素(endostatin),血管抑制素(angiostatin),胶原,免疫球蛋白质或基于免疫球蛋白质的分子或片段之一(例如, SmallModular ImmunoPharmaceuticalTM(“SMIP”)或dAb、Fab’片段、F(ab’)2、scAb、scFv或scFv片段),Kunitz结构域蛋白质(如在 WO03/066824(并入本文以供参考)中所述的那些,具有或不具有白蛋白融合物),干扰素,白细胞介素,IL-10,IL-11,IL-2,干扰素α (αlpha)种和亚种,干扰素β(beta)种和亚种,干扰素γ(gamma) 种和亚种,瘦素,CNTF,CNTFAx15,IL-1-受体拮抗剂,红细胞生成素 (EPO)和EPO模拟物,血小板生成素(TPO)和TPO模拟物,prosaptide,蓝藻抗病毒蛋白质-N,五螺旋蛋白质(5-helix),T20肽,T1249肽, HIV gp41,HIV gp120,尿激酶,尿激酶原,tPA,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽(exendin-4)、GLP-1或GLP-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β(beta),肿瘤坏死因子, G-CSF,GM-CSF,M-CSF,FGF,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白质原、凝血酶、凝血酶前体(pre-thrombin)、凝血酶原(pro-thrombin)、血管假性血友病因子(von Willebrand’s factor)、α1-抗胰蛋白质酶、纤溶酶原激活剂、因子VII、因子VIII、因子IX、因子X和因子XIII),神经生长因子,LACI,血小板衍生内皮细胞生长因子(PD-ECGF),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白质,间-α胰蛋白质酶抑制剂,抗凝血酶III,载脂蛋白质种,蛋白质C(Protein C),蛋白质S(Protein S),代谢物,抗生素,或上述任一项的变体或片段。
优选地,该变体与上述一种或多种蛋白质具有至少70%、75%、 80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。
优选的期望的蛋白质可以是或不是血清蛋白质,如白蛋白或其变体,片段和/或融合物。优选地,白蛋白与SEQ ID NO:10具有60%、 65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、98.2%、 98.4%、98.6%、98.8%、99%、99.2%、99.3%、99.4%、99.5%、99.6%、 99.7%、99.8%、或99.9%至70%、75%、80%、85%、90%、95%、96%、 97%、98%、98.2%、98.4%、98.6%、98.8%、99%、99.2%、99.3%、 99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、或100%的序列同一性。最优选地,白蛋白包含SEQ ID NO:10或由SEQ ID NO:10组成。
白蛋白变体、其片段和/或其融合物相对于SEQ ID NO:10可包含或可不包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、 16、17、18或19至2、3、4、5、6、7、8、9、10、11、12、13、14、 15、16、17、18、19或20个突变。优选的白蛋白变体相对于SEQ ID NO: 10包含1至10个突变,更优选1至5个突变。优选的突变包括取代。
白蛋白变体、其片段和/或融合物在对应于SEQ ID NO:10的位置 K573的位置处可包含或可不包含A、C、D、E、F、G、H、I、L、M、 N、P、Q、R、S、T、V、W或Y,更优选在对应于SEQ IDNO:10的位置K573的位置处可包含或可不包含P,H,W或Y。特别优选的白蛋白变体与SEQ IDNO:10具有至少95%的同一性(更优选至少96%、 97%、98%或99%的同一性)并且在对应于SEQ ID NO:10的573位置处包含P。
白蛋白变体、其片段和/或融合物在对应于SEQ ID NO:10的位置 E492的位置处可包含或可不包含A、C、D、F、G、H、I、K、L、M、 N、P、Q、R、S、T、V、W或Y,更优选在对应于SEQ IDNO:10的位置E492的位置处可包含或可不包含G、D、F、H、M或R,尤其更优选在对应于SEQ IDNO:10的位置E492的位置处可包含或可不包含 G或D。特别优选的白蛋白变体与SEQ ID NO:10具有至少95%的同一性(更优选至少96%、97%、98%或99%的同一性)并且在对应于SEQ ID NO:10的E492位置处包含G。
白蛋白变体、其片段和/或融合物在对应于SEQ ID NO:10的位置 K574的位置处可包含或可不包含A、C、D、E、F、G、H、I、L、M、 N、P、Q、R、S、T、V、W或Y,更优选在对应于SEQ IDNO:10的位置K574的位置处可包含或可不包含H、G、D、F、N、S或Y,尤其更优选在对应于SEQID NO:10的位置K574的位置处可包含或可不包含D、F、G或H。特别优选的白蛋白变体与SEQID NO:10具有至少95%的同一性(更优选至少96%、97%、98%或99%的同一性)并且在对应于SEQ ID NO:10的K574位置处包含H。
白蛋白变体、其片段和/或融合物在对应于SEQ ID NO:10的位置 Q580的位置处可包含或可不包含A、C、D、E、F、G、H、I、K、L、 M、N、P、R、S、T、V、W或Y,更优选在对应于SEQ IDNO:10 的位置Q580的位置处可包含或可不包含K或R。特别优选的白蛋白变体与SEQ ID NO:10具有至少95%的同一性(更优选至少96%、97%、 98%或99%的同一性)并且在对应于SEQ ID NO:10的Q580位置处包含K。
优选的白蛋白变体可在一个或更多个选自对应于位置492、573、 574和580(例如上述取代)的位置处包含或不包含突变。例如,白蛋白变体可包含SEQ ID NO:45或由SEQ IDNO:45组成。
其它优选的白蛋白变体,其片段和/或融合物包括那些在 WO2011/051489、WO2011/124718、WO2012/059486、WO2012/150319、 WO2014/072481、WO2013/135896、WO2015/036579、WO2010/092135、 WO2013/075066、WO2014/179657、WO2009/126920、WO2010/059315、 WO2011/103076、WO2012/112188、WO2015/063611和WO 2017/029407 中公开的,或者其融合物的片段(每一个并入本文以供参考)。
白蛋白可以是或可以不是白蛋白或其变体的片段。
白蛋白变体、其片段和/或融合物可以与FcRn具有结合亲和力,该亲和力比亲本白蛋白、其片段和/或融合物的更强或更弱(优选更强)。
白蛋白变体、其片段和/或融合物与FcRn(例如,shFcRn)的KD 可以比HSA或其缀合物与之对应的KD低。优选地,白蛋白变体、其片段和/或融合物的KD小于HSA与FcRn的0.9XKD,优选小于HSA 对FcRn的0.5X KD,更优选小于HSA对FcRn的0.1X KD,甚至更优选小于HSA与FcRn的0.05X KD,甚至更优选小于HSA与FcRn的 0.02X KD,甚至更优选小于HSA与FcRn的0.01X KD倍,最优选小于HSA与FcRn的0.001X KD(其中X表示‘倍’)。较低的KD对应于较强的结合亲和力。
白蛋白变体、其片段和/或融合物与FcRn的KD可以高于HSA或其缀合物与FcRn的相应KD。优选地,白蛋白变体、其片段和/或融合物的KD大于HSA与FcRn的2X KD,更优选大于HSA与FcRn的5X KD,更优选大于HSA与FcRn的10X KD,甚至更优选大于HSA与 FcRn的25XKD,最优选大于HSA与FcRn的50X KD。白蛋白变体、其片段和/或融合物可以是对于FcRn无效的结合剂。较高的KD对应于较弱的结合亲和力。
当确定和/或比较KD时,可以使用一种或多种(例如几种)(且优选全部)以下参数:
仪器:Biacore 3000仪器(GE Healthcare)
流动池(Flow cell):CM5传感器芯片
FcRn:人FcRn,优选可溶性人FcRn,其任选地偶联至标签(tag) 如谷胱甘肽S转移酶(GST)或组氨酸(His),最优选His、如在β2- 微球蛋白质的C-末端处的6个组氨酸残基。
FcRn定量:1200-2500RU
偶联化学:胺偶联化学(例如通过仪器的制造商提供的科学实验报告中所述)。
偶联方法:偶联可以通过在10mM乙酸钠pH 5.0(GE Healthcare) 中注射20μg/ml蛋白质来进行。可使用pH 5.5的磷酸盐缓冲液(67mM 磷酸盐缓冲液,0.15M NaCl,0.005%吐温20)作为运行缓冲液和稀释缓冲液。表面的再生可以使用pH 7.4的HBS-EP缓冲液(0.01M HEPES, 0.15M NaCl,3mM EDTA,0.005%表面活性剂P20)(Biacore AB) 进行。
测试分子(例如HSA或变体)注射的定量20-0.032μM。
注射流速:恒定,例如30μl/ml。
注射温度:25℃。
数据评估软件:BIAevaluation 4.1软件(BIAcore AB)。
白蛋白变体、其片段和/或融合物可以具有比亲本白蛋白、其片段和/或融合物更长或更短,优选更长的血浆半衰期。
血浆半衰期理想地在合适的个体体内确定。然而,由于耗时且昂贵且不可避免地存在与在动物或人体中进行实验相关的伦理问题,因此期望使用体外测定法来确定血浆半衰期是否延长或减少。已知白蛋白与其受体(FcRn)的结合对于血浆半衰期是重要的,并且受体结合与血浆半衰期之间的相关性是白蛋白与其受体亲和力越高导致越长的血浆半衰期。因此,对于本发明,白蛋白与FcRn更高的亲和力被认为是血浆半衰期增加的指示,白蛋白与其受体更低的亲和力被认为是血浆半衰期减少的指示。
白蛋白与其受体FcRn的结合可使用术语亲和力和表述“更强”或“更弱”来描述。因此,应当理解的是,和HAS与FcRn的亲和力相比,与FcRn具有更高亲和力的分子被认为比HAS与FcRn结合更强地与FcRn结合,和HAS与FcRn的亲和力相比,与FcRn具有更低亲和力的分子被认为比HAS与FcRn结合更弱地与FcRn结合。术语“结合系数”可以用来代替术语“结合亲和力”。
术语“更长的血浆半衰期”或“更短的血浆半衰期”以及类似的表述应理解为与相应的亲本或参照或相应的白蛋白分子有关。因此,就本发明的变体白蛋白而言,较长的血浆半衰期意指与除了本文所述的变化之外具有相同序列的相应白蛋白相比,该变体具有更长的血浆半衰期。
白蛋白或变体和/或其片段可以或可以不与融合配偶体基因融合。优选地,融合配偶体是非白蛋白蛋白质。融合配偶体可以在白蛋白的N’或C’末端融合。在白蛋白部分和配偶体部分之间可能存在或不存在一个或更多个间隔氨基酸。融合配偶体可以插入白蛋白序列内。融合配偶体可以为至少5个氨基酸长,例如至少5、10、15、20、25、30、35、 40、50、60、70、80、90或至少100个氨基酸长。融合配偶体可以具有或可以不具有35、30、40、50、60、70、80、90、100、125、150、 175、200、300、400、500、600、700、800、900或1000个氨基酸长的最大长度。融合蛋白可包含一个或更多个融合配偶体,例如融合在白蛋白的N’或C’末端或插入白蛋白序列内。融合蛋白可包含相同融合配偶体的一个或更多个(例如几个,例如2、3、4或5个)拷贝或两个或多个不同的配偶体。如上所述,融合配偶体可以选自期望的或异源的蛋白质。
优选的融合蛋白可包含具有GLP-1活性的多肽,如描述于 WO2014/138371中的那些(并入本文以供参考,具体参考第13、14、 26、34-37页)。例如,优选的融合蛋白可包含HSA(SEQ ID NO:10),或者与GLP类似物(例如SEQ ID NO:14或51)或HSA(SEQ ID NO: 10)的一个拷贝串联基因融合的HSA的变体(例如SEQ ID NO:45) 和/或片段,或者与GLP类似物(例如SEQ ID NO:15、52或53)的串联重复串联基因融合的HSA的变体(例如SEQ ID NO:45)和/或片段。例如,融合蛋白可包含SEQ ID NO:16(阿必鲁泰albiglutide)或者由其组成。
对于白蛋白,其变体、片段和/或融合物的生产特别合适的真菌宿主细胞包括但不限于曲霉属(WO06/066595),克鲁维酵母属(Fleer, 1991,Bio/technology 9:968-975),毕赤酵母属(Kobayashi,1998, Therapeutic Apheresis 2:257-262)和酵母属(Sleep,1990,Bio/technology 8:42-46),每个并入本文以供参考。
期望的蛋白质(例如异源蛋白质)可以是或可以不是分泌蛋白质。因此,由宿主细胞编码的蛋白质可包含或可以不包含信号肽(在一些文献中也可能称为“前导序列”)。通常,信号肽序列在从宿主细胞分泌期间从蛋白质切割,因此所得(成熟)蛋白质不包含信号肽序列。以下提供合适的信号肽序列的实例。信号肽可包含或不包含前体肽。
或者,期望的蛋白质可以是或可以不是细胞内的。
期望的蛋白质可以或可以不由质粒编码。
期望的蛋白质可以或可以不由染色体核酸编码。
合适的质粒包括2微米族质粒,例如WO2006/067511(并入本文以供参考,特别强调其章节题目“The 2μm-family plasmids:”46-61页)。这样的质粒,共同命名为“2μm族质粒”,其包括来自鲁氏酵母 (Zygosaccharomyces rouxii)(之前被分类为双胞酵母Zygosaccharomyces bisporus)的pSR1、pSB3和pSB4,来自拜氏接合酵母(Zygosaccharomyces bailii)的质粒pSB1和pSB2,来自发酵型结合酵母(Zygosaccharomyces fermentati)的质粒pSM1,来自 Kluyveromyces drosphilarum的质粒pKD1,一种来自膜醭毕赤酵母 (Pichia membranaefaciens)(“pPM1”)的未命名质粒,和来自酿酒酵母的2μm质粒(如WO2006/067511图1所示)以及变体(如Scp1、 Scp2和Scp3)(Volkert等,1989,Microbiological Reviews53:299;Murray 等,1988,J.Mol.Biol.200:601;Painting等,1984,J.Applied Bacteriology56:331)。
2μm族质粒通常包含至少三个开放阅读框(“ORF”),每个开放阅读框编码一个蛋白质,该蛋白质在稳定维持作为多拷贝质粒的2 μm族质粒中起作用。由三个ORF编码的蛋白质可指定为FLP、REP1 和REP2。当2μm族质粒不包含全部3个编码FLP、REP1和REP2的 ORF时,编码缺失蛋白质的ORF应以另一种质粒或通过染色体整合反式(trans)提供。
优选的质粒是来自酿酒酵母的2μm质粒,优选编码期望的蛋白质如异源蛋白质。
Gsh1蛋白质、Not4蛋白质和/或期望的例如异源蛋白质可以由与一个或更多个控制序列可操作地连接的核苷酸序列编码,所述控制序列指导编码序列在适合的宿主细胞中在与控制序列相容的条件下表达。
可以多种方式操作多核苷酸以用多种方式提供多肽的表达。取决于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。利用重组DNA方法修饰多核苷酸的技术是本领域已知的。
控制序列可以是启动子,即为了表达多核苷酸而被宿主细胞识别的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变体,截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例为从以下者的基因中获得的启动子:构巢曲酶乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白质酶、米曲霉磷酸丙糖异构酶、尖孢镰刀霉类胰蛋白质酶(WO96/00787)、镰孢霉(Fusarium venenatum)淀粉葡糖苷酶(WO00/56900)镰孢霉 Daria(WO00/56900)、镰孢霉Quinn(WO00/56900)、米赫根毛霉酯酶、米赫根毛霉天冬氨酸蛋白质酶、里氏木霉β-葡萄糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、以及NA2-tpi启动子(一种来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中未翻译的前导序列(leader)已经被来自曲霉属磷酸丙糖异构酶基因的未翻译的前导序列所替代;非限制性的实例包括来自黑曲霉中性α-淀粉酶基因的启动子,其中未翻译的前导序列(leader)已经被来自构巢曲霉或米曲霉磷酸丙糖异构酶基因的未翻译前导序列所替代);及其突变体、截短的和杂合启动子。
在酵母细胞中,有用的启动子从以下者的基因获得:酿酒酵母烯醇酶(ENO1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/ 甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白质(CUP1)和酿酒酵母3-磷酸甘油酸酯激酶。其它对酵母宿主细胞有用的启动子在上文的Romanos等, 1992中有述。
控制序列还可以是转录终止子,其被宿主细胞识别以终止转录。终止子序列与编码多肽的多核苷酸的3’-末端可操作地连接。可以使用任何在宿主细胞中起作用的终止子。
对于丝状真菌宿主细胞,优选的终止子从以下者的基因中获得:构巢曲霉邻氨基苯甲酸酯合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡萄糖苷酶、米曲霉TAKA淀粉酶和尖孢镰刀霉类胰蛋白质酶。
对于酵母宿主细胞,优选的终止子是从以下者的基因中获得的:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛 -3-磷酸脱氢酶。其它对酵母宿主细胞有用的终止子在上文的Romanos 等,1992中有述。
控制序列还可以是启动子下游和基因编码序列下游的mRNA控制物(stabilizer)区域,其增加基因的表达。
控制序列还可以是前导序列,即对通过宿主细胞的翻译非常重要的mRNA的未翻译区域。前导序列与编码多肽的多核苷酸的5’-末端可操作地连接。可以使用任何在宿主细胞中起作用的前导序列。
对于丝状真菌细胞,优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得。
对于酵母宿主细胞,合适的前导序列从以下者的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸酯激酶、酿酒酵母α- 因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是聚腺苷酸化序列,即与编码序列的多肽的3’-末端可操作连接的序列,并且当转录时,被宿主细胞识别为将聚腺苷酸残基添加到转录的mRNA的信号。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞,优选的聚腺苷酸化序列从以下者的基因获得:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α- 葡萄糖甘酶、米曲霉TAKA淀粉酶和尖孢镰刀霉类胰蛋白质酶。
对于酵母宿主细胞,合适的聚腺苷酸化序列在Guo and Sherman, 1995,Mol.Cellular Biol.15:5983-5990中有述。
控制序列还可以是信号肽编码区,其编码与多肽的N末端连接的信号肽并指导多肽进入细胞的分泌路径。多核苷酸的编码序列的5’-末端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段天然连接的信号肽编码序列。或者,编码序列的5’-末端可以含有对编码序列而言是外源的信号肽编码序列。当编码序列天然不含信号肽编码序列时,可能需要外源信号肽编码序列。或者,外源信号肽编码序列可以简单地替换天然信号肽编码序列以增强多肽的分泌。然而,可以使用指导表达的多肽进入宿主细胞的分泌路径的任何信号肽编码序列。
对于丝状真菌宿主细胞,有效的信号肽编码序列是从以下者的基因中获得的信号肽编码序列:黑曲霉天然淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉酯酶、和米赫根毛酶天门氨酸蛋白质酶。
对于酵母宿主细胞、例如用于生产白蛋白的酵母宿主细胞,优选的信号肽,或其变体、片段和/或融合物包括:
从酿酒酵母α-因子的基因获得的信号肽,
从酿酒酵母转化酶的基因获得的信号肽,
从酿酒酵母KEX2的基因获得的信号肽,例如,包含SEQ ID NO: 17或者由其组成,或者修饰的KEX2信号肽,例如包含SEQ ID NO:18 或者由其组成。
特别优选的信号肽包括:
包含交配因子α信号肽序列和人白蛋白信号肽序列的融合物的信号肽,如WO90/01063(并入本文以供参考)中所教导的,这种信号肽序列的实例提供于SEQ ID NO:19;
包含SEQ ID NO:20的五肽基序的信号肽,其中五肽基序位于信号肽序列的疏水结构域中,例如位于未成熟蛋白质的-10至-25位,其中位置-1是指紧邻成熟序列的第一个氨基酸的N末端的信号肽序列的氨基酸;或者位于包含前肽位置-1的信号肽序列,前肽位置-1是指紧邻前肽第一个氨基酸的N末端的信号肽序列的氨基酸,这种信号肽序列的实例公开于WO2004/009819(并入本文以供参考)中;
被修饰以包含SEQ ID NO:20的五肽基序的白蛋白信号肽,该五肽基序可以位于信号肽序列的疏水结构域中,这种修饰的信号肽序列的实例提供于SEQ ID NO:21。可将五肽基序插入转化酶信号肽中以产生修饰的转化酶信号肽,修饰的转化酶信号肽的实例提供于SEQ ID NO:41和SEQ ID NO:42中;或者白蛋白信号肽,其经修饰以包含SEQ ID NO:20的五肽基序并且在信号肽序列的C’末端包含前肽,五肽基序可位于信号肽序列的疏水结构域中,这种修饰的信号肽序列的实例提供于SEQ ID NO:22,SEQ ID NO:23和SEQ ID NO:24中。
特别优选包含SEQ ID NO:19,SEQ ID NO:24和SEQ ID NO:42 或者由其组成的信号肽,例如用于白蛋白或其变体、片段和/或融合物的表达。
其它有用的信号肽编码序列在上文的Romanos等,1992中有述。
控制序列也可以是编码位于多肽N末端的前肽的前肽编码序列。所得多肽已知为酶原或多肽原(在某些情况下为酶原)。多肽原通常是无活性的并且可以通过多肽的催化或自催化裂解从多肽原转化为活性多肽。前肽编码序列可以从酿酒酵母α-因子的基因获得。
当存在信号肽和前肽序列时,前肽序列紧邻于多肽的N末端且信号肽紧邻于前肽序列的N末端。
加入调节相对于宿主细胞生长的多肽表达的调节序列也可能是期望的。调节体系的实例是引起响应于化学或物理刺激(包括调控化合物的存在)的基因表达的开启或关闭的那些体系。在酵母中,可以使用ADH2体系或GAL1体系。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子,米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的实例。在真核体系中,这些调节序列包括在甲氨喋呤存在下扩增的二氢叶酸还原酶基因,和用重金属扩增的金属硫蛋白质基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。
宿主菌株可以或可以不表达、或者过表达一种或多种分子伴侣蛋白质,如在WO2005/061718、WO2006/067511、WO2006/136831或 WO2014/138371所述的那些(均通过引入并入本文)。例如,宿主菌株可以或可以不表达、或者过表达一种或多种:AHA1、CCT2、CCT3、 CCT4、CCT5、CCT6、CCT7、CCT8、CNS1、CPR3、CPR6、ERO1、 EUG1、FMO1、HCH1、HSP10、HSP12、HSP104、HSP26、HSP30、 HSP42、HSP60、HSP78、HSP82、JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、ATP11、ATP12、BTT1、CDC37、CPR7、 HSC82、KAR2、LHS1、MGE1、MRS11、NOB1、ECM10、SSA1、SSA2、 SSA3、SSA4、SSC1、SSE2、SIL1、SLS1、ORM1、ORM2、PER1、PTC2、PSE1、UBI4和HAC1或者切割的无内含子的HAC1(Valkonen等人,2003, AppliedEnviron.Micro.,69:2065),以及TIM9、PAM18(也称为TIM14) 和TCP1(也称为CCT1)或其变体。优选PDI1(SEQ ID NO:25)或其变体或片段和/或ERO1(SEQ ID NO:26)或其变体或片段的过表达。相对于分子蛋白质在宿主细胞中的天然表达水平,过表达包括使分子伴侣的表达增加至少25%、50%、75%、100%、200%、300%、400%、 500%。过表达可以对应于分子伴侣量的增加,或者分子伴侣活性的增加。过表达可以通过增加编码分子伴侣的基因的拷贝数增加而实现,例如通过提供包含基因的2、3、4、5、6、7、8、9、10或更多个拷贝的宿主细胞。优选地,变体分子伴侣与分子伴侣具有至少70%、75%、 80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列一致性。优选地,变体保持了分子伴侣的功能活性。
宿主细胞可包含或不包含至少一种编码蛋白质酶或其片段和/或变体的异源核酸。宿主细胞可包含或不包含至少一种编码蛋白质酶的核酸,例如钙依赖性丝氨酸蛋白质酶,例如杀伤表达蛋白质酶(Kex2p) 或其片段和/或变体。优选蛋白质酶变体或片段是功能性的,例如具有在识别序列Arg-Arg/X或Lys-Arg/X的羧基末端切割多肽的能力。KEX2 核苷酸序列可包含SEQ ID NO:27或由其组成,Kex2p蛋白质可包含 SEQ ID NO:28或由其组成。KEX2和Kex2p的变体可以分别与SEQ ID NO:27和SEQ ID NO:28具有至少70、75、80、85、90、95、96、97、 98或99%的同一性。KEX2可能会或可能不会过表达。
优选的宿主细胞,最优选酿酒酵母,过表达PDI1和/或ERO1,包含至少一个编码Kex2p的核酸。
编码Gsh1蛋白质、Not4蛋白质或其同系物和期望的蛋白质的核苷酸序列可以使用本领域已知的任何诱变方法来制备,如定点诱变,合成基因构建,半合成基因构建,随机诱变,改组等等来制备。
定点诱变是一种技术,其中在编码亲本的多核苷酸中一个或更多个限定位点处引入一个或更多个(例如几个)突变。
定点诱变可以通过PCR体外完成,包括使用含有所需突变的寡核苷酸引物。定点诱变还可以通过盒式诱变在体外进行,包括在包含编码亲本的多核苷酸的质粒中的位点处通过限制酶切割并随后连接在多核苷酸中含有突变的寡核苷酸。通常消化质粒和寡核苷酸的限制酶是相同的,允许质粒和插入物的粘性末端彼此连接。参见,例如Scherer 和Davis,1979,Proc.Natl.Acad.Sci.USA 76:4949-4955;和Barton等, 1990,Nucleic AcidsRes.18:7349-4966。
定点诱变还可以通过本领域已知的方法体外完成。参见,例如美国专利申请公开第2004/0171154号;Storici等,2001,Nature Biotechnol. 19:773-776;Kren等,1998,Nat.Med.4:285-290;以及Calissano和 Macino,1996,Fungal Genet.Newslett.43:15-16。
任何定点诱变过程可被用于本发明。有许多可用于制备多肽的商业试剂盒。
合成基因构建需要体外合成设计的多核苷酸分子以编码感兴趣的多肽。基因合成可以利用多种技术进行,例如Tian等人描述的基于多重微芯片的技术(multiplexmicrochip-based technology)(2004,Nature 432:1050-1054)以及其中寡核苷酸在光可编程微流控芯片 (photo-programmable microfluidic chips)上合成和组装的类似技术。
可以使用已知的诱变、重组和/或改组方法进行单个或多个氨基酸取代、缺失和/或插入并进行测试,然后进行相关的筛选程序,如在以下公开的那些:Reidhaar-Olson和Sauer,1988,Science 241:53-57; Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156; WO95/17413或WO95/22625。其它可用的方法包括易错PCR,噬菌体展示(例如,Lowman等,1991,Biochemistry 30:10832-10837;U.S专利第5,223,409号;WO92/06204)和区域定向诱变(Derbyshire等,1986, Gene 46:145;Ner等,1988,DNA 7:127)。
可以将诱变/改组方法与高通量自动筛选方法结合以检测由宿主细胞表达的克隆的诱变多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。编码活性多肽的诱变DNA分子可以从宿主细胞中回收并使用本领域的标准方法快速测序。这些方法可以快速确定多肽中单个氨基酸残基的重要性。
通过将合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的方面结合来实现半合成基因构建。半合成构建通常是通过利用合成的多核苷酸片段与PCR技术相结合的方法。因此可以从头合成限定的基因区域,而其它区域可以使用位点特异性诱变引物扩增,而其它区域可以进行易错PCR或非易错PCR扩增。然后可以改组多核苷酸子序列。
本发明的第二方面提供一种含有编码期望的蛋白质如异源蛋白质的多核苷酸序列的真菌宿主细胞培养物,其特征在于真菌宿主细胞具有修饰的(如降低的)Gsh1蛋白质或同系物的活性水平,和/或修饰的 (如降低的)Gsh1蛋白质或其同系物的表达水平。
根据本发明第二方面的真菌宿主细胞的培养物可能还具有修饰的 (如降低的)Not4蛋白质或同系物的活性水平,和/或修饰的(如降低的)Not4蛋白质或其同系物的表达水平。根据本发明第二方面的真菌宿主细胞如本发明第一方面所述。
替代地,本发明的第二方面提供一种含有编码所需蛋白质如异源蛋白质的多核苷酸序列的真菌宿主细胞培养物,其特征在于所述真菌宿主细胞具有增加的Gsh1蛋白质或其同系物的活性水平,和/或增加的Gsh1蛋白质或其同系物的表达水平。这对于产生对宿主生存力有害的期望的蛋白质可能是有用的。根据本发明的该替代性第二方面的真菌宿主细胞如本发明第一方面所述。
本发明的第二方面提供一种含有编码所需蛋白质如异源蛋白质的多核苷酸序列的真菌宿主细胞培养物,其特征在于所述真菌宿主细胞具有(i)增加的Gsh1蛋白质或其同系物的活性水平,和/或增加的Gsh1 蛋白质或其同系物的表达水平;和(ii)增加的Not4蛋白质或其同系物的活性水平,和/或增加的Not4蛋白质或其同系物的表达水平。这对于产生对宿主生存力有害的期望的蛋白质可能是有用的。根据本发明的该替代性第二方面的真菌宿主细胞如本发明第一方面所述。
该方法可以包括在谷胱甘肽存在下培养。当真菌宿主缺乏功能性 Gsh1蛋白质(例如由于突变或缺失)时,这特别有用。当真菌宿主细胞包含功能性或部分功能性Gsh1蛋白质时,它也可能有用。谷胱甘肽在发酵培养基中的存在量至少为0.05mM,例如约0.05mM、0.1mM、 0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9 mM、1mM、2mM、3mM、4mM、5mM、10mM、20mM、30mM、 40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、 200mM、250mM、300mM、350mM、400mM、450mM至约0.1mM、 0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9 mM、1mM、2mM、3mM、4mM、5mM、10mM、20mM、30mM、 40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、 200mM、250mM、300mM、350mM、400mM、450mM、500mM,优选约0.5mM至约50mM,更优选约1mM至约10mM,更优选约3 mM至约7mM,最优选约5mM。
本发明的第三方面提供一种用于从真菌宿主细胞产生期望的蛋白质如异源蛋白质的方法,该方法包括提供根据本发明第一方面的真菌宿主细胞或根据第二方面的培养物,并且培养真菌宿主细胞或培养物以产生期望的蛋白质。该方法可用于改变来自真菌宿主细胞的期望多肽的产量。在某些情况下,可能需要增加一种或更多种蛋白质的产量。在其它情况下,可能需要降低一种或更多种蛋白质的产量,例如可能对宿主细胞有毒性的蛋白质。
期望的蛋白质可以从或可以不从宿主细胞分泌,优选分泌的蛋白质。
可以使用本领域已知的方法在适于产生期望的蛋白质的营养培养基中培养宿主细胞。例如,细胞可以通过摇瓶培养,或通过在实验室或工业发酵罐中小规模或大规模发酵(包括连续、间歇、分批补料或固态发酵)进行培养,在合适的培养基和允许多肽表达和/或分离的条件下进行。培养可以使用本领域已知的过程在包含碳源和氮源以及无机盐的合适的营养培养基中进行。合适的培养基可从商业供应商获得,或者可根据公开的组成(例如,在美国典型培养物保藏中心的目录中) 制备。优选的培养基包括如实施例5中所述的MW11D。如果期望的蛋白质分泌到营养培养基中,则可以从培养基中直接回收期望的蛋白质。如果所需蛋白质不分泌,则可从细胞裂解物中回收。
培养可以是小规模或大规模的,例如微量滴定板规模(例如10-500 微升培养物体积的培养基),摇瓶规模(例如5-1000毫升(mL)培养基体积),或者发酵罐或同等系统规模(例如至少5mL培养物体积,更优选至少1、2、3、4或5升(L),更优选至少10、50、100L,例如至少500、1000、2000、3000、4000、5000、6000、7000、8000、9000、 10000、20000、30000L培养物体积)。
培养可以处于适合于宿主细胞的pH。对酿酒酵母,优选的pH为 5-7,例如从5、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9、6、6.1、 6.2、6.3、6.4、6.5、6.6、6.7、6.8或6.9至5.1、5.2、5.3、5.4、5.5、 5.6、5.7、5.8、5.9、6、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9 或7。优选的pH范围是约6.0至约6.4。
培养可以在约20℃至约35℃的温度下进行,例如约20℃、21℃、 22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、 32℃、33℃、34℃至约21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃或35℃,优选约28℃至约32℃,更优选约30℃。
培养可以涉及或不涉及搅拌,例如旋转培养容器或通过在培养容器内使用搅拌器。搅拌是优选的。
可以使用本领域已知的对期望的蛋白质特异性的方法检测期望的蛋白质。这些检测方法包括但不限于使用特异性抗体或高效液相色谱 (HPLC)。
优选的HPLC是凝胶渗透HPLC(GP-HPLC)。合适的设备包括在Shimadzu VP7.3客户服务软件控制下的装配有UV探测的LC2010 HPLC系统(Shimadzu)。用6.0mm id x 40mm长度的TSK SW保护柱(Tosoh Bioscience),在7.8mm id x 300mm长度的TSK G3000SWXL 柱上(Tosoh Bioscience)进行75μL的注射。样品可以在25mM磷酸钠、100mM硫酸钠、0.05%(w/v)叠氮化钠中进行色谱分析,在 1mL.min-1pH为7.0,运行时间20分钟。样品可以通过在280nm处的紫外探测通过相对于已知浓度(例如10mg/mL)的重组人白蛋白标准品的峰面积进行定量,并校正其相对消光系数。
任选地,该方法包括回收期望的蛋白质,例如从宿主细胞或宿主细胞培养物、例如细胞培养基或细胞裂解物中分离期望的蛋白质。
期望的蛋白质可以使用本领域已知的方法回收。例如,可通过常规程序从营养培养基中回收期望的蛋白质,所述常规程序包括但不限于收集,离心,过滤,提取,喷雾干燥,蒸发或沉淀。
任选地,该方法包括纯化期望的蛋白质。所需蛋白质可通过本领域已知的多种方法纯化以获得基本纯的期望的蛋白质,包括但不限于色谱法(例如离子交换,亲和力,疏水,色谱聚焦和尺寸排除),电泳程序(例如制备性等电聚焦),差示溶解度(例如硫酸铵沉淀),SDS-PAGE,或提取(参见例如Protein Purification,Janson和Ryden, editors,VCHPublishers,New York,1989)。
在另一方面,不回收期望的蛋白质,而是将表达期望的蛋白质的本发明的宿主细胞用作期望的蛋白质的来源。
从培养的宿主细胞或培养基中纯化期望的蛋白质(例如期望的异源蛋白质)的步骤任选地包括细胞固定,细胞分离和/或细胞破碎,但总是包含至少一个与细胞固定、分离和/或破裂步骤不同的纯化步骤。
细胞固定技术如使用藻酸钙珠包裹细胞,是本领域已知的。类似地,细胞分离技术例如离心、过滤(例如错流过滤)、膨胀床层析等是本领域已知的。同样,细胞破碎的方法,包括珠磨、超声处理、酶促暴露等在本领域中是已知的。
该至少一个其它纯化步骤可以是本领域已知适用于蛋白质纯化的任何其它步骤。例如,用于回收重组表达的白蛋白的纯化技术已经在以下公开:WO2010/128142,使用白蛋白特异性配体如2-氯-4,6-二(2’- 磺基苯胺基)-S-三嗪的亲和力纯化,WO92/04367,基质衍生的染料的去除;EP 464590,酵母衍生的着色剂的去除;EP319067,碱性沉淀和随后将白蛋白应用于亲脂相;以及WO96/37515、US5728553和 WO00/44772,其描述了完整的纯化过程;其全部并入本文以供参考。
通过已发现可用于纯化这些蛋白质的任何技术可以从培养基中纯化除白蛋白以外的期望蛋白质。
合适的方法包括硫酸铵或乙醇沉淀,酸或溶剂提取,阴离子或阳离子交换色谱,磷酸纤维素色谱,疏水相互作用色谱,亲和力色谱,羟基磷灰石色谱,凝集素色谱,浓缩,稀释,pH调节,渗滤,超滤,高效液相色谱法(“HPLC”),反相HPLC,电导率调整等。
任选地,该方法可以包括将分离的蛋白质纯化至商业或工业上可接受水平的纯度。按商业或工业上可接受的纯度水平,我们包括提供以下浓度的蛋白质:至少0.01g.L-1、0.02g.L-1、0.03g.L-1、0.04g.L-1、 0.05g.L-1、0.06g.L-1、0.07g.L-1、0.08g.L-1、0.09g.L-1、0.1g.L-1、0.2g.L-1、 0.3g.L-1、0.4g.L-1、0.5g.L-1、0.6g.L-1、0.7g.L-1、0.8g.L-1、0.9g.L-1、1g.L-1、2g.L-1、3g.L-1、4g.L-1、5g.L-1、6g.L-1、7g.L-1、8g.L-1、9g.L-1、 10g.L-1、15g.L-1、20g.L-1、25g.L-1、30g.L-1、40g.L-1、50g.L-1、60g.L-1、 70g.L-1、80g.L-1、90g.L-1、100g.L-1、150g.L-1、200g.L-1、250g.L-1、 300g.L-1、350g.L-1、400g.L-1、500g.L-1、600g.L-1、700g.L-1、800g.L-1、 900g.L-1、1000g.L-1或更多。按商业或工业上可接受的纯度水平,我们包括提供其中其它物质(例如,一种或多种(例如数种)污染物)以以下水平存在的分离的蛋白质:小于50%、40%、30%、20%、10%、 5%、4%、3%、2%、1%、0.5%、0.1%、0.01%、0.001%、0.0001%、0.00001%、或0.000001%且最优选在0%的水平。
该蛋白质可以以下浓度提供:至少0.01g.L-1、0.02g.L-1、0.03g.L-1、 0.04g.L-1、0.05g.L-1,0.06g.L-1,0.07g.L-1、0.08g.L-1、0.09g.L-1、0.1g.L-1、 0.2g.L-1、0.3g.L-1、0.4g.L-1、0.5g.L-1、0.6g.L-1、0.7g.L-1、0.8g.L-1、 0.9g.L-1、1g.L-1、2g.L-1、3g.L-1、4g.L-1、5g.L-1、6g.L-1、7g.L-1、8 g.L-1、9g.L-1、10g.L-1、15g.L-1、20g.L-1、25g.L-1、30g.L-1、40g.L-1、50g.L-1、60g.L-1、70g.L-1、80g.L-1、90g.L-1、100g.L-1、150g.L-1、 200g.L-1、250g.L-1、300g.L-1、350g.L-1、400g.L-1、500g.L-1、600g.L-1、 700g.L-1、800g.L-1、900g.L-1、1000g.L-1或更高。
优选将所需蛋白质纯化以达到药学上可接受的纯度水平。如果蛋白质基本上不含热原并且可以以药学有效量施用而不引起与蛋白质活性无关的医学效应,则该蛋白质具有药学上可接受的纯度水平。
任选地,该方法进一步包括用治疗上可接受的载体或稀释剂配制期望的蛋白质,从而产生适合施用于人或动物的治疗产品。
所得到的期望的蛋白质可以或可以不用于其任何已知用途,在白蛋白的情况下其包括向患者静脉内(i.v.)施用以治疗严重烧伤、休克和失血,补充培养基,并作为其它蛋白质制剂中的赋形剂。
尽管通过本发明的方法获得的治疗上、诊断上、工业上、家庭上或营养上有用的期望的蛋白质可以单独出现或单独给药,但优选其与一种或多种可接受的载体或稀释剂作为制剂(例如药物制剂,特别是治疗上和/或诊断上有用的蛋白质的情况)。载体或稀释剂在与期望的蛋白质相容的意义上必须是“可接受的”,并且如果制剂旨在给予接受者,则对接受者无害。通常,载体或稀释剂将是无菌且无热原的水或盐水。
任选地,如此配制的蛋白质将以单位剂型存在,例如以片剂、胶囊、注射溶液等形式存在。
任选地,该方法进一步包括提供单位剂型的期望的蛋白质。
本发明的第四方面提供一种用于增加期望的蛋白质(如异源蛋白质)的产量的方法,其包含根据本发明第三方面的方法。
本发明的第四方面还提供根据本发明第一方面的宿主细胞或根据本发明第二方面的培养物用于增加期望的蛋白质(如异源蛋白质)的产量的用途。
产量是指溶液(例如培养液或细胞溶解混合物)中产品(例如期望的蛋白质)的量。产量可以用相对术语表示,例如,对照宿主菌株的产量为100%。当比较宿主菌株时,优选在定义的一组条件下测量产量。绝对产量可表示为纳克每微升(ng/μL)或克每升(g/L)。产量也可以表示为比细胞生产率(YPXT)的速率。
优选地,期望的蛋白质的产量比来自参照真菌宿主细胞,如具有野生型Gsh1蛋白质如SEQ ID NO:2的真菌宿主细胞的产量(g/L或 YPXT)高至少2%,更优选高至少3%、4%、5%、6%、7%、8%、9%、 10%、12.5%、15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、 40%、45%或至少50%。优选的参照真菌宿主细胞具有SEQ ID NO:2 的Gsh1蛋白质。
优选地,期望的蛋白质的产量比来自参照真菌宿主细胞,如具有野生型Not4蛋白质如SEQ ID NO:6的真菌宿主细胞的产量(g/L或 YPXT)高至少2%,更优选高至少3%、4%、5%、6%、7%、8%、9%、 10%、12.5%、15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、 40%、45%或至少50%。优选的参照真菌宿主细胞具有SEQ ID NO:6 的Not4蛋白质。
优选地,期望的蛋白质的产量比来自参照真菌宿主细胞,如具有野生型Gsh1蛋白质如SEQ ID NO:2,和如具有野生型Not4蛋白质如 SEQ ID NO:6的真菌宿主细胞的产量(g/L或YPXT)高至少2%,更优选高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、17.5%、 20%、22.5%、25%、27.5%、30%、35%、40%、45%或至少50%。优选的参照真菌宿主细胞具有SEQ ID NO:2的Gsh1蛋白质和SEQ ID NO:6的Not4蛋白质。
期望的蛋白质可以如本发明第一方面所述,特别是白蛋白或其变体,片段和/或融合物。
本发明的第五方面提供通过根据本发明的第三或第四方面的方法产生的期望的蛋白质(例如异源蛋白质)。
本发明还提供包含本发明第五方面的期望的蛋白质的组合物,如药物组合物。药物组合物可包含一种或多种药学上可接受的载体,如由管理机构(如美国食品和药物管理局或欧洲药品管理局)批准的那些。本发明进一步提供了治疗患者的方法,包括向患者施用有效量的药物组合物。
本发明的第六方面提供一种制备根据本发明第一方面的真菌宿主细胞或根据本发明第二方面的培养物的方法。该方法包括遗传修饰(亲本)真菌宿主细胞以修饰所得Gsh1蛋白质或其同系物,以修饰,例如降低Gsh1蛋白质或其同系物的活性水平,以修饰GSH1基因或其同系物或其控制序列,或以修饰GSH1基因或其同系物的表达水平。任选地,该方法还可包括遗传修饰(亲本)真菌宿主细胞以修饰所得Not4 蛋白质或其同系物,以修饰,例如降低Not4蛋白质或其同系物的活性水平,修饰NOT4基因或其同系物或其控制序列,或修饰NOT4基因或其同系物的表达水平。活性和/或表达水平的变异、缺失和修饰可以如本发明的第一、第二和第三方面所述。用于基因改造宿主细胞的方法在本领域中是已知的。作为宿主细胞遗传修饰的替代方法,可以通过在生长培养基中添加抑制剂或增强剂来修饰Gsh1蛋白质或活性的水平。同样,作为宿主细胞遗传修饰的替代方法,可以通过在生长培养基中添加抑制剂或增强剂来修饰Not4蛋白质或活性的水平。
本发明的第七方面提供一种Gsh1蛋白质或其同系物,其包含与 SEQ ID NO:2至少50%的同一性和在对应于选自SEQ ID NO:2以下一个或更多个位置的位置处的突变:47、48、49、50、51、120、121、 122、123、124、125、126、127、128、129、130、409、451、452、 453、454和455,优选选自以下位置:(a)57至51;(b)120至130; (c)409或(d)451至455。特别优选在对应于SEQ ID NO:2位置125 的位置处的突变。
根据本发明的第七方面的Gsh1蛋白质可以如关于本发明的第一方面所述。优选地,Gsh1蛋白质包含SEQ ID NO:4或由其组成。本发明第七方面的Gsh1蛋白质可以是或不是分离的蛋白质。
本发明的第八方面提供一种编码本发明的Gsh1变体的多核苷酸,如SEQ ID NO:2的变体,该变体相比于编码野生型Gsh1蛋白质如SEQ ID NO:2或其同系物的宿主细胞,导致更低水平的Gsh1蛋白质或其同系物的表达、和/或导致更低活性水平的Gsh1蛋白质或其同系物。在本发明的第一至第六方面中描述了这种Gsh1蛋白质。
优选的多核苷酸编码具有突变R125G(SEQ ID NO:4)的Gsh1蛋白质,这种多核苷酸序列的实例由SEQ ID NO:3提供。
例如,本发明还涉及包含编码本发明的Gsh1变体的多核苷酸的核酸构建体,该多核苷酸可操作地连接至一个或更多个控制序列,该控制序列指导编码序列在合适的宿主细胞中在与对照序列相容的条件下的表达。在本发明的第一至第七方面中描述了合适的控制序列。
该核酸构建体此外还包含编码本发明的Not4变体的多核苷酸的核酸构建体,该多核苷酸可操作地连接至一个或更多个控制序列,该控制序列指导编码序列在合适的宿主细胞中在与对照序列相容的条件下的表达。在本发明的第一至第六方面中描述了合适的控制序列。多核苷酸可以位于载体上或宿主细胞的基因组中。
因此,本发明还涉及包含编码本发明的Gsh1变体的多核苷酸、启动子以及转录和翻译终止信号的重组载体。任选地,该载体还包含编码本发明的Not4变体的多核苷酸、启动子以及转录和翻译终止信号。 Gsh1可以编码在与Not4相同的多核苷酸(例如载体)上或不同的多核苷酸(例如载体)上。本发明还涉及包含编码Gsh1和一个或更多个(例如几个)控制序列的多核苷酸的载体,该控制序列引起Gsh1或Gsh1 活性的水平被修饰,例如降低。任选地,该多核苷酸(例如载体)还包含编码Not4和一个或更多个(例如几个)控制序列的多核苷酸的载体,该控制序列引起Not4或Not4活性水平被修饰,例如被减少。可将各种核苷酸和控制序列连接在一起以产生重组载体,其可包含一个或更多个方便的限制性位点以允许在这些位点插入或取代编码变体的多核苷酸。或者,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的合适载体来表达多核苷酸。在创建载体时,编码序列位于载体中,使得编码序列与适当的用于表达的控制序列可操作地连接。
重组载体可以是可以方便地进行重组DNA操作并可以引起多核苷酸表达的任何载体(例如质粒或病毒)。载体的选择通常取决于载体与待导入载体的宿主细胞的相容性。载体可以是线性或闭环质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外因子、微染色体或人工染色体。载体可包含任何用于确保自我复制的手段。或者,载体可以是当被引入宿主细胞时整合到基因组中并与其中已整合的染色体一起复制的载体。此外,可以使用单个载体或质粒或两种或更多种载体或质粒,其共同含有待引入宿主细胞基因组中的总DNA或转位子。
载体优选含有一个或更多个选择性标志物,其允许选择转化的、转染的、转导等的细胞。选择性标志物是基因,其产物提供杀生物剂或病毒抗性,对重金属的抗性,对营养缺陷型的原养型等。
载体优选含有允许载体整合到宿主细胞基因组中的元件或者载体在细胞中独立于基因组的自主复制。
为了整合到宿主细胞基因组中,载体可以依赖于编码变体的多核苷酸序列或为了通过同源或非同源重组整合到基因组中的载体的任何其它元件。或者,载体可含有用于指导通过同源重组在染色体中精确位置处整合到宿主细胞基因组中的额外多核苷酸。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,例如100至10,000 个碱基对,400至10,000个碱基对和800至10,000个碱基对,其与相应的靶序列具有高度的序列同一性以增强同源重组的可能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码多核苷酸。另一方面,可以通过非同源重组将载体整合到宿主细胞的基因组中。
对于自主复制,载体可以进一步包含使得载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是任何在细胞中起作用的介导自主复制的质粒复制子。术语“复制起点”或“质粒复制子”是指使质粒或载体能够在体内复制的多核苷酸。
用于酵母宿主细胞的复制起点的例子是2微米复制起点,ARS1, ARS4,ARS1和CEN3的组合,以及ARS4和CEN6的组合。
可用于丝状真菌细胞的复制起点的实例为AMA1和ANS1(Gems 等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Res.15: 9163-9175;WO00/24883)。AMA1基因和含有该基因的质粒构建体或载体的分离可以根据WO00/24883中所述的方法完成。
可以将多于一个本发明的多核苷酸拷贝插入宿主细胞中以增加期望的蛋白质的产量。多核苷酸的拷贝数的增加可以通过以下方法获得:将至少一个额外的序列拷贝整合到宿主细胞基因组中,或通过包括具有多核苷酸的可扩增选择性标志物基因,其中细胞包含选择性标记基因的扩增拷贝,从而可以通过在合适的选择性试剂存在下培养细胞来选择多核苷酸的额外拷贝。
用于连接上述元件的以构建本发明的重组载体的过程对本领域技术而言而言是已知的(参见,例如Sambrook等,1989,Molecular Cloning, A Laboratory Manual,2dedition,Cold Spring Harbor,New York)。
优选的实施方式
1.一种真菌宿主细胞,其具有修饰的:
a.Gsh1蛋白质或其同系物,和/或
b.Gsh1蛋白质或其同系物的活性水平或表达水平,和/或
c.GSH1基因或其同系物,和/或
d.GSH1基因或其同系物的表达水平。
2.实施方式1的真菌宿主细胞,其中修饰的水平是降低的水平。
3.实施方式1的真菌宿主细胞,其中修饰的水平是增加的水平。
4.前述任一项实施方式的真菌宿主细胞,其中修饰的水平是相对于参照真菌宿主细胞的水平,参照真菌宿主细胞如:
a.Gsh1蛋白质或其同系物是野生型Gsh1蛋白质或其同系物的真菌宿主细胞,
b.Gsh1蛋白质包含SEQ ID NO:2或由SEQ ID NO:2组成的真菌宿主细胞,
c.酿酒酵母S288C或者
d.酿酒酵母DXY1。
5.实施方式1至4中任一项的真菌宿主,其具有修饰的:
e.Not4蛋白质或其同系物,和/或
f.Not4蛋白质或其同系物的活性水平或表达水平,和/或
g.NOT4基因或其同系物,和/或
h.NOT4基因或其同系物的表达水平。
6.实施方式5的真菌宿主细胞,其中修饰的水平是降低的水平。
7.实施方式5的真菌宿主细胞,其中修饰的水平是增加的水平。
8.实施方式5或6的真菌宿主细胞,其中修饰的水平是相对于参照真菌宿主细胞的水平,参照真菌宿主细胞如:
a.Not4蛋白质或其同系物是野生型Not4蛋白质或其同系物的真菌宿主细胞,
b.Not4蛋白质包含SEQ ID NO:6或由SEQ ID NO:6组成的真菌宿主细胞,
c.酿酒酵母S288C或者
d.酿酒酵母DXY1。
9.根据前述任一项实施方式的真菌宿主细胞,其包含编码期望的蛋白质如异源蛋白质的核苷酸序列。
10.根据实施方式9的真菌宿主细胞,其中期望的蛋白质选自白蛋白,单克隆抗体,依托泊苷,血清蛋白质(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白质,乳铁蛋白质,内皮抑素,血管抑制素,胶原,免疫球蛋白质或基于免疫球蛋白质的分子或片段之一(例如,Small Modular ImmunoPharmaceuticalTM(“SMIP”)或dAb、Fab’片段、F(ab’)2、scAb、scFv或scFv片段),Kunitz结构域蛋白质(如在 WO03/066824(并入本文以供参考)中所述的那些,具有或不具有白蛋白融合物),干扰素,白细胞介素,IL-10,IL-11,IL-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,CNTF, CNTFAx15,IL-1-受体拮抗剂,红细胞生成素(EPO)和EPO模拟物,血小板生成素(TPO)和TPO模拟物,prosaptide,蓝藻抗病毒蛋白质-N,五螺旋蛋白质,T20肽,T1249肽,HIV gp41,HIV gp120,尿激酶,尿激酶原,tPA,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、GLP-1 或GLP-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,G-CSF,GM-CSF,M-CSF,FGF,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白质原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白质酶、纤溶酶原激活剂、因子VII、因子VIII、因子IX、因子X和因子XIII),神经生长因子,LACI,血小板衍生内皮细胞生长因子(PD-ECGF),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白质,间-α胰蛋白质酶抑制剂,抗凝血酶III,载脂蛋白质种,蛋白质C,蛋白质S,代谢物,抗生素,或上述任一项的变体或片段。
11.根据实施方式9或10的真菌宿主细胞,其中期望的蛋白质包含白蛋白、其变体、片段和/或融合物,或者由白蛋白、其变体、片段和/或融合物组成。
12.根据实施方式11的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与SEQ ID NO:10具有至少70%的同一性。
13.根据实施方式11的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与SEQ ID NO:10具有至少75%、80%、85%、90%、91%、 92%、93%、95%、96%、97%、98%或99%的同一性。
14.根据实施方式13的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与SEQ ID NO:10具有至少70%的同一性,优选与SEQ ID NO:10具有至少75%、80%、85%、90%、91%、92%、93%、95%、 96%、97%、98%或99%的同一性,并且在对应于SEQ ID NO:10的 K573位置处包含A、C、D、E、F、G、H、I、L、M、N、P、Q、R、 S、T、V、W或Y。
15.根据实施方式14的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物在对应于SEQ ID NO:10的K573位置处包含P、H、W 或Y。
16.根据实施方式15的真菌宿主细胞,其中白蛋白、其变体、片段和/或融合物与SEQ ID NO:10具有至少98%的同一性,并且在对应于SEQ ID NO:10的K573位置处包含P。
17.根据实施方式13至16中任一项的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与SEQ ID NO:10具有至少70%的同一性,优选与SEQ ID NO:10具有至少75%、80%、85%、90%、91%、92%、 93%、95%、96%、97%、98%或99%的同一性,并且在对应于SEQ ID NO:10的E492位置处包含A、C、D、F、G、H、I、K、L、M、N、 P、Q、R、S、T、V、W或Y。
18.根据实施方式17的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物在对应于SEQ ID NO:10的E492位置包含G、D、F、H、M或R。
19.根据实施方式18的真菌宿主细胞,其中白蛋白变体、片段和/ 或其融合物与SEQ ID NO:10具有至少98%的同一性,并且在对应于 SEQ ID NO:10的E492位置处包含G或D。
20.根据实施方式19的真菌宿主细胞,其中白蛋白变体、片段和/ 或其融合物与SEQ ID NO:10具有至少98%的同一性,并且在对应于 SEQ ID NO:10的E492位置处包含G。
21.根据实施方式13至20中任一项的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与SEQ ID NO:10具有至少70%的同一性,优选与SEQ ID NO:10具有至少75%、80%、85%、90%、91%、92%、 93%、95%、96%、97%、98%或99%的同一性,并且在对应于SEQ ID NO:10的K574位置处包含A、C、D、E、F、G、H、I、L、M、N、 P、Q、R、S、T、V、W或Y。
22.根据实施方式21的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物在对应于SEQ ID NO:10的K574位置处包含H、G、D、 F、N、S或Y。
23.根据实施方式22的真菌宿主细胞,其中白蛋白变体、片段和/ 或其融合物与SEQ ID NO:10具有至少98%的同一性,并且在对应于 SEQ ID NO:10的K574位置处包含D、F、G或H。
24.根据实施方式23的真菌宿主细胞,其中白蛋白变体、片段和/ 或其融合物与SEQ ID NO:10具有至少98%的同一性,并且在对应于 SEQ ID NO:10的K574位置处包含H。
25.根据实施方式13至24中任一项的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物与SEQ ID NO:10具有至少70%的同一性,优选与SEQ ID NO:10具有至少75%、80%、85%、90%、91%、92%、 93%、95%、96%、97%、98%或99%的同一性,并且在对应于SEQ ID NO:10的Q580位置处包含A、C、D、E、F、G、H、I、K、L、M、 N、P、R、S、T、V、W或Y。
26.根据实施方式25的真菌宿主细胞,其中白蛋白或其变体、片段和/或融合物在对应于SEQ ID NO:10的Q580位置处包含K或R。
27.根据实施方式26的真菌宿主细胞,其中白蛋白变体、片段和/ 或其融合物与SEQ ID NO:10具有至少98%的同一性,并且在对应于 SEQ ID NO:10的K573位置处包含K。
28.根据实施方式13至26中任一项的真菌宿主细胞,其中白蛋白融合物包含SEQID NO:45的白蛋白变体。
29.根据实施方式13至26中任一项的真菌宿主细胞,其中白蛋白变体包含SEQ IDNO:45或由其组成。
30.根据实施方式11-29中任一项的真菌宿主细胞,其中融合物包含融合配偶体,该融合配偶体不是白蛋白或者其变体或片段或融合物。
31.根据实施方式12-30中任一项的真菌宿主细胞,其中融合物包含选自以下的融合配偶体:单克隆抗体,依托泊苷,血清蛋白质(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白质,乳铁蛋白质,内皮抑素,血管抑制素,胶原,免疫球蛋白质或基于免疫球蛋白质的分子或片段之一(例如,Small Modular ImmunoPharmaceuticalTM (“SMIP”)或dAb、Fab’片段、F(ab’)2、scAb、scFv或scFv片段), Kunitz结构域蛋白质(如在WO03/066824(并入本文以供参考)中所述的那些),干扰素,白细胞介素,IL-10,IL-11,IL-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,CNTF,CNTFAx15, IL-1-受体拮抗剂,红细胞生成素(EPO)和EPO模拟物,血小板生成素(TPO)和TPO模拟物,prosaptide,蓝藻抗病毒蛋白质-N,五螺旋蛋白质,T20肽,T1249肽,HIV gp41,HIV gp120,尿激酶,尿激酶原,tPA,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、GLP-1或GLP-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,G-CSF,GM-CSF,M-CSF,FGF,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白质原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白质酶、纤溶酶原激活剂、因子 VII、因子VIII、因子IX、因子X和因子XIII),神经生长因子,LACI,血小板衍生内皮细胞生长因子(PD-ECGF),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白质,间-α胰蛋白质酶抑制剂,抗凝血酶 III,载脂蛋白质种,蛋白质C,蛋白质S,代谢物,抗生素,或上述任一项的变体或片段。
32.根据实施方式30或31的真菌宿主细胞,其中融合配偶体包含胰高血糖素样蛋白质或其类似物,或者由胰高血糖素样蛋白质或其类似物组成。
33.根据实施方式32的真菌宿主细胞,其中融合配偶体包含SEQ ID NO:14、SEQ IDNO:15、SEQ ID NO:51、或SEQ ID NO:52,或者由SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:51、或SEQ ID NO:52 组成。
34.根据实施方式9至33中任一项的真菌宿主细胞,其中期望的蛋白质包含SEQ IDNO:16,或者由其组成。
35.根据前述实施方式中任一项的真菌宿主细胞,其中修饰的Gsh1 蛋白质或其同系物的活性水平和/或表达水平是相对于亲本真菌宿主细胞(如野生型真菌宿主细胞)的Gsh1蛋白质或其同系物的活性水平或表达水平。
36.根据实施方式35的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的99%。
37.根据实施方式36的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的95%。
38.根据实施方式37的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的90%。
39.根据实施方式38的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的80%。
40.根据实施方式39的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的70%。
41.根据实施方式40的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的60%。
42.根据实施方式41的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的50%。
43.根据实施方式42的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的40%。
44.根据实施方式43的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Gsh1 蛋白质或其同系物的活性水平或表达水平的30%,优选不高于20%。
45.根据实施方式44的真菌宿主细胞,其中Gsh1蛋白质或其同系物的活性水平和/或表达水平减少至基本上为亲本真菌宿主细胞的 Gsh1蛋白质或其同系物的活性水平或表达水平的0%。
46.根据前述任一项实施方式的真菌宿主细胞,其中该宿主细胞缺乏功能性GSH1基因或其同系物或者功能性Gsh1蛋白质或其同系物。
47.根据前述任一项实施方式的真菌宿主细胞,其中该宿主细胞缺乏GSH1基因或其同系物或者Gsh1蛋白质或其同系物。
48.根据前述任一项实施方式的真菌宿主细胞,其中Gsh1蛋白质或其同系物在对应于选自SEQ ID NO:2以下位置的位置处包含突变: 47、48、49、50、51、120、121、122、123、124、125、126、127、 128、129、130、409、451、452、453、454和455。
49.根据实施方式48的真菌宿主细胞,其中该位置对应于SEQ ID NO:2的R125位置。
50.根据实施方式48或49的真菌宿主细胞,其中该位置对应于 SEQ ID NO:2的H409位置。
51.根据实施方式48至50中任一项的真菌宿主细胞,其中该位置对应于SEQ IDNO:2的P453位置。
52.根据实施方式48至51中任一项的真菌宿主细胞,其中突变是取代,优选取代为非保守氨基酸。
53.根据实施方式52的真菌宿主细胞,其中在对应于SEQ ID NO: 2的位置125的位置处的突变是取代为A、C、D、E、F、G、H、I、L、 M、N、P、Q、S、T、V、W或Y,优选取代为C、D、E或G,更优选取代为G。
54.根据实施方式48至53中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置125的位置处的突变是从带正电的氨基酸到脂肪族、芳族、疏水、小、微小、极性或带负电的氨基酸,优选带负电的氨基酸到微小氨基酸。
55.根据实施方式48至54中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置D49的位置处的突变是取代为A、C、F、G、 H、I、K、L、M、N、P、Q、R、S、T、V、W或Y,优选取代为H、 K或R,更优选取代为K或R。
56.根据实施方式48至55中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置49的位置处的突变是从带负电的氨基酸到带正电的氨基酸。
57.根据实施方式48至56中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置H409的位置处的突变是取代为A、C、D、E、 F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y,优选取代为 A、I、L、V、M、F、W、Y,更优选取代为A、I、L、V,最优选取代为L。
58.根据实施方式48至57中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置H409的位置处的突变是从芳族氨基酸到脂肪族氨基酸。
59.根据实施方式48至58中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置P453的位置处的突变是取代为A、C、D、E、 F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y,优选取代为 A、I、L、V、M、F、W、Y,更优选取代为A、I、L、V,最优选取代为L。
60.根据实施方式48至59中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:2的位置P453的位置处的突变是从芳族氨基酸到脂肪族氨基酸。
61.根据前述任一项实施方式的真菌宿主细胞,其中Gsh1蛋白质包含SEQ ID NO:4,或者由SEQ ID NO:4组成。
62.根据前述任一项实施方式的真菌宿主细胞,其包含修饰的GSH1基因,例如编码SEQ ID NO:4的多核苷酸。
63.根据实施方式5-62中任一项的真菌宿主细胞,其中修饰的Not4 蛋白质或其同系物的活性水平或表达水平是相对于亲本真菌宿主细胞 (如野生型真菌宿主细胞)的Not4蛋白质或其同系物的活性水平或表达水平。
64.根据实施方式63的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的90%。
65.根据实施方式64的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的80%。
66.根据实施方式65的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的70%。
67.根据实施方式66的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的60%。
68.根据实施方式67的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的50%。
69.根据实施方式68的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的40%。
70.根据实施方式69的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的30%。
71.根据实施方式70的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至不高于亲本真菌宿主细胞的Not4 蛋白质或其同系物的活性水平和/或表达水平的20%。
72.根据实施方式71的真菌宿主细胞,其中Not4蛋白质或其同系物的活性水平和/或表达水平减少至亲本真菌宿主细胞的Not4蛋白质或其同系物的活性水平和/或表达水平的基本上0%。
73.根据实施方式5至72的真菌宿主细胞,其中该宿主细胞缺乏功能性NOT4基因或其同系物或者功能性Not4蛋白质或其同系物。
74.根据实施方式5至73的真菌宿主细胞,其中该宿主细胞缺乏 NOT4基因或其同系物或者Not4蛋白质或其同系物。
75.根据实施方式5至74的真菌宿主细胞,其中将NOT4基因或其同系物或者Not4蛋白质或其同系物突变以改变Not4蛋白质或其同系物与Not1蛋白质或其同系物的相互作用。
76.根据实施方式5至75的真菌宿主细胞,其中Not4蛋白质或其同系物在对应于选自SEQ ID NO:6以下位置的位置处包含突变:426、 427、428、429、430、431、432、433、434、435、436、437、438、 439、440、441、442、443、444、445、446、447、448、449、450、 451、452、453、454、455、456、457、458、459、460、461、462、 463、464、465、466、467、468、469或470。
77.根据实施方式76的真菌宿主细胞,其中该位置选自对应于SEQ ID NO:6的429、430、434、或437的位置。
78.根据实施方式76或77的真菌宿主细胞,其中该位置选自对应于SEQ ID NO:6的463、464或466的位置。
79.根据实施方式76至78中任一项的真菌宿主细胞,其中该位置选自对应于SEQID NO:6的442、445、447或452的位置。
80.根据实施方式76至79中任一项的真菌宿主细胞,其中突变是取代,优选取代为非保守氨基酸。
81.根据实施方式76至80中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:6的位置429的位置处的突变是取代为A、C、D、E、 G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y,优选为G、A、V、L或I,更优选为I、L或V,最优选为I。
82.根据实施方式76至81中任一项的真菌宿主细胞,其中在对应于SEQ ID NO:6的位置429的位置处的突变是从芳族氨基酸取代为脂肪族氨基酸。
83.根据实施方式76至82中任一项的真菌宿主细胞,其中Not4 蛋白质包含SEQ IDNO:8,或者由SEQ ID NO:8组成。
84.根据前述任一项实施方式的真菌宿主细胞,其包含修饰的 NOT4基因,例如编码SEQ ID NO:8的多核苷酸。
85.根据前述任一项实施方式的真菌宿主细胞,其中宿主细胞缺乏 NOT4基因或其同系物或者Not4蛋白质或其同系物。
86.根据前述任一项实施方式的真菌宿主细胞,其中过表达以下一种或多种分子伴侣:AHA1、CCT2、CCT3、CCT4、CCT5、CCT6、CCT7、 CCT8、CNS1、CPR3、CPR6、ERO1、EUG1、FMO1、HCH1、HSP10、 HSP12、HSP104、HSP26、HSP30、HSP42、HSP60、HSP78、HSP82、 JEM1、MDJ1、MDJ2、MPD1、MPD2、PDI1、PFD1、ABC1、APJ1、 ATP11、ATP12、BTT1、CDC37、CPR7、HSC82、KAR2、LHS1、MGE1、 MRS11、NOB1、ECM10、SSA1、SSA2、SSA3、SSA4、SSC1、SSE2、 SIL1、SLS1、ORM1、ORM2、PER1、PTC2、PSE1、UBI4和HAC1或者截短的无内含子的HAC1、TIM9、PAM18、TCP1或其变体。
87.根据前述任一项实施方式的真菌宿主细胞,其中KEX2或其变体或片段表达或过表达。
88.根据实施方式86或87的真菌宿主细胞,其中PDI1或其变体过表达,或者ERO1或其变体过表达。
89.根据实施方式86或87的真菌宿主细胞,其中PDI1或其变体过表达,并且ERO1或其变体过表达。
90.根据实施方式86或87的真菌宿主细胞,其中PDI1或其变体过表达,并且KEX2或其变体表达或过表达。
91.根据实施方式86或87的真菌宿主细胞,其中ERO1或其变体过表达,并且KEX2或其变体表达或过表达。
92.根据实施方式86至91中任一项的真菌宿主细胞,其中PDI1 或其变体过表达,并且ERO1或其变体过表达,并且KEX2或其变体表达或过表达。
93.根据前述任一项实施方式的真菌宿主细胞,其中真菌宿主是酵母或丝状真菌。
94.根据前述任一项实施方式的真菌宿主细胞,其中宿主细胞是酵母菌、念珠菌、汉逊酵母、克鲁维酵母、毕赤酵母、酵母菌、裂殖酵母或亚罗酵母。
95.根据实施方式94的真菌宿主细胞,其中酵母菌是卡尔伯氏酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁维酵母,诺地酵母或卵形酵母,优选酿酒酵母。
96.一种真菌宿主细胞培养物,真菌宿主细胞包含编码期望的蛋白质如异源蛋白质的多核苷酸序列,其特征在于真菌宿主细胞具有降低的Gsh1蛋白质或其同系物的活性水平和/或表达水平。
97.根据实施方式96的真菌宿主细胞培养物,具有降低的Not4蛋白质或其同系物的活性水平和/或表达水平。
98.实施方式96或97的真菌宿主细胞培养物,其中宿主细胞如实施方式1-95中任一项所定义。
99.一种用于从真菌宿主细胞制备期望的蛋白质如异源蛋白质的方法,其包括:
a.提供根据实施方式1至94中任一项的真菌宿主细胞或者根据实施方式96至98中任一项的培养物,
b.培养真菌宿主细胞或培养物以产生期望的蛋白质,
c.任选地回收期望的蛋白质,
d.任选地纯化期望的蛋白质,
e.任选地将期望的蛋白质与治疗上可接受的载体或稀释剂进行配制以制备适合施用于人或动物的治疗产品,和
f.任选地提供单位剂型的期望的蛋白质。
100.一种用于增加期望的蛋白质(如异源蛋白质)产量的方法,其包括:
a.提供真菌宿主细胞(如酵母或丝状真菌),其具有修饰的:
1.Gsh1蛋白质或其同系物,和/或
2.Gsh1蛋白质或其同系物的活性水平(优选降低),和/或
3.GSH1基因或其同系物,和/或
4.GSH1基因或其同系物的表达水平(优选降低),
例如根据实施方式1至94中任一项的真菌宿主细胞,
b.培养宿主细胞以产生期望的蛋白质,和
c.任选地回收期望的蛋白质,
d.任选地纯化期望的蛋白质,
e.任选地将期望的蛋白质与治疗上可接受的载体或稀释剂进行配制以制备适合施用于人或动物的治疗产品,和
f.任选地提供单位剂型的期望的蛋白质。
101.根据实施方式99或100的方法,其中培养是在谷胱甘肽存在下。
102.根据实施方式101的方法,其中谷胱甘肽以至少0.05mM存在。
103.根据实施方式102的方法,其中谷胱甘肽以约0.05mM、0.1 mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、 0.9mM、1mM、2mM、3mM、4mM、5mM、10mM、20mM、30mM、40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、 200mM、250mM、300mM、350mM、400mM、450mM至约0.1mM、 0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9 mM、1mM、2mM、3mM、4mM、5mM、10mM、20mM、30mM、 40mM、50mM、60mM、70mM、80mM、90mM、100mM、150mM、 200mM、250mM、300mM、350mM、400mM、450mM、500mM 存在。
104.根据实施方式103的方法,其中谷胱甘肽以约1mM至约10 mM存在。
105.根据实施方式104的方法,其中谷胱甘肽以约3mM至约7 mM存在。
106.根据实施方式105的方法,其中谷胱甘肽以约5mM存在。
107.根据实施方式99至106的方法,其中,期望的蛋白质的产量比来自参照真菌宿主细胞如具有野生型Gsh1蛋白质(如SEQ ID NO: 2)的真菌宿主细胞的产量高至少2%。
108.根据实施方式107的方法,其中产量比来自参照真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、 15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、40%、45%或者至少50%。
109.根据实施方式107或108的方法,其中期望的蛋白质的产量比来自参照真菌宿主细胞如具有SEQ ID NO:2的Gsh1蛋白质的真菌宿主细胞的产量高至少2%。
110.根据实施方式109的方法,其中产量比来自参照真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、 15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、40%、45%或者至少50%。
111.根据实施方式99至110中任一项的方法,其中真菌宿主细胞具有修饰的:
1.Not4蛋白质或其同系物,和/或
2.Not4蛋白质或其同系物的活性水平(优选降低),和/或
3.NOT4基因或其同系物,和/或
4.NOT4基因或其同系物的表达水平(优选降低),
例如根据实施方式5至95中任一项的真菌宿主细胞。
112.根据实施方式111的方法,其中期望的蛋白质的产量比来自参照真菌宿主细胞如具有野生型Not4蛋白质(如SEQ ID NO:6)的真菌宿主细胞的产量高至少2%。
113.根据实施方式112的方法,其中产量比来自参照真菌宿主细胞如具有野生型Not4蛋白质(如SEQ ID NO:6)的真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、17.5%、 20%、22.5%、25%、27.5%、30%、35%、40%、45%或者至少50%。
114.根据实施方式111-113中任一项的方法,其中期望的蛋白质的产量比来自参照真菌宿主细胞如具有SEQ ID NO:2的Gsh1蛋白质的真菌宿主细胞的产量高至少2%。
115.根据实施方式114的方法,其中产量比来自参照真菌宿主细胞例如具有SEQID NO:2的Gsh1蛋白质的真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、10%、12.5%、15%、17.5%、 20%、22.5%、25%、27.5%、30%、35%、40%、45%或者至少50%。
116.根据实施方式111-115中任一项的方法,其中期望的蛋白质的产量比来自参照真菌宿主细胞如具有SEQ ID NO:2的Gsh1蛋白质和 SEQ ID NO:6的Not4蛋白质的真菌宿主细胞的产量高至少2%。
117.根据实施方式116的方法,其中产量比来自参照真菌宿主细胞例如具有SEQID NO:2的Gsh1蛋白质和SEQ ID NO:6的Not4蛋白质的真菌宿主细胞的产量高至少3%、4%、5%、6%、7%、8%、9%、 10%、12.5%、15%、17.5%、20%、22.5%、25%、27.5%、30%、35%、 40%、45%或者至少50%。
118.根据实施方式99-117中任一项的方法,其中期望的蛋白质选自白蛋白,单克隆抗体,依托泊苷,血清蛋白质(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白质,乳铁蛋白质,内皮抑素,血管抑制素,胶原,免疫球蛋白质或基于免疫球蛋白质的分子或片段之一 (例如,Small Modular ImmunoPharmaceuticalTM(“SMIP”)或dAb、 Fab’片段、F(ab’)2、scAb、scFv或scFv片段),Kunitz结构域蛋白质 (如在WO03/066824(并入本文以供参考)中所述的那些,具有或不具有白蛋白融合物),干扰素,白细胞介素,IL-10,IL-11,IL-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,CNTF, CNTFAx15,IL-1-受体拮抗剂,红细胞生成素(EPO)和EPO模拟物,血小板生成素(TPO)和TPO模拟物,prosaptide,蓝藻抗病毒蛋白质 -N,五螺旋蛋白质,T20肽,T1249肽,HIV gp41,HIV gp120,尿激酶,尿激酶原,tPA,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、GLP-1 或GLP-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,G-CSF,GM-CSF,M-CSF,FGF,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白质原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白质酶、纤溶酶原激活剂、因子VII、因子VIII、因子IX、因子X和因子XIII),神经生长因子,LACI,血小板衍生内皮细胞生长因子(PD-ECGF),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白质,间-α胰蛋白质酶抑制剂,抗凝血酶III,载脂蛋白质种,蛋白质C,蛋白质S,代谢物,抗生素,或上述任一项的变体或片段。
119.根据实施方式99-118中任一项的方法,其中期望的蛋白质包含白蛋白或其变体、片段和/或融合物,或者由白蛋白或其变体、片段和/或融合物组成。
120.根据实施方式119的方法,其中白蛋白或其变体、片段和/或融合物与SEQ IDNO:10具有至少70%的同一性。
121.根据实施方式120的方法,其中白蛋白或其变体、片段和/或融合物与SEQ IDNO:10具有至少75%、80%、85%、90%、91%、92%、 93%、95%、96%、97%、98%或99%的同一性。
122.根据实施方式121的方法,其中白蛋白或其变体、片段和/或融合物与SEQ IDNO:10具有至少70%的同一性,优选与SEQ ID NO: 10具有至少75%、80%、85%、90%、91%、92%、93%、95%、96%、 97%、98%或99%的同一性,并且在对应于SEQ ID NO:10的K573位置处包含A、C、D、E、F、G、H、I、L、M、N、P、Q、R、S、T、 V、W或Y。
123.根据实施方式122的方法,其中白蛋白或其变体、片段和/或融合物在对应于SEQ ID NO:10的K573位置处包含P、H、W或Y。
124.根据实施方式123的方法,其中白蛋白或其变体、片段和/或融合物与SEQ IDNO:10具有至少98%的同一性,并且在对应于SEQ ID NO:10的K573位置处包含P。
125.根据实施方式119-124中任一项的方法,其中融合物包含融合配偶体,其不是白蛋白或其变体、片段和/或融合物。
126.根据实施方式120-125中任一项的方法,其中融合物包含选自以下的融合配偶体:单克隆抗体,依托泊苷,血清蛋白质(如凝血因子),安替斯塔辛,壁虱抗凝肽,转铁蛋白质,乳铁蛋白质,内皮抑素,血管抑制素,胶原,免疫球蛋白质或基于免疫球蛋白质的分子或片段之一(例如,Small Modular ImmunoPharmaceuticalTM(“SMIP”) 或dAb、Fab’片段、F(ab’)2、scAb、scFv或scFv片段),Kunitz结构域蛋白质(如在WO03/066824(并入本文以供参考)中所述的那些),干扰素,白细胞介素,IL-10,IL-11,IL-2,干扰素α种和亚种,干扰素β种和亚种,干扰素γ种和亚种,瘦素,CNTF,CNTFAx15,IL-1- 受体拮抗剂,红细胞生成素(EPO)和EPO模拟物,血小板生成素(TPO) 和TPO模拟物,prosaptide,蓝藻抗病毒蛋白质-N,五螺旋蛋白质,T20 肽,T1249肽,HIV gp41,HIV gp120,尿激酶,尿激酶原,tPA,水蛭素,血小板衍生生长因子,甲状旁腺素,胰岛素原,胰岛素,胰高血糖素,胰高血糖素样肽如艾塞那肽、GLP-1或GLP-2,胰岛素样生长因子,降钙素,生长激素,转化生长因子β,肿瘤坏死因子,G-CSF, GM-CSF,M-CSF,FGF,前体和活性形式的凝血因子(包括但不限于纤溶酶原、纤维蛋白质原、凝血酶、凝血酶前体、凝血酶原、血管假性血友病因子、α1-抗胰蛋白质酶、纤溶酶原激活剂、因子VII、因子 VIII、因子IX、因子X和因子XIII),神经生长因子,LACI,血小板衍生内皮细胞生长因子(PD-ECGF),葡糖氧化酶,血清胆碱酯酶,抑肽酶,淀粉样前蛋白质,间-α胰蛋白质酶抑制剂,抗凝血酶III,载脂蛋白质种,蛋白质C,蛋白质S,代谢物,抗生素,或上述任一项的变体或片段。
127.根据实施方式126的方法,其中融合配偶体包含胰高血糖素样蛋白质或其类似物,或者由胰高血糖素样蛋白质或其类似物组成。
128.根据实施方式127的方法,其中融合配偶体包含SEQ ID NO: 14、SEQ ID NO:15、SEQ ID NO:51或SEQ ID NO:52,或者由SEQ ID NO:14、SEQ ID NO:15、SEQ ID NO:51或SEQ ID NO:52组成。
129.根据实施方式118-128中任一项的方法,其中期望的蛋白质包含SEQ ID NO:16,或者由其组成。
130.根据实施方式99-129中任一项的方法,其中宿主细胞在至少 1L的规模下培养。
131.根据实施方式130的方法,其中宿主细胞在至少2L的规模下培养。
132.根据实施方式131的方法,其中宿主细胞在至少5L的规模下培养。
133.根据实施方式132的方法,其中宿主细胞在至少10L的规模下培养。
134.根据实施方式133的方法,其中宿主细胞在至少1000L的规模下培养。
135.根据实施方式134的方法,其中宿主细胞在至少5000L的规模下培养。
136.根据实施方式99-135中任一项的方法,其中期望的蛋白质从真菌宿主细胞分泌。
137.根据实施方式136的方法,其中期望的蛋白质得自包含信号肽的未成熟蛋白质。
138.根据实施方式137的方法,其中信号肽包含或由以下组成: SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:22、SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:41或SEQ ID NO:42,或者信号肽包含SEQ ID NO:20的五肽基序。
139.根据实施方式138的方法,其中信号肽包含SEQ ID NO:19 或者由其组成。
140.根据实施方式138的方法,其中信号肽包含SEQ ID NO:24 或者由其组成。
141.根据实施方式138的方法,其中信号肽包含SEQ ID NO:42 或者由其组成。
142.根据实施方式99-135中任一项的方法,其中期望的蛋白质是细胞内的。
143.根据实施方式99-142中任一项的方法制备的期望的蛋白质 (如异源蛋白质)。
144.根据实施方式143的期望的蛋白质,其用于预防、治疗或诊断。
145.一种组合物,如药物组合物,其包含根据实施方式143或144 的期望的蛋白质和药学上可接受的载体。
146.一种治疗方法,其包括将实施方式143或144的期望的蛋白质或实施方式145的组合物施用至患者。
147.一种制备根据实施方式1-95中任一项的真菌宿主细胞或者根据实施方式96-98中任一项的培养物的方法,该方法包括遗传修饰(亲本)真菌宿主细胞以降低Gsh1蛋白质或其同系物的表达水平和/或活性水平。
148.根据实施方式147的方法,还包括遗传修饰(亲本)真菌宿主细胞以降低Not4蛋白质或其同系物的表达水平和/或活性水平。
149.降低真菌宿主细胞中Gsh1蛋白质或其同系物表达水平和/或活性水平以增加来自真菌宿主细胞的期望的蛋白质(如异源蛋白质) 的产量的手段的用途,例如:该手段通过使GSH1基因突变或缺失,从而得到突变的Gsh1蛋白质或其同系物或者使Gsh1蛋白质或其同系物完全不存在;通过除去或改变基因的开放阅读框;通过使GSH1基因的控制序列如启动子序列和/或终止子序列突变或改变;例如通过引入合适的干扰RNA如反义mRNA,通过引入、控制或修饰合适的转录激活子基因或者通过引入阻断Gsh1蛋白质或其同系物的活性水平的试剂,而阻断或减少GSH1基因的转录。
150.降低真菌宿主细胞中Gsh1蛋白质或其同系物的表达水平和/ 或活性水平以及降低真菌宿主细胞中Not4蛋白质或其同系物的活性水平以增加来自真菌宿主细胞的期望的蛋白质(如异源蛋白质)的产量的手段的用途,例如:该手段通过使GSH1基因突变或缺失和使NOT4 基因突变或缺失从而得到突变的Gsh1蛋白质或其同系物或者使Gsh1 蛋白质或其同系物完全不存在以及得到突变的Not4蛋白质或其同系物或者使Not4蛋白质或其同系物完全不存在;通过除去或改变基因的开放阅读框;通过使GSH1基因和/或NOT4基因的控制序列如启动子序列和/或终止子序列突变或改变;例如通过引入合适的干扰RNA如反义mRNA,通过引入、控制或修饰合适的转录激活子基因或者通过引入阻断Gsh1蛋白质或其同系物和/或Not4蛋白质或其同系物的活性水平的试剂,而阻断或减少GSH1基因和/或NOT4基因的转录。
151.Gsh1蛋白质或其同系物,其包含与SEQ ID NO:2至少50%的同一性以及在对应于选自SEQ ID NO:2的一个或更多个以下位置的位置处的突变:47、48、49、50、51、120、121、122、123、124、125、 126、127、128、129、130、409、451、452、453、454和455。
152.根据实施方式151的Gsh1蛋白质或其同系物,其中位置对应于SEQ ID NO:2的R125位置。
153.根据实施方式151或152的Gsh1蛋白质或其同系物,其中位置对应于SEQ IDNO:2的H409位置。
154.根据实施方式151-153中任一项的Gsh1蛋白质或其同系物,其中位置对应于SEQ ID NO:2的P453位置。
155.根据实施方式151-154中任一项的Gsh1蛋白质或其同系物,其中突变是取代,优选取代为非保守氨基酸。
156.根据实施方式152-155中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2位置R125的位置处的突变是取代为A、C、D、E、F、G、H、I、L、M、N、P、Q、S、T、V、W或Y,优选取代为C、D、E或G,更优选取代为G。
157.根据实施方式151-156中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置R125的位置处的突变是从带正电的氨基酸到脂肪族、芳族、疏水、小、微小、极性或带负电的氨基酸,优选带负电的氨基酸到微小氨基酸。
158.根据实施方式151-157中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置D49的位置处的突变是取代为A、 C、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y,优选为H、K或R,更优选为K或R。
159.根据实施方式151-158中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置49的位置处的突变是从带负电的氨基酸到带正电的氨基酸。
160.根据实施方式151-159中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置H409的位置处的突变是取代为A、 C、D、E、F、G、I、K、L、M、N、P、Q、R、S、T、V、W或Y,优选为A、I、L、V、M、F、W、Y,更优选为A、I、L、V,最优选为L。
161.根据实施方式151-160中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置H409的位置处的突变是从芳族氨基酸到脂肪族氨基酸。
162.根据实施方式151-161中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置P453的位置处的突变是取代为A、 C、D、E、F、G、H、I、K、L、M、N、Q、R、S、T、V、W或Y,优选取代为A、I、L、V、M、F、W、Y,更优选取代为A、I、L、V,最优选取代为L。
163.根据实施方式151-162中任一项的Gsh1蛋白质或其同系物,其中在对应于SEQID NO:2的位置P453的位置处的突变是从芳族氨基酸到脂肪族氨基酸。
164.根据实施方式151-163中任一项的Gsh1蛋白质或其同系物,其包含SEQ IDNO:4,或者由SEQ ID NO:4组成。
现在参考以下非限制性实施例描述本发明:
实施例
实施例1:酿酒酵母GSH1基因的突变
酿酒酵母DP9具有整合至PDI1基因座的PDI1,URA3和YIplac211 的基因型cir0MATa,leu2-3,leu2-112 ubc4 ura3 yap3::URA3 lys2 hsp150:LYS2(Finnis等,2010,Microbial Cell Factories 9:87)。本发明人观察到酿酒酵母DP9(当用编码白蛋白的质粒转化时)能够以比先前的菌株例如酿酒酵母DB1更高的产量产生重组人白蛋白。酿酒酵母DP9的表征揭示了GSH1基因中的SNP。为了证实此SNP是否有助于增加酿酒酵母DP9的蛋白质产量,将SNP(A373G)恢复到野生型 (即373位的A),如下所述。因此,突变Gsh1蛋白质(G125)也恢复到野生型(R125)。野生型GSH1基因和Gsh1蛋白质分别提供在 SEQ ID NO:1和SEQ IDNO:2中,突变(即含有SNP)GSH1基因和 Gsh1蛋白质分别提供在SEQ ID NO:3和SEQ ID NO:4中。
酿酒酵母GSH1基因位于染色体X上。通过将片段整合到GSH1 基因座中、将碱基373G变为A的过程,将突变GSH1基因中的SNP (A373G)恢复到野生型,从而将突变Gsh1蛋白质(位置125处的G) 恢复至野生型Gsh1蛋白质(位置125处的R)。
这首先用DNA引物通过PCR扩增合适的选择性标志物(KanMX) 来实现,该DNA引物在其5’端包括与GSH1开放阅读框上游区域相同的DNA序列。PCR引物是MBP267和MBP268,KanMX赋予对遗传霉素(G418)的抗性。
引物MBP267:
5’-ATACTATTGTAATTCAAAAAAAAAAAGCGAATCTTCCCATGCCTGTTGCTGCTCTTGAAT GGCGACAGCCTATTGCCCCAGTGTTCCCTCAACAACCTTGCGTACGCTGCAGGTCG-3’(SEQ ID NO:29)
引物MBP268:
5’-ACAGTTGTAGTCACGTGCGCGCCATGCTGACTAATGGCAGCCGTCGTTGGGCAGAAGAG AATTAGTATGGTACAGGATACGCTAATTGCGCTCCAACTACATCGATGAATTCGAGCTCG-3’ (SEQ ID NO:30)
进行PCR以扩增来自质粒pDB5438的KanMX基因(图2)。条件如下:100ng质粒pDB5438,0.5μM各引物,0.2μM dNTPs,98℃初始变性30秒,然后进行98℃10秒、62℃退火30秒、72℃延伸2分钟的循环35次,然后在72℃最终延伸4分钟,并冷却至4℃,根据制造商的说明书,使用Applied Biosystems 2720热循环仪和NEB Q5热启动高保真DNA聚合酶PCR试剂盒(M0493S),总反应体积50μL。
通过凝胶电泳分析产物5’-GSH1 5’UTR-KanMX-GSH1 5’UTR-3’,发现其具有约1.7kb的预期大小。纯化扩增的PCR产物。纯化产物用于转化野生型GSH1(即SEQ ID NO:1)的酿酒酵母菌株。除了在将转化混合物离心的步骤之后,将小球重新悬浮在0.5mL YEPD培养基中,然后转移到含有4.5mL YEPD的摇瓶,使用Sigma酵母转化试剂盒根据制造商的说明书进行转化。YEPD(g/L):10g BactoTM酵母提取物技术,20g BactoTM蛋白质胨,20g葡萄糖。
在30℃下将摇瓶振荡(200rpm)孵育16小时。将培养物以3,000 rpm离心5分钟,倾析出上清液。然后将小球在1M山梨糖醇中洗涤,然后重悬于0.5ml 1M山梨糖醇中。然后将约100μl接种到新鲜制备的 G418琼脂平板(300μg/ml G418终浓度)上并在30℃倒置孵育4天。如下制备G418琼脂平板:0.17g酵母氮源(不含(NH4)2SO4且不含氨基酸),0.1g谷氨酸(单钠盐,Sigma G-1626),和0.069g CSM-Leu 粉末溶解在100ml H2O(用于冲洗的无菌水-无热原,低渗)并过滤灭菌。然后添加1.5g Bacto琼脂。将瓶子在蒸锅中加热1小时,然后在水浴中冷却至55℃。加入0.6ml 50mg/ml遗传霉素(G418)和4mL 无菌50%右旋糖(w/v)并混合。将等份的混合物倒入培养皿中固化。
从G418抗性转化体提取基因组DNA并在第二次PCR中用作模板,使用引物MBP288和MBP289扩增含有具有KanMX基因插入的 GSH1 5’UTR和GSH1 ORF的5’部分(至碱基422)的5’-GSH1 5’UTR-KanMX-GSH1 5’UTR-GSH1 ORF片段(SEQ ID NO:31)。
引物MBP288:5’-GATTTTATCGGTCAAAGG-3’(SEQ ID NO:32)
引物MBP289:5’-CTATCTTGTCTCGCATATTC-3’(SEQ ID NO: 33)
PCR材料、方法和条件如上所述。除了使用1μl基因组DNA,退火温度为55℃,延伸时间为每个循环3分钟,最后为7分钟外。通过凝胶电泳分析产物,发现其具有约2.9kb的预期大小。根据制造商的说明书,使用QIAGEN QIAquick PCR纯化试剂盒纯化扩增的PCR产物。使用上述转化方法将纯化的产物用于转化DP9[pDB2305](图3)。酿酒酵母DP9是含有GSH1 SNP(A373G,其导致R125G)的菌株。 pDB2305是表达人白蛋白的质粒(图3)。G418琼脂平板上的生长和选择如上所述。从抗性菌落中提取基因组DNA,使用引物MBP290和 MBP292使用PCR扩增约546bp片段,覆盖ORF上游100bp到ORF 的碱基446的区域。使用相同的PCR试剂盒和条件,除了循环步骤变为初始变性为98℃1分钟,随后进行98℃10秒、61℃退火20秒、72℃延伸2.5分钟的循环35次,然后在72℃最后延伸7分钟。
引物MBP290:5’-TCTCGAGTCACTTGTAGAAG-3’(SEQ ID NO:34)
引物MBP292:5’-GAGCCCACATGCAAGTT-3’(SEQ ID NO:35)
使用Qiagen QIAquick PCR纯化试剂盒清洁产物。使用Life TechnologiesBigDye Terminator v3.1循环测序试剂盒按照制造商的说明书对产物进行测序,使用50μL总反应体积,50ng清洁的产物作为模板和4μL1μM引物MBP291。条件分别为:初始变性96℃1分钟,然后进行变性96℃10秒、退火50℃5秒、延伸60℃4分钟的循环25 次,最后冷却至4℃。将测序反应物沉淀出来,并重新悬浮于HiDi (Applied Biosystems)中并在AppliedBiosystems 3130xl遗传分析仪上分析。
引物MBP291:5’-GTAGGGTGGTTTAGAGTATC-3’(SEQ ID NO: 36)
测序分析显示一个转化体在373位具有野生型A(R125),该菌株命名为PRG13[pDB2305]。两个转化体在位置373处仍具有G(G125),这些菌株命名为PSG10[pDB2305]和PSG11[pDB2305]。将三种转化体在48孔微量滴定板(MTP)中培养,每孔含有0.5mL BMMD(0.17% (w/v)无氨基酸和硫酸铵(Difco)的酵母氮基,37.8mM硫酸铵,36 mM柠檬酸,126mM正磷酸氢二钠、pH 6.5,2%(w/v)葡萄糖,用 NaOH调节至pH 6.5)。在30℃将MTP在湿度室中振荡(200rpm) 孵育72小时。然后将来自每个孔的50μL细胞培养物转移到新的48 孔MTP的三个孔中,每个孔中含有0.45mL BMMD。在30℃将新的 MTP在湿度室中振荡(200rpm)孵育96小时。
通过离心分离上清液,并使用配备Shimadzu VP7.3客户端服务器软件控制下的UV探测的LC2010 HPLC系统(Shimadzu)通过GP-HPLC 分析测定重组白蛋白生产力。在7.8mmid×300mm长的TSK G3000SWXL柱(Tosoh Bioscience)上进行75μL的注射,该柱具有 6.0mmid×40mm长的TSK SW保护柱(Tosoh Bioscience)。样品在 25mM磷酸钠,100mM硫酸钠,0.05%(w/v)叠氮化钠,pH 7.0中以1mL.min-1进行色谱分离,运行时间为20分钟。通过在280nm处的 UV探测,通过相对于已知浓度的重组人白蛋白标准品(10mg/mL) 的峰面积,对样品进行定量并校正其相对消光系数。
如表2所示,SNP的存在导致平均白蛋白产量增加21%。
表2:与PSG10[pDB2305]和PSG11[pDB2305]相比,PRG13 [pDB2305]中白蛋白的生产力
Figure BDA0002387856460000731
P值(t-检验):8.89E-05
该工作在另外的酿酒酵母菌株中重复。简而言之,在酿酒酵母菌株BXP10[pDB2244]上进行相同的转化程序(图4),以将GSH1 SNP 恢复到野生型。pDB2244是表达人白蛋白的质粒。将菌株在摇瓶中生长,在50ml瓶中约10mL生长培养基中,在30℃下以200rpm摇动孵育。仍将来自转化体(含有SNP,即BSG3[pDB2244])的白蛋白产量与来自其中SNP转化为野生型,即BRG5[pDB2244]的转化体的白蛋白产量进行比较。BXP10具有基因型MATa,leu2-3,leu2-122,can1, pra1,ubc4,ura3,yap3::URA3,lys2,hsp150::LYS2和pmt1::URA3。
如表3所示,SNP的存在导致白蛋白产量增加68%(每种菌株复制3次)。
表3:BRG5[pDB2244]和BSG3[pDB2244]中白蛋白的生产力
Figure BDA0002387856460000732
P值(t-检验):0.001
实施例2:酿酒酵母GSH1基因的缺失增强重组蛋白质的产生
在与实施例1中用于SNP恢复的相同的两个酿酒酵母菌株中缺失了GSH1基因。通过用标志物KanMX替换GSH1基因来实现缺失。因此,所得菌株不能产生任何Gsh1蛋白质。为了进行缺失,将所需的 DNA排序为侧翼为Acc65I限制性位点的质粒插入物。DNA片段(SEQ IDNO:43)由在5’端紧接GSH1 ORF上游300bp和在3’端紧接GSH1 ORF下游300bp的KanMX DNA组成。用Acc65I消化质粒,并使用 QIAGEN凝胶提取试剂盒从Tris-acetate-EDTA(TAE)琼脂糖凝胶中纯化KanMX片段。该DNA用于转化酵母菌株DP9[pDB2305]和BXP10 [pDB2244],其中pDB2305和pDB2244是含有人血清白蛋白表达盒的质粒。在转化过程结束时,将酵母细胞重悬于YEPD培养基中,并在 30℃和200rpm下生长过夜。第二天,将它们铺在G418平板上(如实施例1中所述),将L-谷胱甘肽添加至5mM。将菌落接种在新的平板上(同样用G418和L-谷胱甘肽),当菌斑生长后,提取基因组DNA,并使用引物进行PCR,如果整个DNA片段正确整合,引物将位于连接的侧面。鉴定出三个转化体在BXP10中缺失了GSH1(转化体命名为 BDG1、BDG2和BDG10)和一个转化体在DP9中缺失了GSH1(转化体命名为PDG14)。将这些菌株以及先前描述的具有或不具有SNP恢复的菌株一起在BMMD中的48孔板中培养。缺失菌株在补充有5mML-谷胱甘肽的孔中生长,其它菌株在有和没有L-谷胱甘肽的情况下都进行培养。通过GP-HPLC测定上清液以定量人血清白蛋白的表达水平。
表4:BXP10来源菌株BRG5[pDB2244](WT GSH1)、BSG3 [pDB2244](SNP)和BDG1[pDB2244]、BDG2[pDB2244]和BDG10 [pDB2244](ΔGSH1)中白蛋白的生产力
Figure BDA0002387856460000741
Figure BDA0002387856460000751
(1个标准差)
缺失(有L-谷胱甘肽下生长)与WT(没有L-谷胱甘肽生长)相比,P值(t检验):1.25E-08 (请参见表4,F和A栏)
缺失与WT(均有L-谷胱甘肽下生长)相比,P值(t检验):8.90E-05(请参见表4,F和D栏)
如表4所示,与具有野生型GSH1的菌株相比,BXP10[pDB2244] 中GSH1的缺失导致白蛋白产量的增加。此外,如实施例1所示,与含有野生型GSH1的菌株相比,GSH1中SNP的存在增加了白蛋白产量。
表5:DP9来源菌株PRG13[pDB2305](WT GSH1)、PSG10 [pDB2305](具有SNP A373G的GSH1)和PDG14[pDB2305](ΔGSH1) 中白蛋白的生产力
Figure BDA0002387856460000752
(1个标准差)
缺失(有L-谷胱甘肽下生长)与WT(没有L-谷胱甘肽下生长)相比,P值(t检验):8.45895E-09 (请参见表5,F和A栏)
缺失与WT(均有L-谷胱甘肽下起生长)相比,P值(t检验):1.02983E-05(请参见表5,F 和D栏)
如表5所示,与具有野生型GSH1的菌株相比,以及与具有SNP 的GSH1的菌株相比,DP9[pDB2305]中GSH1的缺失导致白蛋白产量的增加。
实施例3:酿酒酵母GSH1基因的突变增强了10L规模的重组蛋白质的产生
将来自实施例1的BXP10来源的菌株在发酵罐中以10升规模生长,并测量比细胞生产力(YPXT)的产率(表6)。发酵以与实施例5 中所述类似的方式进行。
表6:10L规模的BXP10来源的菌株中白蛋白的生产力
Figure BDA0002387856460000761
在含有具有SNP A373G(导致R125G)的GSH1的菌株中观察到平均增加4.6%,这在统计学上是显著的。P值=0.069。
实施例4:通过GSH1中的突变提供的对酿酒酵母重组蛋白质产量的积极影响通过NOT4中存在突变进一步增强
之前(PCT/US2016/068239,并入本文以供参考)已确定NOT4(也称为MOT2)的突变导致宿主菌株中产生的异源蛋白质产量增加。
为了确定将NOT4中的突变与GSH1中的突变结合是否进一步影响产量,在宿主细胞中互补了一个突变、两个突变、或者两个突变都不存在(通过用含有野生型版本的一个或两个基因,或两个基因都没有的质粒转化)导致一系列表型接近的菌株:
(A)含有SNP的GSH1和含有SNP的NOT4,
(B)含有SNP的GSH1和野生型NOT4,
(C)含有SNP的野生型GSH1和NOT4,以及
(D)野生型GSH1和野生型NOT4。
通过GP-HPLC分析得到的菌株的培养物的上清液,测量异源蛋白质的产量。
为了产生含有野生型NOT4和/或GSH1的质粒,用来自酵母菌株 DB1的基因组DNA进行PCR。该菌株具有野生型NOT4和野生型 GSH1。引物对(表7)用于产生包含野生型ORF以及NOT4和GSH1 的上游和下游序列的DNA。设计引物以包括限制酶位点以允许克隆到质粒YCP50中(图5和Rose等,1987,Gene,60,237-243)。根据表8进行PCR。
表7:PCR引物
Figure BDA0002387856460000771
表8:PCR条件
Figure BDA0002387856460000772
PCR条件如下:0.1μg基因组DNA,0.5μM每种引物,0.2μM dNTPs,在98℃下初始变性30秒,然后进行98℃10秒、前文所述温度退火30秒、72℃延伸2分钟的循环35次,然后在72℃最终延伸4 分钟,冷却至4℃,根据制造商的说明书使用Applied Biosystems 2720 热循环仪和NEB Q5 Hot Start High-Fidelity DNA聚合酶PCR试剂盒 (M0493S),总反应体积为50μL。通过凝胶电泳分析产物,发现其具有预期的大小,对于NOT4约为2.5kb,对于GSH1约为3.3kb。扩增的PCR产物使用QIAGEN QIAquick PCR纯化试剂盒根据制造商的说明书进行纯化。
对纯化的PCR产物和YCP50质粒进行限制性内切酶消化。限制性内切酶和缓冲液来自New England Biolabs(NEB),并遵循制造商的规程。进行的消化是:NOT4 PCR产物上为EcoRI+HindIII,YCP50上为EcoRI+HindIII,GSH1 PCR产物上为SphI+SalI和YCP50上为SphI和SalI。所用的缓冲液是CutSmart缓冲液,而所有限制性内切酶是NEB High Fidelity(“HF”)酶(即EcoRI-HF等)。在37℃下将消化物孵育约 1.5小时。通过QIAGEN QIAquick PCR纯化试剂盒纯化PCR产物的消化物,并使用QIAGEN QIAquick凝胶提取试剂盒,按照制造商的说明书,从TAE琼脂糖凝胶中纯化YCP50 DNA。
将每种经消化和纯化的PCR产物连接到已用相同酶切割的YCP50 DNA。使用NEB快速连接试剂盒(M2200S)按照制造商的说明书进行连接,使用的PCR产物:YCP50的摩尔比为3:1。然后,按照制造商的说明书,一微升的每连接反应物用于转化NEB 5-α感受态(高效)大肠杆菌细胞(M2987I),然后将其接种到LB氨苄青霉素上。过夜,从所得菌落生长培养物,并进行QIAGEN QIAprep旋转微量制备。进行限制性内切酶消化以鉴定克隆似乎已成功的质粒。
然后,用SphI+SalI消化YCP50-NOT4质粒,并根据制造商的说明书,使用QIAGENQIAquick凝胶提取试剂盒,从TAE琼脂糖凝胶中纯化DNA。将该DNA连接至已经用SphI+SalI消化的GSH1 PCR产物,然后使用QIAquick PCR纯化试剂盒进行纯化。同样,插入片段与主链的摩尔DNA比为3:1。转化NEB 5-α感受态(高效)细胞(如上所述),并制备质粒DNA(如上所述)。通过限制性消化鉴定正确的质粒。
这产生了三个新质粒:YCP50-NOT4、YCP50-GSH1和 YCP50-NOT4-GSH1。这些和单独的YCP50用于转化DYB7 ura3 [pDB2305],该质粒包含用于表达重组人血清白蛋白的质粒pDB2305。 DYB7在Payne等,(2008)Applied and Environmental Microbiology 74 (24)7759-7766中描述。按照制造商的说明书,使用Sigma Yeast转化试剂盒进行转化,除了将转化混合液离心后,将沉淀重悬在200μl 1M 山梨糖醇中,然后将100μl接种在BMMD琼脂板上。在30℃下将板孵育直至出现菌落。
将来自每个转化的单个菌落接种到48孔微量滴定板的孔中,每孔含有0.5mlBMMD。在30℃将板在200rpm下孵育2天,然后将等体积的40%海藻糖混合到每个孔中,并将板储存在-80℃。随后,将板解冻,并从每个孔中将50μl转移至含有450μl BMMD的新板的孔中。在30℃将该板在200rpm下孵育2天,然后继代培养到另一个新板中 (50μl加入450μlBMMD中)。将该板孵育4天。然后将板以2000rpm 离心5分钟,并将每个孔的200μl上清液转移到HPLC小瓶中。如实施例1所述,通过GP-HPLC定量上清液中人血清白蛋白的量。
对新质粒YCP50-NOT4、YCP50-GSH1和YCP50-NOT4-GSH1进行测序,以确认它们各自均包含正确的插入片段。如以上实施例所述进行测序,除了每个反应使用150ng至300ng质粒DNA的情况。
通过GP-HPLC分析测量的培养物上清液的相对白蛋白产量显示在表9中(以下)。
表9:在与含有GSH1(SNP或野生型)和NOT4(SNP或野生型) 组合的表型接近的菌株中的白蛋白生产力
Figure BDA0002387856460000791
*注意,由于采用表9中分析的菌株的构建方法,含有编码GSH1 或NOT4的基因的WT拷贝的菌株也含有SNP版本(即编码Gsh1 R125G和Not4 F429I)。WT版本在质粒上,而含有SNP的基因在基因组上。由于互补,所得表型近似于WT的表型。
相对于(D)显示了产量,其中(D)是两个含有SNP的基因都互补的菌株。可以看出,带有SNP(C)的NOT4导致产量增加31%,带有SNP(B)的GSH1导致产量增加77%,同时存在两个SNP(A)导致产量增加84%。这些互补研究表明,GSH1和NOT4突变对白蛋白产量产生积极影响,并且当组合时,产量甚至进一步增加。
预期这种产量的增加也将在更大的规模上观察到。这是因为,实施例1和2证明GSH1的突变或缺失会小规模地影响酿酒酵母产生的白蛋白的产量,实施例3和实施例5也证明了10L的规模、先前的 PCT/US2016/068239证明NOT4的突变或缺失在小规模和10L规模上都影响酿酒酵母产生的白蛋白的产量。
实施例5:酿酒酵母GSH1基因的突变增强了10L规模的白蛋白产量
通过在10L发酵罐(Wigley等(2007)Genetic Engineering News.27(2):40-42)中的生长评估酿酒酵母菌株DYB7 ura3 [pDB2305/YCp50-NOT4]、DYB7 ura3[pDB2305/YCp50-GSH1]和DYB7 ura3[pDB2305/YCp50-NOT4-GSH1]用于重组蛋白质表达的生产力。使用MW11D培养基如WO97/33973(并入本文以供参考)的实施例1中所述进行发酵,除了使用Wonderware监督控制和数据采集软件代替 MFCS,在使用之前发酵罐还经历柠檬酸洗涤,痕量元素原料包含 Na2MoO4.2H2O而不是Na2MoO4.5H2O,用氨溶液将pH调节至pH 6.2,初始将约1.0vvm(即1.0升)的无菌空气引入容器中而不是0.5vvm,在发酵过程中气流在一步中增加而不是两步,以维持约1.0vvm的气流,比生长速率约为0.06h-1,指数常数(K)保持在0.06。“vvm”是指每分钟单位液体体积的气体流量。
表10中显示了相对产量(每升产品的克数)。
表10:来自DYB7[pDB2305/YCp50-NOT4]和DYB7 [pDB2305/YCp50-NOT4-GSH1]的10L规模的白蛋白生产力
菌株 GSH1状态 NOT4状态 %g/L
DYB7 ura3[pDB2305/YCp50-NOT4-GSH1] WT WT 100
DYB7 ura3[pDB2305/YCp50-NOT4] SNP A373G WT 112
与具有接近野生型的GSH1表型的菌株相比,具有含SNP的GSH1 的菌株的白蛋白产量增加。
实施例6:酿酒酵母GSH1基因的突变或缺失增强白蛋白变体的表达,而GSH1的缺失增强白蛋白融合蛋白(白蛋白-IL-1Ra)和scFv(vHvL) -FLAG的表达
在本实施例中表达的蛋白质是(a)相对于WT HSA(SEQ ID NO.10) 包含4个突变的白蛋白变体(SEQ ID NO:45),(b)与人血清白蛋白(SEQ ID NO:47,“白蛋白-1L-1Ra”)的C端基因融合的IL-1Ra 和(c)scFv,在其C-末端处具有FLAG标签(DYKDDDDK,SEQ ID NO: 50)的FITC8(SEQ ID NO:49)(Evans等2010,Protein Expression and Purification 73:113-124,包括参考16和17,所有并入本文以供参考)。
在准备表达白蛋白-IL-1Ra时,用限制酶Acc65I和BamHI切割质粒pDB3936(图7),并用酶NsiI和PvuI切割质粒pDB5912(含有白蛋白-IL-1Ra表达盒)。图8中提供了pDB5912的质粒图谱,编码白蛋白-IL-1Rα的DNA序列示于SEQ ID NO:46中。限制酶和缓冲液来自 NewEngland Biolabs。按照制造商的说明书,使用Qiagen PCR纯化试剂盒纯化两种质粒消化物。
将3个菌株:PDG14[pDB2305],PSG11[pDB2305]和PRG13 [pDB2305]在摇瓶的YEPD培养基中培养并传代培养3次以固化其质粒 (pDB2305)。将最终培养物的稀释物平铺到YEPD上,然后将来自这些平板的单菌落贴到YEPD上。将YEPD贴片转移至BMMD+5mM L-谷胱甘肽平板并在30℃孵育;缺乏BMMD+5mM L-谷胱甘肽上的生长鉴定了已经质粒固化的细胞。使用Sigma酵母转化试剂盒根据制造商的说明书使用质粒pDB5862(用于表达白蛋白变体)(pDB5862的质粒图谱在图9中提供,编码白蛋白变体的DNA序列示于SEQ ID NO. 44)、pDB3029(用于表达scFv(vHvL)-FLAG(pDB3029的质粒图谱在图9中提供,编码scFv-FLAG的DNA序列示于SEQ ID NO:48中) 或用纯化的pDB3936和pDB5912限制性消化物(用于从间隙修复的质粒pDB3936:GR:pDB5912表达白蛋白-IL-1RA)将固化的酵母菌株分别转化。细胞平铺在BMMD上并在30℃孵育5天。每个菌株中的六个转化子在每孔含有0.5ml BMMD(具有5mML-谷胱甘肽)的48孔 MTP中培养。在30℃将平板在200rpm湿度箱中培养48小时。然后通过将50μl的每种培养物转移到新的平板中的具有5mM L-谷胱甘肽的450μl BMMD中进行传代培养。将该平板孵育96小时。
通过离心分离上清液,并如实施例1中那样通过GP-HPLC测定重组蛋白质生产力(白蛋白变体,白蛋白-IL-1Ra或ScFv)。
如表11所示,SNP(A373G)或缺失的存在导致白蛋白变体的产量增加。与具有野生型GSH1的菌株(PRG13)相比,在GSH1(PSG11) 中含有SNP的菌株中产量高15%,在含有GSH1缺失的菌株(PDG14) 中产量高23%。
表11:在PRG13[pDB5862]、PSG11[pDB5862]和PDG14[pDB5862] 中的白蛋白变体生产力
Figure BDA0002387856460000811
SNP vs WT GSH1的P值(t-检验):P=0.052
缺失vs WT GSH1的P值(t-检验):P=0.011
如表12所示,缺失的存在导致白蛋白-IL-1Ra的产量增加。与具有野生型GSH1的菌株(PRG13)相比,含有缺失的菌株(PDG14) 的产量高14%。
表12:在PRG13[pDB3936:GR:pDB5912]、PSG11 [pDB3936:GR:pDB5912]和PDG14[pDB3936:GR:pDB5912]中的白蛋白 -IL-1Ra的生产力
Figure BDA0002387856460000821
SNP vs WT GSH1的P值(t-检验):P=0.11
缺失vs WT GSH1的P值(t-检验):P=0.049
如表13所示,缺失的存在导致ScFv-FLAG的产量增加。与含有野生型GSH1的菌株(PRG13)相比,含有GSH1缺失的菌株(PDG14) 的产率高38%。
表13:在PRG13[pDB3029]、PSG11[pDB3029]和PDG14[pDB3029] 中ScFv(vHvL)-FLAG的生产力
PRG13[pDB3029] PSG11[pDB3029] PDG14[pDB3029]
ScFv(相对产量) 100%±19.40 108%±19.77 138%±22.32
SNP vs WT GSH1的P值(t-检验):P=0.33
缺失vs WT GSH1的P值(t-检验):P=0.0009。
序列表
<110> 阿尔布梅迪克斯医疗有限公司(Albumedix Ltd)
<120> 改良的表达蛋白质的菌株
<130> 13169-WO-PCT
<150> EP17176932.6
<151> 2017-06-20
<160> 52
<170> PatentIn 版本 3.5
<210> 1
<211> 2037
<212> DNA
<213> 酿酒酵母
<400> 1
atgggactct tagctttggg cacgcctttg cagtggtttg agtctaggac gtacaatgaa 60
cacataaggg atgaaggtat cgagcagttg ttgtatattt tccaagctgc tggtaaaaga 120
gacaatgacc ctcttttttg gggagacgag cttgagtaca tggttgtaga ttttgatgat 180
aaggagagaa attctatgct cgacgtttgc catgacaaga tactcactga gcttaatatg 240
gaggattcgt ccctttgtga ggctaacgat gtgagttttc accctgagta tggccggtat 300
atgttagagg caacaccagc ttctccatat ttgaattacg tgggtagtta cgttgaggtt 360
aacatgcaaa aaagacgtgc cattgcagaa tataagctat ctgaatatgc gagacaagat 420
agtaaaaata acttgcatgt gggctccagg tctgtccctt tgacgctgac tgtcttcccg 480
aggatgggat gccccgactt tattaacatt aaggatccgt ggaatcataa aaatgccgct 540
tccaggtctc tgtttttacc cgatgaagtc attaacagac atgtcaggtt tcctaacttg 600
acagcatcca tcaggaccag gcgtggtgaa aaagtttgca tgaatgttcc catgtataaa 660
gatatagcta ctccagaaac ggatgactcc atctacgatc gagattggtt tttaccagaa 720
gacaaagagg cgaaactggc ttccaaaccg ggtttcattt atatggattc catgggtttt 780
ggcatgggct gttcgtgctt acaagtgacc tttcaggcac ccaatatcaa caaggcacgt 840
tacctgtacg atgcattagt gaattttgca cctataatgc tagccttctc tgccgctgcg 900
cctgctttta aaggttggct agccgaccaa gatgttcgtt ggaatgtgat atctggtgcg 960
gtggacgacc gtactccgaa ggaaagaggt gttgcgccat tactacccaa atacaacaag 1020
aacggatttg gaggcattgc caaagacgta caagataaag tccttgaaat accaaagtca 1080
agatatagtt cggttgatct tttcttgggt gggtcgaaat ttttcaatag gacttataac 1140
gacacaaatg tacctattaa tgaaaaagta ttaggacgac tactagagaa tgataaggcg 1200
ccactggact atgatcttgc taaacatttt gcgcatctct acataagaga tccagtatct 1260
acattcgaag aactgttgaa tcaggacaac aaaacgtctt caaatcactt tgaaaacatc 1320
caaagtacaa attggcagac attacgtttt aaacccccca cacaacaagc aaccccggac 1380
aaaaaggatt ctcctggttg gagagtggaa ttcagaccat ttgaagtgca actattagat 1440
tttgagaacg ctgcgtattc cgtgctcata tacttgattg tcgatagcat tttgaccttt 1500
tccgataata ttaacgcata tattcatatg tccaaagtat gggaaaatat gaagatagcc 1560
catcacagag atgctatcct atttgaaaaa tttcattgga aaaaatcatt tcgcaacgac 1620
accgatgtgg aaactgaaga ttattctata agcgagattt tccataatcc agagaatggt 1680
atatttcctc aatttgttac gccaatccta tgccaaaaag ggtttgtaac caaagattgg 1740
aaagaattaa agcattcttc caaacacgag agactatact attatttaaa gctaatttct 1800
gatagagcaa gcggtgaatt gccaacaaca gcaaaattct ttagaaattt tgtactacaa 1860
catccagatt acaaacatga ttcaaaaatt tcaaagtcga tcaattatga tttgctttct 1920
acgtgtgata gacttaccca tttagacgat tcaaaaggtg aattgacatc ctttttagga 1980
gctgaaattg cagaatatgt aaaaaaaaat aagccttcaa tagaaagcaa atgttaa 2037
<210> 2
<211> 678
<212> PRT
<213> 酿酒酵母
<400> 2
Met Gly Leu Leu Ala Leu Gly Thr Pro Leu Gln Trp Phe Glu Ser Arg
1 5 10 15
Thr Tyr Asn Glu His Ile Arg Asp Glu Gly Ile Glu Gln Leu Leu Tyr
20 25 30
Ile Phe Gln Ala Ala Gly Lys Arg Asp Asn Asp Pro Leu Phe Trp Gly
35 40 45
Asp Glu Leu Glu Tyr Met Val Val Asp Phe Asp Asp Lys Glu Arg Asn
50 55 60
Ser Met Leu Asp Val Cys His Asp Lys Ile Leu Thr Glu Leu Asn Met
65 70 75 80
Glu Asp Ser Ser Leu Cys Glu Ala Asn Asp Val Ser Phe His Pro Glu
85 90 95
Tyr Gly Arg Tyr Met Leu Glu Ala Thr Pro Ala Ser Pro Tyr Leu Asn
100 105 110
Tyr Val Gly Ser Tyr Val Glu Val Asn Met Gln Lys Arg Arg Ala Ile
115 120 125
Ala Glu Tyr Lys Leu Ser Glu Tyr Ala Arg Gln Asp Ser Lys Asn Asn
130 135 140
Leu His Val Gly Ser Arg Ser Val Pro Leu Thr Leu Thr Val Phe Pro
145 150 155 160
Arg Met Gly Cys Pro Asp Phe Ile Asn Ile Lys Asp Pro Trp Asn His
165 170 175
Lys Asn Ala Ala Ser Arg Ser Leu Phe Leu Pro Asp Glu Val Ile Asn
180 185 190
Arg His Val Arg Phe Pro Asn Leu Thr Ala Ser Ile Arg Thr Arg Arg
195 200 205
Gly Glu Lys Val Cys Met Asn Val Pro Met Tyr Lys Asp Ile Ala Thr
210 215 220
Pro Glu Thr Asp Asp Ser Ile Tyr Asp Arg Asp Trp Phe Leu Pro Glu
225 230 235 240
Asp Lys Glu Ala Lys Leu Ala Ser Lys Pro Gly Phe Ile Tyr Met Asp
245 250 255
Ser Met Gly Phe Gly Met Gly Cys Ser Cys Leu Gln Val Thr Phe Gln
260 265 270
Ala Pro Asn Ile Asn Lys Ala Arg Tyr Leu Tyr Asp Ala Leu Val Asn
275 280 285
Phe Ala Pro Ile Met Leu Ala Phe Ser Ala Ala Ala Pro Ala Phe Lys
290 295 300
Gly Trp Leu Ala Asp Gln Asp Val Arg Trp Asn Val Ile Ser Gly Ala
305 310 315 320
Val Asp Asp Arg Thr Pro Lys Glu Arg Gly Val Ala Pro Leu Leu Pro
325 330 335
Lys Tyr Asn Lys Asn Gly Phe Gly Gly Ile Ala Lys Asp Val Gln Asp
340 345 350
Lys Val Leu Glu Ile Pro Lys Ser Arg Tyr Ser Ser Val Asp Leu Phe
355 360 365
Leu Gly Gly Ser Lys Phe Phe Asn Arg Thr Tyr Asn Asp Thr Asn Val
370 375 380
Pro Ile Asn Glu Lys Val Leu Gly Arg Leu Leu Glu Asn Asp Lys Ala
385 390 395 400
Pro Leu Asp Tyr Asp Leu Ala Lys His Phe Ala His Leu Tyr Ile Arg
405 410 415
Asp Pro Val Ser Thr Phe Glu Glu Leu Leu Asn Gln Asp Asn Lys Thr
420 425 430
Ser Ser Asn His Phe Glu Asn Ile Gln Ser Thr Asn Trp Gln Thr Leu
435 440 445
Arg Phe Lys Pro Pro Thr Gln Gln Ala Thr Pro Asp Lys Lys Asp Ser
450 455 460
Pro Gly Trp Arg Val Glu Phe Arg Pro Phe Glu Val Gln Leu Leu Asp
465 470 475 480
Phe Glu Asn Ala Ala Tyr Ser Val Leu Ile Tyr Leu Ile Val Asp Ser
485 490 495
Ile Leu Thr Phe Ser Asp Asn Ile Asn Ala Tyr Ile His Met Ser Lys
500 505 510
Val Trp Glu Asn Met Lys Ile Ala His His Arg Asp Ala Ile Leu Phe
515 520 525
Glu Lys Phe His Trp Lys Lys Ser Phe Arg Asn Asp Thr Asp Val Glu
530 535 540
Thr Glu Asp Tyr Ser Ile Ser Glu Ile Phe His Asn Pro Glu Asn Gly
545 550 555 560
Ile Phe Pro Gln Phe Val Thr Pro Ile Leu Cys Gln Lys Gly Phe Val
565 570 575
Thr Lys Asp Trp Lys Glu Leu Lys His Ser Ser Lys His Glu Arg Leu
580 585 590
Tyr Tyr Tyr Leu Lys Leu Ile Ser Asp Arg Ala Ser Gly Glu Leu Pro
595 600 605
Thr Thr Ala Lys Phe Phe Arg Asn Phe Val Leu Gln His Pro Asp Tyr
610 615 620
Lys His Asp Ser Lys Ile Ser Lys Ser Ile Asn Tyr Asp Leu Leu Ser
625 630 635 640
Thr Cys Asp Arg Leu Thr His Leu Asp Asp Ser Lys Gly Glu Leu Thr
645 650 655
Ser Phe Leu Gly Ala Glu Ile Ala Glu Tyr Val Lys Lys Asn Lys Pro
660 665 670
Ser Ile Glu Ser Lys Cys
675
<210> 3
<211> 2037
<212> DNA
<213> 人工序列
<220>
<223> 具有A373G突变的GSH1
<400> 3
atgggactct tagctttggg cacgcctttg cagtggtttg agtctaggac gtacaatgaa 60
cacataaggg atgaaggtat cgagcagttg ttgtatattt tccaagctgc tggtaaaaga 120
gacaatgacc ctcttttttg gggagacgag cttgagtaca tggttgtaga ttttgatgat 180
aaggagagaa attctatgct cgacgtttgc catgacaaga tactcactga gcttaatatg 240
gaggattcgt ccctttgtga ggctaacgat gtgagttttc accctgagta tggccggtat 300
atgttagagg caacaccagc ttctccatat ttgaattacg tgggtagtta cgttgaggtt 360
aacatgcaaa aaggacgtgc cattgcagaa tataagctat ctgaatatgc gagacaagat 420
agtaaaaata acttgcatgt gggctccagg tctgtccctt tgacgctgac tgtcttcccg 480
aggatgggat gccccgactt tattaacatt aaggatccgt ggaatcataa aaatgccgct 540
tccaggtctc tgtttttacc cgatgaagtc attaacagac atgtcaggtt tcctaacttg 600
acagcatcca tcaggaccag gcgtggtgaa aaagtttgca tgaatgttcc catgtataaa 660
gatatagcta ctccagaaac ggatgactcc atctacgatc gagattggtt tttaccagaa 720
gacaaagagg cgaaactggc ttccaaaccg ggtttcattt atatggattc catgggtttt 780
ggcatgggct gttcgtgctt acaagtgacc tttcaggcac ccaatatcaa caaggcacgt 840
tacctgtacg atgcattagt gaattttgca cctataatgc tagccttctc tgccgctgcg 900
cctgctttta aaggttggct agccgaccaa gatgttcgtt ggaatgtgat atctggtgcg 960
gtggacgacc gtactccgaa ggaaagaggt gttgcgccat tactacccaa atacaacaag 1020
aacggatttg gaggcattgc caaagacgta caagataaag tccttgaaat accaaagtca 1080
agatatagtt cggttgatct tttcttgggt gggtcgaaat ttttcaatag gacttataac 1140
gacacaaatg tacctattaa tgaaaaagta ttaggacgac tactagagaa tgataaggcg 1200
ccactggact atgatcttgc taaacatttt gcgcatctct acataagaga tccagtatct 1260
acattcgaag aactgttgaa tcaggacaac aaaacgtctt caaatcactt tgaaaacatc 1320
caaagtacaa attggcagac attacgtttt aaacccccca cacaacaagc aaccccggac 1380
aaaaaggatt ctcctggttg gagagtggaa ttcagaccat ttgaagtgca actattagat 1440
tttgagaacg ctgcgtattc cgtgctcata tacttgattg tcgatagcat tttgaccttt 1500
tccgataata ttaacgcata tattcatatg tccaaagtat gggaaaatat gaagatagcc 1560
catcacagag atgctatcct atttgaaaaa tttcattgga aaaaatcatt tcgcaacgac 1620
accgatgtgg aaactgaaga ttattctata agcgagattt tccataatcc agagaatggt 1680
atatttcctc aatttgttac gccaatccta tgccaaaaag ggtttgtaac caaagattgg 1740
aaagaattaa agcattcttc caaacacgag agactatact attatttaaa gctaatttct 1800
gatagagcaa gcggtgaatt gccaacaaca gcaaaattct ttagaaattt tgtactacaa 1860
catccagatt acaaacatga ttcaaaaatt tcaaagtcga tcaattatga tttgctttct 1920
acgtgtgata gacttaccca tttagacgat tcaaaaggtg aattgacatc ctttttagga 1980
gctgaaattg cagaatatgt aaaaaaaaat aagccttcaa tagaaagcaa atgttaa 2037
<210> 4
<211> 678
<212> PRT
<213> 人工序列
<220>
<223> 具有Arg125Gly突变的Gsh1
<400> 4
Met Gly Leu Leu Ala Leu Gly Thr Pro Leu Gln Trp Phe Glu Ser Arg
1 5 10 15
Thr Tyr Asn Glu His Ile Arg Asp Glu Gly Ile Glu Gln Leu Leu Tyr
20 25 30
Ile Phe Gln Ala Ala Gly Lys Arg Asp Asn Asp Pro Leu Phe Trp Gly
35 40 45
Asp Glu Leu Glu Tyr Met Val Val Asp Phe Asp Asp Lys Glu Arg Asn
50 55 60
Ser Met Leu Asp Val Cys His Asp Lys Ile Leu Thr Glu Leu Asn Met
65 70 75 80
Glu Asp Ser Ser Leu Cys Glu Ala Asn Asp Val Ser Phe His Pro Glu
85 90 95
Tyr Gly Arg Tyr Met Leu Glu Ala Thr Pro Ala Ser Pro Tyr Leu Asn
100 105 110
Tyr Val Gly Ser Tyr Val Glu Val Asn Met Gln Lys Gly Arg Ala Ile
115 120 125
Ala Glu Tyr Lys Leu Ser Glu Tyr Ala Arg Gln Asp Ser Lys Asn Asn
130 135 140
Leu His Val Gly Ser Arg Ser Val Pro Leu Thr Leu Thr Val Phe Pro
145 150 155 160
Arg Met Gly Cys Pro Asp Phe Ile Asn Ile Lys Asp Pro Trp Asn His
165 170 175
Lys Asn Ala Ala Ser Arg Ser Leu Phe Leu Pro Asp Glu Val Ile Asn
180 185 190
Arg His Val Arg Phe Pro Asn Leu Thr Ala Ser Ile Arg Thr Arg Arg
195 200 205
Gly Glu Lys Val Cys Met Asn Val Pro Met Tyr Lys Asp Ile Ala Thr
210 215 220
Pro Glu Thr Asp Asp Ser Ile Tyr Asp Arg Asp Trp Phe Leu Pro Glu
225 230 235 240
Asp Lys Glu Ala Lys Leu Ala Ser Lys Pro Gly Phe Ile Tyr Met Asp
245 250 255
Ser Met Gly Phe Gly Met Gly Cys Ser Cys Leu Gln Val Thr Phe Gln
260 265 270
Ala Pro Asn Ile Asn Lys Ala Arg Tyr Leu Tyr Asp Ala Leu Val Asn
275 280 285
Phe Ala Pro Ile Met Leu Ala Phe Ser Ala Ala Ala Pro Ala Phe Lys
290 295 300
Gly Trp Leu Ala Asp Gln Asp Val Arg Trp Asn Val Ile Ser Gly Ala
305 310 315 320
Val Asp Asp Arg Thr Pro Lys Glu Arg Gly Val Ala Pro Leu Leu Pro
325 330 335
Lys Tyr Asn Lys Asn Gly Phe Gly Gly Ile Ala Lys Asp Val Gln Asp
340 345 350
Lys Val Leu Glu Ile Pro Lys Ser Arg Tyr Ser Ser Val Asp Leu Phe
355 360 365
Leu Gly Gly Ser Lys Phe Phe Asn Arg Thr Tyr Asn Asp Thr Asn Val
370 375 380
Pro Ile Asn Glu Lys Val Leu Gly Arg Leu Leu Glu Asn Asp Lys Ala
385 390 395 400
Pro Leu Asp Tyr Asp Leu Ala Lys His Phe Ala His Leu Tyr Ile Arg
405 410 415
Asp Pro Val Ser Thr Phe Glu Glu Leu Leu Asn Gln Asp Asn Lys Thr
420 425 430
Ser Ser Asn His Phe Glu Asn Ile Gln Ser Thr Asn Trp Gln Thr Leu
435 440 445
Arg Phe Lys Pro Pro Thr Gln Gln Ala Thr Pro Asp Lys Lys Asp Ser
450 455 460
Pro Gly Trp Arg Val Glu Phe Arg Pro Phe Glu Val Gln Leu Leu Asp
465 470 475 480
Phe Glu Asn Ala Ala Tyr Ser Val Leu Ile Tyr Leu Ile Val Asp Ser
485 490 495
Ile Leu Thr Phe Ser Asp Asn Ile Asn Ala Tyr Ile His Met Ser Lys
500 505 510
Val Trp Glu Asn Met Lys Ile Ala His His Arg Asp Ala Ile Leu Phe
515 520 525
Glu Lys Phe His Trp Lys Lys Ser Phe Arg Asn Asp Thr Asp Val Glu
530 535 540
Thr Glu Asp Tyr Ser Ile Ser Glu Ile Phe His Asn Pro Glu Asn Gly
545 550 555 560
Ile Phe Pro Gln Phe Val Thr Pro Ile Leu Cys Gln Lys Gly Phe Val
565 570 575
Thr Lys Asp Trp Lys Glu Leu Lys His Ser Ser Lys His Glu Arg Leu
580 585 590
Tyr Tyr Tyr Leu Lys Leu Ile Ser Asp Arg Ala Ser Gly Glu Leu Pro
595 600 605
Thr Thr Ala Lys Phe Phe Arg Asn Phe Val Leu Gln His Pro Asp Tyr
610 615 620
Lys His Asp Ser Lys Ile Ser Lys Ser Ile Asn Tyr Asp Leu Leu Ser
625 630 635 640
Thr Cys Asp Arg Leu Thr His Leu Asp Asp Ser Lys Gly Glu Leu Thr
645 650 655
Ser Phe Leu Gly Ala Glu Ile Ala Glu Tyr Val Lys Lys Asn Lys Pro
660 665 670
Ser Ile Glu Ser Lys Cys
675
<210> 5
<211> 1764
<212> DNA
<213> 酿酒酵母
<400> 5
atgatgaatc cacacgttca agaaaatttg caagcaatcc acaacgcctt aagcaatttt 60
gatacgtcat ttttatcgga ggatgaagaa gattattgcc ctctttgtat tgaaccaatg 120
gatattactg ataaaaattt ttttccttgt ccctgtggtt atcaaatttg tcaattttgc 180
tacaataata tcagacaaaa tccagaatta aatggccgtt gcccagcatg tcgtcgtaaa 240
tatgatgacg agaacgtcag atacgtcaca ttatctccgg aggagttaaa aatggagaga 300
gccaagctcg ctaggaagga gaaagaaaga aagcatagag aaaaagaacg taaagagaat 360
gaatatacga ataggaaaca tttatctggt accagagtta tccaaaagaa tttagtgtac 420
gttgttggca tcaatcctcc tgttccatac gaggaagttg cgcccactct gaaatctgaa 480
aaatattttg gccaatatgg taagataaat aagattgtgg ttaatagaaa aacaccccat 540
tctaacaaca caaccagcga gcattatcac catcattcac caggatatgg cgtttacata 600
accttcggat ccaaggacga tgctgcaaga tgtatagctc aggtagacgg gacgtatatg 660
gatggccgcc tgatcaaagc tgcctacggt actactaaat actgttcttc ttatttaaga 720
ggattgccat gcccaaatcc caactgtatg tttttgcatg aacctggtga agaagctgat 780
tcttttaata aaagagaact ccacaataaa caacaagcgc aacagcaaag tggcggaact 840
gcattcacta gatctggaat acacaacaat atatctacca gtaccgctgg ttcaaatacc 900
aatttactaa gtgaaaattt cacaggcaca ccttcaccgg cggcgatgag ggctcagtta 960
catcatgaca gccatacaaa cgctggaaca ccggtattaa cacctgctcc ggtccctgca 1020
gggtcaaatc cttggggagt tactcaatca gcaacacctg taacctctat caatctctct 1080
aaaaacagca gctccataaa cttgccaaca ttaaatgatt ctctgggcca tcatactacc 1140
cccacaacag agaataccat cacaagtacg acaactacta ccaataccaa tgctacaagt 1200
cactcccatg gtagcaagaa gaagcaatct cttgctgcag aggaatacaa agatccttat 1260
gacgcactag ggaatgctgt tgactttttg gatgcaagac tacattctct atcaaattat 1320
cagaagcgcc ctatatctat caaatccaat attattgacg aagaaactta taaaaagtat 1380
ccgtctttgt tttcttggga caagattgag gcctcaaaga aaagtgacaa tacattagcc 1440
aacaaacttg tggagatcct ggctataaag ccaatagact acactgcttc tgtcgttcaa 1500
ttcttgcaga gtgtcaatgt tggtgtaaat gacaatatta caatcacaga taatacgaaa 1560
actcccaccc aaccaataag actgcaaacc gtctcacagc aaatccaacc accattaaac 1620
gtcagtaccc ctccaccggg tatctttggt ccacaacata aggttcctat tcagcagcaa 1680
caaatgggtg atacaagctc aagaaattcc tctgatttac taaatcaact aatcaacgga 1740
aggaaaatta tcgccggtaa ttaa 1764
<210> 6
<211> 587
<212> PRT
<213> 酿酒酵母
<400> 6
Met Met Asn Pro His Val Gln Glu Asn Leu Gln Ala Ile His Asn Ala
1 5 10 15
Leu Ser Asn Phe Asp Thr Ser Phe Leu Ser Glu Asp Glu Glu Asp Tyr
20 25 30
Cys Pro Leu Cys Ile Glu Pro Met Asp Ile Thr Asp Lys Asn Phe Phe
35 40 45
Pro Cys Pro Cys Gly Tyr Gln Ile Cys Gln Phe Cys Tyr Asn Asn Ile
50 55 60
Arg Gln Asn Pro Glu Leu Asn Gly Arg Cys Pro Ala Cys Arg Arg Lys
65 70 75 80
Tyr Asp Asp Glu Asn Val Arg Tyr Val Thr Leu Ser Pro Glu Glu Leu
85 90 95
Lys Met Glu Arg Ala Lys Leu Ala Arg Lys Glu Lys Glu Arg Lys His
100 105 110
Arg Glu Lys Glu Arg Lys Glu Asn Glu Tyr Thr Asn Arg Lys His Leu
115 120 125
Ser Gly Thr Arg Val Ile Gln Lys Asn Leu Val Tyr Val Val Gly Ile
130 135 140
Asn Pro Pro Val Pro Tyr Glu Glu Val Ala Pro Thr Leu Lys Ser Glu
145 150 155 160
Lys Tyr Phe Gly Gln Tyr Gly Lys Ile Asn Lys Ile Val Val Asn Arg
165 170 175
Lys Thr Pro His Ser Asn Asn Thr Thr Ser Glu His Tyr His His His
180 185 190
Ser Pro Gly Tyr Gly Val Tyr Ile Thr Phe Gly Ser Lys Asp Asp Ala
195 200 205
Ala Arg Cys Ile Ala Gln Val Asp Gly Thr Tyr Met Asp Gly Arg Leu
210 215 220
Ile Lys Ala Ala Tyr Gly Thr Thr Lys Tyr Cys Ser Ser Tyr Leu Arg
225 230 235 240
Gly Leu Pro Cys Pro Asn Pro Asn Cys Met Phe Leu His Glu Pro Gly
245 250 255
Glu Glu Ala Asp Ser Phe Asn Lys Arg Glu Leu His Asn Lys Gln Gln
260 265 270
Ala Gln Gln Gln Ser Gly Gly Thr Ala Phe Thr Arg Ser Gly Ile His
275 280 285
Asn Asn Ile Ser Thr Ser Thr Ala Gly Ser Asn Thr Asn Leu Leu Ser
290 295 300
Glu Asn Phe Thr Gly Thr Pro Ser Pro Ala Ala Met Arg Ala Gln Leu
305 310 315 320
His His Asp Ser His Thr Asn Ala Gly Thr Pro Val Leu Thr Pro Ala
325 330 335
Pro Val Pro Ala Gly Ser Asn Pro Trp Gly Val Thr Gln Ser Ala Thr
340 345 350
Pro Val Thr Ser Ile Asn Leu Ser Lys Asn Ser Ser Ser Ile Asn Leu
355 360 365
Pro Thr Leu Asn Asp Ser Leu Gly His His Thr Thr Pro Thr Thr Glu
370 375 380
Asn Thr Ile Thr Ser Thr Thr Thr Thr Thr Asn Thr Asn Ala Thr Ser
385 390 395 400
His Ser His Gly Ser Lys Lys Lys Gln Ser Leu Ala Ala Glu Glu Tyr
405 410 415
Lys Asp Pro Tyr Asp Ala Leu Gly Asn Ala Val Asp Phe Leu Asp Ala
420 425 430
Arg Leu His Ser Leu Ser Asn Tyr Gln Lys Arg Pro Ile Ser Ile Lys
435 440 445
Ser Asn Ile Ile Asp Glu Glu Thr Tyr Lys Lys Tyr Pro Ser Leu Phe
450 455 460
Ser Trp Asp Lys Ile Glu Ala Ser Lys Lys Ser Asp Asn Thr Leu Ala
465 470 475 480
Asn Lys Leu Val Glu Ile Leu Ala Ile Lys Pro Ile Asp Tyr Thr Ala
485 490 495
Ser Val Val Gln Phe Leu Gln Ser Val Asn Val Gly Val Asn Asp Asn
500 505 510
Ile Thr Ile Thr Asp Asn Thr Lys Thr Pro Thr Gln Pro Ile Arg Leu
515 520 525
Gln Thr Val Ser Gln Gln Ile Gln Pro Pro Leu Asn Val Ser Thr Pro
530 535 540
Pro Pro Gly Ile Phe Gly Pro Gln His Lys Val Pro Ile Gln Gln Gln
545 550 555 560
Gln Met Gly Asp Thr Ser Ser Arg Asn Ser Ser Asp Leu Leu Asn Gln
565 570 575
Leu Ile Asn Gly Arg Lys Ile Ile Ala Gly Asn
580 585
<210> 7
<211> 1764
<212> DNA
<213> 人工序列
<220>
<223> 具有T1285A突变的NOT4
<400> 7
atgatgaatc cacacgttca agaaaatttg caagcaatcc acaacgcctt aagcaatttt 60
gatacgtcat ttttatcgga ggatgaagaa gattattgcc ctctttgtat tgaaccaatg 120
gatattactg ataaaaattt ttttccttgt ccctgtggtt atcaaatttg tcaattttgc 180
tacaataata tcagacaaaa tccagaatta aatggccgtt gcccagcatg tcgtcgtaaa 240
tatgatgacg agaacgtcag atacgtcaca ttatctccgg aggagttaaa aatggagaga 300
gccaagctcg ctaggaagga gaaagaaaga aagcatagag aaaaagaacg taaagagaat 360
gaatatacga ataggaaaca tttatctggt accagagtta tccaaaagaa tttagtgtac 420
gttgttggca tcaatcctcc tgttccatac gaggaagttg cgcccactct gaaatctgaa 480
aaatattttg gccaatatgg taagataaat aagattgtgg ttaatagaaa aacaccccat 540
tctaacaaca caaccagcga gcattatcac catcattcac caggatatgg cgtttacata 600
accttcggat ccaaggacga tgctgcaaga tgtatagctc aggtagacgg gacgtatatg 660
gatggccgcc tgatcaaagc tgcctacggt actactaaat actgttcttc ttatttaaga 720
ggattgccat gcccaaatcc caactgtatg tttttgcatg aacctggtga agaagctgat 780
tcttttaata aaagagaact ccacaataaa caacaagcgc aacagcaaag tggcggaact 840
gcattcacta gatctggaat acacaacaat atatctacca gtaccgctgg ttcaaatacc 900
aatttactaa gtgaaaattt cacaggcaca ccttcaccgg cggcgatgag ggctcagtta 960
catcatgaca gccatacaaa cgctggaaca ccggtattaa cacctgctcc ggtccctgca 1020
gggtcaaatc cttggggagt tactcaatca gcaacacctg taacctctat caatctctct 1080
aaaaacagca gctccataaa cttgccaaca ttaaatgatt ctctgggcca tcatactacc 1140
cccacaacag agaataccat cacaagtacg acaactacta ccaataccaa tgctacaagt 1200
cactcccatg gtagcaagaa gaagcaatct cttgctgcag aggaatacaa agatccttat 1260
gacgcactag ggaatgctgt tgacattttg gatgcaagac tacattctct atcaaattat 1320
cagaagcgcc ctatatctat caaatccaat attattgacg aagaaactta taaaaagtat 1380
ccgtctttgt tttcttggga caagattgag gcctcaaaga aaagtgacaa tacattagcc 1440
aacaaacttg tggagatcct ggctataaag ccaatagact acactgcttc tgtcgttcaa 1500
ttcttgcaga gtgtcaatgt tggtgtaaat gacaatatta caatcacaga taatacgaaa 1560
actcccaccc aaccaataag actgcaaacc gtctcacagc aaatccaacc accattaaac 1620
gtcagtaccc ctccaccggg tatctttggt ccacaacata aggttcctat tcagcagcaa 1680
caaatgggtg atacaagctc aagaaattcc tctgatttac taaatcaact aatcaacgga 1740
aggaaaatta tcgccggtaa ttaa 1764
<210> 8
<211> 587
<212> PRT
<213> 人工序列
<220>
<223> 具有Phe429Ile突变的Not4
<400> 8
Met Met Asn Pro His Val Gln Glu Asn Leu Gln Ala Ile His Asn Ala
1 5 10 15
Leu Ser Asn Phe Asp Thr Ser Phe Leu Ser Glu Asp Glu Glu Asp Tyr
20 25 30
Cys Pro Leu Cys Ile Glu Pro Met Asp Ile Thr Asp Lys Asn Phe Phe
35 40 45
Pro Cys Pro Cys Gly Tyr Gln Ile Cys Gln Phe Cys Tyr Asn Asn Ile
50 55 60
Arg Gln Asn Pro Glu Leu Asn Gly Arg Cys Pro Ala Cys Arg Arg Lys
65 70 75 80
Tyr Asp Asp Glu Asn Val Arg Tyr Val Thr Leu Ser Pro Glu Glu Leu
85 90 95
Lys Met Glu Arg Ala Lys Leu Ala Arg Lys Glu Lys Glu Arg Lys His
100 105 110
Arg Glu Lys Glu Arg Lys Glu Asn Glu Tyr Thr Asn Arg Lys His Leu
115 120 125
Ser Gly Thr Arg Val Ile Gln Lys Asn Leu Val Tyr Val Val Gly Ile
130 135 140
Asn Pro Pro Val Pro Tyr Glu Glu Val Ala Pro Thr Leu Lys Ser Glu
145 150 155 160
Lys Tyr Phe Gly Gln Tyr Gly Lys Ile Asn Lys Ile Val Val Asn Arg
165 170 175
Lys Thr Pro His Ser Asn Asn Thr Thr Ser Glu His Tyr His His His
180 185 190
Ser Pro Gly Tyr Gly Val Tyr Ile Thr Phe Gly Ser Lys Asp Asp Ala
195 200 205
Ala Arg Cys Ile Ala Gln Val Asp Gly Thr Tyr Met Asp Gly Arg Leu
210 215 220
Ile Lys Ala Ala Tyr Gly Thr Thr Lys Tyr Cys Ser Ser Tyr Leu Arg
225 230 235 240
Gly Leu Pro Cys Pro Asn Pro Asn Cys Met Phe Leu His Glu Pro Gly
245 250 255
Glu Glu Ala Asp Ser Phe Asn Lys Arg Glu Leu His Asn Lys Gln Gln
260 265 270
Ala Gln Gln Gln Ser Gly Gly Thr Ala Phe Thr Arg Ser Gly Ile His
275 280 285
Asn Asn Ile Ser Thr Ser Thr Ala Gly Ser Asn Thr Asn Leu Leu Ser
290 295 300
Glu Asn Phe Thr Gly Thr Pro Ser Pro Ala Ala Met Arg Ala Gln Leu
305 310 315 320
His His Asp Ser His Thr Asn Ala Gly Thr Pro Val Leu Thr Pro Ala
325 330 335
Pro Val Pro Ala Gly Ser Asn Pro Trp Gly Val Thr Gln Ser Ala Thr
340 345 350
Pro Val Thr Ser Ile Asn Leu Ser Lys Asn Ser Ser Ser Ile Asn Leu
355 360 365
Pro Thr Leu Asn Asp Ser Leu Gly His His Thr Thr Pro Thr Thr Glu
370 375 380
Asn Thr Ile Thr Ser Thr Thr Thr Thr Thr Asn Thr Asn Ala Thr Ser
385 390 395 400
His Ser His Gly Ser Lys Lys Lys Gln Ser Leu Ala Ala Glu Glu Tyr
405 410 415
Lys Asp Pro Tyr Asp Ala Leu Gly Asn Ala Val Asp Ile Leu Asp Ala
420 425 430
Arg Leu His Ser Leu Ser Asn Tyr Gln Lys Arg Pro Ile Ser Ile Lys
435 440 445
Ser Asn Ile Ile Asp Glu Glu Thr Tyr Lys Lys Tyr Pro Ser Leu Phe
450 455 460
Ser Trp Asp Lys Ile Glu Ala Ser Lys Lys Ser Asp Asn Thr Leu Ala
465 470 475 480
Asn Lys Leu Val Glu Ile Leu Ala Ile Lys Pro Ile Asp Tyr Thr Ala
485 490 495
Ser Val Val Gln Phe Leu Gln Ser Val Asn Val Gly Val Asn Asp Asn
500 505 510
Ile Thr Ile Thr Asp Asn Thr Lys Thr Pro Thr Gln Pro Ile Arg Leu
515 520 525
Gln Thr Val Ser Gln Gln Ile Gln Pro Pro Leu Asn Val Ser Thr Pro
530 535 540
Pro Pro Gly Ile Phe Gly Pro Gln His Lys Val Pro Ile Gln Gln Gln
545 550 555 560
Gln Met Gly Asp Thr Ser Ser Arg Asn Ser Ser Asp Leu Leu Asn Gln
565 570 575
Leu Ile Asn Gly Arg Lys Ile Ile Ala Gly Asn
580 585
<210> 9
<211> 1755
<212> DNA
<213> 智人
<400> 9
gatgcacaca agagtgaggt tgctcatcgg tttaaagatt tgggagaaga aaatttcaaa 60
gccttggtgt tgattgcctt tgctcagtat cttcagcagt gtccatttga agatcatgta 120
aaattagtga atgaagtaac tgaatttgca aaaacatgtg ttgctgatga gtcagctgaa 180
aattgtgaca aatcacttca tacccttttt ggagacaaat tatgcacagt tgcaactctt 240
cgtgaaacct atggtgaaat ggctgactgc tgtgcaaaac aagaacctga gagaaatgaa 300
tgcttcttgc aacacaaaga tgacaaccca aacctccccc gattggtgag accagaggtt 360
gatgtgatgt gcactgcttt tcatgacaat gaagagacat ttttgaaaaa atacttatat 420
gaaattgcca gaagacatcc ttacttttat gccccggaac tccttttctt tgctaaaagg 480
tataaagctg cttttacaga atgttgccaa gctgctgata aagctgcctg cctgttgcca 540
aagctcgatg aacttcggga tgaagggaag gcttcgtctg ccaaacagag actcaagtgt 600
gccagtctcc aaaaatttgg agaaagagct ttcaaagcat gggcagtagc tcgcctgagc 660
cagagatttc ccaaagctga gtttgcagaa gtttccaagt tagtgacaga tcttaccaaa 720
gtccacacgg aatgctgcca tggagatctg cttgaatgtg ctgatgacag ggcggacctt 780
gccaagtata tctgtgaaaa tcaagattcg atctccagta aactgaagga atgctgtgaa 840
aaacctctgt tggaaaaatc ccactgcatt gccgaagtgg aaaatgatga gatgcctgct 900
gacttgcctt cattagctgc tgattttgtt gaaagtaagg atgtttgcaa aaactatgct 960
gaggcaaagg atgtcttcct gggcatgttt ttgtatgaat atgcaagaag gcatcctgat 1020
tactctgtcg tgctgctgct gagacttgcc aagacatatg aaaccactct agagaagtgc 1080
tgtgccgctg cagatcctca tgaatgctat gccaaagtgt tcgatgaatt taaacctctt 1140
gtggaagagc ctcagaattt aatcaaacaa aattgtgagc tttttgagca gcttggagag 1200
tacaaattcc agaatgcgct attagttcgt tacaccaaga aagtacccca agtgtcaact 1260
ccaactcttg tagaggtctc aagaaaccta ggaaaagtgg gcagcaaatg ttgtaaacat 1320
cctgaagcaa aaagaatgcc ctgtgcagaa gactatctat ccgtggtcct gaaccagtta 1380
tgtgtgttgc atgagaaaac gccagtaagt gacagagtca ccaaatgctg cacagaatcc 1440
ttggtgaaca ggcgaccatg cttttcagct ctggaagtcg atgaaacata cgttcccaaa 1500
gagtttaatg ctgaaacatt caccttccat gcagatatat gcacactttc tgagaaggag 1560
agacaaatca agaaacaaac tgcacttgtt gagctcgtga aacacaagcc caaggcaaca 1620
aaagagcaac tgaaagctgt tatggatgat ttcgcagctt ttgtagagaa gtgctgcaag 1680
gctgacgata aggagacctg ctttgccgag gagggtaaaa aacttgttgc tgcaagtcaa 1740
gctgccttag gctta 1755
<210> 10
<211> 585
<212> PRT
<213> 智人
<400> 10
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu
580 585
<210> 11
<211> 1827
<212> DNA
<213> 智人
<400> 11
atgaagtggg taagctttat ttcccttctt tttctcttta gctcggctta ttccaggagc 60
ttggataaaa gagatgcaca caagagtgag gttgctcatc ggtttaaaga tttgggagaa 120
gaaaatttca aagccttggt gttgattgcc tttgctcagt atcttcagca gtgtccattt 180
gaagatcatg taaaattagt gaatgaagta actgaatttg caaaaacatg tgttgctgat 240
gagtcagctg aaaattgtga caaatcactt catacccttt ttggagacaa attatgcaca 300
gttgcaactc ttcgtgaaac ctatggtgaa atggctgact gctgtgcaaa acaagaacct 360
gagagaaatg aatgcttctt gcaacacaaa gatgacaacc caaacctccc ccgattggtg 420
agaccagagg ttgatgtgat gtgcactgct tttcatgaca atgaagagac atttttgaaa 480
aaatacttat atgaaattgc cagaagacat ccttactttt atgccccgga actccttttc 540
tttgctaaaa ggtataaagc tgcttttaca gaatgttgcc aagctgctga taaagctgcc 600
tgcctgttgc caaagctcga tgaacttcgg gatgaaggga aggcttcgtc tgccaaacag 660
agactcaagt gtgccagtct ccaaaaattt ggagaaagag ctttcaaagc atgggcagta 720
gctcgcctga gccagagatt tcccaaagct gagtttgcag aagtttccaa gttagtgaca 780
gatcttacca aagtccacac ggaatgctgc catggagatc tgcttgaatg tgctgatgac 840
agggcggacc ttgccaagta tatctgtgaa aatcaagatt cgatctccag taaactgaag 900
gaatgctgtg aaaaacctct gttggaaaaa tcccactgca ttgccgaagt ggaaaatgat 960
gagatgcctg ctgacttgcc ttcattagct gctgattttg ttgaaagtaa ggatgtttgc 1020
aaaaactatg ctgaggcaaa ggatgtcttc ctgggcatgt ttttgtatga atatgcaaga 1080
aggcatcctg attactctgt cgtgctgctg ctgagacttg ccaagacata tgaaaccact 1140
ctagagaagt gctgtgccgc tgcagatcct catgaatgct atgccaaagt gttcgatgaa 1200
tttaaacctc ttgtggaaga gcctcagaat ttaatcaaac aaaattgtga gctttttgag 1260
cagcttggag agtacaaatt ccagaatgcg ctattagttc gttacaccaa gaaagtaccc 1320
caagtgtcaa ctccaactct tgtagaggtc tcaagaaacc taggaaaagt gggcagcaaa 1380
tgttgtaaac atcctgaagc aaaaagaatg ccctgtgcag aagactatct atccgtggtc 1440
ctgaaccagt tatgtgtgtt gcatgagaaa acgccagtaa gtgacagagt caccaaatgc 1500
tgcacagaat ccttggtgaa caggcgacca tgcttttcag ctctggaagt cgatgaaaca 1560
tacgttccca aagagtttaa tgctgaaaca ttcaccttcc atgcagatat atgcacactt 1620
tctgagaagg agagacaaat caagaaacaa actgcacttg ttgagctcgt gaaacacaag 1680
cccaaggcaa caaaagagca actgaaagct gttatggatg atttcgcagc ttttgtagag 1740
aagtgctgca aggctgacga taaggagacc tgctttgccg aggagggtaa aaaacttgtt 1800
gctgcaagtc aagctgcctt aggctta 1827
<210> 12
<211> 609
<212> PRT
<213> 智人
<400> 12
Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala
20 25 30
His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu
35 40 45
Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val
50 55 60
Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp
65 70 75 80
Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp
85 90 95
Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala
100 105 110
Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln
115 120 125
His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val
130 135 140
Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys
145 150 155 160
Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro
165 170 175
Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys
180 185 190
Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu
195 200 205
Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys
210 215 220
Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val
225 230 235 240
Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser
245 250 255
Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly
260 265 270
Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile
275 280 285
Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu
290 295 300
Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp
305 310 315 320
Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser
325 330 335
Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly
340 345 350
Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val
355 360 365
Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys
370 375 380
Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu
385 390 395 400
Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys
405 410 415
Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu
420 425 430
Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val
435 440 445
Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His
450 455 460
Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val
465 470 475 480
Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg
485 490 495
Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe
500 505 510
Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala
515 520 525
Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu
530 535 540
Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys
545 550 555 560
Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala
565 570 575
Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe
580 585 590
Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly
595 600 605
Leu
<210> 13
<211> 2108
<212> PRT
<213> 酿酒酵母
<400> 13
Met Leu Ser Ala Thr Tyr Arg Asp Leu Asn Thr Ala Ser Asn Leu Glu
1 5 10 15
Thr Ser Lys Glu Lys Gln Ala Ala Gln Ile Val Ile Ala Gln Ile Ser
20 25 30
Leu Leu Phe Thr Thr Leu Asn Asn Asp Asn Phe Glu Ser Val Glu Arg
35 40 45
Glu Ile Arg His Ile Leu Asp Arg Ser Ser Val Asp Ile Tyr Ile Lys
50 55 60
Val Trp Glu Arg Leu Leu Thr Leu Ser Ser Arg Asp Ile Leu Gln Ala
65 70 75 80
Gly Lys Phe Leu Leu Gln Glu Asn Leu Leu His Arg Leu Leu Leu Glu
85 90 95
Phe Ala Lys Asp Leu Pro Lys Lys Ser Thr Asp Leu Ile Glu Leu Leu
100 105 110
Lys Glu Arg Thr Phe Asn Asn Gln Glu Phe Gln Lys Gln Thr Gly Ile
115 120 125
Thr Leu Ser Leu Phe Ile Asp Leu Phe Asp Lys Ser Ala Asn Lys Asp
130 135 140
Ile Ile Glu Ser Leu Asp Arg Ser Ser Gln Ile Asn Asp Phe Lys Thr
145 150 155 160
Ile Lys Met Asn His Thr Asn Tyr Leu Arg Asn Phe Phe Leu Gln Thr
165 170 175
Thr Pro Glu Thr Leu Glu Ser Asn Leu Arg Asp Leu Leu His Ser Leu
180 185 190
Glu Gly Glu Ser Leu Asn Asp Leu Leu Ala Leu Leu Leu Ser Glu Ile
195 200 205
Leu Ser Pro Gly Ser Gln Asn Leu Gln Asn Asp Pro Thr Arg Ser Trp
210 215 220
Leu Thr Pro Pro Met Val Leu Asp Ala Thr Asn Arg Gly Asn Val Ile
225 230 235 240
Ala Arg Ser Ile Ser Ser Leu Gln Ala Asn Gln Ile Asn Trp Asn Arg
245 250 255
Val Phe Asn Leu Met Ser Thr Lys Tyr Phe Leu Ser Ala Pro Leu Met
260 265 270
Pro Thr Thr Ala Ser Leu Ser Cys Leu Phe Ala Ala Leu His Asp Gly
275 280 285
Pro Val Ile Asp Glu Phe Phe Ser Cys Asp Trp Lys Val Ile Phe Lys
290 295 300
Leu Asp Leu Ala Ile Gln Leu His Lys Trp Ser Val Gln Asn Gly Cys
305 310 315 320
Phe Asp Leu Leu Asn Ala Glu Gly Thr Arg Lys Val Ser Glu Thr Ile
325 330 335
Pro Asn Thr Lys Gln Ser Leu Leu Tyr Leu Leu Ser Ile Ala Ser Leu
340 345 350
Asn Leu Glu Leu Phe Leu Gln Arg Glu Glu Leu Ser Asp Gly Pro Met
355 360 365
Leu Ala Tyr Phe Gln Glu Cys Phe Phe Glu Asp Phe Asn Tyr Ala Pro
370 375 380
Glu Tyr Leu Ile Leu Ala Leu Val Lys Glu Met Lys Arg Phe Val Leu
385 390 395 400
Leu Ile Glu Asn Arg Thr Val Ile Asp Glu Ile Leu Ile Thr Leu Leu
405 410 415
Ile Gln Val His Asn Lys Ser Pro Ser Ser Phe Lys Asp Val Ile Ser
420 425 430
Thr Ile Thr Asp Asp Ser Lys Ile Val Asp Ala Ala Lys Ile Ile Ile
435 440 445
Asn Ser Asp Asp Ala Pro Ile Ala Asn Phe Leu Lys Ser Leu Leu Asp
450 455 460
Thr Gly Arg Leu Asp Thr Val Ile Asn Lys Leu Pro Phe Asn Glu Ala
465 470 475 480
Phe Lys Ile Leu Pro Cys Ala Arg Gln Ile Gly Trp Glu Gly Phe Asp
485 490 495
Thr Phe Leu Lys Thr Lys Val Ser Pro Ser Asn Val Asp Val Val Leu
500 505 510
Glu Ser Leu Glu Val Gln Thr Lys Met Thr Asp Thr Asn Thr Pro Phe
515 520 525
Arg Ser Leu Lys Thr Phe Asp Leu Phe Ala Phe His Ser Leu Ile Glu
530 535 540
Val Leu Asn Lys Cys Pro Leu Asp Val Leu Gln Leu Gln Arg Phe Glu
545 550 555 560
Ser Leu Glu Phe Ser Leu Leu Ile Ala Phe Pro Arg Leu Ile Asn Phe
565 570 575
Gly Phe Gly His Asp Glu Ala Ile Leu Ala Asn Gly Asp Ile Ala Gly
580 585 590
Ile Asn Asn Asp Ile Glu Lys Glu Met Gln Asn Tyr Leu Gln Lys Met
595 600 605
Tyr Ser Gly Glu Leu Ala Ile Lys Asp Val Ile Glu Leu Leu Arg Arg
610 615 620
Leu Arg Asp Ser Asp Leu Pro Arg Asp Gln Glu Val Phe Thr Cys Ile
625 630 635 640
Thr His Ala Val Ile Ala Glu Ser Thr Phe Phe Gln Asp Tyr Pro Leu
645 650 655
Asp Ala Leu Ala Thr Thr Ser Val Leu Phe Gly Ser Met Ile Leu Phe
660 665 670
Gln Leu Leu Arg Gly Phe Val Leu Asp Val Ala Phe Arg Ile Ile Met
675 680 685
Arg Phe Ala Lys Glu Pro Pro Glu Ser Lys Met Phe Lys Phe Ala Val
690 695 700
Gln Ala Ile Tyr Ala Phe Arg Ile Arg Leu Ala Glu Tyr Pro Gln Tyr
705 710 715 720
Cys Lys Asp Leu Leu Arg Asp Val Pro Ala Leu Lys Ser Gln Ala Gln
725 730 735
Val Tyr Gln Ser Ile Val Glu Ala Ala Thr Leu Ala Asn Ala Pro Lys
740 745 750
Glu Arg Ser Arg Pro Val Gln Glu Met Ile Pro Leu Lys Phe Phe Ala
755 760 765
Val Asp Glu Val Ser Cys Gln Ile Asn Gln Glu Gly Ala Pro Lys Asp
770 775 780
Val Val Glu Lys Val Leu Phe Val Leu Asn Asn Val Thr Leu Ala Asn
785 790 795 800
Leu Asn Asn Lys Val Asp Glu Leu Lys Lys Ser Leu Thr Pro Asn Tyr
805 810 815
Phe Ser Trp Phe Ser Thr Tyr Leu Val Thr Gln Arg Ala Lys Thr Glu
820 825 830
Pro Asn Tyr His Asp Leu Tyr Ser Lys Val Ile Val Ala Met Gly Ser
835 840 845
Gly Leu Leu His Gln Phe Met Val Asn Val Thr Leu Arg Gln Leu Phe
850 855 860
Val Leu Leu Ser Thr Lys Asp Glu Gln Ala Ile Asp Lys Lys His Leu
865 870 875 880
Lys Asn Leu Ala Ser Trp Leu Gly Cys Ile Thr Leu Ala Leu Asn Lys
885 890 895
Pro Ile Lys His Lys Asn Ile Ala Phe Arg Glu Met Leu Ile Glu Ala
900 905 910
Tyr Lys Glu Asn Arg Leu Glu Ile Val Val Pro Phe Val Thr Lys Ile
915 920 925
Leu Gln Arg Ala Ser Glu Ser Lys Ile Phe Lys Pro Pro Asn Pro Trp
930 935 940
Thr Val Gly Ile Leu Lys Leu Leu Ile Glu Leu Asn Glu Lys Ala Asn
945 950 955 960
Trp Lys Leu Ser Leu Thr Phe Glu Val Glu Val Leu Leu Lys Ser Phe
965 970 975
Asn Leu Thr Thr Lys Ser Leu Lys Pro Ser Asn Phe Ile Asn Thr Pro
980 985 990
Glu Val Ile Glu Thr Leu Ser Gly Ala Leu Gly Ser Ile Thr Leu Glu
995 1000 1005
Gln Gln Gln Thr Glu Gln Gln Arg Gln Ile Ile Leu Met Gln Gln
1010 1015 1020
His Gln Gln Gln Met Leu Ile Tyr Gln Gln Arg Gln Gln Gln Gln
1025 1030 1035
Gln Gln Arg Gln Gln Gln Gln Gln His His Ile Ser Ala Asn Thr
1040 1045 1050
Ile Ala Asp Gln Gln Ala Ala Phe Gly Gly Glu Gly Ser Ile Ser
1055 1060 1065
His Asp Asn Pro Phe Asn Asn Leu Leu Gly Ser Thr Ile Phe Val
1070 1075 1080
Thr His Pro Asp Leu Lys Arg Val Phe Gln Met Ala Leu Ala Lys
1085 1090 1095
Ser Val Arg Glu Ile Leu Leu Glu Val Val Glu Lys Ser Ser Gly
1100 1105 1110
Ile Ala Val Val Thr Thr Thr Lys Ile Ile Leu Lys Asp Phe Ala
1115 1120 1125
Thr Glu Val Asp Glu Ser Lys Leu Lys Thr Ala Ala Ile Ile Met
1130 1135 1140
Val Arg His Leu Ala Gln Ser Leu Ala Arg Ala Thr Ser Ile Glu
1145 1150 1155
Pro Leu Lys Glu Gly Ile Arg Ser Thr Met Gln Ser Leu Ala Pro
1160 1165 1170
Asn Leu Met Ser Leu Ser Ser Ser Pro Ala Glu Glu Leu Asp Thr
1175 1180 1185
Ala Ile Asn Glu Asn Ile Gly Ile Ala Leu Val Leu Ile Glu Lys
1190 1195 1200
Ala Ser Met Asp Lys Ser Thr Gln Asp Leu Ala Asp Gln Leu Met
1205 1210 1215
Gln Ala Ile Ala Ile Arg Arg Tyr His Lys Glu Arg Arg Ala Asp
1220 1225 1230
Gln Pro Phe Ile Thr Gln Asn Thr Asn Pro Tyr Ser Leu Ser Leu
1235 1240 1245
Pro Glu Pro Leu Gly Leu Lys Asn Thr Gly Val Thr Pro Gln Gln
1250 1255 1260
Phe Arg Val Tyr Glu Glu Phe Gly Lys Asn Ile Pro Asn Leu Asp
1265 1270 1275
Val Ile Pro Phe Ala Gly Leu Pro Ala His Ala Pro Pro Met Thr
1280 1285 1290
Gln Asn Val Gly Leu Thr Gln Pro Gln Gln Gln Gln Ala Gln Met
1295 1300 1305
Pro Thr Gln Ile Leu Thr Ser Glu Gln Ile Arg Ala Gln Gln Gln
1310 1315 1320
Gln Gln Gln Leu Gln Lys Ser Arg Leu Asn Gln Pro Ser Gln Ser
1325 1330 1335
Ala Gln Pro Pro Gly Val Asn Val Pro Asn Pro Gln Gly Gly Ile
1340 1345 1350
Ala Ala Val Gln Ser Asp Leu Glu Gln Asn Gln Arg Val Leu Val
1355 1360 1365
His Leu Met Asp Ile Leu Val Ser Gln Ile Lys Glu Asn Ala Thr
1370 1375 1380
Lys Asn Asn Leu Ala Glu Leu Gly Asp Gln Asn Gln Ile Lys Thr
1385 1390 1395
Ile Ile Phe Gln Ile Leu Thr Phe Ile Ala Lys Ser Ala Gln Lys
1400 1405 1410
Asp Gln Leu Ala Leu Lys Val Ser Gln Ala Val Val Asn Ser Leu
1415 1420 1425
Phe Ala Thr Ser Glu Ser Pro Leu Cys Arg Glu Val Leu Ser Leu
1430 1435 1440
Leu Leu Glu Lys Leu Cys Ser Leu Ser Leu Val Ala Arg Lys Asp
1445 1450 1455
Val Val Trp Trp Leu Val Tyr Ala Leu Asp Ser Arg Lys Phe Asn
1460 1465 1470
Val Pro Val Ile Arg Ser Leu Leu Glu Val Asn Leu Ile Asp Ala
1475 1480 1485
Thr Glu Leu Asp Asn Val Leu Val Thr Ala Met Lys Asn Lys Met
1490 1495 1500
Glu Asn Ser Thr Glu Phe Ala Met Lys Leu Ile Gln Asn Thr Val
1505 1510 1515
Leu Ser Asp Asp Pro Ile Leu Met Arg Met Asp Phe Ile Lys Thr
1520 1525 1530
Leu Glu His Leu Ala Ser Ser Glu Asp Glu Asn Val Lys Lys Phe
1535 1540 1545
Ile Lys Glu Phe Glu Asp Thr Lys Ile Met Pro Val Arg Lys Gly
1550 1555 1560
Thr Lys Thr Thr Arg Thr Glu Lys Leu Tyr Leu Val Phe Thr Glu
1565 1570 1575
Trp Val Lys Leu Leu Gln Arg Val Glu Asn Asn Asp Val Ile Thr
1580 1585 1590
Thr Val Phe Ile Lys Gln Leu Val Glu Lys Gly Val Ile Ser Asp
1595 1600 1605
Thr Asp Asn Leu Leu Thr Phe Val Lys Ser Ser Leu Glu Leu Ser
1610 1615 1620
Val Ser Ser Phe Lys Glu Ser Asp Pro Thr Asp Glu Val Phe Ile
1625 1630 1635
Ala Ile Asp Ala Leu Gly Ser Leu Ile Ile Lys Leu Leu Ile Leu
1640 1645 1650
Gln Gly Phe Lys Asp Asp Thr Arg Arg Asp Tyr Ile Asn Ala Ile
1655 1660 1665
Phe Ser Val Ile Val Leu Val Phe Ala Lys Asp His Ser Gln Glu
1670 1675 1680
Gly Thr Thr Phe Asn Glu Arg Pro Tyr Phe Arg Leu Phe Ser Asn
1685 1690 1695
Ile Leu Tyr Glu Trp Ala Thr Ile Arg Thr His Asn Phe Val Arg
1700 1705 1710
Ile Ser Asp Ser Ser Thr Arg Gln Glu Leu Ile Glu Phe Asp Ser
1715 1720 1725
Val Phe Tyr Asn Thr Phe Ser Gly Tyr Leu His Ala Leu Gln Pro
1730 1735 1740
Phe Ala Phe Pro Gly Phe Ser Phe Ala Trp Val Thr Leu Leu Ser
1745 1750 1755
His Arg Met Leu Leu Pro Ile Met Leu Arg Leu Pro Asn Lys Ile
1760 1765 1770
Gly Trp Glu Lys Leu Met Leu Leu Ile Ile Asp Leu Phe Lys Phe
1775 1780 1785
Leu Asp Gln Tyr Thr Ser Lys His Ala Val Ser Asp Ala Val Ser
1790 1795 1800
Val Val Tyr Lys Gly Thr Leu Arg Val Ile Leu Gly Ile Ser Asn
1805 1810 1815
Asp Met Pro Ser Phe Leu Ile Glu Asn His Tyr Glu Leu Met Asn
1820 1825 1830
Asn Leu Pro Pro Thr Tyr Phe Gln Leu Lys Asn Val Ile Leu Ser
1835 1840 1845
Ala Ile Pro Lys Asn Met Thr Val Pro Asn Pro Tyr Asp Val Asp
1850 1855 1860
Leu Asn Met Glu Asp Ile Pro Ala Cys Lys Glu Leu Pro Glu Val
1865 1870 1875
Phe Phe Asp Pro Val Ile Asp Leu His Ser Leu Lys Lys Pro Val
1880 1885 1890
Asp Asn Tyr Leu Arg Ile Pro Ser Asn Ser Leu Leu Arg Thr Ile
1895 1900 1905
Leu Ser Ala Ile Tyr Lys Asp Thr Tyr Asp Ile Lys Lys Gly Val
1910 1915 1920
Gly Tyr Asp Phe Leu Ser Val Asp Ser Lys Leu Ile Arg Ala Ile
1925 1930 1935
Val Leu His Val Gly Ile Glu Ala Gly Ile Glu Tyr Lys Arg Thr
1940 1945 1950
Ser Ser Asn Ala Val Phe Asn Thr Lys Ser Ser Tyr Tyr Thr Leu
1955 1960 1965
Leu Phe Asn Leu Ile Gln Asn Gly Ser Ile Glu Met Lys Tyr Gln
1970 1975 1980
Ile Ile Leu Ser Ile Val Glu Gln Leu Arg Tyr Pro Asn Ile His
1985 1990 1995
Thr Tyr Trp Phe Ser Phe Val Leu Met Asn Met Phe Lys Ser Asp
2000 2005 2010
Glu Trp Asn Asp Gln Lys Leu Glu Val Gln Glu Ile Ile Leu Arg
2015 2020 2025
Asn Phe Leu Lys Arg Ile Ile Val Asn Lys Pro His Thr Trp Gly
2030 2035 2040
Val Ser Val Phe Phe Thr Gln Leu Ile Asn Asn Asn Asp Ile Asn
2045 2050 2055
Leu Leu Asp Leu Pro Phe Val Gln Ser Val Pro Glu Ile Lys Leu
2060 2065 2070
Ile Leu Gln Gln Leu Val Lys Tyr Ser Lys Lys Tyr Thr Thr Ser
2075 2080 2085
Glu Gln Asp Asp Gln Ser Ala Thr Ile Asn Arg Arg Gln Thr Pro
2090 2095 2100
Leu Gln Ser Asn Ala
2105
<210> 14
<211> 31
<212> PRT
<213> 人工序列
<220>
<223> GLP-1片段
<400> 14
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 15
<211> 61
<212> PRT
<213> 人工序列
<220>
<223> GLP-1片段的串联重复
<400> 15
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly
20 25 30
Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala
35 40 45
Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
50 55 60
<210> 16
<211> 645
<212> PRT
<213> 人工序列
<220>
<223> 阿必鲁泰 (融合于人血清白蛋白的N端的GLP-1串联重复)
<400> 16
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly
20 25 30
Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala
35 40 45
Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Asp Ala His Lys
50 55 60
Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys
65 70 75 80
Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe
85 90 95
Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr
100 105 110
Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr
115 120 125
Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr
130 135 140
Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu
145 150 155 160
Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val
165 170 175
Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu
180 185 190
Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr
195 200 205
Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala
210 215 220
Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro
225 230 235 240
Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln
245 250 255
Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys
260 265 270
Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe
275 280 285
Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu
290 295 300
Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu
305 310 315 320
Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys
325 330 335
Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu
340 345 350
Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp
355 360 365
Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp
370 375 380
Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp
385 390 395 400
Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr
405 410 415
Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys
420 425 430
Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile
435 440 445
Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln
450 455 460
Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr
465 470 475 480
Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys
485 490 495
Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr
500 505 510
Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro
515 520 525
Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg
530 535 540
Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys
545 550 555 560
Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu
565 570 575
Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu
580 585 590
Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met
595 600 605
Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys
610 615 620
Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln
625 630 635 640
Ala Ala Leu Gly Leu
645
<210> 17
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> KEX前导序列
<400> 17
Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Ser Leu Asp Lys Arg
20
<210> 18
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 修饰的KEX前导序列
<400> 18
Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Gly Ser Leu Asp Lys Arg
20
<210> 19
<211> 27
<212> PRT
<213> 人工序列
<220>
<223> 交配因子α-人血清白蛋白融合前导序列
<400> 19
Met Lys Trp Val Ser Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Ser Leu Asp Lys Arg Asp Ala His
20 25
<210> 20
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> 五肽基序
<220>
<221> 尚未归类的特征
<222> (1)..(1)
<223> Xaa = Phe, Trp 或 Tyr
<220>
<221> 尚未归类的特征
<222> (2)..(2)
<223> Xaa = Ile, Leu, Val, Ala 或 Met
<220>
<221> 尚未归类的特征
<222> (3)..(3)
<223> Xaa = Leu, Val, Ala 或 Met
<220>
<221> 尚未归类的特征
<222> (4)..(4)
<223> Xaa = Ser 或 Thr
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> Xaa = Ile, Val, Ala 或 Met
<400> 20
Xaa Xaa Xaa Xaa Xaa
1 5
<210> 21
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 前导序列
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> Xaa = Phe, Trp 或 Tyr
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> Xaa = Ile, Leu, Val, Ala 或 Met
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> Xaa = Leu, Val, Ala 或 Met
<220>
<221> 尚未归类的特征
<222> (8)..(8)
<223> Xaa = Ser 或 Thr
<220>
<221> 尚未归类的特征
<222> (9)..(9)
<223> Xaa = Ile, Val, Ala 或 Met
<400> 21
Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg
<210> 22
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 前导序列
<220>
<221> 尚未归类的特征
<222> (5)..(5)
<223> Xaa = Phe, Trp 或 Tyr
<220>
<221> 尚未归类的特征
<222> (6)..(6)
<223> Xaa = Ile, Leu, Val, Ala 或 Met
<220>
<221> 尚未归类的特征
<222> (7)..(7)
<223> Xaa = Leu, Val, Ala 或 Met
<220>
<221> 尚未归类的特征
<222> (8)..(8)
<223> Xaa = Ser 或 Thr
<220>
<221> 尚未归类的特征
<222> (9)..(9)
<223> Xaa = Ile, Val, Ala 或 Met
<220>
<221> 前肽
<222> (20)..(24)
<220>
<221> 尚未归类的特征
<222> (20)..(20)
<223> Xaa = Gly 或 Ser
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> Xaa = Val 或 Leu
<220>
<221> 尚未归类的特征
<222> (22)..(22)
<223> Xaa = Phe 或 Asp
<220>
<221> 尚未归类的特征
<222> (23)..(23)
<223> Xaa = Arg 或 Lys
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> Xaa = Arg 或 Lys
<400> 22
Met Lys Trp Val Xaa Xaa Xaa Xaa Xaa Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Xaa Xaa Xaa Xaa Xaa
20
<210> 23
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 前导序列
<220>
<221> 信号
<222> (1)..(19)
<223> 前序
<220>
<221> 前肽
<222> (20)..(24)
<220>
<221> 尚未归类的特征
<222> (20)..(20)
<223> Xaa = Gly 或 Ser
<220>
<221> 尚未归类的特征
<222> (21)..(21)
<223> Xaa = Val 或 Leu
<220>
<221> 尚未归类的特征
<222> (22)..(22)
<223> Xaa = Phe 或 Asp
<220>
<221> 尚未归类的特征
<222> (23)..(23)
<223> Xaa = Arg 或 Lys
<220>
<221> 尚未归类的特征
<222> (24)..(24)
<223> Xaa = Arg 或 Lys
<400> 23
Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Xaa Xaa Xaa Xaa Xaa
20
<210> 24
<211> 24
<212> PRT
<213> 人工序列
<220>
<223> 前导序列
<400> 24
Met Lys Trp Val Phe Ile Val Ser Ile Leu Phe Leu Phe Ser Ser Ala
1 5 10 15
Tyr Ser Arg Ser Leu Asp Lys Arg
20
<210> 25
<211> 522
<212> PRT
<213> 酿酒酵母
<400> 25
Met Lys Phe Ser Ala Gly Ala Val Leu Ser Trp Ser Ser Leu Leu Leu
1 5 10 15
Ala Ser Ser Val Phe Ala Gln Gln Glu Ala Val Ala Pro Glu Asp Ser
20 25 30
Ala Val Val Lys Leu Ala Thr Asp Ser Phe Asn Glu Tyr Ile Gln Ser
35 40 45
His Asp Leu Val Leu Ala Glu Phe Phe Ala Pro Trp Cys Gly His Cys
50 55 60
Lys Asn Met Ala Pro Glu Tyr Val Lys Ala Ala Glu Thr Leu Val Glu
65 70 75 80
Lys Asn Ile Thr Leu Ala Gln Ile Asp Cys Thr Glu Asn Gln Asp Leu
85 90 95
Cys Met Glu His Asn Ile Pro Gly Phe Pro Ser Leu Lys Ile Phe Lys
100 105 110
Asn Ser Asp Val Asn Asn Ser Ile Asp Tyr Glu Gly Pro Arg Thr Ala
115 120 125
Glu Ala Ile Val Gln Phe Met Ile Lys Gln Ser Gln Pro Ala Val Ala
130 135 140
Val Val Ala Asp Leu Pro Ala Tyr Leu Ala Asn Glu Thr Phe Val Thr
145 150 155 160
Pro Val Ile Val Gln Ser Gly Lys Ile Asp Ala Asp Phe Asn Ala Thr
165 170 175
Phe Tyr Ser Met Ala Asn Lys His Phe Asn Asp Tyr Asp Phe Val Ser
180 185 190
Ala Glu Asn Ala Asp Asp Asp Phe Lys Leu Ser Ile Tyr Leu Pro Ser
195 200 205
Ala Met Asp Glu Pro Val Val Tyr Asn Gly Lys Lys Ala Asp Ile Ala
210 215 220
Asp Ala Asp Val Phe Glu Lys Trp Leu Gln Val Glu Ala Leu Pro Tyr
225 230 235 240
Phe Gly Glu Ile Asp Gly Ser Val Phe Ala Gln Tyr Val Glu Ser Gly
245 250 255
Leu Pro Leu Gly Tyr Leu Phe Tyr Asn Asp Glu Glu Glu Leu Glu Glu
260 265 270
Tyr Lys Pro Leu Phe Thr Glu Leu Ala Lys Lys Asn Arg Gly Leu Met
275 280 285
Asn Phe Val Ser Ile Asp Ala Arg Lys Phe Gly Arg His Ala Gly Asn
290 295 300
Leu Asn Met Lys Glu Gln Phe Pro Leu Phe Ala Ile His Asp Met Thr
305 310 315 320
Glu Asp Leu Lys Tyr Gly Leu Pro Gln Leu Ser Glu Glu Ala Phe Asp
325 330 335
Glu Leu Ser Asp Lys Ile Val Leu Glu Ser Lys Ala Ile Glu Ser Leu
340 345 350
Val Lys Asp Phe Leu Lys Gly Asp Ala Ser Pro Ile Val Lys Ser Gln
355 360 365
Glu Ile Phe Glu Asn Gln Asp Ser Ser Val Phe Gln Leu Val Gly Lys
370 375 380
Asn His Asp Glu Ile Val Asn Asp Pro Lys Lys Asp Val Leu Val Leu
385 390 395 400
Tyr Tyr Ala Pro Trp Cys Gly His Cys Lys Arg Leu Ala Pro Thr Tyr
405 410 415
Gln Glu Leu Ala Asp Thr Tyr Ala Asn Ala Thr Ser Asp Val Leu Ile
420 425 430
Ala Lys Leu Asp His Thr Glu Asn Asp Val Arg Gly Val Val Ile Glu
435 440 445
Gly Tyr Pro Thr Ile Val Leu Tyr Pro Gly Gly Lys Lys Ser Glu Ser
450 455 460
Val Val Tyr Gln Gly Ser Arg Ser Leu Asp Ser Leu Phe Asp Phe Ile
465 470 475 480
Lys Glu Asn Gly His Phe Asp Val Asp Gly Lys Ala Leu Tyr Glu Glu
485 490 495
Ala Gln Glu Lys Ala Ala Glu Glu Ala Asp Ala Asp Ala Glu Leu Ala
500 505 510
Asp Glu Glu Asp Ala Ile His Asp Glu Leu
515 520
<210> 26
<211> 563
<212> PRT
<213> 酿酒酵母
<400> 26
Met Arg Leu Arg Thr Ala Ile Ala Thr Leu Cys Leu Thr Ala Phe Thr
1 5 10 15
Ser Ala Thr Ser Asn Asn Ser Tyr Ile Ala Thr Asp Gln Thr Gln Asn
20 25 30
Ala Phe Asn Asp Thr His Phe Cys Lys Val Asp Arg Asn Asp His Val
35 40 45
Ser Pro Ser Cys Asn Val Thr Phe Asn Glu Leu Asn Ala Ile Asn Glu
50 55 60
Asn Ile Arg Asp Asp Leu Ser Ala Leu Leu Lys Ser Asp Phe Phe Lys
65 70 75 80
Tyr Phe Arg Leu Asp Leu Tyr Lys Gln Cys Ser Phe Trp Asp Ala Asn
85 90 95
Asp Gly Leu Cys Leu Asn Arg Ala Cys Ser Val Asp Val Val Glu Asp
100 105 110
Trp Asp Thr Leu Pro Glu Tyr Trp Gln Pro Glu Ile Leu Gly Ser Phe
115 120 125
Asn Asn Asp Thr Met Lys Glu Ala Asp Asp Ser Asp Asp Glu Cys Lys
130 135 140
Phe Leu Asp Gln Leu Cys Gln Thr Ser Lys Lys Pro Val Asp Ile Glu
145 150 155 160
Asp Thr Ile Asn Tyr Cys Asp Val Asn Asp Phe Asn Gly Lys Asn Ala
165 170 175
Val Leu Ile Asp Leu Thr Ala Asn Pro Glu Arg Phe Thr Gly Tyr Gly
180 185 190
Gly Lys Gln Ala Gly Gln Ile Trp Ser Thr Ile Tyr Gln Asp Asn Cys
195 200 205
Phe Thr Ile Gly Glu Thr Gly Glu Ser Leu Ala Lys Asp Ala Phe Tyr
210 215 220
Arg Leu Val Ser Gly Phe His Ala Ser Ile Gly Thr His Leu Ser Lys
225 230 235 240
Glu Tyr Leu Asn Thr Lys Thr Gly Lys Trp Glu Pro Asn Leu Asp Leu
245 250 255
Phe Met Ala Arg Ile Gly Asn Phe Pro Asp Arg Val Thr Asn Met Tyr
260 265 270
Phe Asn Tyr Ala Val Val Ala Lys Ala Leu Trp Lys Ile Gln Pro Tyr
275 280 285
Leu Pro Glu Phe Ser Phe Cys Asp Leu Val Asn Lys Glu Ile Lys Asn
290 295 300
Lys Met Asp Asn Val Ile Ser Gln Leu Asp Thr Lys Ile Phe Asn Glu
305 310 315 320
Asp Leu Val Phe Ala Asn Asp Leu Ser Leu Thr Leu Lys Asp Glu Phe
325 330 335
Arg Ser Arg Phe Lys Asn Val Thr Lys Ile Met Asp Cys Val Gln Cys
340 345 350
Asp Arg Cys Arg Leu Trp Gly Lys Ile Gln Thr Thr Gly Tyr Ala Thr
355 360 365
Ala Leu Lys Ile Leu Phe Glu Ile Asn Asp Ala Asp Glu Phe Thr Lys
370 375 380
Gln His Ile Val Gly Lys Leu Thr Lys Tyr Glu Leu Ile Ala Leu Leu
385 390 395 400
Gln Thr Phe Gly Arg Leu Ser Glu Ser Ile Glu Ser Val Asn Met Phe
405 410 415
Glu Lys Met Tyr Gly Lys Arg Leu Asn Gly Ser Glu Asn Arg Leu Ser
420 425 430
Ser Phe Phe Gln Asn Asn Phe Phe Asn Ile Leu Lys Glu Ala Gly Lys
435 440 445
Ser Ile Arg Tyr Thr Ile Glu Asn Ile Asn Ser Thr Lys Glu Gly Lys
450 455 460
Lys Lys Thr Asn Asn Ser Gln Ser His Val Phe Asp Asp Leu Lys Met
465 470 475 480
Pro Lys Ala Glu Ile Val Pro Arg Pro Ser Asn Gly Thr Val Asn Lys
485 490 495
Trp Lys Lys Ala Trp Asn Thr Glu Val Asn Asn Val Leu Glu Ala Phe
500 505 510
Arg Phe Ile Tyr Arg Ser Tyr Leu Asp Leu Pro Arg Asn Ile Trp Glu
515 520 525
Leu Ser Leu Met Lys Val Tyr Lys Phe Trp Asn Lys Phe Ile Gly Val
530 535 540
Ala Asp Tyr Val Ser Glu Glu Thr Arg Glu Pro Ile Ser Tyr Lys Leu
545 550 555 560
Asp Ile Gln
<210> 27
<211> 2445
<212> DNA
<213> 酿酒酵母
<400> 27
atgaaagtga ggaaatatat tactttatgc ttttggtggg ccttttcaac atccgctctt 60
gtatcatcac aacaaattcc attgaaggac catacgtcac gacagtattt tgctgtagaa 120
agcaatgaaa cattatcccg cttggaggaa atgcatccaa attggaaata tgaacatgat 180
gttcgagggc taccaaacca ttatgttttt tcaaaagagt tgctaaaatt gggcaaaaga 240
tcatcattag aagagttaca gggggataac aacgaccaca tattatctgt ccatgattta 300
ttcccgcgta acgacctatt taagagacta ccggtgcctg ctccaccaat ggactcaagc 360
ttgttaccgg taaaagaagc tgaggataaa ctcagcataa atgatccgct ttttgagagg 420
cagtggcact tggtcaatcc aagttttcct ggcagtgata taaatgttct tgatctgtgg 480
tacaataata ttacaggcgc aggggtcgtg gctgccattg ttgatgatgg ccttgactac 540
gaaaatgaag acttgaagga taatttttgc gctgaaggtt cttgggattt caacgacaat 600
accaatttac ctaaaccaag attatctgat gactaccatg gtacgagatg tgcaggtgaa 660
atagctgcca aaaaaggtaa caatttttgc ggtgtcgggg taggttacaa cgctaaaatc 720
tcaggcataa gaatcttatc cggtgatatc actacggaag atgaagctgc gtccttgatt 780
tatggtctag acgtaaacga tatatattca tgctcatggg gtcccgctga tgacggaaga 840
catttacaag gccctagtga cctggtgaaa aaggctttag taaaaggtgt tactgaggga 900
agagattcca aaggagcgat ttacgttttt gccagtggaa atggtggaac tcgtggtgat 960
aattgcaatt acgacggcta tactaattcc atatattcta ttactattgg ggctattgat 1020
cacaaagatc tacatcctcc ttattccgaa ggttgttccg ccgtcatggc agtcacgtat 1080
tcttcaggtt caggcgaata tattcattcg agtgatatca acggcagatg cagtaatagc 1140
cacggtggaa cgtctgcggc tgctccatta gctgccggtg tttacacttt gttactagaa 1200
gccaacccaa acctaacttg gagagacgta cagtatttat caatcttgtc tgcggtaggg 1260
ttagaaaaga acgctgacgg agattggaga gatagcgcca tggggaagaa atactctcat 1320
cgctatggct ttggtaaaat cgatgcccat aagttaattg aaatgtccaa gacctgggag 1380
aatgttaacg cacaaacctg gttttacctg ccaacattgt atgtttccca gtccacaaac 1440
tccacggaag agacattaga atccgtcata accatatcag aaaaaagtct tcaagatgct 1500
aacttcaaga gaattgagca cgtcacggta actgtagata ttgatacaga aattagggga 1560
actacgactg tcgatttaat atcaccagcg gggataattt caaaccttgg cgttgtaaga 1620
ccaagagatg tttcatcaga gggattcaaa gactggacat tcatgtctgt agcacattgg 1680
ggtgagaacg gcgtaggtga ttggaaaatc aaggttaaga caacagaaaa tggacacagg 1740
attgacttcc acagttggag gctgaagctc tttggggaat ccattgattc atctaaaaca 1800
gaaactttcg tctttggaaa cgataaagag gaggttgaac cagctgctac agaaagtacc 1860
gtatcacaat attctgccag ttcaacttct atttccatca gcgctacttc tacatcttct 1920
atctcaattg gtgtggaaac gtcggccatt ccccaaacga ctactgcgag taccgatcct 1980
gattctgatc caaacactcc taaaaaactt tcctctccta ggcaagccat gcattatttt 2040
ttaacaatat ttttgattgg cgccacattt ttggtgttat acttcatgtt ttttatgaaa 2100
tcaaggagaa ggatcagaag gtcaagagcg gaaacgtatg aattcgatat cattgataca 2160
gactctgagt acgattctac tttggacaat ggaacttccg gaattactga gcccgaagag 2220
gttgaggact tcgattttga tttgtccgat gaagaccatc ttgcaagttt gtcttcatca 2280
gaaaacggtg atgctgaaca tacaattgat agtgtactaa caaacgaaaa tccatttagt 2340
gaccctataa agcaaaagtt cccaaatgac gccaacgcag aatctgcttc caataaatta 2400
caagaattac agcctgatgt tcctccatct tccggacgat cgtga 2445
<210> 28
<211> 814
<212> PRT
<213> 酿酒酵母
<400> 28
Met Lys Val Arg Lys Tyr Ile Thr Leu Cys Phe Trp Trp Ala Phe Ser
1 5 10 15
Thr Ser Ala Leu Val Ser Ser Gln Gln Ile Pro Leu Lys Asp His Thr
20 25 30
Ser Arg Gln Tyr Phe Ala Val Glu Ser Asn Glu Thr Leu Ser Arg Leu
35 40 45
Glu Glu Met His Pro Asn Trp Lys Tyr Glu His Asp Val Arg Gly Leu
50 55 60
Pro Asn His Tyr Val Phe Ser Lys Glu Leu Leu Lys Leu Gly Lys Arg
65 70 75 80
Ser Ser Leu Glu Glu Leu Gln Gly Asp Asn Asn Asp His Ile Leu Ser
85 90 95
Val His Asp Leu Phe Pro Arg Asn Asp Leu Phe Lys Arg Leu Pro Val
100 105 110
Pro Ala Pro Pro Met Asp Ser Ser Leu Leu Pro Val Lys Glu Ala Glu
115 120 125
Asp Lys Leu Ser Ile Asn Asp Pro Leu Phe Glu Arg Gln Trp His Leu
130 135 140
Val Asn Pro Ser Phe Pro Gly Ser Asp Ile Asn Val Leu Asp Leu Trp
145 150 155 160
Tyr Asn Asn Ile Thr Gly Ala Gly Val Val Ala Ala Ile Val Asp Asp
165 170 175
Gly Leu Asp Tyr Glu Asn Glu Asp Leu Lys Asp Asn Phe Cys Ala Glu
180 185 190
Gly Ser Trp Asp Phe Asn Asp Asn Thr Asn Leu Pro Lys Pro Arg Leu
195 200 205
Ser Asp Asp Tyr His Gly Thr Arg Cys Ala Gly Glu Ile Ala Ala Lys
210 215 220
Lys Gly Asn Asn Phe Cys Gly Val Gly Val Gly Tyr Asn Ala Lys Ile
225 230 235 240
Ser Gly Ile Arg Ile Leu Ser Gly Asp Ile Thr Thr Glu Asp Glu Ala
245 250 255
Ala Ser Leu Ile Tyr Gly Leu Asp Val Asn Asp Ile Tyr Ser Cys Ser
260 265 270
Trp Gly Pro Ala Asp Asp Gly Arg His Leu Gln Gly Pro Ser Asp Leu
275 280 285
Val Lys Lys Ala Leu Val Lys Gly Val Thr Glu Gly Arg Asp Ser Lys
290 295 300
Gly Ala Ile Tyr Val Phe Ala Ser Gly Asn Gly Gly Thr Arg Gly Asp
305 310 315 320
Asn Cys Asn Tyr Asp Gly Tyr Thr Asn Ser Ile Tyr Ser Ile Thr Ile
325 330 335
Gly Ala Ile Asp His Lys Asp Leu His Pro Pro Tyr Ser Glu Gly Cys
340 345 350
Ser Ala Val Met Ala Val Thr Tyr Ser Ser Gly Ser Gly Glu Tyr Ile
355 360 365
His Ser Ser Asp Ile Asn Gly Arg Cys Ser Asn Ser His Gly Gly Thr
370 375 380
Ser Ala Ala Ala Pro Leu Ala Ala Gly Val Tyr Thr Leu Leu Leu Glu
385 390 395 400
Ala Asn Pro Asn Leu Thr Trp Arg Asp Val Gln Tyr Leu Ser Ile Leu
405 410 415
Ser Ala Val Gly Leu Glu Lys Asn Ala Asp Gly Asp Trp Arg Asp Ser
420 425 430
Ala Met Gly Lys Lys Tyr Ser His Arg Tyr Gly Phe Gly Lys Ile Asp
435 440 445
Ala His Lys Leu Ile Glu Met Ser Lys Thr Trp Glu Asn Val Asn Ala
450 455 460
Gln Thr Trp Phe Tyr Leu Pro Thr Leu Tyr Val Ser Gln Ser Thr Asn
465 470 475 480
Ser Thr Glu Glu Thr Leu Glu Ser Val Ile Thr Ile Ser Glu Lys Ser
485 490 495
Leu Gln Asp Ala Asn Phe Lys Arg Ile Glu His Val Thr Val Thr Val
500 505 510
Asp Ile Asp Thr Glu Ile Arg Gly Thr Thr Thr Val Asp Leu Ile Ser
515 520 525
Pro Ala Gly Ile Ile Ser Asn Leu Gly Val Val Arg Pro Arg Asp Val
530 535 540
Ser Ser Glu Gly Phe Lys Asp Trp Thr Phe Met Ser Val Ala His Trp
545 550 555 560
Gly Glu Asn Gly Val Gly Asp Trp Lys Ile Lys Val Lys Thr Thr Glu
565 570 575
Asn Gly His Arg Ile Asp Phe His Ser Trp Arg Leu Lys Leu Phe Gly
580 585 590
Glu Ser Ile Asp Ser Ser Lys Thr Glu Thr Phe Val Phe Gly Asn Asp
595 600 605
Lys Glu Glu Val Glu Pro Ala Ala Thr Glu Ser Thr Val Ser Gln Tyr
610 615 620
Ser Ala Ser Ser Thr Ser Ile Ser Ile Ser Ala Thr Ser Thr Ser Ser
625 630 635 640
Ile Ser Ile Gly Val Glu Thr Ser Ala Ile Pro Gln Thr Thr Thr Ala
645 650 655
Ser Thr Asp Pro Asp Ser Asp Pro Asn Thr Pro Lys Lys Leu Ser Ser
660 665 670
Pro Arg Gln Ala Met His Tyr Phe Leu Thr Ile Phe Leu Ile Gly Ala
675 680 685
Thr Phe Leu Val Leu Tyr Phe Met Phe Phe Met Lys Ser Arg Arg Arg
690 695 700
Ile Arg Arg Ser Arg Ala Glu Thr Tyr Glu Phe Asp Ile Ile Asp Thr
705 710 715 720
Asp Ser Glu Tyr Asp Ser Thr Leu Asp Asn Gly Thr Ser Gly Ile Thr
725 730 735
Glu Pro Glu Glu Val Glu Asp Phe Asp Phe Asp Leu Ser Asp Glu Asp
740 745 750
His Leu Ala Ser Leu Ser Ser Ser Glu Asn Gly Asp Ala Glu His Thr
755 760 765
Ile Asp Ser Val Leu Thr Asn Glu Asn Pro Phe Ser Asp Pro Ile Lys
770 775 780
Gln Lys Phe Pro Asn Asp Ala Asn Ala Glu Ser Ala Ser Asn Lys Leu
785 790 795 800
Gln Glu Leu Gln Pro Asp Val Pro Pro Ser Ser Gly Arg Ser
805 810
<210> 29
<211> 116
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP267
<400> 29
atactattgt aattcaaaaa aaaaaagcga atcttcccat gcctgttgct gctcttgaat 60
ggcgacagcc tattgcccca gtgttccctc aacaaccttg cgtacgctgc aggtcg 116
<210> 30
<211> 119
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP268
<400> 30
acagttgtag tcacgtgcgc gccatgctga ctaatggcag ccgtcgttgg gcagaagaga 60
attagtatgg tacaggatac gctaattgcg ctccaactac atcgatgaat tcgagctcg 119
<210> 31
<211> 2723
<212> DNA
<213> 人工序列
<220>
<223> 5'-GSH1 5'UTR-KanMX-GSH1 5'UTR-GSH1 ORF片段.由MBP288和MBP289扩增的序列和用于GSH1 SNP复原.
<400> 31
gattttatcg gtcaaagggg aaatcaatgc gaaagacagt aatgatgaga gaaaaactct 60
ccgtaaccac caagtttggt tcagcgcgac gagattttta tcgattatcg agaaaaatac 120
ctgtatatct acatttctat gtcagtgata tatacttctt agataagtta tgccaccagt 180
gcatacgctt acgcacacac acgtattctt gtgcacacgc ctgttacttc ttgcagacat 240
cagacatact attgtaattc aaaaaaaaaa agcgaatctt cccatgcctg ttgctgctct 300
tgaatggcga cagcctattg ccccagtgtt ccctcaacaa ccttgcgtac gctgcaggtc 360
gacggatccc cgggttaatt aaggcgcgcc agatctgttt agcttgcctc gtccccgccg 420
ggtcacccgg ccagcgacat ggaggcccag aataccctcc ttgacagtct tgacgtgcgc 480
agctcagggg catgatgtga ctgtcgcccg tacatttagc ccatacatcc ccatgtataa 540
tcatttgcat ccatacattt tgatggccgc acggcgcgaa gcaaaaatta cggctcctcg 600
ctgcagacct gcgagcaggg aaacgctccc ctcacagacg cgttgaattg tccccacgcc 660
gcgcccctgt agagaaatat aaaaggttag gatttgccac tgaggttctt ctttcatata 720
cttcctttta aaatcttgct aggatacagt tctcacatca catccgaaca taaacaacca 780
tgggtaagga aaagactcac gtttcgaggc cgcgattaaa ttccaacatg gatgctgatt 840
tatatgggta taaatgggct cgcgataatg tcgggcaatc aggtgcgaca atctatcgat 900
tgtatgggaa gcccgatgcg ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca 960
atgatgttac agatgagatg gtcagactaa actggctgac ggaatttatg cctcttccga 1020
ccatcaagca ttttatccgt actcctgatg atgcatggtt actcaccact gcgatccccg 1080
gcaaaacagc attccaggta ttagaagaat atcctgattc aggtgaaaat attgttgatg 1140
cgctggcagt gttcctgcgc cggttgcatt cgattcctgt ttgtaattgt ccttttaaca 1200
gcgatcgcgt atttcgtctc gctcaggcgc aatcacgaat gaataacggt ttggttgatg 1260
cgagtgattt tgatgacgag cgtaatggct ggcctgttga acaagtctgg aaagaaatgc 1320
ataagctttt gccattctca ccggattcag tcgtcactca tggtgatttc tcacttgata 1380
accttatttt tgacgagggg aaattaatag gttgtattga tgttggacga gtcggaatcg 1440
cagaccgata ccaggatctt gccatcctat ggaactgcct cggtgagttt tctccttcat 1500
tacagaaacg gctttttcaa aaatatggta ttgataatcc tgatatgaat aaattgcagt 1560
ttcatttgat gctcgatgag tttttctaat cagtactgac aataaaaaga ttcttgtttt 1620
caagaacttg tcatttgtat agttttttta tattgtagtt gttctatttt aatcaaatgt 1680
tagcgtgatt tatatttttt ttcgcctcga catcatctgc ccagatgcga agttaagtgc 1740
gcagaaagta atatcatgcg tcaatcgtat gtgaatgctg gtcgctatac tgctgtcgat 1800
tcgatactaa cgccgccatc cagtgtcgaa aacgagctcg aattcatcga tgtagttgga 1860
gcgcaattag cgtatcctgt accatactaa ttctcttctg cccaacgacg gctgccatta 1920
gtcagcatgg cgcgcacgtg actacaactg tggctggaaa ccttttcgtc ctccccggtt 1980
tttcagtgag ccgactctac tacaatgctt tttcattttt cactcagaaa aacctgcaat 2040
ttgccaaatt ggccatgctc tgtgcctccc ttgacaaagg acatcttccc tgtttataaa 2100
cggcggctta ccaaaagttg aagcttgttc ttgcctctta tgagtggagc aatcgattat 2160
attgaatcgt tgtgctggag tagttggatc tttccacgtg gtctcgagtc acttgtagaa 2220
gctgaaaatt gagcagattt agtatagggc tacattgtag ggtggtttag agtatcgaaa 2280
atatacatat agaagaataa aatgggactc ttagctttgg gcacgccttt gcagtggttt 2340
gagtctagga cgtacaatga acacataagg gatgaaggta tcgagcagtt gttgtatatt 2400
ttccaagctg ctggtaaaag agacaatgac cctctttttt ggggagacga gcttgagtac 2460
atggttgtag attttgatga taaggagaga aattctatgc tcgacgtttg ccatgacaag 2520
atactcactg agcttaatat ggaggattcg tccctttgtg aggctaacga tgtgagtttt 2580
caccctgagt atggccggta tatgttagag gcaacaccag cttctccata tttgaattac 2640
gtgggtagtt acgttgaggt taacatgcaa aaaagacgtg ccattgcaga atataagcta 2700
tctgaatatg cgagacaaga tag 2723
<210> 32
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP288
<400> 32
gattttatcg gtcaaagg 18
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP289
<400> 33
ctatcttgtc tcgcatattc 20
<210> 34
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP290
<400> 34
tctcgagtca cttgtagaag 20
<210> 35
<211> 17
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP292
<400> 35
gagcccacat gcaagtt 17
<210> 36
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP291
<400> 36
gtagggtggt ttagagtatc 20
<210> 37
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP393
<400> 37
tattatgaat tcaaatgttg agcccgaaga cg 32
<210> 38
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP396
<400> 38
tattataagc ttaaattagc gaagcaggtt cc 32
<210> 39
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP397
<400> 39
tattatgcat gccacgtatt cttgtgcaca cg 32
<210> 40
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> PCR 引物 MBP406
<400> 40
tattatgtcg actaccacct acaccaataa gc 32
<210> 41
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 修饰的转化酶信号肽
<220>
<221> MISC
<222> (7)..(7)
<223> Xaa = Phe, Trp 或 Tyr
<220>
<221> MISC
<222> (8)..(8)
<223> Xaa = Ile, Leu, Val, Ala 或 Met
<220>
<221> MISC
<222> (9)..(9)
<223> Xaa = Leu, Val, Ala 或 Met
<220>
<221> MISC
<222> (10)..(10)
<223> Xaa = Ser 或 Thr
<220>
<221> MISC
<222> (11)..(11)
<223> Xaa = Ile, Val, Ala 或 Met
<400> 41
Met Leu Leu Gln Ala Phe Xaa Xaa Xaa Xaa Xaa Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala
<210> 42
<211> 19
<212> PRT
<213> 人工序列
<220>
<223> 修饰的转化酶信号肽
<400> 42
Met Leu Leu Gln Ala Phe Phe Ile Val Ser Ile Gly Phe Ala Ala Lys
1 5 10 15
Ile Ser Ala
<210> 43
<211> 2118
<212> DNA
<213> 人工序列
<220>
<223> KanMX在5'末端紧接GSH1 ORF上游的300bp,在3'末端紧接GSH1 ORF下游的300bp
<400> 43
ggtaccacaa tgctttttca tttttcactc agaaaaacct gcaatttgcc aaattggcca 60
tgctctgtgc ctcccttgac aaaggacatc ttccctgttt ataaacggcg gcttaccaaa 120
agttgaagct tgttcttgcc tcttatgagt ggagcaatcg attatattga atcgttgtgc 180
tggagtagtt ggatctttcc acgtggtctc gagtcacttg tagaagctga aaattgagca 240
gatttagtat agggctacat tgtagggtgg tttagagtat cgaaaatata catatagaag 300
aataaacgta cgctgcaggt cgacggatcc ccgggttaat taaggcgcgc cagatctgtt 360
tagcttgcct cgtccccgcc gggtcacccg gccagcgaca tggaggccca gaataccctc 420
cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg actgtcgccc gtacatttag 480
cccatacatc cccatgtata atcatttgca tccatacatt ttgatggccg cacggcgcga 540
agcaaaaatt acggctcctc gctgcagacc tgcgagcagg gaaacgctcc cctcacagac 600
gcgttgaatt gtccccacgc cgcgcccctg tagagaaata taaaaggtta ggatttgcca 660
ctgaggttct tctttcatat acttcctttt aaaatcttgc taggatacag ttctcacatc 720
acatccgaac ataaacaacc atgggtaagg aaaagactca cgtttcgagg ccgcgattaa 780
attccaacat ggatgctgat ttatatgggt ataaatgggc tcgcgataat gtcgggcaat 840
caggtgcgac aatctatcga ttgtatggga agcccgatgc gccagagttg tttctgaaac 900
atggcaaagg tagcgttgcc aatgatgtta cagatgagat ggtcagacta aactggctga 960
cggaatttat gcctcttccg accatcaagc attttatccg tactcctgat gatgcatggt 1020
tactcaccac tgcgatcccc ggcaaaacag cattccaggt attagaagaa tatcctgatt 1080
caggtgaaaa tattgttgat gcgctggcag tgttcctgcg ccggttgcat tcgattcctg 1140
tttgtaattg tccttttaac agcgatcgcg tatttcgtct cgctcaggcg caatcacgaa 1200
tgaataacgg tttggttgat gcgagtgatt ttgatgacga gcgtaatggc tggcctgttg 1260
aacaagtctg gaaagaaatg cataagcttt tgccattctc accggattca gtcgtcactc 1320
atggtgattt ctcacttgat aaccttattt ttgacgaggg gaaattaata ggttgtattg 1380
atgttggacg agtcggaatc gcagaccgat accaggatct tgccatccta tggaactgcc 1440
tcggtgagtt ttctccttca ttacagaaac ggctttttca aaaatatggt attgataatc 1500
ctgatatgaa taaattgcag tttcatttga tgctcgatga gtttttctaa tcagtactga 1560
caataaaaag attcttgttt tcaagaactt gtcatttgta tagttttttt atattgtagt 1620
tgttctattt taatcaaatg ttagcgtgat ttatattttt tttcgcctcg acatcatctg 1680
cccagatgcg aagttaagtg cgcagaaagt aatatcatgc gtcaatcgta tgtgaatgct 1740
ggtcgctata ctgctgtcga ttcgatacta acgccgccat ccagtgtcga aaacgagctc 1800
gaattcatcg atactccttt tacttcggtt gtgaaagaaa gttgacatta tcgatttggg 1860
tgacacggtg attgaaaaag caacgaccag tattatacct ctttttttta ttattcagtt 1920
tatatttttg caagtgatct taagcatttc tacacaaact tatgccaacg tgaccattta 1980
ttattttata tagcaaaaaa aaatgagggg ccttgcagaa caattgttgc gagtttctaa 2040
taacaagcac gtagaatatt ggccatttaa tttttctctt caatttatag aatggttgtg 2100
ttagtgacaa aaggtacc 2118
<210> 44
<211> 1755
<212> DNA
<213> 人工序列
<220>
<223> 编码相对于wt HSA具有突变E492G、K573P、K574H和Q580K的白蛋白变体的核酸序列
<400> 44
gacgctcaca agtctgaagt tgctcacaga ttcaaggact taggcgagga aaacttcaaa 60
gctttggttt tgattgcatt cgctcaatac ttacaacaat gcccattcga agaccacgtc 120
aaattggtta acgaagttac tgaattcgca aagacttgcg ttgcagacga atccgcagaa 180
aactgcgaca agtctttgca cacattgttc ggcgacaaat tgtgcacagt tgctacttta 240
agagaaacat acggcgaaat ggctgactgc tgcgctaaac aagagccaga aagaaacgaa 300
tgcttcttac aacacaagga cgacaaccca aacttaccaa gattggttag accagaagtt 360
gacgttatgt gcacagcatt ccacgacaac gaagaaactt tcttgaagaa gtacttgtac 420
gaaattgcta gaagacaccc atacttctac gctccagaat tgttgttctt cgctaaaaga 480
tacaaggctg cattcacaga atgctgccaa gcagctgaca aggctgcttg cttgttacca 540
aagttggacg aattgagaga cgaaggcaag gcttcttctg ctaagcaaag gttgaaatgc 600
gcttctttgc aaaagttcgg cgagagagca ttcaaggcat gggctgttgc tcgtttatct 660
caaagattcc caaaagcaga gttcgctgaa gtttccaagt tagttactga cttgacaaaa 720
gttcacactg aatgctgcca cggcgacttg ttagagtgcg ctgacgaccg tgctgactta 780
gccaaataca tttgcgaaaa ccaagactct atttcttcta agttaaagga gtgctgcgaa 840
aaaccgttgt tagagaaatc tcactgcatt gctgaagttg aaaacgacga aatgccagct 900
gacttgccat ctttagctgc tgacttcgtt gaatctaaag acgtttgcaa gaactacgca 960
gaagctaagg acgttttctt gggcatgttc ttatacgaat acgcaagaag acacccagac 1020
tactctgttg ttttgttgtt aagattggct aagacttacg aaactacatt agaaaagtgc 1080
tgcgctgccg cagacccaca cgaatgctac gctaaagttt tcgacgagtt caagccattg 1140
gttgaagaac cacaaaactt gattaagcaa aactgcgagt tattcgaaca attgggcgaa 1200
tacaaattcc aaaacgcctt gttagttaga tacactaaga aagttccaca agtttcaact 1260
ccaacattgg ttgaagtttc tcgtaactta ggcaaggttg gctctaagtg ctgcaaacac 1320
ccagaggcta agcgtatgcc atgcgctgaa gactacttgt ctgttgtttt gaaccagtta 1380
tgcgttttgc acgagaagac tccagtttct gaccgtgtta ctaagtgctg cacagaatct 1440
ttagttaaca gacgtccatg cttctcagct ttgggtgttg acgaaactta cgttccaaaa 1500
gaattcaacg ctgaaacttt cactttccac gctgacattt gcactttgtc tgaaaaggaa 1560
agacagatta agaaacaaac tgctttggtt gaattggtta agcacaagcc aaaggctact 1620
aaggaacaat tgaaggctgt tatggacgac ttcgctgctt tcgttgaaaa gtgctgcaaa 1680
gctgacgaca aggaaacttg cttcgctgag gaaggcccac atttggttgc agcttcaaaa 1740
gctgctttgg gcttg 1755
<210> 45
<211> 585
<212> PRT
<213> 人工序列
<220>
<223> 相对于wt HSA具有突变E492G、K573P、K574H和Q580K的白蛋白变体
<400> 45
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Gly Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Pro His Leu Val
565 570 575
Ala Ala Ser Lys Ala Ala Leu Gly Leu
580 585
<210> 46
<211> 2253
<212> DNA
<213> 人工序列
<220>
<223> 融合于HSA的C端的IL-1Ra
<400> 46
gacgctcaca agtccgaagt cgctcacaga ttcaaggact tgggtgaaga aaacttcaag 60
gctttggtct tgatcgcttt cgctcaatac ttgcaacaat gtccattcga agatcacgtc 120
aagttggtca acgaagttac cgaattcgct aagacttgtg ttgctgacga atccgcggaa 180
aactgtgaca agtccttgca caccttgttc ggtgataagt tgtgtactgt tgctaccttg 240
agagaaacct acggtgaaat ggctgactgt tgtgctaagc aagaaccaga aagaaacgaa 300
tgtttcttgc aacacaagga cgacaaccca aacttgccaa gattggttag accagaagtt 360
gacgtcatgt gtactgcttt ccacgacaac gaagaaacct tcttgaagaa gtacttgtac 420
gaaattgcta gaagacaccc atacttctac gctccagaat tgttgttctt cgctaagaga 480
tacaaggctg ctttcaccga atgttgtcaa gctgctgata aggctgcttg tttgttgcca 540
aagttggatg aattgagaga cgaaggtaag gcttcttccg ctaagcaaag attgaagtgt 600
gcttccttgc aaaagttcgg tgaaagagct ttcaaggctt gggctgtcgc tagattgtct 660
caaagattcc caaaggctga attcgctgaa gtttctaagt tggttactga cttgactaag 720
gttcacactg aatgttgtca cggtgacttg ttggaatgtg ctgatgacag agctgacttg 780
gctaagtaca tctgtgaaaa ccaagactct atctcttcca agttgaagga atgttgtgaa 840
aagccattgt tggaaaagtc tcactgtatt gctgaagttg aaaacgatga aatgccagct 900
gacttgccat ctttggctgc tgacttcgtt gaatctaagg acgtttgtaa gaactacgct 960
gaagctaagg acgtcttctt gggtatgttc ttgtacgaat acgctagaag acacccagac 1020
tactccgttg tcttgttgtt gagattggct aagacctacg aaactaccct cgagaagtgt 1080
tgtgctgctg ctgacccaca cgaatgttac gctaaggttt tcgatgaatt caagccattg 1140
gtcgaagaac cacaaaactt gatcaagcaa aactgtgaat tgttcgaaca attgggtgaa 1200
tacaagttcc aaaacgcttt gttggttaga tacactaaga aggtcccaca agtctccacc 1260
ccaactttgg ttgaagtctc tagaaacttg ggtaaggtcg gttctaagtg ttgtaagcac 1320
ccagaagcta agagaatgcc atgtgctgaa gattacttgt ccgtcgtttt gaaccaattg 1380
tgtgttttgc acgaaaagac cccagtctct gatagagtca ccaagtgttg tactgaatct 1440
ttggttaaca gaagaccatg tttctctgct ttggaagtcg acgaaactta cgttccaaag 1500
gaattcaacg ctgaaacttt caccttccac gctgatatct gtaccttgtc cgaaaaggaa 1560
agacaaatta agaagcaaac tgctttggtt gaattggtca agcacaagcc aaaggctact 1620
aaggaacaat tgaaggctgt catggatgat ttcgctgctt tcgttgaaaa gtgttgtaag 1680
gctgatgata aggaaacttg tttcgctgaa gaaggtaaga agttggtcgc tgcttcccaa 1740
gctgccttag gtttgggtgg ttctggtggt tccggtggtt ctggtggatc cggtggtcga 1800
ccctctggga gaaaatccag caagatgcaa gccttcagaa tctgggatgt taaccagaag 1860
accttctatc tgaggaacaa ccaactagtt gctggatact tgcaaggacc aaatgtcaat 1920
ttagaagaaa agatagatgt ggtacccatt gagcctcatg ctctgttctt gggaatccat 1980
ggagggaaga tgtgcctgtc ctgtgtcaag tctggtgatg agaccagact ccagctggag 2040
gcagttcaaa tcactgacct gagcgagaac agaaagcagg acaagcgctt cgccttcatc 2100
cgctcagaca gcggccccac caccagtttt gagtctgccg cctgccccgg ttggttcctc 2160
tgcacagcga tggaagctga ccagcccgtc agcctcacca atatgcctga cgaaggcgtc 2220
atggtcacca aattctactt ccaggaggac gag 2253
<210> 47
<211> 751
<212> PRT
<213> 人工序列
<220>
<223> 融合于HSA的C端的IL-1Ra
<400> 47
Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu
1 5 10 15
Glu Asn Phe Lys Ala Leu Val Leu Ile Ala Phe Ala Gln Tyr Leu Gln
20 25 30
Gln Cys Pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu
35 40 45
Phe Ala Lys Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys
50 55 60
Ser Leu His Thr Leu Phe Gly Asp Lys Leu Cys Thr Val Ala Thr Leu
65 70 75 80
Arg Glu Thr Tyr Gly Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro
85 90 95
Glu Arg Asn Glu Cys Phe Leu Gln His Lys Asp Asp Asn Pro Asn Leu
100 105 110
Pro Arg Leu Val Arg Pro Glu Val Asp Val Met Cys Thr Ala Phe His
115 120 125
Asp Asn Glu Glu Thr Phe Leu Lys Lys Tyr Leu Tyr Glu Ile Ala Arg
130 135 140
Arg His Pro Tyr Phe Tyr Ala Pro Glu Leu Leu Phe Phe Ala Lys Arg
145 150 155 160
Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln Ala Ala Asp Lys Ala Ala
165 170 175
Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp Glu Gly Lys Ala Ser
180 185 190
Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln Lys Phe Gly Glu
195 200 205
Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln Arg Phe Pro
210 215 220
Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu Thr Lys
225 230 235 240
Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp Asp
245 250 255
Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser
260 265 270
Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His
275 280 285
Cys Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser
290 295 300
Leu Ala Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala
305 310 315 320
Glu Ala Lys Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg
325 330 335
Arg His Pro Asp Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr
340 345 350
Tyr Glu Thr Thr Leu Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu
355 360 365
Cys Tyr Ala Lys Val Phe Asp Glu Phe Lys Pro Leu Val Glu Glu Pro
370 375 380
Gln Asn Leu Ile Lys Gln Asn Cys Glu Leu Phe Glu Gln Leu Gly Glu
385 390 395 400
Tyr Lys Phe Gln Asn Ala Leu Leu Val Arg Tyr Thr Lys Lys Val Pro
405 410 415
Gln Val Ser Thr Pro Thr Leu Val Glu Val Ser Arg Asn Leu Gly Lys
420 425 430
Val Gly Ser Lys Cys Cys Lys His Pro Glu Ala Lys Arg Met Pro Cys
435 440 445
Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln Leu Cys Val Leu His
450 455 460
Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys Cys Thr Glu Ser
465 470 475 480
Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val Asp Glu Thr
485 490 495
Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His Ala Asp
500 505 510
Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr Ala
515 520 525
Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu
530 535 540
Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys Cys Cys Lys
545 550 555 560
Ala Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val
565 570 575
Ala Ala Ser Gln Ala Ala Leu Gly Leu Gly Gly Ser Gly Gly Ser Gly
580 585 590
Gly Ser Gly Gly Ser Gly Gly Arg Pro Ser Gly Arg Lys Ser Ser Lys
595 600 605
Met Gln Ala Phe Arg Ile Trp Asp Val Asn Gln Lys Thr Phe Tyr Leu
610 615 620
Arg Asn Asn Gln Leu Val Ala Gly Tyr Leu Gln Gly Pro Asn Val Asn
625 630 635 640
Leu Glu Glu Lys Ile Asp Val Val Pro Ile Glu Pro His Ala Leu Phe
645 650 655
Leu Gly Ile His Gly Gly Lys Met Cys Leu Ser Cys Val Lys Ser Gly
660 665 670
Asp Glu Thr Arg Leu Gln Leu Glu Ala Val Gln Ile Thr Asp Leu Ser
675 680 685
Glu Asn Arg Lys Gln Asp Lys Arg Phe Ala Phe Ile Arg Ser Asp Ser
690 695 700
Gly Pro Thr Thr Ser Phe Glu Ser Ala Ala Cys Pro Gly Trp Phe Leu
705 710 715 720
Cys Thr Ala Met Glu Ala Asp Gln Pro Val Ser Leu Thr Asn Met Pro
725 730 735
Asp Glu Gly Val Met Val Thr Lys Phe Tyr Phe Gln Glu Asp Glu
740 745 750
<210> 48
<211> 756
<212> DNA
<213> 人工序列
<220>
<223> 融合于scFv的C端的FLAG
<400> 48
gaagttcaat tgttggaatc tggtggtggt ttggttcaac ctggtggttc tttgagattg 60
tcttgtgctg cttctggttt tactttttct aattattgga tgtcttgggt tagacaagct 120
ccaggtaaag gtttggaatg ggtttccggt atttcaggta atggtggtta tacttatttt 180
gctgattcag ttaaagatag atttactatt tctagagata attctaaaaa taccttatat 240
ttgcaaatga actctttgag agcagaagat actgctgttt attactgtgc aggtggtgac 300
ggttctggtt ggagtttttg gggtcaaggt actctagtta ccgtttcttc aggtggtggt 360
ggttctggtg gaggtggatc aggtggtgga ggatctcaat cagttttgac tcaaccacca 420
tctgcttcag gtactccagg tcaaagagtt accatttctt gtactggttc ttcttctaat 480
attggtgcag gttacgatgt tcattggtat caacaattgc caggtactgc tccaaaattg 540
ttgatttatg gtaacaacaa tagaccatct ggtgtcccag atagattttc tggttctaaa 600
tctggtactt ctgcttcttt ggctatttct ggtttaagat cagaagatga agctgattac 660
tactgtgctg cttgggatga ctctttgtct ggtagagttt tcggtggtgg tactaaattg 720
accgttttgg gtgattataa agatgatgac gataaa 756
<210> 49
<211> 252
<212> PRT
<213> 人工序列
<220>
<223> 融合于scFv的C端的FLAG
<400> 49
Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly
1 5 10 15
Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr
20 25 30
Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val
35 40 45
Ser Gly Ile Ser Gly Asn Gly Gly Tyr Thr Tyr Phe Ala Asp Ser Val
50 55 60
Lys Asp Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr
65 70 75 80
Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys
85 90 95
Ala Gly Gly Asp Gly Ser Gly Trp Ser Phe Trp Gly Gln Gly Thr Leu
100 105 110
Val Thr Val Ser Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly
115 120 125
Gly Gly Gly Ser Gln Ser Val Leu Thr Gln Pro Pro Ser Ala Ser Gly
130 135 140
Thr Pro Gly Gln Arg Val Thr Ile Ser Cys Thr Gly Ser Ser Ser Asn
145 150 155 160
Ile Gly Ala Gly Tyr Asp Val His Trp Tyr Gln Gln Leu Pro Gly Thr
165 170 175
Ala Pro Lys Leu Leu Ile Tyr Gly Asn Asn Asn Arg Pro Ser Gly Val
180 185 190
Pro Asp Arg Phe Ser Gly Ser Lys Ser Gly Thr Ser Ala Ser Leu Ala
195 200 205
Ile Ser Gly Leu Arg Ser Glu Asp Glu Ala Asp Tyr Tyr Cys Ala Ala
210 215 220
Trp Asp Asp Ser Leu Ser Gly Arg Val Phe Gly Gly Gly Thr Lys Leu
225 230 235 240
Thr Val Leu Gly Asp Tyr Lys Asp Asp Asp Asp Lys
245 250
<210> 50
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> FLAG
<400> 50
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 51
<211> 30
<212> PRT
<213> 人工序列
<220>
<223> GLP-1片段
<400> 51
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg
20 25 30
<210> 52
<211> 60
<212> PRT
<213> 人工序列
<220>
<223> GLP-1片段的串联重复
<400> 52
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg His Gly
20 25 30
Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala
35 40 45
Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg
50 55 60

Claims (26)

1.一种真菌宿主细胞,其具有修饰的:
a.Gsh1蛋白质或其同系物,和/或
b.Gsh1蛋白质或其同系物的活性水平或表达水平,和/或
c.GSH1基因或其同系物,和/或
d.GSH1基因或其同系物的表达水平。
2.根据权利要求1所述的真菌宿主细胞,其中修饰的水平是降低的水平。
3.根据权利要求1或2所述的真菌宿主细胞,其中修饰的水平是相对于参照真菌宿主细胞的水平,所述参照真菌宿主细胞例如其中Gsh1蛋白质包含SEQ ID NO:2或Gsh1蛋白质由SEQ ID NO:2组成的真菌宿主细胞。
4.根据权利要求1-3中任一项所述的真菌宿主细胞,其具有修饰的:
a.Not4蛋白质或其同系物,和/或
b.Not4蛋白质或其同系物的活性水平或表达水平,和/或
c.NOT4基因或其同系物,和/或
d.NOT4基因或其同系物的表达水平。
5.根据权利要求4所述的真菌宿主细胞,其中修饰的水平是降低的水平。
6.根据权利要求5所述的真菌宿主细胞,其中修饰的水平是相对于参照真菌宿主细胞的水平,所述参照真菌宿主细胞例如其中Not4蛋白质包含SEQ ID NO:6或Not4蛋白质由SEQID NO:6组成的真菌宿主细胞。
7.根据权利要求1-6中任一项所述的真菌宿主细胞,其中所述真菌宿主为酵母或丝状真菌。
8.根据前述权利要求中任一项所述的真菌宿主细胞,其包含编码期望的蛋白质的核苷酸序列,所述期望的蛋白质例如为异源蛋白质,例如为血清蛋白质,优选为白蛋白或其变体、片段和/或融合物。
9.根据前述权利要求中任一项所述的真菌宿主细胞,其中所述Gsh1蛋白质或其同系物在对应于选自SEQ ID NO:2以下位置的位置处包含突变:47、48、49、50、51、120、121、122、123、124、125、126、127、128、129、130、409、451、452、453、454和455,优选R125、D49、H409或P453。
10.根据权利要求9所述的真菌宿主细胞,其中在对应于SEQ IDNO:2的位置125的位置处的突变是取代为A、C、D、E、F、G、H、I、L、M、N、P、Q、S、T、V、W或Y,优选取代为C、D、E或G,更优选取代为G。
11.根据前述权利要求中任一项所述的真菌宿主细胞,其中所述Gsh1蛋白质包含SEQID NO:4,或者由SEQ ID NO:4组成。
12.根据前述权利要求中任一项所述的真菌宿主细胞,其中所述宿主细胞缺乏GSH1基因或其同系物或者Gsh1蛋白质或其同系物。
13.根据权利要求5-12中任一项所述的真菌宿主细胞,其中所述Not4蛋白质或其同系物在对应于选自SEQ ID NO:6的以下位置的位置处包含突变:426、427、428、429、430、431、432、433、434、435、436、437、438、439、440、441、442、443、444、445、446、447、448、449、450、451、452、453、454、455、456、457、458、459、460、461、462、463、464、465、466、467、468、469或470。
14.根据权利要求13所述的真菌宿主细胞,其中在对应于SEQ ID NO:6的位置429的位置处的突变是取代为A、C、D、E、G、H、I、K、L、M、N、P、Q、R、S、T、V、W或Y,优选取代为G、A、V、L或I,更优选取代为I、L或V,最优选取代为I。
15.根据权利要求5-14中任一项所述的真菌宿主细胞,其中所述Not4蛋白质包含SEQID NO:8,或者由SEQ ID NO:8组成。
16.根据前述权利要求中任一项所述的真菌宿主细胞,其中所述真菌宿主为酵母属(Saccharomyces),例如酿酒酵母(Saccharomyces cerevisiae)。
17.一种用于增加期望的蛋白质(例如异源蛋白质)产量的方法,其包括:
a.提供真菌宿主细胞(例如酵母或丝状真菌),其具有修饰的:
1.Gsh1蛋白质或其同系物,和/或
2.Gsh1蛋白质或其同系物的活性水平(优选降低),和/或
3.GSH1基因或其同系物,和/或
4.GSH1基因或其同系物的表达水平(优选降低),和
b.培养所述宿主细胞以产生所述期望的蛋白质,和
c.任选地回收所述期望的蛋白质,
d.任选地纯化所述期望的蛋白质,
e.任选地将所述期望的蛋白质与治疗上可接受的载体或稀释剂进行配制以制备适合施用于人或动物的治疗产品,和
f.任选地提供单位剂型的所述期望的蛋白质。
18.根据权利要求17所述的方法,其中所述期望的蛋白质的产量比来自参照真菌宿主细胞例如具有SEQ ID NO:2的Gsh1蛋白质的真菌宿主细胞的产量高至少2%。
19.根据权利要求17或18所述的方法,其中所述真菌宿主细胞具有修饰的:
1.Not4蛋白质或其同系物,和/或
2.Not4蛋白质或其同系物的活性水平(优选降低),和/或
3.NOT4基因或其同系物,和/或
4.NOT4基因或其同系物的表达水平(优选降低)。
20.根据权利要求19所述的方法,其中所述期望的蛋白质的产量比来自参照真菌宿主细胞例如具有野生型Not4蛋白质、例如SEQ ID NO:6的真菌宿主细胞的产量高至少2%。
21.根据权利要求19或20所述的方法,其中所述期望的蛋白质的产量比来自参照真菌宿主细胞例如具有SEQ ID NO:2的Gsh1蛋白质的真菌宿主细胞的产量高至少2%。
22.根据权利要求19-21中任一项所述的方法,其中所述期望的蛋白质的产量比来自参照真菌宿主细胞例如具有SEQ ID NO:2的Gsh1蛋白质和SEQ ID NO:6的Not4蛋白质的真菌宿主细胞的产量高至少2%。
23.根据权利要求17-22中任一项所述的方法,其中所述期望的蛋白质包括白蛋白或其变体、片段和/或融合物或者所述期望的蛋白质由白蛋白或其变体、片段和/或融合物组成。
24.根据权利要求17-23中任一项所述的方法,其中所述宿主细胞在至少5L的规模下培养。
25.在真菌宿主细胞中降低Gsh1蛋白质或其同系物的表达水平和/或活性水平以增加来自所述真菌宿主细胞的期望的蛋白质(例如异源蛋白质)的产量的手段的用途。
26.在真菌宿主细胞中降低Gsh1蛋白质或其同系物的表达水平和/或活性水平以及降低Not4蛋白质或其同系物的活性水平和/或表达水平以增加来自所述真菌宿主细胞的期望的蛋白质(例如异源蛋白质)的产量的手段的用途。
CN201880054025.6A 2017-06-20 2018-06-20 改良的表达蛋白质的菌株 Pending CN111032871A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17176932.6 2017-06-20
EP17176932 2017-06-20
PCT/EP2018/066344 WO2018234349A1 (en) 2017-06-20 2018-06-20 IMPROVED STRAINS FOR THE EXPRESSION OF PROTEINS

Publications (1)

Publication Number Publication Date
CN111032871A true CN111032871A (zh) 2020-04-17

Family

ID=59257979

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880054025.6A Pending CN111032871A (zh) 2017-06-20 2018-06-20 改良的表达蛋白质的菌株

Country Status (12)

Country Link
US (2) US11130979B2 (zh)
EP (2) EP4026908A1 (zh)
JP (1) JP7282693B2 (zh)
KR (1) KR102638505B1 (zh)
CN (1) CN111032871A (zh)
AU (1) AU2018286919B2 (zh)
BR (1) BR112019027397A2 (zh)
CA (1) CA3064037A1 (zh)
DK (1) DK3642343T3 (zh)
ES (1) ES2906997T3 (zh)
IL (1) IL271404A (zh)
WO (1) WO2018234349A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7282693B2 (ja) * 2017-06-20 2023-05-29 アルブミディクス リミティド 改良されたタンパク質発現株

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102296033A (zh) * 2011-04-26 2011-12-28 武汉大学 一种酿酒酵母gsh1缺失突变株的构建方法及应用
CN104059936A (zh) * 2014-04-30 2014-09-24 唐星 一种用于合成谷胱甘肽的基因工程菌的制备方法及其产品
CN105378058A (zh) * 2013-07-12 2016-03-02 味之素株式会社 具有高含量的Abu、γ-Glu-Abu和/或γ-Glu-Abu-Gly的酵母

Family Cites Families (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9019919D0 (en) 1990-09-12 1990-10-24 Delta Biotechnology Ltd Purification of proteins
US4302386A (en) 1978-08-25 1981-11-24 The Ohio State University Antigenic modification of polypeptides
IL88326A (en) 1987-11-18 1993-03-15 Gist Brocades Nv Purification of serum albumin
ATE135045T1 (de) 1988-07-23 1996-03-15 Delta Biotechnology Ltd Sekretorische leader-sequenzen
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
CA2017176A1 (en) 1989-05-22 1990-11-22 Yoshitomi Pharmaceutical Industries Ltd. Albumin gene-containing plasmid, transformant carrying same, production of such transformant and production of albumin
JPH03155791A (ja) 1989-11-14 1991-07-03 Green Cross Corp:The 雑種プロモーター
JP3230091B2 (ja) 1990-06-25 2001-11-19 ウェルファイド株式会社 ヒト血清アルブミンの着色抑制方法
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
WO1992013951A1 (en) 1991-02-04 1992-08-20 The Salk Institute Biotechnology/Industrial Associates, Inc. Production of human serum albumin in methylotrophic yeast cells
US5728553A (en) 1992-09-23 1998-03-17 Delta Biotechnology Limited High purity albumin and method of producing
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
CN101659926A (zh) 1994-06-30 2010-03-03 诺沃奇梅兹有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
ATE241695T1 (de) 1996-03-13 2003-06-15 Delta Biotechnology Ltd Gärungs-steuerungssysteme
AU733007B2 (en) 1996-09-24 2001-05-03 Cadus Pharmaceutical Corporation Methods and compositions for identifying receptor effectors
JP5043254B2 (ja) 1998-10-26 2012-10-10 ノボザイムス アクティーゼルスカブ 糸状面細胞内の問題のdnaライブラリーの作製及びスクリーニング
GB9902000D0 (en) 1999-01-30 1999-03-17 Delta Biotechnology Ltd Process
EP2278016B1 (en) 1999-03-22 2012-09-26 Novozymes Inc. Promoter sequences derived from Fusarium Venenatum and uses thereof
ATE375388T1 (de) 2001-07-27 2007-10-15 Us Gov Health & Human Serv Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
ZA200406124B (en) 2002-02-07 2008-09-25 Delta Biotechnology Ltd Albumin-fused kunitz domain peptides
GB0217033D0 (en) 2002-07-23 2002-08-28 Delta Biotechnology Ltd Gene and polypeptide sequences
GB0329681D0 (en) 2003-12-23 2004-01-28 Delta Biotechnology Ltd Gene expression technique
US20090280534A1 (en) 2004-12-22 2009-11-12 Novozymes A/S Recombinant Production of Serum Albumin
JP5631533B2 (ja) 2004-12-23 2014-11-26 ノボザイムス バイオファーマ デーコー アクティーゼルスカブ 遺伝子発現技術
GB0512707D0 (en) 2005-06-22 2005-07-27 Delta Biotechnology Ltd Gene expression technique
PL2288715T3 (pl) 2008-04-11 2015-03-31 Merrimack Pharmaceuticals Inc Łączniki będące albuminą surowicy ludzkiej i ich koniugaty
JP5410703B2 (ja) 2008-07-30 2014-02-05 アサヒグループホールディングス株式会社 酵母変異株の作製方法および酵母変異株
CN102282168A (zh) 2008-11-18 2011-12-14 梅里麦克制药股份有限公司 人血清白蛋白接头以及其结合物
SG2014012918A (en) 2009-02-11 2014-04-28 Novozymes Biopharma Dk As Albumin variants and conjugates
EP2427486B1 (en) 2009-05-07 2015-02-25 Novozymes Biopharma DK A/S Method for purifying albumin
GB2488077A (en) 2009-10-30 2012-08-15 Novozymes Biopharma Dk As Albumin variants
JP5634051B2 (ja) 2009-11-13 2014-12-03 Mcフードスペシャリティーズ株式会社 グルタチオン高生産酵母及びその利用
CN102781960B (zh) 2010-02-16 2014-12-10 米迪缪尼有限公司 Hsa相关组合物及使用方法
KR20130070576A (ko) 2010-04-09 2013-06-27 노보자임스 바이오파마 디케이 에이/에스 알부민 유도체 및 변이체
US20130225496A1 (en) 2010-11-01 2013-08-29 Novozymes Biopharma Dk A/S Albumin Variants
CN103379915A (zh) 2011-02-15 2013-10-30 米迪缪尼有限公司 Hsa相关组合物及使用方法
GB2491006A (en) 2011-05-05 2012-11-21 Novozymes Biopharma Uk Ltd Albumin variants
FR2980483B1 (fr) 2011-09-23 2015-07-17 Lesaffre & Cie Souches de levure pour la production de glutathion
KR102359731B1 (ko) 2011-11-16 2022-02-08 더 제너럴 하스피탈 코포레이션 피부 조직의 극저온 처리를 위한 방법 및 장치
WO2013075066A2 (en) 2011-11-18 2013-05-23 Eleven Biotherapeutics, Inc. Proteins with improved half-life and other properties
US9944691B2 (en) 2012-03-16 2018-04-17 Albumedix A/S Albumin variants
BR112015003701A2 (pt) 2012-08-22 2017-12-12 Butamax Advanced Biofuels Llc células hospedeiras recombinantes, método para aprimoramento, processo para a produção de um álcool, polinucleotídeo isolado, cassete de expressão e composição
BR112015010318A2 (pt) 2012-11-08 2017-08-22 Albumedix As Variantes de albumina
US9926570B2 (en) 2013-03-06 2018-03-27 Glaxosmithkline Llc Host cells and methods of use
US20160052993A1 (en) 2013-05-03 2016-02-25 Eleven Biotherapeutics, Inc. Albumin variants binding to fcrn
EP3044232A1 (en) 2013-09-13 2016-07-20 Novozymes Biopharma DK A/S Albumin variants
JP6306700B2 (ja) 2013-11-01 2018-04-04 ユニバーシティ オブ オスロUniversity of Oslo アルブミン改変体及びその使用
JP7007261B2 (ja) 2015-08-20 2022-01-24 アルブミディクス リミティド アルブミン変異体及びコンジュゲート
BR112018012851A2 (pt) 2015-12-22 2018-12-26 Albumedix Ltd cepas de expressão de proteína melhoradas
JP7282693B2 (ja) * 2017-06-20 2023-05-29 アルブミディクス リミティド 改良されたタンパク質発現株

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102296033A (zh) * 2011-04-26 2011-12-28 武汉大学 一种酿酒酵母gsh1缺失突变株的构建方法及应用
CN105378058A (zh) * 2013-07-12 2016-03-02 味之素株式会社 具有高含量的Abu、γ-Glu-Abu和/或γ-Glu-Abu-Gly的酵母
CN104059936A (zh) * 2014-04-30 2014-09-24 唐星 一种用于合成谷胱甘肽的基因工程菌的制备方法及其产品

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
ANGEL F. MARIS等: "Glutathione, but not transcription factor Yap1, is required for carbon source-dependent resistance to oxidative stress in Saccharomyces cerevisiae", vol. 37, no. 3, pages 175 - 182, XP009501709, DOI: 10.1007/s002940050516 *
GUADALUPE GUTIÉRREZ-ESCOBEDO等: "Role of glutathione in the oxidative stress response in the fungal pathogen Candida glabrata", vol. 59, no. 3, pages 91 - 106, XP009501704, DOI: 10.1007/s00294-013-0390-1 *
刘亮伟等: "《基因工程原理与实验指导》", 中国轻工业出版社, pages: 114 - 117 *
张君丽等: "一种适用于产朊假丝酵母的基因敲除系统及其 在gsh1 基因敲除中的应用", vol. 38, no. 6, pages 795 - 802 *
熊玲红等: "活细胞合成无机纳米材料", vol. 46, no. 3, pages 163 - 172 *

Also Published As

Publication number Publication date
EP3642343A1 (en) 2020-04-29
KR20200019731A (ko) 2020-02-24
US20200123584A1 (en) 2020-04-23
AU2018286919B2 (en) 2022-10-06
BR112019027397A2 (pt) 2020-07-14
CA3064037A1 (en) 2018-12-27
US11396670B2 (en) 2022-07-26
IL271404A (en) 2020-01-30
WO2018234349A1 (en) 2018-12-27
ES2906997T3 (es) 2022-04-21
DK3642343T3 (en) 2022-03-14
JP2020530260A (ja) 2020-10-22
KR102638505B1 (ko) 2024-02-20
EP3642343B1 (en) 2021-12-08
EP4026908A1 (en) 2022-07-13
AU2018286919A1 (en) 2019-12-05
US20220090159A1 (en) 2022-03-24
JP7282693B2 (ja) 2023-05-29
US11130979B2 (en) 2021-09-28

Similar Documents

Publication Publication Date Title
US10023618B2 (en) Protein expression strains
KR101262682B1 (ko) 유전자 발현 기술
CN105586355B (zh) 在镶片镰孢的酶缺陷突变体中产生多肽的方法
AU2013341049B2 (en) Expression sequences
CN105492604B (zh) 受调节的pepc表达
NZ537779A (en) Increase in the yield of secreted protein by the introduction of an amino acid sequence motif, preferably by modification of leader sequences
US11396670B2 (en) Protein expression strains
US20160152993A1 (en) Promoters for Expressing Genes in a Fungal cell
JP7146637B2 (ja) 改善されたタンパク質発現株
Muraki Secretory expression of synthetic human Fas ligand extracellular domain gene in Pichia pastoris: influences of tag addition and N-glycosylation site deletion, and development of a purification method
DK2646558T3 (en) Promoters for expression of genes in a fungal cell
JP2001509392A (ja) 組換え酵母細胞による分泌タンパク質の産生増加
US8703444B2 (en) Pichia pastoris deficient in endogenous secreted protease
Ramagoma Development of Yarrowia lipolytica for enhanced production of heterologous proteins

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination