CN104837857B

CN104837857B - 表达序列

Info

Publication number: CN104837857B
Application number: CN201380056279.9A
Authority: CN
Inventors: B·加塞尔; D·马塔诺维赫; S·海斯
Original assignee: Lonza AG
Current assignee: Lonza AG
Priority date: 2012-10-29
Filing date: 2013-10-29
Publication date: 2018-11-06
Anticipated expiration: 2033-10-29
Also published as: EP2912053A1; EP3130598B1; EP2912053B1; US10160988B2; IL266700A; US20180135092A1; KR102079293B1; DK2912053T3; US20150232904A1; KR20150076160A; CA2886460C; ES2789299T3; JP2015533286A; EP3130598A2; SG11201502745XA; AU2013341049B2; CN104837857A; WO2014067926A1; IL238420A0; HUE033282T2

Abstract

本发明公开了一种编码前导序列的分离的核酸，其具有一特定序列，以及公开了由该核酸编码的分离的前导肽、包括编码前导序列的这种核酸的表达组件，该核酸可操作地连接到编码POI的核酸序列上，本发明公开了一包括该表达组件的重组酵母宿主细胞或载体，一种在该酵母宿主细胞中生产POI的方法，以及进一步地，公开了该特定核酸用于从宿主细胞分泌POI和/或增加来自宿主细胞的POI的分泌的用途。

Description

表达序列

本发明涉及巴斯德毕赤酵母(P.pastoris)表达系统的调节元件，以及它们在生产目标蛋白(POI)的方法中的用途。

背景技术

已在原核和真核宿主中成功实现蛋白分泌。最突出的例子是细菌如大肠杆菌，酵母菌如酿酒酵母、巴斯德毕赤酵母、汉逊酵母(Hansenula polymorpha)，丝状真菌如泡盛曲霉或里氏木霉，或哺乳动物细胞如CHO细胞。尽管一些蛋白可以容易地实现高效率分泌，但是很多其他蛋白仅以相对较低的水平分泌。

基因在宿主生物体内的异源表达需要一载体，允许宿主生物体的稳定转化。该载体或表达组件需为基因提供一功能性启动子，该启动子位于编码序列的5'末端附近。转录因此而受该启动子序列调节和启动。

分泌途径通常开始于跨膜多肽和旨在分泌到内质网(ER)内腔的多肽的易位。为此，这些蛋白具有氨基末端先导序列(precursing sequence)，也被称作“前导序列”，其包含一信号肽和一可选的分泌前导肽原，或由其组成。信号肽通常由13-36个相当疏水的氨基酸组成。信号肽有一个共同的结构：一短的带正电荷的氨基末端区域(n-区域)；一中央疏水区域(h-区域)；和一极性较强的羧基末端区域(c区域)，其中羧基末端区域包含被信号肽酶切割的位点。在ER的内腔侧，信号肽被信号肽酶切除。在通过ER伴侣和折叠酶成功折叠新生多肽后，该蛋白进一步被引导移出ER。这一进程可得到N末端原序列(pro-sequence)的支持，因为其存在于例如酿酒酵母交配因子α(MFα)的前体中。该蛋白然后被运输到高尔基网络并最终到达质膜从而分泌到上清液中。前导肽原(推测)被高尔基内的蛋白酶如酿酒酵母的Kex2蛋白酶从该蛋白上切除。

由于大多数酵母并不分泌大量的內源性蛋白，并且它们的细胞外蛋白质组学目前并未广泛表征，因此，可获得的用于酵母的分泌序列的数量是有限的。因此，采用融合目标蛋白和酿酒酵母的交配因子α前导肽(MFα)的方式来驱动在多种酵母(包括毕赤酵母属、克鲁维酵母属、接合酵母属)中的分泌表达。很可惜，由Kex2蛋白酶进行的MFα蛋白酶解处理经常在产品中产生异源的N末端氨基酸残基。

EP324274B1介绍了在酵母中的改进的异源蛋白的表达和分泌，其采用截短的酿酒酵母α因子前导序列，EP301669B1描述了用于分泌异源蛋白的克鲁维酵母α因子前导序列。

或者，可用酿酒酵母磷酸酶(PHO5，DK3614)、酿酒酵母蔗糖转化酶(SUC，WO84/01153)，以及酵母天冬氨酸蛋白酶3(YAP3，EP792367B1)的信号肽用于酵母中的分泌表达。EP0438200(A1)披露了用于在巴斯德毕赤酵母中表达的酿酒酵母SUC2的信号肽序列。

US5268273描述了巴斯德毕赤酵母酸性磷酸酶(PHO1)信号序列，其在大多数情况下弱于MFα。

US7741075描述了用于重组蛋白表达的巴斯德毕赤酵母PIR1分泌信号肽，以及用于重组表面展示的巴斯德毕赤酵母PIR1和PIR2锚定域肽。

Khasa等人2011年(Yeast.28(3):213-26)描述了巴斯德毕赤酵母PIR基因的分离以及在细胞表面展示和重组蛋白分泌方面的应用，尤其是利用PpPir1p蛋白的前原(pre-pro)信号在巴斯德毕赤酵母中进行的重组蛋白分泌，没有与MFα进行对比。

WO2011073367A1和Kottmeier等人2011年(Applied Microbiology andBiotechnology.91:1,133-141)描述了一疏水蛋白信号序列，其介导重组蛋白在巴斯德毕赤酵母中的高效分泌，尤其是使用里氏木霉疏水蛋白的前序列或原序列用于eGFP在巴斯德毕赤酵母中的分泌。

在巴斯德毕赤酵母基因组测序过程中列出了54种不同的序列作为预测的信号肽，其包括一切割位点以提供蛋白的分泌。(De Schutter et al.Nature Biotechnology doi:10.1038/nbt.15442009)。

US2011/0021378A1描述了经过鉴定的一组54个巴斯德毕赤酵母基因，其包括一信号序列，在它们之中SEQ ID 8的第1-21个残基列于US2011/0021378A1中，也包括一切割位点以提供蛋白分泌。

EP2258855A1描述了巴斯德毕赤酵母来源的表达系统的调节序列，其中巴斯德毕赤酵母Epx1蛋白的信号和前导肽序列用作57氨基酸先导序列以便于目标POI蛋白的表达和分泌。用于信号肽酶的切割位点预计跟随信号序列，即在位置20和21之间，显示为切割位点序列中的连字符：VSA-AP(SEQ ID 6)。

最好是能够提供适合在重组真核宿主细胞内表达POI的替代的调节元件，以及在真核细胞内产生分泌性蛋白的简单、高效的方法，该方法最好能使POI产生同种N末端。

发明内容

可通过本发明要求保护的主题来实现这个目标。

本发明提供一编码前导序列的分离的核酸，该前导序列选自：

a)具有SEQ ID 10的氨基酸序列的前导肽或其具有一个或两个点突变的功能变体，

b)具有选自由SEQ ID 11、12、13和14组成的组的氨基酸序列的前导肽，

c)具有SEQ ID 1的氨基酸序列的信号肽或其具有一个或两个点突变的功能变体(优选排除SEQ ID 2)，以及

d)具有选自由SEQ ID 2、3、4和5组成的组(优选排除SEQ ID 2)的氨基酸序列的信号肽。

本发明进一步提供一前导序列，其选自：

特异性前导肽因此通过一36个氨基酸(aa)前导序列表征，其中N末端的20aa序列是一特异性信号肽。

特异性信号肽因此通过一20aa信号序列表征，特别地，排除C末端延伸序列，例如一包括通过另外的氨基酸例如丙氨酸实现的C末端延伸的21aa序列。

SEQ ID 1：MKSTNLILAIAAASVVSA，其中

位置3处的X是F或者L

位置16处的X是A或者T

例如，EpxL-A，一20个氨基酸(aa)的信号肽，具有SEQ ID 1的氨基酸序列，其中位置3处的X是L，并且位置16处的X是A(SEQ ID 2)。

根据一特定实例，该EpxL-A，一20个氨基酸(aa)的信号肽，具有SEQ ID 1的氨基酸序列，其中位置3处的X是F，并且位置16处的X是A(SEQ ID 3)。

具体而言，本发明提供一信号肽或一编码该信号肽的核酸，该信号肽具有选自由SEQ ID2、3、4和5组成的组的氨基酸序列。

SEQ ID 2：MKSTNLILAIAAASVVSA

SEQ ID 3：MKSTNLILAIAAASVVSA

SEQ ID 4：MKSTNLILAIAAASVVSA

SEQ ID 5：MKSTNLILAIAAASVVSA

在位置3和16处的氨基酸替换以粗体和下划线标示。

编码本发明的信号肽的核酸分子在此也称作“信号序列”。

本发明上述定义的前导序列特别地具有SEQ ID 10的氨基酸序列。

SEQ ID 10：

MKSTNLILAIAAASVVSAAPVAPAEEAANHLHKR，其中

位置3处的X是F或者L

位置16处的X是A或者T

具体而言，本发明提供一前导序列或一编码该前导序列的核酸，该前导序列具有选自由SEQ ID 11、12、13和14组成的组的氨基酸序列。

SEQ ID 11：MKSTNLILAIAAASVVSAAPVAPAEEAANHLHKR

SEQ ID 12：MKSTNLILAIAAASVVSAAPVAPAEEAANHLHKR

SEQ ID 13：MKSTNLILAIAAASVVSAAPVAPAEEAANHLHKR

SEQ ID 14：MKSTNLILAIAAASVVSAAPVAPAEEAANHLHKR

在位置3和16处的氨基酸替换以粗体和下划线标示。

例如，EpxL-KR，一36个氨基酸(aa)的截短前导序列，具有SEQ ID 10的氨基酸序列，其中位置3处的X是L，并且位置16处的X是A。

根据一特定实例，EpxL-KR，一36个氨基酸(aa)的前导肽，具有SEQ ID 10的氨基酸序列，其中位置3处的X是F，并且位置16处的X是A(SEQ ID 12)。

本发明的具有SEQ ID 10、11、12、13或14的氨基酸序列的前导序列，或其具有一个或两个点突变的功能变体，在此也被称作“截短前导序列”。

具体而言，编码截短前导序列的核酸包括一编码信号肽的核酸或由其组成，其中，该信号肽选自由SEQ ID 2、3、4和5组成的组，优选排除SEQ ID 2。特别地，编码截短前导序列的核酸包括一编码前导肽的核酸或由其组成，其中，该前导肽选自由SEQ ID 11、12、13和14组成的组。

特别地，该截短前导序列包括选自由SEQ ID 2、3、4和5组成的组，优选排除SEQ ID2的信号肽，或由其组成，或由前导肽组成，所述前导肽选自由SEQ ID 11、12、13和14组成的组。

一特别优选的核酸编码SEQ ID 3的氨基酸序列的信号肽或者SEQ ID 12的前导肽；优选地，编码该信号肽或前导肽的核酸序列分别是SEQ ID 16或SEQ ID 19。一特别优选的前导序列是具有SEQ ID 3的氨基酸序列的信号肽或者具有SEQ ID 12的氨基酸序列的前导肽。

因此，本发明的一具体实例是指一前导序列或编码这种前导序列的核酸，该前导序列为

a)具有SEQ ID 3的氨基酸序列的信号肽，优选地，其中该编码核酸由SEQ ID 16的核苷酸序列或SEQ ID 16的密码子优化的变体组成；或

b)具有或包括SEQ ID 12的氨基酸序列，或者由其组成的前导肽，优选地，其中该编码核酸由SEQ ID 19的核苷酸序列或SEQ ID 19的密码子优化的变体组成。

具体而言，本发明的核酸具有

a)编码信号肽的核苷酸序列，选自由SEQ ID 15、16和17组成的组(优选排除SEQID15)，或者

b)编码前导肽的核苷酸序列，选自由SEQ ID 18、19和20组成的组，或者

c)一核苷酸序列，其为SEQ ID 15、16、17、18、19或20的密码子优化的变体。

本发明的一特定核酸编码一前导序列，该前导序列为SEQ ID 3的氨基酸序列的信号肽，优选地，其中该核酸由SEQ ID 16的核酸序列或SEQ ID 16的密码子优化的变体组成。

本发明的一特定核酸编码一前导序列，该前导序列为一前导肽或截短前导序列，具有SEQ ID 12的氨基酸序列，优选地，其中该核酸由SEQ ID 19的核苷酸序列或SEQ ID 19的密码子优化的变体组成。

SEQ ID 15：获自巴斯德毕赤酵母CBS7435株(CBS-KNAW Fungal BiodiversityCentre(CBS-KNAW真菌生物多样性中心)，Centraalbureau voor Schimmelcultures，Utrecht,The Netherlands(荷兰乌得勒支))的核苷酸序列：

ATGAAGCTCTCCACCAATTTGATTCTAGCTATTGCAGCAGCTTCCGCCGTTGTCTCAGCT

SEQ ID 16：用于实例9的核苷酸序列，获自巴斯德巴斯德毕赤酵母CBS7435株，通过使用实例9中描述的引物进行PCR扩增。

ATGAAGTTCTCTACCAATTTGATTCTAGCTATTGCAGCAGCTTCCGCCGTTGTCTCAGCT

SEQ ID17：获自巴斯德毕赤酵母DSMZ70382株(German Collection ofMicroorganisms and Cell Cultures(德国微生物保藏和细胞培养中心))的核苷酸序列

ATGAAGTTCTCTACCAATTTGATCTTAGCTATTGCAGCAGCATCCACTGTTGTCTCAGCT

上述序列中的不同的核苷酸带有下划线。

SEQ ID 18：获自巴斯德毕赤酵母CBS7435株(CBS-KNAW真菌生物多样性中心，Centraalbureau voor Schimmelcultures，荷兰乌得勒支)的核苷酸序列

ATGAAGCTCTCCACCAATTTGATTCTAGCTATTGCAGCAGCTTCCGCCGTTGTCTCAGCTGCTCCAGTTGCTCCAGCCGAAGAGGCAGCAAACCACTTGCACAAGCGT

SEQ ID 19：用于实例5的核苷酸序列，获自巴斯德毕赤酵母CBS7435株，通过使用实例1和5中描述的引物进行PCR扩增

ATGAAGTTCTCTACCAATTTGATTCTAGCTATTGCAGCAGCTTCCGCCGTTGTCTCAGCTGCTCCAGTTGCTCCAGCCGAAGAGGCAGCAAACCACTTGCACAAGCGT

SEQ ID 20：获自巴斯德毕赤酵母DSMZ70382株(德国微生物保藏和细胞培养中心)的核苷酸序列

ATGAAGTTCTCTACCAATTTGATCTTAGCTATTGCAGCAGCATCCACTGTTGTCTCAGCTGCTCCAGTTGCTCCAGCCGAAGAGGCAGCAAACCACTTGCACAAGCGT

特别地，本发明的核酸是DNA。

特别地，本发明的前导序列是多肽。

根据一个特定方面，本发明提供一分离的前导序列、截短前导序列、信号肽或前导肽，优选地该前导序列具有一氨基酸序列，该氨基酸序列选自由SEQ ID 1、2、3、4、5、10、11、12、13和14组成的组，优选排除SEQ ID 2。

一特别优选的前导序列是一肽，该肽由SEQ ID 3或SEQ ID 12的氨基酸序列组成。

根据另一方面，本发明进一步提供一包含一核酸的表达组件，该核酸编码一前导序列，该前导序列可操作地连接到一编码POI的核酸序列上，其特征在于，该前导序列选自由以下组成的组：

c)具有SEQ ID 1的氨基酸序列的信号肽，或者其具有一个或两个点突变的功能变体，以及

d)具有选自由SEQ ID 2、3、4和5组成的组的氨基酸序列的信号肽，

优选地，其中排除由SEQ ID 2氨基酸序列组成的信号肽和包含一种或多种免疫球蛋白单可变域(或由其组成)的多肽的融合体，例如纳米抗体。

然而，根据具体实例，本发明提供具有选自由SEQ ID 11、12、13和14组成的组的氨基酸序列的前导肽与一POI的融合体，或者提供具有选自由SEQ ID 2、3、4和5组成的组的氨基酸序列的信号肽与一POI的融合体，该POI选自由生长因子、激素、细胞因子、抗体和抗体片段组成的组，特别地，其中抗体或抗体片段选自由以下组成的组：scFv、微抗体、双特异抗体、三特异抗体、四特异抗体、Fab、Fc-融合蛋白和全长抗体例如IgG、IgA、IgD、IgM或Ig，优选的是一全长抗体、scFv或Fab，特别包括由SEQ ID 2氨基酸序列组成的信号肽与这类抗体或抗体片段的任一种，特别是全长抗体、scFv或Fab中的任一种的融合体。

编码用于表达组件的信号肽或前导肽的特别优选的核苷酸序列由编码SEQ ID 3或SEQ ID 12的氨基酸序列的核苷酸序列组成，优选地，由SEQ ID 16或SEQ ID 19，或者SEQID 16或19的密码子优化的变体组成。这类信号肽或前导肽优选地融合到任意POI，包括任意抗体或抗体片段，特别包括由SEQ ID 3或SEQ ID 12的氨基酸序列组成的信号肽或前导肽与一多肽的融合，该多肽包含一个或多个免疫球蛋白单可变域，或由其组成，例如一纳米抗体。

根据另一方面，本发明进一步提供一表达组件，包括

a)编码信号肽的核苷酸序列，选自由SEQ ID 15、16和17组成的组，或者

c)一核苷酸序列，其为SEQ ID 15、16、17、18、19或20的密码子优化的变体，

优选地，其中排除通过将SEQ ID 15的核苷酸序列融合到编码一种或多种免疫球蛋白单可变域的核苷酸序列的融合构建体，例如纳米抗体。

然而，根据一特定实例，本发明提供将SEQ ID 15的核苷酸序列融合到编码一抗体或抗体片段的核苷酸序列的融合构建体，该抗体或抗体片段选自由以下组成的组：scFv、微抗体、双特异抗体、三特异抗体、四特异抗体、Fab、Fc-融合蛋白和全长抗体例如IgG、IgA、IgD、IgM或IgE，优选的是一全长抗体、scFv或Fab。

特别优选的核苷酸序列是SEQ ID 16，编码SEQ ID 3的信号肽。

另一特别优选的核苷酸序列是SEQ ID 19，编码SEQ ID 12的前导肽。

因此，根据具体实例，本发明提供将SEQ ID 16或19的核苷酸序列融合到编码任何目标蛋白的核苷酸序列的融合构建体，特别地，该目标蛋白是例如本文描述的POI，包括但不限于，任意抗体或抗体片段，特别包括融合构建体，其中POI是一多肽，包括一个或多个免疫球蛋白单可变域，或由其组成，例如一纳米抗体。

通过本发明的表达组件，第一次可以提供POI的表达，特别是分泌的成熟POI的表达，具有正确的、天然的N末端氨基酸残基，特别是在N末端不具有另外的丙氨酸。

具体来说，POI选自：治疗性蛋白，包括抗体或其片段、酶和肽类、蛋白质抗生素、毒素融合蛋白、碳水化合物-蛋白质结合物，结构蛋白、调节蛋白、疫苗和类疫苗蛋白或颗粒、过程酶(process enzymes)、生长因子、激素和细胞因子，或者其中所述POI介导宿主细胞代谢物的产生，代谢物优选选自由抗体或其片段、生长因子、激素和细胞因子组成的组。

根据特定实例，该抗体或其抗体片段选自由以下所组成的组：scFv、微抗体、双特异抗体、三特异抗体、四特异抗体、Fab、Fc-融合蛋白和全长抗体例如IgG、IgA、IgD、IgM或IgE，优选的是一全长抗体、scFv或Fab。

特别地，本发明的表达组件是本发明的核酸和一编码POI的核酸的融合体，并因此是一非天然存在的核酸。本发明进一步提供本发明的前导序列与POI的融合蛋白，并因此是一非天然存在的融合蛋白。

因此，前导序列经改造用于改善POI的生产，例如，用于增加分泌量和改善质量，例如正确的N末端，并且采用了不同于现有技术的前导序列。

本发明的表达组件特别地编码一前导序列，该前导序列由信号肽或通过原序列(pro-sequence)延长的信号肽组成，该原序列由APVAPAEEAANHLHKR(SEQ ID 7)组成，该原序列是巴斯德毕赤酵母Epx1蛋白的天然全长前导序列的一部分，即与SEQ ID 8(MKFSTNLILAIAAASTVVSAAPVAPAEEAANHLHKRAYYTDTTKTHTFTEVVTVYRT)的57个氨基酸序列中的第21-36个氨基酸序列相同的16个氨基酸序列。

与现有技术的前导序列例如SEQ ID 21相比，本发明的两个前导序列，信号肽和截短肽意外地具有意料之外的改善的性能，其中，

SEQ ID 21：MKLSTNLILAIAAASAVVSAA，

根据US2011/0021378A1，本文中也称为EpxL-AA(21个氨基酸)。

此外，与EP2258855A1中描述的巴斯德毕赤酵母Epx1蛋白的全长前导序列相比，本发明显示出改善的性能，该全长前导序列是SEQ ID 8的57个氨基酸序列或在其位置3用亮氨酸进行取代的变体。

这更令人惊讶，因为根据本发明，该没有原序列的20个氨基酸的信号肽或者该截短前导序列的长度分别仅为全长前导序列的35％和63％。

与用α交配因子(αMF)前导序列进行融合相比，本发明的前导序列融合到POI之时具有特殊优势，例如POI分泌增加，和/或质量提高，例如正确的N末端，特别是当POI是激素、细胞因子、抗体或抗体片段时，例如选自由以下组成的组：scFv、微抗体、双特异抗体、三特异抗体、四特异抗体、Fab、Fc-融合蛋白和全长抗体例如IgG、IgA、IgD、IgM或IgE，优选的是一全长抗体、scFv或Fab。

本发明的表达组件明确地排除如EP2258855A1中描述的编码巴斯德毕赤酵母Epx1蛋白的天然前导序列(SEQ ID 8)的核酸。

本发明的表达组件进一步明确排除一核酸，该核酸编码具有巴斯德毕赤酵母Epx1蛋白全长前导序列的第1-21个氨基酸的前导序列(即SEQ ID 11)，如US2011/0021378A1中所述的。

根据本发明的一个特殊方面，表达组件可选地结合到一表达构建体上，例如一载体。

根据本发明的进一步的特殊方面，表达组件或者表达构建体包含一启动子，其可操作地连接到编码该前导序列的核酸上。

根据本发明的一特定实施例，本发明提供一重组酵母宿主细胞，其包括本发明的表达组件，特别是酵母宿主细胞系，更特别的是一生产细胞系。根据本发明的一特定方面，该表达组件是一载体，或者载体的一部分。

优选地，酵母选自以下种属：毕赤酵母属、假丝酵母属、球拟酵母属、Arxula酵母、汉逊氏酵母、Ogatea酵母、耶氏酵母属、克鲁维酵母属、裂殖酵母属、Komagataella酵母，优选的是一甲醇营养型酵母，并且特别优选的是巴斯德毕赤酵母、Komagataella pastoris、K.phaffii或K.pseudopastoris。

根据另一具体实施方式，本发明提供在酵母宿主细胞内生产POI的方法，包括：

-提供本发明的宿主细胞，

-培养所述宿主细胞以表达所述POI，以及

-纯化POI以获得纯化的POI制品。

根据本发明，优选地采用表达组件以便于重组基因在酵母宿主细胞内的分泌，从而增加分泌产物的产量。

因此，本发明的表达组件提供宿主细胞内的POI的高效表达和分泌，该宿主细胞用所述表达组件进行转化。在这方面，本发明的表达组件理解为酵母表达组件。

特别地，该POI是一重组蛋白，该术语在本文中总是理解为包括多肽和蛋白，例如由重组宿主细胞产生的那些。该POI可以是异源蛋白，例如与酵母异源的，例如获自较高级的真核生物如人类，或除巴斯德毕赤酵母以外的其他酵母种的蛋白，或者是人工多肽或蛋白。或者，POI可以是一同源蛋白，其获自酵母例如巴斯德毕赤酵母，其在没有被本发明载体转化的天然酵母内不表达或表达量不够，但其在本发明的重组酵母宿主细胞内达到理想的表达量例如过量表达以产生大量POI或代谢产物。

具体而言，POI具有一氨基酸序列，该序列具有一天然的N末端氨基酸序列。所述POI优选包含一氨基酸序列，其不包括额外的丙氨酸作为N末端氨基酸残基。具体而言，该POI不具有额外的源自前导序列的N末端氨基酸残基。这对于重组蛋白产物的质量和生产的容易性至关重要。

具体而言，所述POI是一分泌的多肽或蛋白，包括可溶性的细胞外分子或膜结合分子。

具体而言，所述POI选自治疗性蛋白，包括抗体或其片段、酶和肽类、蛋白质抗生素、毒素融合蛋白、碳水化合物-蛋白质结合物、结构蛋白、调节蛋白、疫苗和类疫苗蛋白或颗粒、过程酶、生长因子、激素和细胞因子，或者其中所述POI介导宿主细胞代谢物的产生。该POI还可以是一表达产物，其介导宿主细胞代谢产物的产生。

具体而言，该POI选自生长因子、激素、细胞因子、抗体或抗体片段，优选选自全长抗体，例如IgG、IgA、IgD、IgM或IgE、scFv、微抗体、双特异抗体、三特异抗体、四特异抗体、Fab、Fc-融合蛋白，优选是一全长抗体、scFv或Fab。

具体而言，POI包括一除丙氨酸之外的N末端氨基酸残基。因此，不存在现有技术(EP2258855A1)预测的VSA-AP(SEQ ID 6)信号肽酶切割位点。

具体而言，该POI可以是一分泌蛋白，例如可以一成熟蛋白，其可以是蛋白的活性形式或原形式。

本发明的方法优选提供宿主细胞在细胞培养物中的培养，以及获得所述POI或代谢产物，例如作为分泌的POI，包括膜结合或可溶性或细胞外蛋白或代谢产物，其可选地从细胞培养物上清液中进行纯化。

根据一进一步的方面，本发明提供本发明所述的核酸或前导序列的用途，尤其是编码本发明信号肽或截短前导序列的核酸，用于从宿主细胞分泌POI和/或增加来自宿主细胞的POI的分泌量，优选地，其中至少60、65、70、75、80、85、90、95、98或100％的分泌POI包含一天然N末端氨基酸序列。

附图说明

图1：启动子序列pG1：SEQ ID 9。

图2.1：分泌pTRP的分别具有EpxL-RT或MFα的巴斯德毕赤酵母的还原型上清液的银染SDS-PAGE。

图2.2：分泌eGFP的分别具有EpxL-RT或MFα的巴斯德毕赤酵母的还原型上清液的银染SDS-PAGE。

图2.3：分泌HSA的分别具有EpxL-RT或MFα的巴斯德毕赤酵母的还原型上清液的抗HSA的蛋白质印迹。

图3：分泌HSA的具有EpxL-RT用于N末端测序的巴斯德毕赤酵母上清液的考马斯亮蓝染色蛋白质印迹。

图4.1：分泌pTRP的分别具有EpxL-RT、EpxL-KR或MFα的巴斯德毕赤酵母的还原型上清液的银染SDS-PAGE。

图4.2：分泌eGFP的分别具有EpxL-RT或MFα的巴斯德毕赤酵母的还原型上清液的银染SDS-PAGE。

图4.3：具有EpxL-KR的分别分泌HyHEL重链或HyHEL轻链的巴斯德毕赤酵母上清液。HC：使用抗IgGγ链抗体的蛋白质印迹；LC：SDS-PAGE和银染。

图5.1：分泌eGFP的分别具有EpxL-KR、EpxL-AA或EpxL-A的巴斯德毕赤酵母的还原型上清液的银染SDS-PAGE。

图5.2：分泌LC的分别具有EpxL-KR、EpxL-AA或EpxL-A的巴斯德毕赤酵母的还原型上清液的银染SDS-PAGE。

图5.3：在分别具有EpxL-A或MFα的pG1控制下分泌HyHEL Fab的巴斯德毕赤酵母的非还原型上清液的蛋白质印迹。

图6：在具有EpxL-A的pG1控制下，分别分泌人类生长激素(HGH)、人促生长素、干扰素α2a、3种不同抗体片段Fab1、Fab2、Fab3，以及2种不同的单链Fv抗体片段scFv1和scFv2的巴斯德毕赤酵母上清液的蛋白质印迹。

具体实施方式

专用术语在整个说明书中具有以下意义。

本文使用的术语“细胞系”指的是一具体类型的细胞构建的克隆，其获得在一长时间段内增殖的能力。术语“宿主细胞系”指用于表达一内源性或重组基因或代谢途径产物以生产多肽或由这些多肽介导的细胞代谢物的细胞系。一“生产宿主细胞系”或“生产细胞系”通常理解为即用型细胞系，其用于在生物反应器中培养以获得生产过程中的产物，例如POI。术语“酵母宿主”或“酵母细胞系”或“酵母宿主细胞”或“宿主细胞”或“宿主”是指任何酵母细胞，其可通过培养产生POI或宿主细胞代谢产物。

术语“表达”或“表达系统”或“表达组件”是指可操作连接的包含表达产物如POI的所需编码序列和控制序列如启动子的核酸分子，使得用这些序列转化或转染的宿主能够生产编码蛋白或宿主细胞代谢产物。为了引起转化，表达系统可包含在一载体上，然而，相关DNA也可整合到宿主染色体上。表达可涉及分泌的或非分泌的表达产物，包括多肽或代谢物。特别地，该术语涉及在合适的条件下的宿主细胞和相容的载体，例如，用于通过载体携带并引入宿主细胞中的外来DNA表达编码的蛋白。

本文使用的“表达构建体”或“载体”定义为转录克隆重组核苷酸序列所需的DNA序列，即，在合适的宿主生物体中，重组基因及它们的mRNA的翻译所需的DNA序列。表达载体包含表达组件以及额外地通常包含在宿主细胞中用于自主复制的原点(origin)或基因整合位点、一个或多个可选择的标记(例如，氨基酸合成基因或赋予抗生素抗性的基因，所述抗生素如博来霉素(zeocin)、卡那霉素、G418或潮霉素)、多个限制性酶切位点、合适的启动子序列以及转录终止子，这些构件是可操作地连接在一起的。本文使用的术语“质粒”和“载体”包括自主复制的核苷酸序列以及基因组整合核苷酸序列。

特别地，该术语指的是一运载工具，通过它能将DNA或RNA序列(如，外来基因)引入宿主细胞中，从而转化宿主，并促进引入的序列的表达(如，转录和翻译)。质粒是本发明优选的载体。

载体通常包含可转移媒介(transmissible agent)的DNA，外来DNA可插入其中。将一个DNA片段插入到另一DNA片段中的一种常用方法包括使用称为限制性酶的酶，限制性酶在称为限制性位点的特定位点(特定的核苷酸群)裂解DNA。“组件”指DNA编码序列或DNA片段，其编码可插入载体限定的限制性位点的表达产物。组件的限制性位点经设计以确保组件插入到适当的阅读框中。一般来说，外来DNA在载体DNA的一个或多个限制性位点处插入，然后由载体携带随可转移载体DNA进入宿主细胞。具有插入的或增加的DNA的DNA片段或序列，如表达载体，也被称为“DNA构造体”。载体的一种常见类型是“质粒”，其通常是自包含的双链DNA分子，能容易地接收额外的(外来的)DNA，并能容易地引入到合适的宿主细胞中。质粒载体通常包含编码DNA和启动子DNA，并具有一个或多个适合用于插入外来DNA的限制性位点。编码DNA是一种DNA序列，其编码一特定的氨基酸序列，用于特定多肽或蛋白，如POI。启动子DNA是启动、调节或者介导或控制编码DNA表达的DNA序列。启动子DNA和编码DNA可以是来自相同的基因或不同基因，并可以是来自相同或不同的生物体。重组克隆载体通常包括一个或多个用于克隆或表达的复制系统、一个或多个用于在宿主中筛选的标记，如抗生素抗性，以及一个或多个表达组件。

本文使用的术语“功能变体”，例如相对于本发明调节序列如具有SEQ ID 1的氨基酸序列的信号肽，或相对于具有SEQ ID 10的氨基酸序列的前导序列来说，是指在氨基酸序列中具有一个或两个点突变的那些变体，其具有与未修饰序列实质相同的信号或前导序列活性。本发明的核酸的功能变体进一步包括密码子优化的序列，在此还称为“密码子优化变体”，其编码本发明的任意信号肽或前导序列。核酸的这种密码子优化理解为在异源系统中待表达的重组DNA中密码子的系统性改变，以匹配生物体中用于表达的密码子使用方式。本发明目的特别是为了提高表达的蛋白的产量。

应理解的是，本文使用的术语“信号肽”、“前导序列”或“截短前导序列”总是分别指SEQ ID1和SEQ ID 10的特定氨基酸，也指它们的具有一个或两个点突变的功能变体。

本文使用的术语“实质相同的信号或前导序列活性”是指重组宿主细胞将实质相同的POI分泌到上清液中显示的活性；例如在上清液中POI水平为分别由SEQ ID 1或SEQ ID10提供的上清液中POI水平的至少50％、至少60、至少70％、至少80％、至少90％、至少95％、至少98％。

点突变理解为对多核苷酸的改造，获得与非改造的氨基酸序列不同的氨基酸序列的表达，其中，通过替换或交换一个或多个单(不连续的)氨基酸得到不同的氨基酸。优选的功能变体分别在SEQ ID 1和SEQ ID 10的位置3和位置16具有一个或多个点突变。

进一步优选的点突变指的是相同极性和/或电荷的氨基酸的交换。在这方面，氨基酸指的是由64个三联体密码子编码的20种天然存在的氨基酸。这20种氨基酸可以划分成具有中性电荷、正电荷和负电荷的氨基酸：

“中性”氨基酸如下所示，连同它们对应的三字母和单字母代码，以及极性：

丙氨酸：(ALa，A)非极性，中性；

天门冬酰胺：(Asn，N)极性，中性；

半胱氨酸：(Cys，C)非极性，中性；

谷氨酰胺：(Gln，Q)极性，中性；

甘氨酸：(Gly，G)非极性，中性；

异亮氨酸：(Ile，I)非极性，中性；

亮氨酸：(Leu，L)非极性，中性；

蛋氨酸：(Met，M)非极性，中性；

苯丙氨酸：(Phe，F)非极性，中性；

脯氨酸：(Pro，P)非极性，中性；

丝氨酸：(Ser，S)极性，中性；

苏氨酸：(Thr，T)极性，中性；

色氨酸：(Trp，W)非极性，中性；

酪氨酸：(Tyr，Y)极性，中性；

缬氨酸：(Val，V)非极性，中性；以及

组氨酸：(His，H)极性，正电荷(10％)中性(90％)。

“正”电荷的氨基酸是：

精氨酸：(Arg，R)极性，正电荷；以及

赖氨酸：(Lys，K)极性，正电荷。

“负”电荷的氨基酸是：

天冬氨酸：(Asp，D)极性，负电荷；以及

谷氨酸：(Glu，E)极性，负电荷。

本文对于核酸、POI或其他化合物使用的术语“分离的”或“分离”指的是这些化合物已从其自然联系的环境中充分分离，从而以“基本上纯”的形式存在。“分离的”的意思并不必然地排除人工或合成的混合物，其中混合有其他化合物或材料，或存在不会干扰基本活性的杂质，并且这些是可以存在的，例如，由于不完全纯化。特别地，本发明分离的核酸分子也指包括那些化学合成的。提到本发明的核酸，有时会使用术语“分离的核酸”。这一术语，当应用在DNA上时，指的是从序列分开的DNA分子，它在其源生物体的自然存在的基因组中与所述序列是直接相邻的。例如，一“分离的核酸”可包含插入载体如质粒或病毒载体中的DNA分子，或整合在原核细胞或真核细胞或宿主生物体的基因组DNA中的DNA分子。具体而言，本发明中的术语“分离的核酸”不包括编码EPX1蛋白的核酸连接到编码本发明前导序列的核酸。当应用在RNA上时，术语“分离的核酸”主要指由上面定义的分离的DNA所编码的RNA分子。或者，该术语指的是已与其自然状态下(即，在细胞或组织中)联系的其他核酸充分分开的RNA分子。“分离的核酸”(DNA或RNA)可进一步表示由生物或合成手段直接产生，并与其产生过程中存在的其他成分分开的分子。

本文使用的术语“前导序列”应当如下理解。本发明表达组件中的多核苷酸和核酸编码区域可与编码分泌性或信号肽的另外的编码区域关联，引导POI的分泌。注定迈向分泌途径的蛋白质具有一N末端前导序列，一旦启动将初期蛋白链输出穿过粗面内质网，该N末端前导序列从成熟蛋白切除。前导序列诱导表达蛋白朝细胞质膜运输或输出到细胞质膜外，因此容易分离和纯化表达的蛋白。通常而言，运输到周质空间、细胞膜内或细胞外的膜蛋白或分泌蛋白包含这种N末端序列。通常，在运输蛋白以后，前导序列通过特异性细胞肽酶从蛋白中切除。

由真核细胞分泌的蛋白通常具有一融合到蛋白N末端的前导序列，其从完整的或“全长”蛋白切除以产生分泌的或“成熟”形式的蛋白。

本发明的前导序列的特定实例是一由信号肽组成的前导序列，或一由信号肽和原序列组成的前导序列，例如本文描述的截短前导序列。由SEQ ID 1的信号肽组成的前导序列，或SEQ ID 10的截短前导序列，在本文中也被称为调节序列。

本文使用的术语特别指可以调节POI表达的控制序列。前导序列，也被称为前导肽，其连接到POI氨基酸序列的N末端。编码前导序列的核酸是上游的并可操作地连接到编码POI的核酸序列的5’末端。可使用本发明的在选择的宿主细胞内具有功能活性的任何前导序列。

术语“天然N末端氨基酸残基”或“天然N末端氨基酸序列”指N末端序列的一个或多个氨基酸，例如所述POI的N末端氨基酸残基，与待表达的所述POI的序列相比，该氨基酸残基被认为是正确的。因此，天然N末端氨基酸残基提供POI的一天然N末端或N末端区域，其是获得一正确的完整的氨基酸序列的先决条件，例如获得一不含任何对POI来说是外来的的额外(多余的)N末端氨基酸残基的功能性化合物。通常，任意野生型蛋白理解为具有一天然N末端氨基酸残基。此外，重组蛋白也可具有一天然的N末端氨基酸残基，其被预定义并展示出所需的蛋白特性。

具体而言，当本发明的信号肽或截短前导序列直接连接到POI的天然N末端氨基酸残基时，释放的蛋白将至少在某种程度上包含一天然N末端氨基酸残基，并通常不包含可变长度的N末端延伸。优选的POI组成的特征是包含一正确的N末端的天然N末端氨基酸残基，至少达到优选主要是POI分子的程度，或者至少60、65、70、75、80、85、90、95、98或100％(w/w)为POI分子，而在N末端不含有额外的氨基酸残基，例如源自信号肽或原序列或其片段的那些。

本文使用的术语“原序列”是指可操作地连接到POI的N末端的前体氨基酸序列。该原序列也可具有一可操作地连接到原序列的N末端的信号序列。通常，原序列从POI切除以留下成熟形式的POI。

本发明的原序列的一特定实例是截短前导序列的一部分，具有以下氨基酸序列：

SEQ ID 7：APVAPAEEAANHLHKR

即，截短原序列：SEQ ID 10的截短前导序列的第21-36个氨基酸。

本文使用的术语“可操作地连接”指核苷酸序列以一种方式连接到单个核酸分子上，例如一载体，使得一个或多个核苷酸序列的功能受到存在于所述核酸分子上的至少一个其他核苷酸序列的影响。例如，一启动子可操作地连接到重组基因的一编码序列，当启动子能够影响该编码序列表达时。作为一进一步的实例，编码信号肽的核酸可操作地连接到一编码POI的核酸序列，当其能够表达分泌形式的蛋白时，例如成熟蛋白的原形式(proform)或成熟蛋白。具体而言，这类可操作地相互连接的核酸可立即进行连接，即在编码信号肽的核酸和编码POI的核酸之间没有进一步的元件或核酸序列。

本文使用的“启动子”是指能够控制编码序列或功能RNA表达的DNA序列。启动子活性可通过其转录效率进行评估。这可直接通过测量来自启动子的mRNA转录量进行测定，例如，通过Northern杂交，或间接地通过由启动子表达的基因产物的量进行测量。

本文使用的术语“目标蛋白(POI)”是指通过重组技术在宿主细胞内产生的多肽或蛋白，也称为重组POI或由重组宿主细胞产生的POI。更具体而言，重组POI可以是非天然产生于宿主细胞内的，即异源蛋白，也可以是宿主细胞本身存在的，即宿主细胞同源蛋白，但其通过例如包含编码POI的核酸序列的自我复制载体进行转化产生，或者通过重组技术将编码POI的一个或多个核酸序列拷贝整合到宿主基因组中而产生，或者通过重组修饰控制编码POI基因表达的一个或多个调节序列而产生，例如启动子或信号序列修饰。在特定情况下，重组POI，不管是异源还是同源POI，通过重组宿主细胞过量表达，以获得高产量产物。在一些情形下，本文使用的术语POI还指通过重组表达的蛋白介导的宿主细胞的任何代谢产物。

本文使用的术语“分泌”是指多肽或蛋白特别是POI易位通过宿主植物细胞的细胞膜和细胞壁。分泌的POI可以是细胞膜的一部分，作为膜结合蛋白锚定在细胞壁中，或者作为可溶性蛋白释放到细胞上清液中。

应理解的是，本文使用的与POI相关的术语“分泌物”尤其包含成熟形式(包括活性蛋白的原形式或活性蛋白)的POI表达物，作为膜结合POI或细胞外POI。

本文使用的术语“重组”意思是“由基因工程制备或基因工程的结果”。因此，一“重组微生物”包括至少一个“重组核酸”。重组微生物尤其包括表达载体或克隆载体，或者其通过基因工程改造而包含重组核酸序列。“重组蛋白”是通过在宿主中表达相应的重组核酸来产生的。

本发明的核酸分子或肽/多肽/蛋白优选是重组的，以提供前导序列与POI的融合体。本文使用的“重组”是指人工结合两种原本分开的序列片段，例如通过化学合成或通过基因工程技术操作分离的核酸片段。“重组”还包括涉及细胞或表达组件，其通过引入异源核酸进行修饰，或涉及衍生自该修饰细胞的细胞，但不包括自然发生事件(例如自发突变、自然转化/转导/转座)导致的细胞或载体的改变，例如不通过有意的人为干预发生的那些。

本文使用的术语“信号序列”是指编码信号肽的核酸，其通常是短(3-60个氨基酸长度)肽链，其引导蛋白运输。信号肽也可称为靶信号、转运肽或定位信号。信号肽尤其包括沿着分泌途径待运输的表达蛋白。通常而言，运输到周质空间、细胞膜内或细胞外的膜蛋白或分泌蛋白包含这种N末端信号序列。通常，一旦实现初生蛋白链易位到内质网，就通过信号肽酶将信号肽从成熟蛋白切除。

本发明使用的信号肽的一个特定实例是SEQ ID 1的信号肽，或其具有一个或两个点突变的功能变体。本发明使用的信号肽通常具有固有特性，即使不存在SEQ ID 6的切割位点，其也能切除丙氨酸20之后的氨基酸。

信号肽由通常在编码POI的核酸序列之前的核酸序列编码，可选地在信号序列下游和POI编码序列上游具有一原序列。

本文使用的术语“基本上纯的”或“纯化的”指的是制备物包含至少50％(w/w)，优选地至少60％、70％、80％、90％或95％的化合物，如核酸分子或POI。通过适当的方法来测量该化合物的纯度(例如层析法、聚丙烯酰胺凝胶电泳、HPLC分析等等)。

在鉴定和表征本发明的编码特定信号肽的新分离的核酸时，令人惊讶的是，发现该信号肽包含一固有特征，其独立于后面的氨基酸残基，切割C末端。这在本文也被称为C末端的“固有分泌位点”。因此，一旦前导序列被切除，在信号肽序列之后的氨基酸序列将具有一正确的、天然N末端氨基酸序列。

意外的是，当使用编码本发明信号肽的核酸时，本领域已知的信号肽酶的切割位点位于天然巴斯德毕赤酵母Epx1前导序列的信号序列和原序列之间，即在位置20和21之间，以切割位点的序列中的连字符表示：VSA-AP(SEQ ID 6)，其中该切割位点可以省略。因此，可提供一改进的表达系统，用于至少在某种程度上提供正确的、天然的POI的N末端氨基酸残基，其尤其不包括额外的丙氨酸作为N末端氨基酸残基，例如，大多数(直至高达100％)的POI分子包含天然N末端序列(通过LC-MS测定)。

因此，这是第一次可以使用即用型的编码20个氨基酸的信号肽的分离的核酸。现有技术的信号序列(例如US20110021378A1的信号序列)总是在C末端包含至少一个额外的氨基酸残基，其为丙氨酸，这可导致待表达蛋白的N末端错误。

同样，发现本发明的截短前导序列包含一固有特征，其独立于后面的氨基酸残基，切割C末端。这在本文也被称为C末端的“固有切割位点”。因此，一旦前导序列被切除，截短前导序列的C末端或截短前导序列的原序列的C末端之后的氨基酸序列将具有一正确的天然的N末端氨基酸序列。

本发明的分离的核酸和表达载体因此提供具有天然N末端氨基酸残基的POI的表达和分泌。这更令人惊讶，因为具有20个氨基酸信号肽的情况下的分泌量远远高于用具有21个氨基酸序列(即如US20110021378A1提出的，在C末端添加一额外的丙氨酸从而延长该20个氨基酸的信号肽)进行的实验的分泌量。

因此，本发明的另一种实施方式是使用本发明的核酸或前导肽用于分泌POI和/或增加POI从宿主细胞的分泌，优选地，其中在本发明的前导序列被切除后，至少60、65、70、75、80、85、90、95、98、或100％的POI包含一天然的N末端氨基酸序列。优选地，与已知的信号肽SEQ ID 21相比，分泌量增加1.15、1.5、2、5、10、20、30、40、50、60、70、80、90倍或更多倍。最优选地，POI是一抗体或其片段或衍生物，如下文进一步定义的。

进一步，意外地发现可使用截短的前导序列，其长度仅为现有的天然全长前导序列的63％，因而少于SEQ ID 8的全长前导序列的有效部分。令人惊讶的是，与使用全长前导序列进行的实验相比，使用截短前导序列甚至增加了分泌量。

根据本发明，分离的核酸或表达组件或载体可使用其他的天然采用的或通常用于重组表达系统的常规的调节元件或序列，例如以提供高产量生产重组蛋白的构建体。调控序列的实例包括启动子、操纵子和增强子、核糖体结合位点，以及控制转录和翻译起始和终止的序列。

为了证明相关序列的功能，可构建表达组件或载体以驱动POI表达，并且将表达和/或分泌量与具有传统调节元件的构建体进行比较。实验程序的详细描述见下述实例。

鉴定的序列使用特定的核苷酸引物从巴斯德毕赤酵母通过PCR扩增，克隆到酵母表达载体，该载体功能性连接到POI的N末端或者POI序列的上游，并转化到酵母宿主细胞系，例如巴斯德毕赤酵母，用于高水平生产各种不同的分泌形式的POI。为了评估调节序列(例如本发明的信号序列和截短前导序列)对POI产量的影响，根据本发明获得的酵母宿主细胞系可在培养于摇瓶实验中及分批补料(fedbatch)或恒化器发酵，与包含传统调节元件的细胞株进行比较。

通过使用本发明的调节元件，特别是编码信号肽或截短前导序列和表达载体的序列，本发明方法优选不仅通过提高分泌来增加产量，还提高酵母宿主细胞特别是巴斯德毕赤酵母宿主细胞中的POI质量。POI分泌增加的确定基于在调节序列特别是信号序列或截短前导序列存在时，其分泌量的对比，与现有元件相比，其增加蛋白分泌。

该POI可以是真核的、原核的或合成的多肽。它可以作为一成熟蛋白分泌，作为膜结合蛋白或胞外表达蛋白。本发明还提供了天然存在蛋白的功能等价的变体、衍生物和生物活性片段的重组生产。功能等价的变体优选具有实质相同的功能特征或活性。

本文提到的POI可以是一产物，其与真核宿主细胞同源或异源，优选用于治疗、预防、诊断、分析或工业用途。

POI优选是酵母细胞生产的异源重组多肽或蛋白。

特别地，POI是真核蛋白，优选是哺乳动物蛋白。

根据本发明产生的POI可以是一多聚体蛋白，优选是二聚体或三聚体。

根据本发明的一个方面，POI是重组的或异源的蛋白，优选选自治疗性蛋白，包括抗体或其片段、酶和肽类、蛋白质抗生素、毒素融合蛋白、碳水化合物-蛋白质结合物、结构蛋白、调节蛋白、疫苗和类疫苗蛋白或颗粒、过程酶、生长因子、激素和细胞因子，或者POI的代谢物。

一特定的POI是抗原结合分子，例如抗体或其片段。在各种特异性POI中，有抗体，例如单克隆抗体(mAbs)、免疫球蛋白(Ig)或G类免疫球蛋白(IgG)、重链抗体(HcAb's)、或其片段，例如片段-抗原结合物(Fab)、Fd、单链可变片段(scFv)，或者其经过改造的变体例如Fv二聚体(双特异抗体)、Fv三聚体(三特异性抗体)、Fv四聚体，或者微抗体和单域抗体如VH或VHH或V-NAR。

进一步的特异性抗体是抑肽酶、组织因子途径抑制剂或其他蛋白酶抑制剂，以及胰岛素或胰岛素前体、胰岛素类似物、生长激素、白细胞介素、组织纤溶酶原激活物、转化生长因子a或b、胰高血糖素、胰高血糖素样肽1(GLP-1)、胰高血糖素样肽2(GLP-2)、GRPP、因子VII、因子VIII、因子XIII、血小板源生长因子1、血清白蛋白、酶，例如脂酶或蛋白酶，或与天然蛋白具有相似功能的功能性同系物、功能等价变体、衍生物和生物活性片段。POI可以是与天然蛋白结构相似，可来源于天然蛋白，通过添加一个或多个氨基酸到C末端和N末端中的任一个或两个或天然蛋白的侧链、在天然氨基酸序列的一个或多个不同位点取代一个或多个氨基酸、在天然蛋白的一端或两端或者在氨基酸序列的一个或几个位点删除一个或多个氨基酸，或者在天然氨基酸序列的一个或多个位点插入一个或多个氨基酸。这些修饰对于上述几种蛋白是已知的。

POI还可选自底物、酶、抑制剂或辅因子，其在宿主细胞内提供生化反应，目的在于获得所述生化反应或几种反应的级联反应的产物，例如，以获得宿主细胞的代谢物。示例性的产品可以是维生素，例如维生素B2、有机酸和醇，其产量可在本发明重组蛋白或POI表达后得到提高。

具体而言，表达本发明重组产物的宿主细胞可以是适合POI重组表达的任意酵母细胞。

优选的宿主细胞选自毕赤酵母属、假丝酵母属、球拟酵母属、Arxula酵母、汉逊氏酵母、Ogatea酵母、耶氏酵母属、克鲁维酵母属、酵母属(Saccharomyces)或Komagataella酵母，优选的是一甲醇营养型酵母，并且特别优选的是巴斯德毕赤酵母、Komagataellapastoris、K.phaffii或K.pseudopastoris。

本发明优选的宿主细胞的实例包括但不限于毕赤酵母属，例如巴斯德毕赤酵母或甲醇毕赤酵母或Komagataella属，例如K.pastoris、K.pseudopastoris或K.phaffii。

较新的文献划分了巴斯德毕赤酵母并将其重命名为Komagataella pastoris、Komagataellaphaffii和Komagataella pseudopastoris。此处巴斯德毕赤酵母作为所有种类的同义词，包括Komagataella pastoris、Komagataella phaffii和Komagataellapseudopastoris。

巴斯德毕赤酵母株的实例包括CBS 704(＝NRRL Y-1603＝DSMZ 70382)、CBS 2612(＝NRRL Y-7556)、CBS 7435(＝NRRL Y-11430)、CBS 9173-9189(CBS株：CBS-KNAW真菌生物多样性中心,Centraalbureau voor Schimmelcultures,荷兰乌特勒支)，以及DSMZ 70877(German Collection of Micro-organisms and Cell Cultures(德国微生物和细胞培养物保藏中心))，还包括获自Invitrogen公司的细胞株，例如，X-33、GS115、KM71和SMD1168。所有上述细胞株已成功用于生产转化株和表达异源基因。

根据本发明，优选提供一酵母宿主细胞，其用一包含一启动子序列的载体进行转化，该启动子序列可操作地连接到本发明的信号序列或截短前导序列。

根据本发明的优选模式，本发明的表达组件包括一启动子，例如P.pastoris pGAP(磷酸甘油醛脱氢酶)启动子、pAOX(醇氧化酶)启动子或SEQ ID 9(图1，pG1启动子)，或者其功能变体。可只用这些启动子序列的一部分获得有效的序列活性。具体而言，优选的部分启动子序列由至少150个连续碱基或bp组成，更优选地，由至少200bp、至少300bp、至少400bp、至少500bp、至少600bp、至少700bp、至少800bp或者至少900bp组成。优选地，启动子区域的3'末端包含在优选的部分启动子序列内。

在一优选的表达系统中，该启动子是一可诱导的或一组成型启动子。该启动子可以是宿主细胞的内源性启动子或与宿主细胞异源的。可诱导的启动子的一优选实例是pG1启动子，其在葡萄糖限制条件下可被诱导，并具有SEQ ID 9的核苷酸序列。

本发明的一特定宿主细胞包含异源的或重组的启动子序列，其可获自不同于生产宿主的细胞株，例如来自另一种酵母株，例如酿酒酵母株。在另一种特定的实施方式中，本发明的宿主细胞包含一本发明的重组表达构建体，其包含来自与宿主细胞相同的属、种或株的细胞的启动子。

启动子可以是任何DNA序列，其在宿主细胞中显示出转录活性，并可获自编码与宿主同源或异源的蛋白的基因。启动子优选获自编码与宿主细胞同源的蛋白的基因。

例如，本发明的一启动子可获自酵母，例如酿酒酵母株。但一尤其优选的实施方式采用了一来源于巴斯德毕赤酵母的启动子，用于在巴斯德毕赤酵母生产者宿主细胞系中生产重组POI的方法中。核苷酸序列的同源性原点便于其结合到相同属或种的宿主细胞中，从而能够稳定生产POI，可能在工业制造过程中提高产量。此外，可使用来自其他合适酵母或其他真菌或其他生物体如脊椎动物或植物的启动子的功能活性变体。

进一步合适的用于酵母宿主细胞的启动子序列可包括但不限于获自编码代谢酶的基因的启动子，已知该代谢酶在细胞中以高浓度存在，例如糖酵解酶如磷酸丙糖异构酶(TPI)、磷酸甘油酸激酶(PGK)、甘油醛-3-磷酸脱氢酶(GAPDH)、醇氧化酶(AOX)、乳糖酶(LAC)和半乳糖苷酶(GAL)。

合适的启动子的优选实例是酵母启动子，其包含一DNA序列作为一启动子用于酵母细胞中的基因转录。优选的实例是酿酒酵母Mal、TPI、CUP、ADH或PGK启动子，或者巴斯德毕赤酵母的葡萄糖-6-磷酸异构酶启动子(PPGI)、3-磷酸甘油酸激酶启动子(PPGK)或甘油醛磷酸脱氢酶启动子PGAP、醇氧化酶启动子(PAOX)、甲醛脱氢酶启动子(PFLD)、异柠檬酸裂合酶启动子(PICL)、翻译延长因子启动子(PTEF)，以及巴斯德毕赤酵母的烯醇酶1(PENO1)、磷酸甘油醛异构酶(PTPI)、α-酮异己酸脱羧酶(PTHI)、核糖体亚基蛋白(PRPS2、PRPS7、PRPS31、PRPL1)、热休克蛋白家族成员(PSSA1、PHSP90、PKAR2)、6-磷酸葡萄糖酸脱氢酶(PGND1)、磷酸甘油酸变位酶(PGPM1)、转酮酶(PTKL1)、磷脂酰肌醇合成酶(PPIS1)、铁-O2-氧化还原酶(PFET3)、高亲和力铁通透酶(PFTRl)、可阻抑碱性磷酸酶(PPHO8)、N-肉豆蔻酰转移酶(PNMTl)、外激素应答转录因子(PMCMl)、泛素(PUBI4)、单链DNA内切核酸酶(PRAD2)的启动子和线粒体内膜主要ADP/ATP载体的启动子(PPET9)。

如果POI是一与宿主细胞同源的蛋白，即在宿主细胞内天然产生的蛋白，那么该POI在细胞内的表达可通过用一启动子序列与其天然启动子序列交换来进行调节，该启动子序列与宿主细胞异源或与宿主细胞同源但是与所述POI的天然启动子序列不同。

引入新启动子的目的可例如通过用一重组DNA分子转化一宿主细胞实现，该DNA分子包含目标基因的同源序列以允许位点特异性重组，启动子序列以及适合宿主细胞的选择性标记。可产生位点特异性重组以将编码POI的核苷酸序列可操作地连接到启动子序列。这导致了从异源启动子序列而非从天然启动子序列表达POI。

在本发明的一尤其优选的实施方式中，本发明的启动子序列相对于POI的天然启动子序列具有提高的启动子活性。

根据本发明，还可以提供本发明的一通配型载体或表达组件，其包括本发明的一信号序列或截短前导序列。这种通配型载体或表达组件即时可结合编码POI的目标基因。因此，该通配型细胞系是一预先形成的宿主细胞系，特征是其表达能力。这遵循了一创新的“通用型”平台策略，用于产生生产者细胞系，用于生产POI，例如，使用位点特异性组件整合或位点特异性的重组酶介导的组件交换。这种新的宿主细胞便于克隆目标基因(GOI)到例如预定基因组表达位点，以获得可复制的高效生产细胞系。

根据优选实施方式，本发明的表达载体是一质粒，其适合以每个细胞单拷贝或多拷贝的形式整合到宿主细胞的基因组中。编码POI的重组核苷酸序列也可以每个细胞单拷贝或多拷贝形式提供于自主复制的质粒上。优选的质粒是真核细胞表达载体，优选是酵母表达载体。

表达载体可包括但不限于克隆载体、修饰的克隆载体和特殊设计的质粒。用于本发明的优选的表达载体可以是任何适合在宿主细胞中表达重组基因的表达载体，并根据宿主生物体进行选择。重组表达载体可以是任何能够复制到或整合到宿主生物体的基因组中的载体，也可称为宿主载体，例如酵母载体，其携带本发明的DNA构造体。一优选的酵母表达载体适合在甲醇营养型酵母中表达，该甲醇营养型酵母以汉逊氏酵母属、Ogatea酵母属、毕赤酵母属、假丝酵母属和球拟酵母属为代表。

在本发明中，优选使用获自pPICZ、pGAPZ、pPIC9、pPICZalfa、pGAPZalfa、pPIC9K、pGAPHis或pPUZZLE的质粒作为载体。

根据本发明的优选实施方式，通过绑定相关基因到载体上获得重组构建体。可通过使用这类载体转化宿主细胞将这些基因稳定地整合到宿主细胞基因组中。可使用重组细胞系通过培养转化体产生由这些基因编码的多肽，从而在合适的培养基中获得，从培养物中分离表达的POI，并使用适合表达产物的方法将其纯化，特别是从污染蛋白中分离POI。

编码POI的DNA序列也可可操作地连接到合适的终止子序列上，例如AOX1(醇氧化酶)终止子、CYC1(细胞色素c)终止子、TEF(翻译延长因子)终止子。

表达载体可包括一种或多种表型选择标记，例如编码具有抗生素抗性的蛋白的基因或者提供一营养缺陷要求的基因。酵母载体通常包含一来自酵母质粒的复制原点、一自主复制序列(ARS)，或者一用于整合到宿主基因组中的序列、一启动子区域、用于聚腺苷酸化的序列、用于转录终止子的序列以及一选择性标记。

用于连接DNA序列的方法，例如分别用于连接编码前导序列和/或POI的DNA序列，启动子和终止子的方法以及用于将它们插入到合适的载体中(该载体包含整合或宿主复制的必需信息)的方法对于本领域技术人员来说是已知的，例如描述于“J.Sambrook etal.,"Molecular Cloning 2nd ed.",Cold Spring Harbor Laboratory Press(1989)”。

可理解的是，本发明的载体可通过以下方法构建：首先制备包含载体所需元件的整个DNA序列的DNA构建体，并将此构建体插入合适的表达载体；或者按顺序插入包含各个元件(例如信号、前导序列或POI)的基因信息的DNA片段，然后进行连接。或者，表达组件的各个元件也可通过PCR进行融合。

本发明也可使用多克隆载体，其具有多克隆位点，其中可在多克隆位点结合所需基因以提供一表达载体。在表达载体中，启动子置于前导序列和POI的基因的上游，并调节该基因的表达。在多克隆载体的情形下，因为前导序列和POI的基因是在多克隆位点被引入，因此启动子被置于多克隆位点的上游。该前导序列的基因可在PCR反应或合成制备中融合到POI基因上，或者该前导序列的基因可提供于载体或表达组件中，并且该POI基因可通过标准克隆方法引入。

本发明提供的表达载体或组件和DNA构建体可通过已建立的标准方法，例如亚磷酰胺方法进行合成制备。该DNA构造体还可以是基因组来源或cDNA来源的，例如通过制备一基因组或cDNA文库，并通过杂交筛选编码本发明所有或部分多肽的DNA序列，该杂交使用合成的寡核苷酸探针，并使用标准技术(Sambrook et al.,Molecular Cloning:ALaboratoryManual,Cold Spring Harbor,1989)。最后，DNA构造体可以是合成来源和基因组来源的混合、合成来源和cDNA来源的混合，或者基因组来源和cDNA来源的混合，其使用标准技术通过使合成的、基因组的或cDNA来源的片段退火制备，该片段对应整个DNA构造体的各个部分，视情况而定。

根据本领域算法和技术的状态(例如，由商业供应商提供的，如GeneArt、GeneCust、GenScript或DNA2.0)，对于本领域技术人员显而易见的是，编码前导序列和/或POI的DNA序列可进行优化以使用宿主生物体偏好的密码子。

在另一优选的实施方式中，酵母表达载体或组件能够稳定整合到酵母基因组中，例如通过同源重组。

本发明的一优选方面涉及这样一种方法，其中表达载体或组件包含一前导序列，其通过转化的宿主细胞有效引起成熟POI的分泌。

本发明的信号序列或截短的前导序列可融合到编码POI的核苷酸序列中，用于通过本领域技术人员已知的传统克隆技术进行重组表达。在优选的实施方式中，POI的核苷酸序列融合到分泌前导序列的核苷酸序列上，从而，该信号序列或截短的前导序列将该蛋白靶向到分泌途径，在该途径中，前导序列被切除，蛋白被释放到培养基中。

通过转化本发明的具有表达载体或组件的细胞获得的本发明转化宿主细胞可优选首先在高效生长条件下培养以获得大量细胞而没有表达POI的负担。当制备细胞系用于POI表达时，选择培养技术以产生表达产物。

这种差异化的发酵策略可区分生长阶段和生产阶段。生长和/或生产可合适地发生在分批模式、分批补料模式或连续模式。可使用任何合适的生物反应器，包括分批的、分批补料的、连续的、搅拌槽反应器，或气升式反应器。

提供中试规模或工业规模的发酵工艺是有利的。工业工艺规模可优选采用至少10L的体积，尤其是至少50L，优选至少1m³，优选至少10m³，最优选至少100m³。

工业规模的生产条件是优选的，这是指例如分批补料式培养的反应器体积为100L至10m³或更大，采用几天的典型处理时间，或连续工艺的发酵体积为约50–1000L或更大，稀释比例为约0.02–0.4h^-1。

合适的培养技术可包括在生物反应器中的培养，以分批阶段开始，然后是一短的指数形式的分批补料阶段(高比生长速率)，进一步接着的是一低比生长速率的分批补料阶段。另一种合适的培养技术可包括一分批培养，然后是一较低稀释速率的连续培养阶段。本发明的一优选的实施方式包括一分批培养以提供生物质，然后是分批补料培养以获得高产量的POI。

优选的是在生长条件下，在生物反应器中培养本发明的宿主细胞系，以获得至少1g/L细胞干重的细胞密度，更优选为至少10g/L细胞干重，更优选为至少20g/L细胞干重的细胞密度。提供中试规模或工业规模的生物质生产是有利的。

可理解的是，本文公开的方法可进一步包括在允许表达POI的条件下培养所述重组宿主细胞。然后，一膜结合或可溶性的重组产生的POI或宿主细胞代谢物可从细胞培养基中分离并进一步通过本领域技术人员熟知的方法进行纯化。

几种不同的用于通过宿主细胞表达和分泌POI的方法是优选的。蛋白被表达、加工和分泌，其通过：转化具有包含编码所需蛋白的DNA的本发明的表达载体或组件的真核生物，制备转化生物体的培养物，培养培养物并从培养基中回收蛋白，例如将浓缩和富集一小部分细胞培养物中的蛋白，或者纯化蛋白以获得基本纯的制品。也可采用删除一种或多种主要污染宿主细胞蛋白的宿主细胞(例如，如下所述：Heiss et al.2012；Appl MicrobiolBiotechnol.doi:10.1007/s00253-012-4260-4)以便于纯化POI。

作为用于获得重组多肽或蛋白产品的分离和纯化方法，可使用方法，如利用溶解性差异的方法，例如盐析和溶剂沉淀，利用分子量差异的方法，例如超滤和凝胶电泳，利用电荷差异的方法，例如离子交换层析，利用特异亲和性方法，例如亲和层析，利用疏水性差异的方法，例如反相高效液相色谱法，以及利用等电点差异的方法，例如等电点聚焦。

高度纯化的产品基本上是不含污染蛋白的，优选的纯度为至少90％，更优选至少95％，或甚至至少98％，高达100％。纯化产品可通过纯化细胞培养物上清液或从细胞碎片获得。

分离并纯化的POI可通过传统方法例如蛋白印迹法或活性试验进行鉴定。纯化的化合物的结构可通过氨基酸分析、氨基末端分析、一级结构分析等进行界定。优选的是，可大量获得高纯度化合物，因而达到用作药物组合物的活性成分的所需要求。

本发明的优选的宿主细胞系保持了本发明调节序列和POI基因的整合，且表达水平保持在高水平，例如至少在μg/L的水平，即使在约20代培养后，优选至少在30代培养后，更优选至少40代后，最优选至少50代后。该重组宿主细胞出人意料地稳定，这在工业规模蛋白生产中是一个巨大优势。

本发明根据以下实例进一步详细阐述，其不打算以任何方式限制本发明要求保护的范围。

实例

实例1：使用用于分泌的巴斯德毕赤酵母Epx1天然前导序列(SEQ ID 8)构建用于表达重组蛋白的巴斯德毕赤酵母宿主细胞系

1a)：构建包含巴斯德毕赤酵母Epx1天然前导序列(信号序列和原序列；SEQ ID 8， EpxL-RT，“先导序列”)的表达载体

在巴斯德毕赤酵母中天然分泌的蛋白Epx1的鉴定以及推定的分泌前导序列EpxL-RT(由Epx1信号序列和原序列直至实验确定的成熟Epx1蛋白的N末端构成)的鉴定描述于EP2258855。由于实验证实成熟Epx1的N末端之前的最后一个氨基酸是Arg-Thr(RT)，该推测的分泌前导序列被称为EpxL-RT。

为了使用巴斯德毕赤酵母Epx1蛋白的分泌前导序列生成表达载体用于分泌POI，将相应的序列(SEQ ID 8)克隆到pPM2_pGAP表达载体的具有PGAP启动子(甘油醛-3-磷酸脱氢酶启动子)的框架中。pPM2_pGAP表达载体是pPuzzle_zeoR_AOXTT载体骨架(描述于WO2008/128701A2)的衍生物，由pUC19细菌复制原点、巴斯德毕赤酵母甘油醛磷酸脱氢酶启动子、酿酒酵母(S.cerevisiae)CYC1转录终止子和博来霉素(Zeocin)抗生素抗性组件组成。

通过PCR，使用寡核苷酸引物(表1)从巴斯德毕赤酵母基因组DNA扩增Epx1分泌前导序列。

表1：用于PCR扩增巴斯德毕赤酵母Epx1蛋白的先导序列EpxL-RT的寡核苷酸引物(限制性位点用下划线标注)

随后，将PCR产物(189bp)通过限制性酶SbfI和NsiI消化；并连接到pPM2_pGAP载体上，该载体已通过SbfI线性化并使用牛小肠磷酸酶(CIP)处理。由于NsiI和SbfI产生重叠末端，获得的构造体pPM2_pGAPxLRT在EpxL-RT序列的起始密码子之前直接具有单SbfI位点。正确的整合通过使用SbfI和AscI消化获得的质粒进行验证。

1b)使用pPM2_pGAPxLRT载体构建分泌重组猪胰蛋白酶原的巴斯德毕赤酵母株。

合成一密码子优化的人工基因(Geneart，Germany)用于表达重组的猪胰蛋白酶原(rpTRP)。使用运输质粒作为模板、表2.1所示的引物，在PCR扩增过程中添加用于限制性酶Pfl23II和SfiI的位点，位于开放阅读框的侧翼。用Pfl23II和SfiI消化PCR产物，并克隆到用Pfl23II、SfiI和CIP处理的质粒pPM2_pGAPxLRT(实例1a)。将连接的质粒转化到大肠杆菌(E.coli)TOP10(Invitrogen)中并涂布于含博来霉素的LB-琼脂上。进行限制性内切酶分析以确认质粒pPM2_pGAPxLRT_rpTRP的正确特性。

表2.1：用于猪胰蛋白酶原基因的PCR扩增的寡核苷酸引物

1c)用pPM2_pGAPxLRT载体构建过量表达重组人血清白蛋白或增强型绿色荧光蛋白的巴斯德毕赤酵母株。

将编码人血清白蛋白(HSA)或增强型绿色荧光蛋白(eGFP)的基因通过PCR从载体扩增，所述载体描述于Stadlmayr et al.(2010,J Biotechnol.150:519-529)，引物如表2.2所示。用AccI和SfiI消化PCR产物，并克隆到用AccI和SfiI处理的质粒pPM2_pGAPxLRT中(实例1a)。将连接的质粒转化到大肠杆菌TOP10(Invitrogen)中并涂布于含博来霉素的LB-琼脂上。在序列确认后，将载体pPM2_pGAPxLRT-HSA和pPM2_pGAPxLRT-eGFP在启动子区域线性化并转化到巴斯德毕赤酵母中。对于HSA，使用天然HSA前导序列的构建体描述于Stadlmayr et al.2010，作为参考，而在酿酒酵母MFα前导序列之后克隆的eGFP作为对照。

表2.2：用于融合到EpxL-RT的HSA和eGFP以及融合到酿酒酵母MFα前导序列的eGFP的PCR扩增的寡核苷酸引物

实例2：培养巴斯德毕赤酵母宿主细胞系用于表达重组分泌蛋白以及进行产物分析

在电转化到巴斯德毕赤酵母之前，将所有质粒在它们各自的启动子区域或AOX-TT整合区域进行线性化。在YPD琼脂平板(包含酵母提取物(10g/L)、蛋白胨(20g/L)、葡萄糖(20g/L)和博来霉素)上选择阳性转化体。

2a)在小规模培养物中培养表达重组分泌蛋白的经转化的巴斯德毕赤酵母株

将来自实例1b、5、7或9的巴斯德毕赤酵母株单菌落接种到包含10g/L甘油的5mLYP-培养基(10g/L酵母提取物、20g/L蛋白胨)中并在28℃过夜培养。将分装的培养物(对应的最终的OD₆₀₀为0.1)转移到补充了20g/L葡萄糖的10mL表达培养基(每种重组蛋白的培养基组成在下面给出)中并置于100mL锥形瓶中在170rpm、28℃条件下培养48h。或者，使用2mL的表达培养基在24深孔板中培养。每12h重复添加葡萄糖(10g/L)，直到收获细胞，通过在2500xg于室温离心10min收获细胞并制备用于分析。通过使用葡萄糖饲养珠(glucose feedbeads)(Kuhner,CH)，实现葡萄糖限制生长条件，从而实现pG1驱动的表达，该饲养珠按照方程(葡萄糖)＝1.63*t^0.74[mg/平碟]随时间缓慢释放葡萄糖，而不补充葡萄糖。10mL主要培养物使用2个饲养珠。通过测量1mL细胞悬浮液离心后的细胞重量来确定生物量，而上清液中的重组分泌蛋白的确定描述于下述实例2b-2e中。

表达培养基如下：

用于猪胰蛋白酶原：每升：10g酵母提取物，10g豌豆蛋白胨，10.2g(NH4)₂PO₄，1.24gKCl，0.1g CaCl₂，用HCl调节pH至5.0

用于HSA：每升：22g柠檬酸，3.15g(NH₄)₂HPO₄，0.027g CaCl₂*2H₂O，0.9g KCl，0.5gMgSO₄*7H₂O，2ml 500x生物素以及1.47mL微量盐储存溶液[每升：6g CuSO₄*5H₂O，0.08gNaI，3g MnSO₄*H₂O，0.2g Na₂MoO₄*2H₂O，0.02g H₃BO₃，0.5g CoCl₂，20g ZnCl₂，5g FeSO₄*7H₂O和5mL H₂SO₄]；用5M KOH将pH设置为6；过滤灭菌。

用于eGFP和用于抗体片段(例如Fab)：每升：10g酵母提取物，10g蛋白胨，100mM磷酸钾缓冲液，pH 6.0，13.4g酵母含氮碱基和硫酸铵，0.4mg生物素

2b)胰蛋白酶定量

使用小的预包装分子筛色谱柱(一次性PD-10脱盐柱17-0851-01；GE医疗集团)对巴斯德毕赤酵母培养上清液进行脱盐。将2.5mL上清液加到柱子，并用3.5mL洗脱液(1mMHCl)进行洗脱。洗脱之后添加70μL的2M CaCl₂溶液。

为了将无活性的胰蛋白酶原转化为活性胰蛋白酶，将300μL脱盐上清液(+CaCl₂)与690μL活化缓冲液(50mM TRIS/HCl pH 8.6；40mM CaCl₂和0.15g/L肠激酶，Sigma；E0632)混合并在37℃培养2小时。

将165μL活化混合物与1000μL TAME溶液混合，TAME溶液包含446mg/L Nα-p-甲苯磺酰基-L-精氨酸-甲基-酯-盐酸盐(Nα-p-Tosyl-L-arginine-methyl-ester-hydrochloride)(TAME；Sigma；T4626)，其溶解在稀释缓冲液中(50mM TRIS/HCl pH 8.1；40mM CaCl₂)，并在分光光度计中在30℃条件下，在5min时间内测定247nm处的吸收动力学。如果需要，用稀释缓冲液将活化的胰蛋白酶溶液稀释以达到此方法的线性范围(ΔA247/min<0.3)。1g/L的胰蛋白酶浓缩物对应ΔA247/min＝0.101。

2c)通过ELISA对HSA进行定量

为了定量巴斯德毕赤酵母上清液中的HSA，使用人血清白蛋白ELISA定量套组(产品目录号：E80-129，Bethyl实验室，美国德克萨斯州)。使用HSA标准品，其起始浓度为400ng/mL。相应地稀释上清液样品。

2d)SDS-PAGE&蛋白印迹分析

使用Bis-Tris系统用于蛋白凝胶分析，其使用12％的Bis-Tri或4-12％Bis-Tris凝胶和MOPS电泳缓冲液(均来自Invitrogen)。电泳之后，蛋白通过银染可视化，或者转移到硝酸纤维素膜上用于蛋白印迹分析。因此，按照制造商的说明书使用用于湿式(槽)转移的XCell II^TM印迹模块(Invitrogen)将蛋白电转移到硝酸纤维素膜上。在封闭后，使用下述抗体探测蛋白印迹：对于HSA：抗人血清白蛋白-马辣根过氧化物酶(HRP)结合物，Bethyl A80-129P(1:50,000)；对于IgG轻链：抗人κ轻链(结合或自由的)-碱性磷酸酶(AP)结合抗体，Sigma A3813(1:5,000)；对于IgG重链：产生于山羊的抗人IgG(γ链特异性)抗体，Sigma I3382(1:5,000)和抗山羊AP结合物(1:20,000)。

基于NBT/BCIP系统用比色AP检测盒(BioRad)检测AP结合物，以及用化学发光的Super Signal West化学发光底物(Thermo Scientific)检测HRP结合物。。

2e)通过ELISA对Fab进行定量

通过ELISA，使用抗人IgG抗体(Abcam ab7497)作为包被抗体(1:1,000)，使用山羊抗人κ轻链(结合或自由的)-碱性磷酸酶结合抗体(Sigma A3813)作为检测抗体(1:1000)对完整Fab进行定量。使用人Fab/κ,IgG片段(Bethyl P80-115)作为标准品，其起始浓度为50ng/mL。相应地稀释上清液样品。使用pNPP底物(Sigma S0942)进行检测。包被-、稀释-和洗涤缓冲液基于PBS(2mM KH₂PO₄,10mM Na₂HPO₄.2H₂O,2.7mM g KCl,8mM NaCl,pH 7.4)，并相应地包括BSA(1％(w/v))和/或吐温20(0.1％(v/v))完成。

实例3：使用用于分泌的巴斯德毕赤酵母Epx1先导序列(EpxL-RT，SEQ ID 8)由巴斯德毕赤酵母宿主细胞系表达重组蛋白

3a)使用用于分泌的EpxL-RT分析过量表达重组猪胰蛋白酶原的巴斯德毕赤酵母

使用用于分泌的EpxL-RT序列的表达pTRP的巴斯德毕赤酵母如实例2a所述进行培养，并使用胰蛋白酶活性试验(如实例2b所述)和SDS-PAGE(如实例2d所述)进行分析。使用用于分泌的MFα、表达pTRP的巴斯德毕赤酵母被用作参照。

意外地，使用EpxL-RT分泌前导序列进行pTRP表达导致大约30kDa的蛋白拖尾(图2.1，左侧)，而MFα导致分泌的pTRP具有正确的大小(25kDa；图2.1右侧)。用EpxL-RT时分泌的部分pTRP也导致pTRP大小正确，即使程度较低。用EpxL-RT时分泌的pTRP的量少于使用MFα时分泌量的50％(表3，由实例2b所述的胰蛋白酶活性试验检测进行测定)。拖尾带可能是EpxL-RT-pTRP融合蛋白，其似乎是由于EpxL-RT序列的非正确加工(切割)造成的。

表3：以αMF为标准的pTRP的相对分泌水平

前导序列	pTRP相对平均分泌量±SEM
		EpxL-RT	0.48±0.02
MFα	1.00±0.05

3b)使用用于分泌的EpxL-RT、过量表达重组eGFP的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-RT序列、表达eGFP的巴斯德毕赤酵母如实例2a所述进行培养，并使用SDS-PAGE和蛋白印迹(实例2d)进行分析。显然，与MFα(图2.2，右侧部分)相比，天然EpxL-RT不能完全分泌eGFP(图2.2，左侧部分)。在细胞内，可观察到eGFP仍然结合到部分EpxL-RT序列上，因此排除了蛋白表达中的缺陷(没有显示)。

3c)使用用于分泌的EpxL-RT、过量表达重组人血清白蛋白的巴斯德毕赤酵母的分析。

使用用于分泌的EpxL-RT序列、表达HSA的巴斯德毕赤酵母如实例2a所述进行培养，并使用HSA ELISA(实例2c)和蛋白印迹(实例2d)进行分析。使用用于分泌的天然HSA前导序列、表达HSA的巴斯德毕赤酵母被用作参照(Kobayashi.2006.Biologicals.34(1):55-9.)。

在合成-筛选-培养基中用摇瓶培养48h后，分析每种构建体的12个单独的克隆的分泌行为。通过还原SDS-PAGE以及随后的蛋白印迹，使用用于检测HSA的抗HSA抗体对上清液进行定性检查。对由EpxL-RT分泌的HSA，可看到明显的双条带模式(图2.3，左侧)。与其天然前导序列分泌的HSA(图2.3，右侧)和纯化的HSA(未显示)进行比较，下面的条带是正确加工的HSA。上面的条带是未预期的，但由于其分子量仅稍微大于下面的条带，其可能代表由于非正确加工EpxL-RT导致的EpxL-RT-HSA融合蛋白。基于条带密度(由ImageJ分析)，分泌的HSA总量的40-60％以非正确的较高分子量的形式存在。

小结：当使用用于分泌的EpxL-RT序列时，对于分泌的重组蛋白，可看见拖尾或双条带模式，这表明长前导序列EpxL-RT非正确加工或没有加工。这种特征使得对应于EP2258855A1的全长Epx1前导序列的EpxL-RT不适合且不能用于重组蛋白分泌。

实例4：HSA表达培养物的较高分子量条带的N末端鉴定

如上面的实例3c)所述地使用EpxL-RT时表达的HSA的N末端接着进一步进行N末端测序。

因此，装载500μL相应的上清液到离心过滤器用于浓缩蛋白(Amicon Ultra-0.5mL 10 kDa离心过滤器，Millipore，UFC5010)，离心5min，通过反向旋转回收15μL样品。

之后，样品通过4-12％Bis-Tris NuPAGE凝胶分离，并使用PVDF(聚偏二氟乙烯)膜在25V下进行2h的使用硼酸盐缓冲液(每升：3.09g硼酸盐[50mM]，100mL MeOH，用1M NaOH将pH设为9)的蛋白印迹。在印迹之前，将凝胶在硼酸盐缓冲液中保温10min，而膜用甲醇浸渍30秒然后用硼酸盐缓冲液浸渍3min。

在印迹之后，膜用考马斯亮蓝(0.1％[w/v]R250，甲醇[40％v/v]，乙酸[10％v/v])染色3min，然后进行脱色(甲醇[40％v/v]，乙酸[10％v/v])。膜用ddH₂O漂洗，切出上和下条带(图3)并送去用于N末端EDMAN测序。对于下条带，D被确定为N末端氨基酸，最终具有HSA的第一个氨基酸(HSA的N末端，SEQ ID 30:DAHKSEV)，而对于上条带，AYYT(SEQ ID 31)被确定为分泌蛋白的N末端。这些氨基酸是EpxL-RT序列(SEQ ID 8)的一部分，保留了不需要的21个氨基酸悬于HSA上。AYYT(SEQ ID 31)之前的EpxL-RT序列是KR，其可能是二元Lys-Arg肽酶酶切基序的一部分。由蛋白酶如Kex2加工二元Lys-Arg基序不仅取决于基序本身，也取决于三维结构和周围的氨基酸环境(Bader et al.2008,BMC Microbiol.8:116.)。EpxL-RT与其他酵母(例如酿酒酵母、假丝酵母)的Epx1同系物序列的BLAST分析和序列比对揭示了前导序列中的KR基序是非保守的。因此，通过蛋白酶如Kex2加工KR基序不能被认为是基于序列分析的一种先验。

实例5：使用用于分泌的巴斯德毕赤酵母EpxL-KR序列(截短前导序列，SEQ ID 10，其中位置3的X是F，位置16的X是A(SEQ ID 12))构建巴斯德毕赤酵母宿主细胞系用于表达重组蛋白

为了测试EpxL-RT中的KR序列是否蛋白酶切割位点，使用用于分泌的EpxL-KR序列构建用于表达重组蛋白的载体。

5a)使用用于分泌的EpxL-KR序列构建过量表达HSA的巴斯德毕赤酵母株。

使用表4.1中的引物扩增HSA，并将其连接到用BglI和SbfiI消化的载体pPM2_pGAPxLRT中。在序列确认后，将载体pPM2_pGAPxLKR-HSA在启动子区域线性化并转化到巴斯德毕赤酵母中。

表4.1：融合到EpxL-KR的HSA(限制位点用下划线标注，EpxL序列用斜体表示)的PCR扩增的寡核苷酸引物

5b)使用用于分泌的EpxL-KR序列构建过量表达猪胰蛋白酶原或eGFP的巴斯德毕赤酵母株。

使用表4.2中的引物扩增pTRP，并将其连接到用PvuII和SbfiI消化的载体pPM2_pGAPxLRT中。用相同方法生成表达载体pPM2_pGAPxLKR-eGFP。在序列确认后，载体pPM2_pGAPxLKR-pTRP和pPM2_pGAPxLKR-eGFP在启动子区域线性化并转化到巴斯德毕赤酵母。

表4.2：融合到EpxL-KR的pTRP或eGFP(限制位点用下划线标注，EpxL序列用斜体表示)的PCR扩增的寡核苷酸引物

5c)使用用于分泌的EpxL-KR序列构建过量表达抗体轻链或重链的巴斯德毕赤酵母株。

使用表4.3中的引物扩增抗体HyHEL的轻链(LC)和重链(HC)，并连接到用BglII和SbfiI消化的载体pPM2_pGAPxLRT上。在序列确认后，载体pPM2_pGAPxLKR-LC和pPM2_pGAPxLKR-HC在启动子区域线性化并转化到巴斯德毕赤酵母。

表4.3：融合到EpxL-KR的HyHEL LC或HC(限制位点用下划线标注，EpxL序列用斜体表示)的PCR扩增的寡核苷酸引物

实例6：使用用于分泌的EpxL-KR(截短前导序列，SEQ ID 10，其中位置3的X是F，位置16的X是A(SEQ ID 12))通过巴斯德毕赤酵母宿主细胞系表达重组蛋白

6a)使用用于分泌的EpxL-KR、过量表达重组猪胰蛋白酶原的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-KR序列、表达pTRP的巴斯德毕赤酵母(实例5b)如实例2a所述进行培养，并如实例3a所述进行分析。

意外地，我们观察到使用缩短的Epx分泌前导序列EpxL-KR(图4.1，中部)确实能增强加工。与使用用于分泌的EpxL-RT时观察到的蛋白拖尾现象(图4.1，左侧部分)相反，使用EpxL-KR分泌的pTRP产生了正确大小的条带(图4.1，中部)。使用EpxL-KR分泌的pTRP的正确N末端通过质谱分析(LC-MS)验证。

因此，用SDS-PAGE分离大约10μg的每个样品，割出所需蛋白条带并在凝胶中消化。蛋白在凝胶中被脲甲基化。用测序级胰蛋白酶(Roche)消化该蛋白，或者用Glu-C(Sigma-Aldrich)、LysC(Roche)和糜蛋白酶(Chymotrypsin)(Roche)消化，或者不进行消化直接进行分析。所有的蛋白水解反应在37℃下进行过夜。在此之后，将样品直接注入LC-MS系统(LC：Dionex Ultimate 3000LC，MS：Bruker,amaZon ETD，配备在线纳米源)。在C-18柱上分离肽(Dr.Maisch股份有限公司，C-18HPLC柱ReproSil-Pur 200*0.1mm，3μm包装，200A孔径，流速：0.4μL/min)，采用的线性梯度为在40min内从95％溶剂A和5％溶剂B(溶剂A：0.1％FA水溶液，溶于ACCN的0.1％FA)变为32％B，接着是15min的线性梯度，从32％B到75％B，以便于洗脱大肽，并用具有数据依赖采集技术的MS进行分析。使用标准Bruker软件(数据分析)以及免费软件程序X！-tandem结合GPM进行数据处理。

与用EpxL-KR分泌pTRP的正确N末端相反，当使用用于分泌的MFα时，氨基酸EAEA被确定留在分泌的pTRP的N末端。而且，与通常使用的MFα分泌前导序列相比，使用EpxL-KR分泌的pTPR的量要高20％以上(表5)。

表5：以MFα为标准的pTRP的相对分泌水平

前导序列	pTRP相对平均分泌量±SEM
		EpxL-KR	1.21±0.02
MFα	1.00±0.09

6b)使用用于分泌的EpxL-KR、过量表达重组人血清白蛋白的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-KR序列、表达HSA的巴斯德毕赤酵母(实例5a)如实例2a所述进行培养，并使用蛋白印迹进行分析(实例2d)。

与使用用于分泌的EpxL-RT时观察到的双条带模式(图2.3，左侧部分)相反，使用EpxL-KR分泌的HSA产生了正确大小的单条带(未显示)。因此，EpxL-KR能够分泌正确加工的HSA。

6c)使用用于分泌的EpxL-KR、过量表达eGFP的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-KR序列、表达eGFP的巴斯德毕赤酵母(实例5b)如实例2a所述进行培养，并如实例3b所述进行分析。

仅仅EpxL-KR前导序列导致了正确大小的eGFP(图4.2，左侧)，而剩下的MFα前导序列导致了较高分子量的eGFP(图4.2，右侧)。LC-MS分析(描述于实例6a中)验证了由EpxL-KR分泌的eGFP的正确N末端，其证实了分泌产品中，具有正确N末端的分子的含量为至少95％、优选为至少98％、甚至更优选为至少99％，或者约100％(w/w)。相反，使用MFα导致了氨基酸EAEA由于Ste13氨肽酶非正确加工前导肽而作为N末端的额外氨基酸序列保留下来。根据SDS-PAGE上的条带大小，由MFα分泌的大多数eGFP在N末端拥有错误的氨基酸悬挂物EAEA，而通过EpxL-KR分泌的eGFP没有观察到不正确大小的条带。对于pTRP(实例6a)，使用EpxL-KR的eGFP的分泌水平与使用MFα的相比高20％以上(表6)。

表6：以MFα为标准的eGFP的相对分泌水平(使用ImageJ软件通过条带密度进行定量)

前导序列	eGFP相对平均分泌量±SEM
		EpxL-KR	1.23±0.05
MFα	1.00±0.08

6d)使用用于分泌的EpxL-KR的过量表达抗体轻链或抗体重链的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-KR序列、表达HyHEL LC或HyHEL HC的巴斯德毕赤酵母(实例5c)如实例2a所述进行培养，并如实例2b所述进行分析。

两种抗体链均可使用EpxL-KR序列进行分泌(图4.3)，证实了EpxL-KR对于巴斯德毕赤酵母中的抗体生产是有价值的分泌前导序列。由EpxL-KR分泌的HyHEL LC的正确N末端通过LC-MS分析(如实例6a所述)进行验证。

实例7：使用用于分泌的EpxL-AA序列(SEQ ID 21)构建巴斯德毕赤酵母宿主细胞系用于表达重组蛋白

WO2010/135678和US20110021378描述了氨基酸序列MKLSTNLILAIAAASAVVSAA(SEQID 21)，即SEQ ID 8的第1-21个氨基酸，其对应于全长Epx1前导序列的前21个氨基酸。然而，WO2010/135678和US20110021378没有提供实验数据证明该序列实际上适合于重组蛋白的分泌。为了测试该片段(此后称为EpxL-AA)是否足以使正确加工的重组蛋白进行分泌，我们使用用于分泌的EpxL-AA序列构建了用于表达重组蛋白的载体。

使用表7中的引物扩增抗体轻链LC、pTRP和eGFP，并将其连接到用BglI和SfiI消化的载体pPM2_pGAPxLRT上。在序列确认后，将载体pPM2_pGAPxLAA-LC、pPM2_pGAPxLAA-pTRP和pPM2_pGAPxLAA-eGFP在启动子区域线性化并分别转化到巴斯德毕赤酵母中。

表7：融合到EpxL-AA(限制位点用下划线标注，EpxL序列用斜体表示)的pTRP、eGFP和HyHEL LC的PCR扩增的寡核苷酸引物

实例8：使用用于分泌的EpxL-AA(SEQ ID 21)由巴斯德毕赤酵母宿主细胞系表达重组蛋白

8a)使用用于分泌的EpxL-AA、过量表达eGFP的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-AA、表达eGFP的巴斯德毕赤酵母(实例7)如实例2a所述进行培养，并如实例3b所述进行分析。

在SDS-PAGE上，具有EpxL-AA的条带大小略大于EpxL-KR的(图5.1)，这表明至少一个丙氨酸残基被留在eGFP的N末端，因此代表了重组分泌蛋白的非天然N末端。

8b)使用用于分泌的EpxL-AA、过量表达重组猪胰蛋白酶原的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-AA序列、表达pTRP的巴斯德毕赤酵母(实例7)如实例2a所述进行培养，并如实例3a所述进行分析。

使用EpxL-AA序列可分泌pTRP，然而，分泌水平低于EpxL-KR序列(表8)。在SDS-PAGE上，具有EpxL-AA的条带大小略大于EpxL-KR的(图5.1)，这表明至少一个丙氨酸残基被留在pTRP的N末端。

确实，EpxL-AA分泌的pTRP的N末端测序揭示了重组分泌蛋白的N末端包含一额外的氨基酸，Ala，其从EpxL-AA序列保留，因此代表了重组分泌蛋白的非天然N末端。

表8：以EpxL-KR为标准的相对分泌水平

前导序列	pTRP相对平均分泌量±SEM
		EpxL-KR	1.00±0.12
EPxL-AA	0.79±0.04

8c)使用用于分泌的EpxL-AA、过量表达LC的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-AA序列、表达HyHEL LC的巴斯德毕赤酵母(实例7)如实例2a所述进行培养，并如实例2d所述进行分析。对于LC，使用EpxL-AA时的分泌水平低于使用EpxL-KR或MFα时的(图5.2)。对于pTRP，EpxL-AA分泌的LC的N末端测序显示了重组分泌蛋白的N末端包含一额外的氨基酸，Ala，其从EpxL-AA序列保留。

这又是一来自信号序列的不需要的残基，使得EpxL-AA不适合用于生产分泌重组蛋白。

实例9：使用用于分泌的EpxL-A序列(信号肽序列，SEQ ID 1，其中位置3的X是F，位置16的X是A(SEQ ID 3))构建巴斯德毕赤酵母宿主细胞系用于表达重组蛋白

因此我们构建了通过信号序列分泌重组蛋白的巴斯德毕赤酵母株，所述信号序列仅由天然Epx1前导序列的前20个氨基酸组成，被称为EpxL-A。Ala代表了预测的信号肽酶切割位点(C末端)的最后一个氨基酸，而在SP切割位点的N末端侧上，重组蛋白立即开始。为了验证此N末端氨基酸的性质不会影响SP的切割，我们测试了三种不同重组蛋白的分泌：eGFP(起始为疏水氨基酸Val)、抗体LC和HC(起始为带负电氨基酸Asp)。

使用表9中的引物扩增抗体轻链LC、Fab-HC和eGFP，并将其连接到用BglI和SfiI消化的载体pPM2_pGAPxLRT上。在序列确认后，将载体在启动子区域线性化并转化到巴斯德毕赤酵母中。

对于LC和Fab-HC，使用ApaI和SbfI将pGAP启动子也交换为可诱导的pG1启动子(SEQ ID 9)，然后使用相容限制性酶MreI和AgeI将两条链的表达组件结合到一个载体上。在序列确认后，将载体在AOX-TT区域线性化并转化到巴斯德毕赤酵母中。

表9：融合到EpxL-A(限制位点用下划线标注，EpxL序列用斜体表示)的eGFP和HyHEL LC和Fab-HC的PCR扩增的寡核苷酸引物

实例10：使用用于分泌的EpxL-A(信号肽序列，SEQ ID 1，其中位置3的X是F，位置 16的X是A(SEQ ID 3))通过巴斯德毕赤酵母宿主细胞系表达重组蛋白

10a)使用用于分泌的EpxL-A、过量表达eGFP的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-A序列、表达eGFP的巴斯德毕赤酵母(实例9)如实例2a所述进行培养，并如实例3b所述进行分析。

从图5.1可见，使用EpxL-A的eGFP的分泌水平比得上使用EpxL-KR的，且高于使用EpxL-AA的。

与Kottmaier等人(2011Appl Microbiol Biotechnol.91:133-141)描述的疏水信号和前导序列、MFα的前原前导序列(pre-pro leader)相反，EpxL-A序列和EpxL-KR序列不会造成eGFP的液泡靶向(vacuolar targeting)(由共聚焦激光扫描显微镜证实——数据未显示)。两种细胞株都展示了eGFP的细胞内分布，代表了存在于分泌途径中的蛋白(主要进行内质网染色)；因此EpxL-A信号肽和EpxL-KR截短前导序列似乎非常适合重组蛋白的分泌，因为它们显示出“分泌显型”。

10b)使用用于分泌的EpxL-A、过量表达LC的巴斯德毕赤酵母的分析

使用用于分泌的EpxL-A序列、表达HyHEL LC的巴斯德毕赤酵母(实例9)如实例2a所述进行培养，并如实例6d所述进行分析。

使用EpxL-A进行抗体轻链分泌导致了具有正确大小的蛋白(图5.2)，因此分泌效率与使用EpxL-KR相似，并比用EpxL-AA的情况高8倍以上(表10)。使用ImageJ软件通过定量图5.2所示的凝胶上的条带密度比较分泌水平。

表10：以EpxL-AA为标准的HyHEL LC的相对分泌水平。

前导序列	LC相对平均分泌量±SEM
		EpxL-KR	8.82±0.53
EPxL-AA	1.00±0.55
		EPxL-A	9.53±0.87

由EpxL-A分泌的LC的N末端通过LC-MS验证是正确的N末端DIVLTQSP(Asp-Ile-Val-Leu-Thr-Gln-Ser-Pro，SEQ ID 54)。

因此，与较长的序列EpxL-AA相反，Epx1的信号肽EpxL-A足以适合用于分泌具有正确N末端的重组蛋白。

除了测试在组成型pGAP启动子控制下进行的表达，还测试了在诱导型pG1启动子(SEQ ID 9)控制下的具有EpxL-A的LC分泌。细胞株构建如实例9所述。在筛选培养物中通过使用如实例2a所述的葡萄糖饲养珠来产生葡萄糖限制条件。在这样的诱导条件下，可观察到轻链的分泌。

10c)使用用于分泌的EpxL-A、过量表达抗体Fab片段的巴斯德毕赤酵母的分析

使用用于分泌两种链的EpxL-A序列、表达HyHEL抗体的Fab片段(由轻链(v_L和c_L)和重链片段(v_H和c_H1)组成)的巴斯德毕赤酵母(细胞株描述于实例9中)如实例2a所述进行培养，并如实例2d和2e所述进行分析。

意外的是，使用EpxL-A序列用于分泌HyHEL Fab的LC和HC时，完整分泌的Fab的水平比使用MFα前原前导序列高多达10倍(由实例2e所述的ELISA确定)。当使用EpxL-A时，每单位生物质的Fab产量为0.15-0.35mg Fab/OD，而使用用于分泌的MFα时为0.03-0.13mgFab/OD。而且，在具有EpxL-A的pG1控制下，分泌HyHEL Fab的巴斯德毕赤酵母的上清液不包含高水平的重组蛋白的游离LC或重组蛋白的高分子量聚合物(图5.3)。

实例11：使用用于分泌的EpxL-A(信号肽序列，SEQ ID 1，其中位置3的X是F，位置 16的X是A(SEQ ID 3))通过巴斯德毕赤酵母宿主细胞系表达重组蛋白

测试使用EpxL-A(SEQ ID 3)从巴斯德毕赤酵母分泌的八种蛋白：人生长激素(HGH)、促生长素、干扰素α2a(IFN-α2a)，两种不同的组氨酸标记的scFvs(scFvs1和scFvs2)，以及3种不同的Fabs(Fab1，Fab2和Fab3)。

由GeneArt(德国)对巴斯德毕赤酵母的基因进行密码子优化并合成。获得的载体用SbfI和SfiI进行消化，并将基因连接到载体pPM2aZ30_pG1。在Fabs的情形下，通过使用相容的限制性酶MreI和AgeI将两种链的表达组件结合到一个载体上。在序列确认后，将载体在AOX终止子区域线性化并转化到巴斯德毕赤酵母中。

使用用于分泌的EpxL-A序列(SEQ ID 3)、表达重组蛋白人生长激素、促生长素、干扰素α2a(IFN-α2a)，两种组氨酸标记的scFvs(scFvs1和scFvs2)，以及三种Fabs(Fab1，Fab2和Fab3)(Fabs由轻链(v_L和c_L)和重链片段(v_H和c_H1)组成)的巴斯德毕赤酵母株在培养基中培养，每升该培养基包含：10g酵母提取物，10g蛋白胨，100mM磷酸钾缓冲液，pH 6.0，13.4g酵母含氮碱基和硫酸铵，以及0.4mg生物素。用两种饲养珠(Kuhner，直径6mm)在24孔板中进行小规模筛选。

如实例2d所述对上清液进行分析。使用特异性抗体在蛋白印迹中检测POI：对于促生长素和人生长激素：GH1多克隆抗体；proteintech 17867-1AP(1:5,000)以及抗兔IgG(整个分子)-碱性磷酸酶抗体，Sigma A3687(1:12,000)。对于干扰素α2a：干扰素，α2a抗体；antibodies-online ABIN573795(1:1,500)以及抗兔IgG(整个分子)-碱性磷酸酶抗体，Sigma A3687(1:12,000)。对于组氨酸标记的scFvs：Penta-His HRP结合物；QIAGEN10149928(1:1,500)。

当使用EpxL-A序列(SEQ ID 3)时(图6)，所有受试蛋白都成功分泌到培养基中。

Claims

1.编码一前导序列的分离的核酸，所述前导序列是SEQ ID NO:12的氨基酸序列的前导肽，其中该核酸由SEQ ID NO:19的核苷酸序列或SEQ ID NO:19的密码子优化的变体组成。

2.编码一前导序列的分离的核酸，所述前导序列是SEQ ID NO:3的氨基酸序列的信号肽，其中该核酸由SEQ ID NO:16的核苷酸序列或SEQ ID NO:16的密码子优化的变体组成。

3.根据权利要求1-2中任意一项所述的核酸，其中所述核酸为DNA。

4.根据权利要求1-2中任意一项所述的核酸编码的分离的前导序列。

5.根据权利要求4所述的前导序列，其中所述前导序列是一肽，所述肽由SEQ ID NO:3或SEQ ID NO:12的氨基酸序列组成。

6.表达组件，其包含一编码前导序列的核酸，所述编码前导序列的核酸与编码POI的核酸序列融合，其特征在于，所述前导序列选自由以下组成的组：

(a)SEQ ID NO:12的氨基酸序列的前导肽，所述编码前导序列的核酸是一编码前导肽的核苷酸序列，所述核苷酸序列由SEQ ID NO:19的核苷酸序列或SEQ ID NO:19的密码子优化的变体组成，

(b)SEQ ID NO:3的氨基酸序列的信号肽，所述编码前导序列的核酸是一编码前导肽的核苷酸序列，所述核苷酸序列由SEQ ID NO:16的核苷酸序列或SEQ ID NO:16的密码子优化的变体组成。

7.根据权利要求6所述的表达组件，其中所述POI包含一具有天然N末端氨基酸序列的氨基酸序列。

8.根据权利要求6或7所述的表达组件，其中，POI选自以下组成的组：治疗性蛋白，包括抗体或其片段、酶和肽类、蛋白质抗生素、毒素融合蛋白、碳水化合物-蛋白质结合物，结构蛋白、调节蛋白、疫苗和类疫苗蛋白或颗粒、过程酶、生长因子、激素和细胞因子，或者其中所述POI介导宿主细胞代谢物的产生。

9.根据权利要求8所述的表达组件，其中POI选自以下组成的组：生长因子、激素、细胞因子、抗体或抗体片段。

10.根据权利要求9所述的表达组件，其中所述POI选自以下组成的组：全长抗体、scFv、微抗体、双特异抗体、三特异性抗体、四特异性抗体、Fab和Fc融合蛋白。

11.根据权利要求6-10中任意一项所述的表达组件，进一步包括一启动子，所述启动子可操作地连接到编码前导序列的核酸。

12.包含根据权利要求6-11中任意一项所述的表达组件的重组酵母宿主细胞或载体。

13.根据权利要求12所述的宿主细胞，其中酵母选自以下属组成的组：毕赤酵母属、假丝酵母属、球拟酵母属、Arxula酵母属、汉逊氏酵母属、Ogatea酵母属、耶氏酵母属、克鲁维酵母属、酵母属或Komagataella酵母属。

14.一种在酵母宿主细胞中生产POI的方法，包括：

-提供根据权利要求12或13的宿主细胞，

-培养所述宿主细胞以表达所述POI，以及

-纯化POI以获得纯化的POI制品。

15.根据权利要求14所述的方法，其中所述POI包含一具有天然N末端氨基酸序列的氨基酸序列。

16.根据权利要求14或15所述的方法，其中所述POI包含一氨基酸序列，所述氨基酸序列不包括一额外的丙氨酸作为N末端氨基酸残基。

17.根据权利要求14-15中任意一项所述的方法，其中所述POI选自由以下组成的组：治疗性蛋白，包括抗体或其片段、酶和肽类、蛋白质抗生素、毒素融合蛋白、碳水化合物-蛋白质结合物、结构蛋白、调节蛋白、疫苗和类疫苗蛋白或颗粒、过程酶、生长因子、激素和细胞因子，或者其中所述POI介导宿主细胞代谢物的产生。

18.根据权利要求17所述的方法，其中POI选自由生长因子、激素、细胞因子、抗体或抗体片段组成的组。

19.根据权利要求17所述的方法，其中POI选自由全长抗体、scFv、微抗体、双特异抗体、三特异抗体、四特异抗体、Fab和Fc融合蛋白组成的组。

20.根据权利要求1-3中任意一项所述的核酸或者根据权利要求4-5中任一项所述的前导序列用于从宿主细胞分泌POI和/或增加来自宿主细胞的POI的分泌的用途。

21.根据权利要求20所述的用途，其中至少60％的分泌的POI包括天然N末端氨基酸序列。