CN102239183B

CN102239183B - 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

Info

Publication number: CN102239183B
Application number: CN200880132268.3A
Authority: CN
Inventors: 孙廷薰; 裴贞勋; 金炫辰; 林光默
Original assignee: Korea Research Institute of Bioscience and Biotechnology KRIBB
Current assignee: Korea Research Institute of Bioscience and Biotechnology KRIBB
Priority date: 2008-12-04
Filing date: 2008-12-05
Publication date: 2017-06-30
Anticipated expiration: 2028-12-05
Also published as: KR20130091797A; EP2573122A3; KR20110104512A; EP2370470A1; JP2012510808A; KR101387693B1; KR101498668B1; EP2370470A4; KR20130091798A; EP2573122A2; JP5955875B2; CN103952425B; EP2370470B1; CN103952425A; EP2918606A2; WO2010064748A1; CN102239183A; JP2014138600A; US9550997B2; EP2918606A3

Abstract

本发明涉及鉴定用于超量分泌制备重组蛋白质的合适的分泌融合配偶体(SFP)的方法。SFP可通过分泌蛋白质组分析获得。重组蛋白可与分泌融合配偶体(SFP)一起以融合蛋白形式制备得到，并通过体外蛋白酶处理与SFP相分离。本发明的SFP极大地提高了目标蛋白和肽的分泌水平，所述目标蛋白和肽对于生物制药和生物产业很有价值。

Description

大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

技术领域

本发明属于重组蛋白质表达领域。特别是，本发明涉及分泌融合配偶体和筛选合适的分泌融合配偶体(SFP)的技术。本发明公开了用于实现高水平分泌目标多肽的最佳SFP。本发明的SFP可诱导超量分泌制备重组蛋白质。

背景技术

目标蛋白质的重组表达是广泛用来生产大量用于研究目的或治疗和其它商业用途的蛋白质的方法。本领域已知有多种重组表达系统，包括细菌、酵母和哺乳动物宿主细胞系统，并且许多不同蛋白质已在这些系统中成功生产。然而，使用现有表达系统还有许多蛋白质很难生产，导致很少或没有蛋白质表达和分泌。提高重组表达蛋白质分泌的方法，例如过量表达分子伴侣和折叠酶(Hackel等人，Pharm Res 23：790(2006)；Poewer和Robinson，Biotechnol Prog 23：364(2007)；Shusta等人，Nat Biotechnol 16：773(1998))、过量表达与分泌途径相关的基因((Carla Fama等人，Biochim Biophys Acta 1773：232(2007)；Wentz和Shusta等人，Appl Environ Microbiol 73：1189(1998))、对前导序列进行操作(Clements等人，Gene 106：267(1991)；Kjaerulff和Jensen，Biochem Biophys Res Commun336：974(2005)；Sagiya等人，Microbiol.Biotechnol 42：358(1994)；Li等人，BitechnolProg 18：831(2002))已在特定的目标蛋白上取得一定成功。

提高蛋白质生产能力的另一种方法是将目标蛋白连接到融合配偶体上。作为融合配偶体使用的分泌蛋白包括人血清白蛋白(Kang等人，Protein Expr Purif 53：331(2007)；Huang等人，J.Pept.Sci 14：588(2008))、α-乳白蛋白(WO1995027782A1)、红素氧还蛋白(WO2000039310A1)、人胰高血糖素(WO2000053777A1)、八目鳗抗菌肽相关肽(WO2005019242A2)、磷酸核酮糖激酶(US6500647B1)、蛋白质二硫键异构酶(Kajino等人，Appl Environ Microbiol 66：638(2000)、葡萄球菌A蛋白(Moreno等人，Protein ExprPurif 18：242(2000)、Hsp150蛋白(Sievi等人，Biotechnol.Prog.19：1368(2003)、纤维素结合域(Ahn等人，Appl Microbiol Biotechnol.64：833(2004))和金结合肽(US20050106625A1)已在特定的目标蛋白上取得一定成功。

为了鉴定分泌蛋白和新信号序列，已开发了数个信号序列捕获系统。美国专利No.6,228,590描述了一种筛选哺乳动物信号序列的技术，其使用含有哺乳动物编码序列且与报告蛋白融合的核酸转化报告蛋白缺乏的酵母，并检测分泌报告蛋白的细胞。一种使用缺乏转化酶的酵母和转化酶报告蛋白的类似系统公开于欧洲专利EP0907727中。基于酵母的信号序列捕获已用于鉴定来自人DNA(Klein等人，Proc.Natl.Acad.Sci.USA 93：7108(1996)；Jacobs等人，Gene 198：289(1997))、鼠DNA(Gallicioti等人，J.MembraneBiol.183：175(2001))、斑马鱼DNA(Crosier等人，Dev.Dynamics 222：637(2001))、拟南芥DNA(Goo等人，Plant Mol.Biol.41：415(1999))、马铃薯DNA(Surpili等人，Anais deAcademia Brasileira de Ciencias 74：599(2002))和白色念珠菌DNA(Monteoliva等人，Eukaryotic Cell 1：514(2002))的分泌蛋白。已开发了使用哺乳动物宿主细胞(Gallicioti等人，J.Membrane Biol.183：175(2001))和细菌宿主细胞(Ferguson等人，Cancer Res.65：8209(2000)的类似捕获系统。已用于信号序列捕获的报告蛋白包括转化酶(Klein等人，Proc.Natl.Acad.Sci.USA 93：7108(1996))、α-淀粉酶(U.S.Patent No.6,228,590)、酸性磷酸酯酶(PHO5)(Surpili等人，Anais de Academia Brasileira deCiencias 74：599(2002))和β-内酰胺酶(Ferguson等人，Cancer Res.65：8209(2000))。

鉴定对目标蛋白分泌有用的翻译融合配偶体(TFPs)的方法公开于WO 2005/068658中。该方法包含：(i)制备多个宿主细胞，所述的宿主细胞用包含核酸片段的文库和与编码报告蛋白的核苷酸序列融合的编码目标蛋白的核苷酸序列的多种载体进行转化；其中所述的宿主细胞缺乏报告蛋白；和(ii)从宿主细胞中鉴定出TFP文库，其中该TFP文库包含单独诱导目标蛋白分泌的核酸片段。

在酵母中分泌制备极少分泌型蛋白的翻译融合配偶体(TFP)技术描述于WO 2007/015178。在从酵母基因组中筛选TFP的过程中，发现了YGR106C(Voa1p)基因。目前鉴定出Voa1p蛋白在ER膜上的细胞定位(Ryan等人，Mol.Biol.Cell，Epub ahead of print，Sep17，2008)。Voa1p被认为是5个用于液泡ATP酶的V0装配因子中的一个。

因此本领域仍亟需能提高蛋白表达的其它序列，以及鉴定这些序列的方法。

发明内容

技术问题

本发明涉及使用分泌融合配偶体(SFP)超量分泌制备和有效纯化各种重组蛋白质，所述的分泌融合配偶体可通过分泌蛋白质组分析获得。重组蛋白质以含有分泌融合配偶体的融合体形式在胞外制备，并且可通过体外蛋白酶处理从SFP上分离出来。本发明所述SFP极大地提高了目标蛋白的分泌水平并改良了对生物制药和生物产业有价值的多肽。还描述了选择/筛选SFP的方法。尽管可以确定甚至可以预测是否分泌出特定的蛋白质，但不可能预测出分泌的蛋白质是否具有SFP的功能。本发明的选择/筛选方法使得可能选择出具有SFP功能的蛋白质和该蛋白质的片段或衍生物。用本发明的选择/筛选方法选择出的SFP提高了可用于生物制药和生物产业的蛋白质的重组制备。本发明还包括鉴定出的SFP及其片段和衍生物。

技术方案

因此，本发明的一个目的在于提供鉴定分泌融合配偶体(SFP)的方法，所述的方法包括：

(i)用可操作地连接有异源启动子的编码分泌多肽的多核苷酸转化第一宿主细胞；

(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比，确定所述的第一宿主细胞是否过量分泌所述的分泌多肽；

(iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞，其中，所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；

(iv)在培养条件下培养所述的第二宿主细胞，其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽；和

(v)确定所述的融合多肽是否分泌到培养基中；从而鉴定所述的过量分泌多肽是否为SFP。

本发明的另一个目的在于提供一种分离的融合多肽，其包括：(i)上述的SFP或其片段或衍生物；和(ii)目标多肽。

本发明另一个目的还在于提供一种分离的融合多肽，其包括：(i)包括含有SEQ IDNO：1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物，其中所述SFP没有跨膜结构域(TM)；和(ii)目标多肽。

本发明另一个目的还在于提供一种构建体，其包括：(i)启动子；(ii)编码SEQ IDNO：1的176-213位的氨基酸或其片段或衍生物的第一多核苷酸，其中所述SFP无跨膜结构域(TM)；和(iii)编码目标多肽或其衍生物的第二多核苷酸。

本发明的另一个目的还在于提供一种包含上述构建体的宿主细胞。

本发明的另一个目的还在于提供一种重组制备目标多肽的方法，其包括：(i)用编码SFP的多核苷酸和编码目标多肽的多核苷酸转化宿主细胞；(ii)在培养条件下培养所述的宿主细胞，其中从所述的宿主细胞中制备并分泌出包含融合到所述目标多肽的所述SFP的融合多肽；和

(iii)分离所述的融合多肽。

本发明的另一个目的还在于提供一种用上述方法重组制备的目标多肽。

附图说明

从下述的详细说明并结合所附的附图，将更加清楚地理解本发明上述及其它目的、特征和优点。

图1所示为(A)预测的氨基酸序列和SFP1蛋白的结构域；(B)表达连续缺失的SFP1基因的载体示意图；(C)SDS-PAGE分析SFP1蛋白的相对表达水平。10％Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1：用YGaT91载体转化的2805株的培养物；2：用YGaT92载体转化的2805株的培养物；3：用YGaT93载体转化的2805株的肉汤培养物；4：用YGaT94载体转化的2805株的肉汤培养物；5：用YGaT95载体转化的2805株的肉汤培养物；6：用YGaT96载体转化的2805株的肉汤培养物；7：用YGaT97载体转化的2805株的肉汤培养物；泳道M：预染色的蛋白质大小标记(Invitrogen)。

图2所示为(A)表达SFP1-IL2融合蛋白的载体示意图；(B)SDS-PAGE分析SFP1-IL2融合蛋白表达水平。10％Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1：用YGaT92-IL2载体转化的2805株的肉汤培养物；泳道2：用YGaT93-IL2载体转化的2805株的肉汤培养物；泳道3：用YGaT94-IL2载体转化的2805株的肉汤培养物；泳道M：预染色的蛋白质大小标记(Invitrogen)

图3为含有YGaT92-EXD4的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。

图4所示为SDS-PAGE分析用不同浓度的肠激酶(Invitrogen，USA)消化纯化后的SFP1-EXD4融合蛋白的结果。泳道1：纯化后的SFP1-EXD4融合蛋白；泳道2：用0.1μl肠激酶37℃消化1小时后纯化的SFP1-EXD4融合蛋白；泳道3：用0.2μl肠激酶37℃消化1小时后纯化的SFP1-EXD4融合蛋白；泳道4：用0.3μl肠激酶37℃消1小时后化纯化的SFP1-EXD4融合蛋白；泳道M：预染色的蛋白质大小标记(Invitrogen)。

图5所示为(A)HPLC分析肠激酶消化的SFP1-EXD4融合蛋白；(B)SDS-PAGE分析HPLC片段。凝胶上的数字表述HPLC片段的编号。

图6所示为MALDI-TOF分析纯化的EXD4蛋白。

图7所示为(A)表达SFP1突变体-EXD4融合蛋白的载体示意图；(B)SDS-PAGE分析SFP1突变体-EXD4融合蛋白表达水平。10％Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1：用YGaT92-EXD4载体转化的2805株的肉汤培养物；泳道2：用YGaT921-EXD4载体转化的2805株的肉汤培养物；泳道3：用YGaT922-EXD4载体转化的2805株的肉汤培养物；泳道4：用YGaT923-EXD4载体转化的2805株的肉汤培养物；泳道M：预染色的蛋白质大小标记(Invitrogen)。

图8所示为含有YGaMKH-EXD4的重组酵母株在指定发酵时间的分批补料发酵的SDS-PAGE分析。

图9为含有YGaST6-EXD4-HL的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。

图10所示为含有YGaMKH-EGF的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。

图11所示为(A)HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析和(B)用肠激酶消化后的HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析。

图12为含有YGaMKH-PTH的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。

图13所示为SDS-PAGE分析用分泌形式的重组子Kex2p(JH Sohn，KRIBB)和肠激酶(Invitrogen，USA)消化后纯化的HL-PTH融合蛋白。泳道1：纯化后的HL-PTH融合蛋白；泳道2：用Kex2p于37℃消化1小时后纯化的HL-PTH融合蛋白；泳道3：用肠激酶37℃消化1小时后纯化的HL-PTH融合蛋白；泳道M：预染色的蛋白质大小标记(Invitrogen)。

图14所示为(A)2805株的生长曲线，箭头所指是取样点；(B)样品细胞经荧光染料hochest染色后的共焦激光扫描显微镜结果。

图15所示为样品M2的双向凝胶电泳结果。

图16所示为1-DE/MudPIT的SDS-PAGE分析1-DE/MudPIT(多维蛋白质鉴定技术，Multidimensional Protein Identification Technology)。

图17所示为(A)表达19个选自分泌蛋白质组分析的基因的Y2805转化株培养物上清液的SDS-PAGE分析。10％Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1：过量表达BGL2基因的2805株的肉汤培养物；泳道2：过量表达CIS3基因的2805株的肉汤培养物；泳道3：过量表达CRH1基因的2805株的肉汤培养物；泳道4：过量表达CWP1基因的2805株的肉汤培养物；泳道5：过量表达DSE4基因的2805株的肉汤培养物；泳道7：过量表达EGT2基因的2805株的肉汤培养物；泳道8：过量表达EXG1基因的2805株的肉汤培养物；泳道9：过量表达GAS1基因的2805株的肉汤培养物；泳道10：过量表达GAS3基因的2805株的肉汤培养物；泳道11：过量表达GAS5基因的2805株的肉汤培养物；泳道12：过量表达PST1基因的2805株的肉汤培养物；泳道13：过量表达SCW4基因的2805株的肉汤培养物；泳道15：过量表达SIM1基因的2805株的肉汤培养物；泳道16：过量表达TOS1基因的2805株的肉汤培养物；泳道17：过量表达UTH1基因的2805株的肉汤培养物；泳道18：过量表达YGP1基因的2805株的肉汤培养物；泳道19：过量表达YPS1基因的2805株的肉汤培养物；泳道20：过量表达ZPS1基因的2805株的肉汤培养物；泳道M：预染色的蛋白质大小标记(Invitrogen)。SDS-PAGE分析用Endo-H处理后的培养物上清液(B)。

图18所示为SDS-PAGE分析表达出分别与EXD4融合的11个基因的Y2805转化株培养物上清液。10％Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1：过量表达BGL2-EXD4基因的2805株的肉汤培养物；泳道2：过量表达GAS3-EXD4基因的2805株的肉汤培养物；泳道3：过量表达GAS5-EXD4基因的2805株的肉汤培养物；泳道4：过量表达PST1-EXD4基因的2805株的肉汤培养物；泳道5：过量表达SCW4-EXD4基因的2805株的肉汤培养物；泳道6：过量表达SCW10-EXD4基因的2805株的肉汤培养物；泳道7：过量表达SIM1-EXD4基因的2805株的肉汤培养物；泳道8：过量表达UTH1-EXD4基因的2805株的肉汤培养物；泳道9：过量表达YGP1-EXD4基因的2805株的肉汤培养物；泳道10：过量表达YPS1-EXD4基因的2805株的肉汤培养物；泳道11：过量表达ZPS1-EXD4基因的2805株的肉汤培养物；泳道M：预染色的蛋白质大小标记(Invitrogen)。

图19所示为(A)Kyte-Doolittle亲水性分析和SCW4和EXD4融合体的缺失片段的示意图；(B)SDS-PAGE分析含有逐渐缺失的SCW4-EXD4融合片段的各个转化体培养物上清液。

图20所示为分析分别含有YGa-SCW4-1-EXD4和YGa-SCW4-3-EXD4的重组酵母株2805在分批补料发酵过程中分泌到培养液中的蛋白质的SDS-PAGE结果。

图21所示为分析用肠激酶处理前后分泌的融合蛋白、SCW4-1-EXD4和SCW4-3-EXD4的SDS-PAGE结果。

图22所示为(A)分泌到培养基中的SCW4-hGH的SDS-PAGE结果，肉汤培养10μL含有各自载体的细胞；(B)用肠激酶处理前后的样品。

图23所示为根据发酵时间，分析含有YGa-SCW4-2-hGH的重组酵母株分批补料发酵过程中分泌到培养基中的蛋白质的SDS-PAGE结果。

图24为IL-2表达载体pYGaT92-IL2的载体图。

图25为毒蜥外泌肽-4表达载体pYGaT923-EXD4的载体图。

图26为毒蜥外泌肽-4表达载体pYGaMKH-EXD4的载体图。

图27为毒蜥外泌肽-4表达载体pYGaST6-EXD-HL的载体图。

图28为EGF表达载体pYGaMKH-EGF的载体图。

图29为PTH表达载体pYGaMKH-PTH的载体图。

图30为毒蜥外泌肽-4表达载体pYGaSCW4-1-EXD4的载体图。

图31为毒蜥外泌肽-4表达载体pYGaSCW4-3-EXD4的载体图。

图32为hGH表达载体pYGaSCW4-2-hGH的载体图。

具体实施方式

本发明满足了高水平地分泌目标多肽和快速、有效地筛选可用于获得高水平分泌的目标多肽的SFP鉴定技术。本发明有助于优化任何蛋白的重组表达，尤其有助于因在已知表达系统中表达水平低而不能大规模和/或低成本制备的蛋白质制备。优化后的SFP可获得高水平的目标多肽的分泌。

定义：

应当注意，术语“一”或“一个”个体是指一个或多个体；如“一个载体”应当理解为一个或多个载体。同样，术语“一”(或“一个”)、“一个或多个”和“至少一个”在本申请中可以互换使用。

本发明中，术语“多肽”包括单个的“多肽”以及多个“多肽”，是指通过酰胺键(也称肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或多个氨基酸的任何链，不是指产物具体的长度。因此，肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或其它用于指代两个或多个氨基酸的链的任何术语都包括在“多肽”的定义内，而且术语“多肽”用这些中的任何一个替代或可互换使用。术语“多肽”还指多肽表达后修饰的产物，包括但不限于：糖基化、酰基化、磷酸化、酰胺化、用已知的保护/保卫基团衍生物、蛋白水解裂解或用非天然的氨基酸修饰。多肽可来源于天然的生物或通过重组技术制备，但不一定翻译自特定的核酸序列。其可以用任何方法生成，包括化学合成。

“分离的多肽”或其片段、变体或衍生物是指不在其天然环境下的多肽。不需要特别的纯化程度。例如，分离的多肽可移取自其原生的和天然的环境。为本发明目的，在宿主细胞中重组制备的多肽和蛋白被看做进行了分离，其被认为是已经被任何合适的技术分开、分离、部分或基本纯化的原生或重组的多肽。

本发明的多肽还包括前述多肽的片段、衍生物、类似物或变体和其任意组合。当术语“片段”、“变体”、“衍生物”和“类似物”是指本发明的多肽时，包括至少保留一些相应原始多肽的生物学、抗原或免疫的特性。本发明的多肽片段包括蛋白水解片段以及缺失片段，此外还包括其它本申请其它地方描述的特定片段。本发明多肽的变体包括如上所述的片段，还包括由于氨基酸取代、缺失或插入导致氨基酸序列改变的多肽。变体可自然发生或非自然发生。非自然发生的变体可通过使用本领域公知的诱变技术进行制备。多肽变体可包括保守的或非保守的氨基酸取代、缺失或增加。本发明多肽的衍生物包括为具有原始多肽所不具有的额外特性而已经发生改变的多肽。多肽变体在本申请中还指“多肽类似物”。本申请中，多肽的“衍生物”指具有通过功能侧基反应后化学衍生出的一个或多个残基的主体多肽(subject polypeptide)。“衍生物”还包括含有20个基本氨基酸的一个或多个天然氨基酸衍生物的肽。例如，4-羟基脯氨酸可用来取代脯氨酸；5-羟基赖氨酸可用来取代赖氨酸；3-甲基组氨酸可用来取代组氨酸；高丝氨酸可用来取代丝氨酸以及鸟氨酸可用来取代赖氨酸。

“参考氨基酸序列”是指没有任何引入任何氨基酸取代的特异序列。作为本领域技术人员应当理解，如果没有发生取代，本发明“分离的多肽”包括与参考氨基酸序列相同的氨基酸序列。

本发明所述的多肽可具有多种改变，如取代、缺失或插入。可在多肽中取代的典型的氨基酸包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。

还包括与本申请所述的多肽和参考多肽具有至少70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％一致性的相应多肽片段。

序列一致性的计算是通过比较两个在比较区域进行最佳排列的序列，确定相同氨基酸残基或核苷酸在两个序列中所处位置的数目以获得匹配位置的数目，用比较区域(例如窗口大小)的位置总数目除以匹配位置的数目并将其结果乘以100来获得序列一致性的百分数。一方面；当长度为100个氨基酸或核苷酸的四个空位可被引入以使比对最大化时，一致性百分比的计算是指两个序列中的较小序列氨基酸残基或核苷酸的百分数，其中所述的两个序列与被比序列中的相同氨基酸残基或核苷酸比对(Dayhoff，in Atlas ofProteinSequence and Structure(蛋白质序列和结构地图集)，Vol.5，p.124，NationalBiochemical Research Foundation(全国生化研究基金会)，Washington，D.C.(1972)，作为引文并入本申请)。一致性的确定通常通过本领域已知的计算机同源性程序进行。典型程序为Gap程序(Wisconsin Sequenc Analysis Package(Wisconsin序列分析软件包)，Version 8 for UNIX，Genetics Computer Group，University Research Park，Madison，WI)，使用默认设置，应用Smith和Waterman的算法(Adv.Appl.Math.，1981，2：482-489，其以引文形式整体并入本申请)。

优选的，任何取代为保守氨基酸的取代。“保守氨基酸取代”是指氨基酸残基用具有相似侧链的氨基酸残基替代。具有相似侧链的氨基酸残基家族在本领域内已有定义。这些家族包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。

在一个实施方案中，本发明涉及一种鉴定分泌融合配偶体(SFP)的方法，所述的方法包括：(i)用可操作地与编码分泌多肽的多核苷酸连接的异源启动子转化第一宿主细胞；(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比，确定所述第一宿主细胞是否过量分泌所述的分泌多肽；(iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞，其中，所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；(iv)在培养条件下培养所述的第二宿主细胞，其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽；和(v)确定所述的融合多肽是否分泌到培养基中；从而鉴定所述的过量分泌多肽是否为SFP。

在本发明的方法中，可从“分泌蛋白质组”或“总分泌多肽”中鉴定SFP。分泌蛋白质组包括分泌到胞外培养基并从胞外培养基中收集的多肽。任何真核或原核生物的DNA可编码分泌蛋白质组，包括细菌、真菌(如酵母)、植物和动物(如哺乳动物)。适合的细菌包括但不限于：埃希氏杆菌属和芽孢杆菌属。适合的酵母包括但不限于：念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体的物种实例包括：产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。其它可作为DNA来源的真菌包括但不限于：曲霉属、青霉属、根霉属和木霉属。可作为DNA来源的植物包括但不限于：拟南芥、玉米、烟草和马铃薯。适合的动物细胞包括但不限于：人、鼠、白鼠、兔子、狗、猫和猴子。在一个实施方案中，分泌蛋白质组可源自酵母、细菌、植物或动物。

可使用本领域可获得的技术分析分泌蛋白质组用于筛选大量分泌的多肽。例如，从浓缩的培养物上清液中分离出的总分泌多肽可通过双向凝胶电泳和/或多维蛋白质鉴定技术(1-DE/MudPIT)进行分析。可通过任何一种蛋白质纯化柱从分泌蛋白质组分析多肽，如离子交换柱、疏水交互作用柱、凝胶过滤柱、亲和层析柱和反相柱。

在一个实施方案中，分析正常的酵母细胞生长过程中制备的总分泌多肽(酵母分泌蛋白质组)。正常的细胞生长是指细胞培养于基本培养基(如0.67％无氨基酸的酵母含氮碱基、0.5％酪蛋白水解物、2％葡萄糖和0.002％尿嘧啶)。可使用改变的条件，所述条件可包括用不同的碳源替代葡萄糖，如半乳糖、木糖、果糖、甘露糖、蔗糖、棉子糖和纤维二糖。改变的条件还可包括限制培养基中任何组分的水平，如氮或磷。

术语“大量分泌”是指分泌多肽的水平达到至少40％、45％、50％、55％、60％、65％或70％的分泌蛋白质组。大量分泌多肽可通过PAI(蛋白丰富指数，protein abundanceindex)确定(Rappsilber等人，Genome Res.12：1231-45(2002))，其可与分泌蛋白质的量成正比。大量分泌的蛋白的实例列于表1中。

术语“过量分泌”被定义为宿主细胞的多肽分泌水平至少超过用天然启动子表达的多肽分泌水平的5X、6X、7X、8X、9X或10X。还可通过与野生型蛋白分泌水平和大量分泌的多肽分泌水平相比，确定过量分泌。例如，野生型酵母在正常细胞生产过程中，分泌的蛋白不超过20mg/L的分泌水平，然而连接到一个强异源启动子后，一些这样的蛋白就过量分泌，分泌水平超过了20mg/L。

在一个实施方案中，本发明的方法还包括确定用于分泌融合多肽的SFP的最佳大小。SFP的最佳大小可通过缺失分析所述SFP进行确定，其中，比较各自含有不同SFP的缺失构建体的融合多肽的分泌水平。一些SFP可能具有最佳的大小，从而使其融合多肽的表达水平可能甚至高于最初鉴定的SFP的表达水平。与目标多肽融合到次优的SFP上时目标多肽的分泌水平相比，最佳大小的SFP可增加目标多肽的分泌水平。SFP的最佳大小可随目标多肽而变，但只要SFP被首次鉴定后，就可使用本申请的方法或本领域公知的方法进行确定。

在一个实施方案中，选择以亲水序列结束的SFP缺失片段。蛋白的亲水结构域通常定位于蛋白表面的附近。因此，SFP和目标多肽的结合点连接可轻易地暴露于两个多肽之间，使得蛋白酶更易在体外切割连接点而释放目标多肽。

术语“其片段”，如SFP所使用的，是指含有任意部分的SFP的氨基酸序列的多肽，其中该片段基本保留了诱导与其融合的目标多肽分泌的能力。

本申请中所用的术语“基本上保留诱导与其融合的目标多肽分泌的能力”是指保留原始SFP的诱导与其融合的目标多肽分泌的能力至少50％的片段或其衍生物。在一些实施方案。至少保留60、65、70、75、80、85、90或95％诱导与其融合的目标蛋白分泌的能力。诱导目标多肽分泌的能力可通过本领域公知和前述的常规技术来确定。

术语“其衍生物”，如SFP所使用的，是指由与SFP的氨基酸序列至少70％相同的氨基酸序列组成的多肽，其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中，该衍生物包含与SFP的氨基酸序列至少75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％一致性的氨基酸序列。该衍生物还可包含对SFP氨基酸序列的增加、删除、取代或其组合。衍生物可包括用1、2、3、4、5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。

SFP的衍生物的实例包括但不限于：缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)SFP中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术，如文所引的参考文献中所述，制备SFP的衍生物或编码SFP的核酸的衍生物，并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。

在一个实施方案中，用本发明的方法鉴定SFP或其衍生物或片段。在另一个实施方案中，编码SFP的核苷酸序列选自下述：BGL2(SEQ ID NO：62)、GAS3(SEQ ID NO：63)、GAS5(SEQ ID NO：64)、PST1(SEQ ID NO：65)、SCW4(SEQ ID NO：66)、SCW10(SEQ ID NO：67)、SIMI(SEQ ID NO：68)、UTH1(SEQ ID NO：69)、YGP1(SEQ ID NO：70)、YPS1(SEQ ID NO：71)和ZPS1(SEQ ID NO：72)。在另一个实施方案中，SFP选自下述：BGL2(SEQ ID NO：80)、GAS3(SEQ IDNO：81)、GAS5(SEQ ID NO：82)、PST1(SEQ ID NO：83)、SCW4(SEQ ID NO：84)、SCW10(SEQ IDNO：85)、SIMI(SEQ ID NO：86)、UTH1(SEQ ID NO：87)、YGP1(SEQ ID NO：88)、YPS 1(SEQ IDNO：89)和ZPS1(SEQ ID NO：90)。

本发明的方法可使用术语“目标多肽”或其衍生物，它们为被期望有高水平重组表达的多肽。术语“其衍生物”如所用于“目标多肽”，是指由与多肽的氨基酸序列至少70％相同的氨基酸序列组成的多肽，其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中，该衍生物包含与目标多肽的氨基酸序列至少75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％或99％相同的氨基酸序列。该衍生物还可包含对目标多肽的氨基酸序列的增加、缺失、取代或其组合。衍生物可包括用1、2、3、4、5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。

目标蛋白或目标多肽的衍生物的实例包括但不限于：缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)目标多肽中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术，如本文所引的参考文献中所述，制备目标多肽的衍生物或编码目标多肽的核酸的衍生物，并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。

如目标多肽融合到SFP，目标多肽和SFP就不是同样的天然存在蛋白的多肽。目标多肽可为正以研究目的而研究的多肽或正以商业为目的如制药和产业用途而生产的多肽。目标多肽可来自于任何植物、动物或微生物，只要它可以被核酸编码，可以是天然发生的或经过修饰的。在一个实施方案中，目标多肽为人类蛋白。在另一个实施方案中，目标多肽为细胞因子、血清蛋白、集落刺激因子、生长因子、激素或酶。

例如，目标多肽可选自下述：白细胞介素、凝结因子、干扰素-α、-β或-γ、粒细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子、组织生长因子、上皮生长因子、TGFα、TGFβ、表皮生长因子、血小板衍生生长因子、成纤维细胞生长因子、促卵泡激素、促甲状腺激素、抗利尿激素、色素性激素、甲状旁腺激素、促黄体生成激素释放激素、碳水化合物特异性酶、蛋白水解酶、脂肪酶、氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、免疫球蛋白、细胞因子受体、乳铁蛋白、磷脂酶A2激活蛋白、胰岛素、胖瘤坏死因子、降钙素、降钙素基因相关肽、脑啡肽、生长调节素、促红细胞生成素、下丘脑释放因子、催乳素、绒毛膜促性腺激素、组织纤溶酶原激活物、生长激素释放肽、胸腺体液因子、抗癌肽或抗菌肽。具体实例包括但不限于：人白细胞介素-2(hIL-2)、毒蜥外泌肽-3、毒蜥外泌肽-4(EXD4)、胰高血糖素样肽-1(GLP-1)、甲状腺激素(PTH)、人白细胞介素-1β、人白细胞介素-6、人白细胞介素-32α、-32β或32γ、VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β或-γ、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β-1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YM1 & 2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白24、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。

在一个实施方案中，目标多肽为很难用常规的重组制备方法制备的多肽，也即不能制备或仅以很低的水平进行制备。在另一个实施方案中，目标多肽为易于用已知的表达系统进行制备的多肽，但期望其获得更高水平的表达。

在一个实施方案中，本发明的融合多肽是指包含分泌多肽以任何顺序融合到目标多肽而形成的多肽。在另一个实施方案中，本发明涉及包含融合到目标多肽的本发明SFP的分离融合多肽。

术语“融合的”在本申请中是指重组制备的融合多肽。在一个实施方案中，融合多肽包含融合到目标多肽的分泌多肽，其中分泌多肽和目标多肽以任何顺序进行融合。在另一个实施方案中，SFP在目标多肽的N-末端或C-末端进行融合。SFP和目标多肽可使用或不使用插入的氨基酸如由连接DNA编码的氨基酸进行融合。在一些实施方案中，SFP和目标多肽的距离可为0～10；0～20；0～30；0～40个或更多氨基酸。在一些实施方案中，融合多肽包含蛋白酶识别序列和或亲和标签。

在一个实施方案中，分离的融合多肽包括含有SEQ ID NO：1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物和目标多肽。在一个实施方案中，修饰的HL结构域由SEQ ID NO：45编码。

本发明还涉及使用本发明的SFP重组制备目标蛋白的方法。在一个实施方案中，该方法包括：制备构建体，所述构建体包含编码目标蛋白的核苷酸序列，该核苷酸序列可操作性地连接至编码SFP或其衍生物或片段的核苷酸序列；用所述构建体转化宿主细胞；在宿主细胞生成和分泌目标蛋白的条件下培养宿主细胞；再从所述的目标多肽中分离出SFP。

目标蛋白可使用任何本领域已知表达系统重组制备。优选地，目标蛋白在例如细菌、酵母或哺乳动物细胞培养物中重组表达。重组表达包括：制备包含编码目标蛋白的多核苷酸的载体，运送载体至宿主细胞，在目标蛋白表达条件下培养宿主细胞，以及分离目标蛋白。制备重组载体和使用同样的载体转化宿主细胞、在宿主细胞中复制载体和表达生物活性外源多肽和蛋白质的方法和材料在前面讨论且描述于Sambrook等人，MolecularCloning(《分子克隆》)，第三版，Cold Spring Harbor Laboratory(冷泉港实验室)，2001和Ausubel等人，Current Protocols in Molecular Biology(《现代分子生物学教程》)，JohnWiley & Sons，New York第三版(2000)，均以参阅的方式纳入本申请。

目标蛋白可从宿主细胞生长的培养基中分离出来，通过本领域已知的纯化方法例如常规色谱方法包括免疫亲和层析法、受体亲和层析法、流水作用色谱法、凝集素亲和层析法、尺寸排阻过滤法、阳离子或阴离子交换色谱法、高效液相色谱法(HPLC)、反相HPLC等。其它纯化方法还包括那些预期多肽作为融合多肽被表达和纯化的方法，其中所述的融合多肽具有特定的亲和肽、标签、标记或被特定结合配偶体或试剂识别的螫合部分。经纯化的蛋白质可断裂以获得预期蛋白，或可作为完整的融合蛋白被保存。作为断裂过程的结果，亲和标签组分的断裂可生成具有其它氨基酸残基的预期蛋白质形式。在一个实施方案中，亲和标签为GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、S-标签或其组合。

本发明的目标多肽与分泌融合配偶体以融合形式在胞外制备，并可通过体外蛋白酶处理从SFP中分离出来。如果被分离的目标蛋白在采用分离操作后没有生物活性，可使用多种方法使多肽发生“重折叠”或转化成其三级结构并生成二硫键使之恢复生物活性。本领域普通技术人员已知的方法包括在特定浓度的离液剂存在下将溶解的多肽的pH调节至通常大于7。离液剂的选择类似于包涵体增溶作用的选择，但是通常浓度较低且不必要和增溶作用使用同种离液剂。可能需要使用还原剂或特定比例的还原剂和其氧化形式，以得到特定的氧化还原电位使蛋白质的半脱氨酸桥形成中可发生二硫键的转移。一些常用的氧化还原对包括半脱氨酸/胱胺、谷胱苷肽(GSH)/二硫代谷胱甘肽、氯化铜、二硫苏糖醇(DTT)/二噻烷DTT、2-巯基乙醇(bME)/二硫代-b(ME)。为了增加重折叠效率，可能有必要使用助溶剂，例如甘油、多种分子量的聚乙二醇和精氨酸。

术语“多核苷酸”包括单个核酸以及多个核酸，是指分离的核酸分子或构建体，如信使RNA(mRNA)、病毒来源的RNA或质粒DNA(pDNA)。多核苷酸可包括常规的磷酸二酯键或非常规的键(如酰胺键，例如发现于肽核酸中(PNA))。术语“核酸”是存在于多核苷酸的指任何一种或多种核酸片段，如DNA或RNA片段。“分离的”核酸或多核苷酸是指从它的原始环境中移取的核酸分子，DNA或RNA。例如，载体中所含的编码治疗用多肽的重组多核苷酸被认为是为本发明目的的分离的重组多核苷酸。分离的多核苷酸的进一步的实例包括异源宿主细胞中维持的重组多核苷酸或溶液中的(部分地或大体上地)纯化的多核苷酸。分离的RNA分子包括本发明体内或体外的RNA转录本以及本申请公开的瘟病毒载体的正链和负链形式和双链形式。

本发明分离的多核苷酸或核酸包括该合成制备的分子。此外，多核苷酸或核酸可为或可包括调控元件，如启动子、核糖体结合位点或转录终止子。

本申请使用的“编码区域”为含有翻译成氨基酸的密码子的核酸的一部分。尽管“终止子”(TAG、TGA或TAA)不翻译成氨基酸，但它被认为是编码区域的一部分，但如果存在任何侧翼序列，如启动子、核糖体结合位点、转录终止子、内含子、5′和3′非编码区等则不是编码区的一部分。本发明的两个或多个编码区可存在于单个的多核苷酸构建体如在单个载体中，或分别存在于多核苷酸构建体如分别(不同)的载体中。此外，任何载体可含有单个编码区或可包含两个或多个编码区，如本发明的载体可编码一个或多个多肽，其通过蛋白酶裂解翻译后或共翻译分离出最终的多肽。此外，本发明的载体、多核苷酸、或核酸可编码异源编码区，可以融合或不融合到本发明的第一或第二编码区或其变体或衍生物。异源编码区包括不受限的特殊的元件或基序，如分泌的信号肽或异源功能域。

在某些实施方案中，多核苷酸或核酸为DNA。对于DNA，多核苷酸包括核酸，其通常编码包括启动子和/或其它转录或翻译控制元件可操作地与一个或多个编码区相连的多肽。当基因产物，如多肽的编码区可操作地与一个或多个调节序列连接时，这样在调控序列的影响或控制下进行基因产物的表达。如果启动子功能的诱导导致了编码所期望的基因产物的mRNA的诱导，如果两个DNA片段之间的自然的连接没有干扰表达调节序列直接表达基因产物的能力，或没有干扰的表达或转录DNA模板的能力，那么两个DNA片段(如多肽编码区和与之相连的启动子)是“可操作性地连接”的，因此，如果启动子可影响核酸的转录，那么启动子区是可操作性地与编码多肽的核酸相连。启动子可以为细胞特异性启动子，其基本上只在预定的细胞内的指导DNA的大量转录。除启动子外的其它的转录控制元件，如增强子、操作子、抑制子和转录终止信号可与多核苷酸可操作性地相连，以指导细胞特异性转录。本申请公开了合适的启动子和其它转录控制区域。

各种转录转录控制区域是本领域技术人员公知的。它们包括但不限于：在脊椎动物中发挥功能的转录控制区域，例如不限于巨细胞病毒的启动子和增强元件(如与内含子A相连的即刻早期启动子)、猴病毒40(如早期启动子)和逆转录病毒(如劳氏肉瘤病毒)。其它转录控制区域包括来自于脊椎动物基因，如肌动蛋白、热激蛋白、牛生长激素和兔β-球蛋白的启动子以及其它可在真核生物细胞中控制基因表达的序列。此外合适的转录控制区域包括组织特异性启动子和增强子以及淋巴因子可诱导启动子(如可被干扰素或白细胞介素诱导的启动子)。

同样的，各种翻译控制元件是本领域技术人员公知的。它们包括但不限于：核糖体结合位点、翻译起始和终止密码子和源自病毒系统的元件(特别为内部核糖体进入位点，或IRES，也被称为CITE序列)。

本发明的多核苷酸可包括RNA，如信使RNA(mRNA)形式的。本发明的RNA可以是单链或双链的。

本发明的多核苷酸和核酸编码区域可与其它的编码分泌或信号多肽的编码区域相关，其指导本发明多核苷酸编码的多肽分泌。根据信号假说，哺乳动物细胞分泌的蛋白具有信号肽或分泌前导序列，其在穿越粗面内质网的生长中蛋白链开始输出时裂解自成熟蛋白。本领域技术人员应当了解，通过脊椎动物的细胞分泌的多肽通常具有融合到多肽N-末端的信号肽，其裂解自全部或“全长”多肽中而产生分泌的或“成熟”形式的多肽。在某些实施方案中，使用了天然的信号肽如免疫球蛋白的重链或轻链信号肽，或使用与多肽可操作性相连、保留指导多肽分泌能力的序列的功能性衍生物。或者，可使用异源哺乳动物信号肽或其功能性衍生物。例如，野生型前导序列可被人组织型纤维蛋白溶酶原激活剂(TPA)或鼠β-葡糖酸醛酶的前导序列取代。

术语“构建体”是指非天然存在的核酸分子。构建体是编码融合多肽的多核苷酸。在一个实施方案中，构建体编码含有SFP或候选的SFP和目标多肽的融合多肽。构建体可进一步包括环状或线性载体，并可与其它多核苷酸组合，如进行同源重组。

如本申请所使用的，术语“载体”是指能够转运与其相连的另一个核酸的核酸分子。一种载体是“质粒”，它是指能连接其它DNA片段的环状双链DNA环。另一种载体是病毒载体，其中其它DNA片段可连接到该病毒基因组中。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌的复制起始区的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)一旦引入至宿主细胞后就整合至宿主细胞的基因组中从而随着宿主基因组复制。本发明的载体能够指导编码与它们可操作性连接的目标蛋白基因的表达。这些载体在本文中称为“表达载体”。一般而言，在重组DNA技术中有用的表达载体通常是质粒的形式。在本说明书中，“质粒”和“载体”可互换使用，因为质粒是载体的最常用形式。但是，本发明也包括具有相同功能的其它形式的表达载体，例如病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺伴随病毒)。

载体DNA可通过常规的转化或转染技术导入到原核或真核细胞内。如本申请所使用的，术语“转化”和“转染”是指各种本领域公知的将外源核酸(如DNA)引入到宿主DNA的技术，包括磷酸钙或氯化钙共沉淀法、DEAE-dextran介导的转染法、脂质体转染法或电转法。适合转化或转染宿主细胞的方法可见Sambrook等人的(MOLECULAR CLONING：A LABORATORYMANUAL.2nd ed.，Cold Spring Harbor Laboratory，Cold Spring Harbor LaboratoryPress，Cold Spring Harbor，N.Y.，1989)和其它实验室手册。

已知的是，哺乳动物细胞的稳定转染取决于表达载体和所用的转染技术，仅有一小部分的细胞可将外源DNA整合到其基因组中。为鉴定和选择这些整合体，通常将编码选择标记(如抗抗生素)的基因随目标基因一起导入到宿主细胞内。各种选择标记包括那些抗药标记，如G418、潮霉素和甲胺嘌呤。可将编码选择标记的基因和编码目标多肽的基因在同一个载体或在各自的载体上导入宿主细胞。用导入的核酸稳定地转染过的细胞可通过药物选择、营养缺陷型的选择、基质组合物、碳源选择或其它本领域公知的方法(如含有选择标记基因的成活，而其它细胞死亡)鉴别。

在一个实施方案中，编码本发明的方法中所使用的多肽或其片段或衍生物的核苷酸序列还可在5′端和3′端包含用于与本发明的线性载体进行体内同源重组的DNA。当5′端和3′端DNA共转化到宿主细胞内时，它们能提供足够的序列以允许编码多肽或其片段或衍生物的核苷酸序列和线性载体之间进行体内重组。在一个实施方案中，5′端和3′端DNA各自包含至少20个与线性载体序列重叠的碱基对，如至少30个或40个碱基对。可使用常规的重组技术添加5′和3′DNA，如PCR和/或限制性内切酶消化和连接。

本发明的多核苷酸还可编码亲和标签，如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、或S-标签。亲和标签可由连接DNA编码或由本发明其它部分的多核苷酸编码，如融合蛋白编码区域的5′或3′部分。

本发明的多核苷酸还可包括连接DNA。在一个实施方案中，连接DNA编码连接肽。

本发明的连接DNA可足够长，并与线性载体的核苷酸序列部分具有足够的一致性，从而在它们共转化到宿主细胞内后，允许编码多肽的核苷酸序列和线性载体之间发生体内重组。在一个实施方案中，连接DNA的长度至少为20个碱基对，或至少长度为30个或40个碱基对。在进一步的实施方案中，连接DNA至少与相应的线性载体的序列具有80％的一致性，例如至少85％、90％、95％或99％的一致性。

在一个实施方案中，连接DNA编码蛋白酶识别序列，从而允许在SFP和目标多肽的连接点发生裂解。例如，连接DNA可编码酵母kex2p-或Kex2样蛋白酶识别序列(如含有Lys-Arg、Arg-Arg或Leu-Asp-Lys-Arg(SEQ ID NO：74)的氨基酸)、哺乳动物弗林蛋白酶识别序列(如含有Arg-X-X-Arg的氨基酸序列)、因子Xa-识别序列(如含有Ile-Glu-Gly-Arg(SEQID NO：75)的氨基酸序列)、肠激酶-识别序列(如含有Asp-Asp-Lys的氨基酸序列)、枯草杆菌蛋白酶-识别序列(如含有Ala-Ala-His-Tyr(SEQ ID NO：76)的氨基酸序列)、烟草蚀刻病毒蛋白酶-识别序列(如含有Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO：77)的氨基酸)，泛素水解酶-识别序列(如含有Arg-Gly-Gly的氨基酸)或凝血酶-识别序列(如含有Arg-Gly-Pro-Arg(SEQ ID NO：78)的氨基酸)。

在连接子的蛋白酶位点内或在分泌多肽或目标多肽内，优选通过内源宿主蛋白酶避免融合多肽的不想要的裂解。同样，在目标多肽或分泌多肽或SFP或其片段或衍生物内，优选通过用于从目标多肽中裂解分泌多肽的蛋白酶避免裂解。因此，如果作为编码融合多肽的多核苷酸一部分，编码蛋白酶识别序列的连接DNA被转化入宿主细胞时，则所述宿主细胞优选不表达识别连接子内蛋白酶序列的蛋白酶。宿主细胞既可以天然地不表达蛋白酶，或宿主细胞也可以经过修饰而不表达蛋白酶(如kex2突变体宿主细胞、Kex2样蛋白酶突变体宿主细胞和弗林蛋白酶突变体宿主细胞)。如果融合多肽包含分泌多肽和目标多肽，则分泌多肽或SFP或其片段或衍生物和/或目标多肽可天然不包含宿主蛋白酶识别序列，或分泌多肽或SFP或其片段和衍生物和/或目标多肽可以经过修饰而不含有被宿主蛋白酶识别的序列。如果融合多肽包含分泌多肽或SFP或其片段或衍生物、目标多肽和含有蛋白酶识别序列的肽连接子，则分泌序列或SFP或其片段或衍生物和/或目标多肽可天然地不含有蛋白酶识别序列，或分泌多肽或SFP或其片段或衍生物和/或目标多肽可以经过修饰而不含有被肽连接子的蛋白酶识别的序列识别的序列。

在另一个实施方案中，连接DNA编码亲和标签，如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD或S-tag.

在进一步的实施方案中，连接DNA编码限制性内切酶识别位点和蛋白酶识别序列(如kex2p样蛋白酶或kex-2p-识别序列)。

原核生物中多肽表达的实施，可使用含有指导目标蛋白-报告蛋白融合的表达的组成型或诱导型启动子的载体。适合的大肠杆菌表达载体的实例包括pTrc(Amrann等，Gene69：301-315(1988))和pET(Studier等，GENE EXPRES SION TECHNOLOGY：METHODS INENZYMOLOGY 185，Academic Press，San Diego，Calif.(1990)60-89)。

为了在酵母细胞中表达，合适的酵母表达载体包括，但不限于pYepSecl(Baldari等，EMBO J.6：229-234(1987))，pMFa(Kurjan等，细胞30：933-943(1982))、pJRY88(Schultz等，Gene 54：113-123(1987))，pYES2(Invitrogen Corporation，San Diego，Calif.)和picZ(Invitrogen Corp，San Diego，Cal.)。

为了在昆虫细胞中表达，可使用杆状病毒表达载体。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等，Mol.Cell.Biol.3：2156-2165(1983))和pVL系列(Lucklow等，Virology 170：31-39(1989))。

在另一个实施方案中，宿主细胞是哺乳动物细胞而载体是哺乳动物表达载体。哺乳动物表达载体的实例包括pCDM8(Seed，Nature 329：840(1987))和pMT2PC(Kaufman等，EMBO J.6：187-195(1987))。当用于哺乳动物细胞时，表达载体的调控功能常常由病毒调控元件提供。例如，通常使用的启动子来源于多瘤腺病毒2、巨细胞病毒和猿猴病毒40。其它适合的用于原核和真核细胞两者的表达系统参见例如Sambrook等人，MOLECULAR CLONING：ALABORATORY MANUAL.2nd ed.，Cold Spring Harbor Laboratory，Cold Spring HarborLaboratory Press，Cold Spring Harbor，N.Y.，1989。

优选的载体包括但不限于：质粒、噬菌体、粘粒、游离基因、病毒颗粒或病毒和整合的DNA片段(例如通过同源重组可整合至宿主基因组的片段)。优选的病毒颗粒包括但不限于腺病毒、杆状病毒、细小病毒、疱疹病毒、痘病毒、腺相关病毒、塞姆利基森林病毒、痘苗病毒和逆转录病毒。优选的表达载体包括但不限于：pcDNA3(Invitrogen)和pSVL(PharmaciaBiotech)。其它表达载体包括但不限于：pSPORTTM载体、pGEMTM载体(Promega)、pPROEX载体TM(LTI、Besda、MD)、BluescriptTM载体(Strata基因)、pQETM载体(Qiagen)、pSE420TM(Invitrogen)和pYES2TM(Invitrogen)。

在一个实施方案中，表达载体是复制型DNA构建体，其中编码目标多肽的DNA序列可操作性地连接或结合至能够影响目标多肽在合适宿主中表达的合适调控序列中。当它们的功能彼此相关时，DNA区域可操作性地连接或结合。例如，如果启动子能调控该编码序列的转录，则将该启动子可操作性地连接或结合于编码序列。扩增载体不需要表达调控域，而相反，仅需要由复制起始区赋予的在宿主中进行复制的能力和帮助识别转化体的选择基因。表达载体对调控序列的需要取决于选择的宿主和选择的转化方法。一般来说，调控序列包括但不限于：转录启动子、增强子、控制转录的可选操纵子序列、多腺苷酸化信号、编码适合的结合核糖体的mRNA的序列和调控转录和翻译终止的序列。这些调控序列描述于例如，Goeddel，GENR EXPRESSION TECHNOLOGY：METHODS IN ENZYMOLOGY 185，Academic Press，San Diego，Calif.(1990)。调控序列包括那些在多种类型的宿主细胞中指导核苷酸序列的组成型表达和那些仅在特定宿主细胞中指导核苷酸序列表达(如组织特异性调控序列)的调控序列。本领域技术人员应当理解表达载体的设计取决于所选择的要转化的宿主细胞、预期的蛋白质表达的水平等等这些因素。

本发明的表达载体可导入宿主细胞从而制备蛋白质或肽，包括本文描述的由核酸编码的融合蛋白或肽。优选载体含有可被宿主生物体识别的启动子。

在一个实施方案中，本发明的启动子是强异源启动子，其用于重组制备外源多肽。异源启动子可以是诱导型或组成型启动子。优选异源启动子为那些用于常规制备蛋白质的启动子，如上文所述的那些。本发明的异源启动子可分为天然或野生型SFP启动子。

本发明的启动子序列可以是原核、真核或病毒的序列。合适的原核序列实例包括λ噬菌体的PR和PL启动子(The bacteriophage Lambda，Hershey，A.D.，Ed.，Cold SpringHarbor Press，Cold Spring Harbor，NY(1973)其以参阅的方式全文并入本申请；λII，Hendrix，R.W.，Ed.，Cold Spring Harbor Press，Cold Spring Harbor，NY(1980)，其以参阅的方式全文并入本申请)；大肠杆菌的trp、recA、热休克和lacZ启动子以及SV40早期启动子(Benoist等，Nature，290：304-310(1981)，其以参阅的方式全文并入本申请)。对于酵母，合适的启动子的实例包括但不限于：GAPDH、PGK、ADH、PHOS、GALI和GAL10。其它启动子包括但不限于：小鼠乳腺瘤病毒、人免疫缺陷症病毒长末端复制、maloney病毒、巨细胞病毒立即早期启动子、EB病毒(Epstein Bar virus)、劳氏肉瘤病毒、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌酸和人金属硫蛋白。

其它调控序列也可包括在优选的载体中。合适的调控序列的实例以噬菌体MS-2的复制酶基因和λ噬菌体的cII基因的夏因-达尔加诺序列为代表。

此外，合适的表达载体可包括允许筛选转化的宿主细胞的适当标记。所选宿主的转化使用本领域技术人员公知和先前Sambrook等人描述的各种技术中的任意一种来进行。

复制起始区还可通过构建载体以包括外源的起始区来提供或通过宿主细胞染色体复制机制提供，如果将载体整合入宿主细胞染色体，后者就足够了。或者，相比使用含有病毒复制起始区的载体，本领域技术人员可使用用选择性标记和目标蛋白DNA共转化的方法来转化哺乳动物细胞。合适标记的一个实例是二氢叶酸还原酶(DHFR)或胸苷激酶(参见美国专利4,399,216)。

编码目标蛋白的核苷酸序列可用载体DNA利用常规技术重组，包括平末端或粘末端(staggered)连接、限制性酶消化来提供适当的末端、适当补平粘性末端、碱性磷酸酶处理以避免非预期的连接以及用适当的连接酶连接。这些操作的技术先前由Sambrook等人公开且在本领域内公知。构建哺乳动物表达载体的方法公开于例如Okayama等人，Mol.Cell.Biol.3：280(1983)，Cosman等，Mol.Immunol.23：935(1986)，Cosman等，Nature312：768(1984)、EP-A-0367566和WO 91/18982，它们各自均以参阅的方式全文并入本申请。

本发明所用的宿主细胞可以是本领域技术人员公知的任何宿主细胞。合适的宿主细胞包括细菌、真菌、(例如酵母)、植物或动物(例如哺乳动物或昆虫)细胞。合适的酵母细胞包括念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体实例包括产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。其它合适的真菌包括曲霉属、青霉属、根霉属和木霉属。可用作宿主细胞的细菌包括埃希氏杆菌属、假单胞菌属和杆菌属。合适的植物宿主细胞包括拟南芥、玉米、烟草和马铃薯。动物细胞包括人、小鼠、大鼠、兔、狗、猫、猴和昆虫。实例包括CHO、COS1、COS 7、BSC1、BSC40、BMT 10和Sf9细胞。在一个具体的实施方案中，宿主细胞为酵母细胞。

本发明的多核苷酸可导入宿主细胞作为环状质粒的部分或作为包含分离蛋白质编码区域的线性DNA或病毒载体。本领域公知且常规进行的将DNA导入宿主细胞的方法包括转化、转染、电穿孔法、核注射或与载体如脂质体、胶束、血影细胞和原生质体融合。

任何可快速有效检测的报告蛋白可用于本发明。在一个实施方案中，为了使筛选过程自动化，报告蛋白具有可被积极选择的活性。在另一个实施方案中，报告蛋白是分泌至细胞外间隙的蛋白质，例如转化酶、蔗糖酶、纤维素酶、木聚糖酶、麦芽糖酶、淀粉酶、葡萄糖淀粉酶、半乳糖苷酶(例如α-半乳糖苷酶、β-半乳糖苷酶、蜜二糖酶)、磷酸酶(例如PHO5)、β-内酰胺酶、脂肪酶或蛋白酶。在一个具体的实施方案中，分泌蛋白允许细胞在特定底物上生长。作为哺乳动物细胞中报告基因系统的实例，CD2/新霉素-磷酸转移酶(Ceo)基因可用作含有抗生素G418的培养基中的分泌报告基因以捕获在小鼠胚胎干细胞中的分泌通路基因(De-Zolt等，Nucleic Acid Res.34：e25(2006))。

在一个实施方案中，宿主细胞是酵母，报告蛋白是转化酶，转化的酵母细胞根据它们在蔗糖或蜜三糖上生长的能力来选择。在另一个实施方案中，宿主细胞是酵母，报告蛋白是蜜二糖酶；转化的酵母细胞根据它们在蜜二糖上生长的能力来选择。在另一个实施方案中，宿主细胞是酵母，报告蛋白是淀粉酶(例如内淀粉酶、外淀粉酶、β-淀粉酶或葡萄糖淀粉酶)，酵母细胞是非淀粉分解的，转化的细胞根据它们降解淀粉的能力来筛选。在另一个实施方案中，鉴定具有报告蛋白活性的细胞的步骤通过使用具有生长抑制因子抗性的报告蛋白来进行，例如抗生素。在另一个实施方案中，报告蛋白是能够目测的蛋白质，例如绿色荧光蛋白或荧光素酶。在一个实施方案中，鉴定显示报告蛋白活性的细胞的步骤通过使用两个或多个报告蛋白例如脂肪酶和转化酶来进行。

本发明的宿主细胞不显示报告蛋白活性。在一个实施方案中，宿主细胞不天然表达报告蛋白。在其它实施方案中，编码报告蛋白的基因已被全部或部分缺失或已突变以使得报告蛋白不表达或以无活性形式表达。使一个细胞缺乏一种特定蛋白质的方法在本领域内公知；并且任何此种方法可用来制备本发明的宿主细胞(前述Sambrook等人)。对于酵母来说，报告蛋白缺乏可使用公知的基因置换技术来引入(Rothstein，Meth.Enzymol.194：281(1991))。

可使用本领域技术公知的技术从任何来源获得编码目标多肽的核酸，包括从基因组或cDNA中分离、通过PCR扩增或化学合成。

可从任何形式的DNA，包括基因组DNA、cDNA、合成的DNA和重组DNA获得核酸或其片段的文库。除DNA外，还可使用核酸，包括RNA和非天然存在的核酸。可通过多样化预先鉴定核酸片段，如单一缺失、突变、功能性序列的增加(如糖基化位点)或核酸片段之间的前和后信号序列的交换获得预先选定的核酸片段文库。在一个实施方案中，核酸片段大小小于1000碱基对，如小于700、500或300个碱基对。核酸片段的文库可通过DNA酶切割、DNA合成或重组DNA技术(如单一缺失、突变)构建。

核酸片段可源自生物的整个基因组，如整个基因组或cDNA文库。片段还可源自整个基因组的子集，如扣除文库或一定大小的文库(sized library)。

下列实施例用于说明而非限制本发明的方法和组合物。其它对在临床治疗中经常遇到的各种条件和参数的合适的修饰和调节对本领域技术人员显而易见的，也在本发明的精神和范围内。

实施例

实施例1确定胞外分泌用YGR106C基因的最佳大小

本实施例阐释了胞外分泌所需的YGR106的最佳区域。如图1A所示，YGR106C(下称分泌融合配偶体1，SFP1)蛋白(SEQ ID NO：1)由包含信号肽的256个氨基酸残基、三个糖基化位点、一个亲水性结构域(HL)和一个跨膜结构域组成。

在GAL10启动子的调控下过量表达完整的YGR106C基因在培养基中没有产生YGR106C蛋白。然而，在酵母GAL10启动子的调控下，使用C-末端截短形式的YGR106C，在培养基中高水平地分泌出截短的SFP1(SEQ ID NO：1的氨基酸1-213)。

确定用于分泌的SFP1基因最佳区域进一步鉴定。通过Kyte-Doolittle亲水性分析(图1A)确定几种SFP1蛋白的功能结构域，如分泌信号(SEQ ID NO：1的氨基酸1-19)、亲水结构域(HL)(SEQ ID NO：1的氨基酸176-213)和跨膜结构域(TM)(SEQ ID NO：1的氨基酸220-247)。

构建含有具有连续缺失的SFP1基因的不同载体的重组酿酒酵母(Saccharomycescerevisiae)2805菌株(Mat a ura3 INV2 pep4::HIS3 can1)并比较各个载体分泌的SFP1相关蛋白(图1B)。起初，为表达完整的SFP1蛋白，用PCR引物、含有BamHI位点的正向引物T9F(SEQ ID NO：2)和含有SalI位点的反向引物H159(SEQ ID NO：3)，从酿酒酵母2805基因组DNA扩增出SFP1的开放阅读框(ORF)。用Pfu聚合酶(Stratagene，USA)或Ex-Taq DNA聚合酶(TaKaRa Korea Biomedical Inc.，韩国首尔)进行PCR扩增。PCR条件包括：94℃变性5min，94℃进行25个扩增循环30sec，55℃30sec和72℃1min，最后72℃延伸7min。扩增出的SFP1ORF用BamHI-SalI酶切，再亚克隆到YEGα-HIR525的BamHI-SalI位点(Sohn等，ProcessBiochem.30：653(1995))，生成的质粒命名为YGaT91。

为表达C末端缺失TM结构域的截短SFP1蛋白，用正向引物T9F(SEQ ID NO：2)和反向引物H160(SEQ ID NO：4)，从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525，生成的质粒命名为YGaT92。

为表达C末端缺失一半HL结构域的截短的SFP1蛋白，用正向引物T9F(SEQ ID NO：2)和反向引物H161(SEQ ID NO：5)，从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525，生成的质粒命名为YGaT93。

为表达C末端缺失HL结构域的截短的SFP1蛋白，用正向引物T9F(SEQ ID NO：2)和反向引物H162(SEQ ID NO：6)，从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525，生成的质粒命名为YGaT94。

为表达C末端缺失第三个糖基化位点的截短的SFP1蛋白，用正向引物T9F(SEQ IDNO：2)和反向引物H205(SEQ ID NO：7)，从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525，生成的质粒命名为YGaT95。

为表达C末端缺失第二个糖基化位点的截短的SFP1蛋白，用正向引物T9F(SEQ IDNO：2)和反向引物H204(SEQ ID NO：8)，从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525，生成的质粒命名为YGaT96。

为表达C末端缺失第一个糖基化位点的截短的SFP1蛋白，用正向引物T9F(SEQ IDNO：2)和反向引物H203(SEQ ID NO：9)，从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525，生成的质粒命名为YGaT97。

用构建的载体(YGaT91、YGaT92、YGaT93、YGaT94、YGaT95、YGaT96和YGaT97)转化酿酒酵母2805菌株。从UD平板(0.67％无氨基酸酵母氮源、0.77g/l氨基酸混合物、2％葡萄糖和2％琼脂)上选择的单菌落于YPDG肉汤培养基(1％酵母提取物、2％细菌蛋白胨、1％葡萄糖、1％半乳糖)中30℃培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩，并通过SDS-PAGE分离。如图1C所示，只在携带YGaT92、YGaT93和YGaT94的细胞中检测到SFP1相关蛋白(分别为泳道2、3和4)。在所有的三个阳性菌株中均检测到两条带，一条为糖基化形式，另一条为非糖基化形式。但其它细胞，YGaT91、YGaT95、YGaT96和YGaT97没有这些条带(分别为泳道1、5、6和7)。该结果表明去除TM结构域并保留所含的所有三个糖基化位点使SFP1可进行胞外分泌。

实施例2确定作为融合配偶体用于分泌目标蛋白的SFP1基因的最佳大小

本实施例阐释了SFP1衍生物作为融合配偶体的应用。为测试SFP1衍生物作为融合配偶体用于示例性目标蛋白人白介素-2(hIL-2)的分泌，分别用YGaT92、YGaT93和YGaT94的三个SFP1衍生物(SFP1-92(SEQ ID NO：39)、SFP1-93(SEQ ID NO：40)和SFP1-94(SEQ IDNO：41))，构建了三个载体以表达融合蛋白hIL-2(图2A)。还生成了hIL-2和SFP1-91(SEQ IDNO：38)的融合蛋白，数据未示出。为了用YGaT92的SFP1-92融合hIL2基因，用识别GAL10启动子的正向引物GAL100(SEQ ID NO：10)和反向引物H121(SEQ ID NO：11)从YGaT92载体扩增出SFP1基因片段。为方便与hIL2基因融合从而诱导酵母二肽蛋白酶Kex2p体内裂解hIL2融合蛋白(Mizuno K等，Biochem.Biophys.Res.Commun.156：246(1988))，设计了H121引物(SEQ ID NO：11)以含有Kex2p裂解序列和N-末端hIL2序列。用含有与H121引物(SEQ ID NO：11)互补的部分SFP1序列的正向引物IL2F(SEQ ID NO：12)和反向引物IL2R(SEQ ID NO：13)扩增人IL-2基因。IL2R引物含有部分GAL7终止子序列。使用GAL100和GT50R(SEQ ID NO：14)引物，使扩增得到的含有SFP1-92和hIL-2基因的PCR片段通过重叠-衍生PCR进行融合。GT50R引物为识别GAL7终止子的反向引物。生成的PCR产物含有100bp的GAL10启动子和50bp的GAL7终止子侧翼序列。酿酒酵母作为表达宿主的一个优点在于可以使用有效和正确的同源重组策略。本领域公知的是线性化载体和在片段末端每一侧共有DNA序列重叠的的DNA片段可进行重组，恢复质粒的环状拓扑(Kunes等，Genetics.115：73(1987))。酿酒酵母的这一特性被用来构建表达宿主系统。

为使用YGaT92载体作为体内重组的骨架，将YGaT92载体用BamHI/SalI酶切。用凝胶回收试剂盒(Bioneer，韩国)从琼脂糖凝胶中回收线性化载体。用GAL100/GT50R引物扩增获得的PCR产物与线性化载体有50个共有的核苷酸。体内重组最小的要求为约30个核苷酸的重叠(Oldenberg等，Nucleic Acids Res.25：451(1997)。50个核苷酸的重叠足以在酿酒酵母中进行质粒的重新构建。通过共转化上述的PCR产物和载体片段直接构建酿酒酵母2805的重组子。通过重组构建的质粒命名为YGaT92-IL2(图24)。为构建转化YGaT93-IL2载体的酿酒酵母2805菌株，除了使用(SEQ ID NO：15)代替H121引物(SEQ ID NO：11)，我们使用与YGaT92-IL2质粒构建中相同的方法。H120引物为识别YGaT93载体的SFP1基因的3’末端并含有Kex2p裂解序列和hIL2的N-末端序列的反向引物。为用YGaT94-IL2载体转化酿酒酵母2805株，除了使用H119引物(SEQ ID NO：16)代替H121引物(SEQ ID NO：11)，使用如YGaT92-IL2质粒构建中相同的方法。H119引物为识别YGaT9载体的SFP1基因的3’末端并含有hIL2的N-末端序列的反向引物。

从UD平板(0.67％无氨基酸酵母氮源、0.77g/l氨基酸混合物、2％葡萄糖和2％琼脂)上选择的单菌落于YPDG肉汤培养基(1％酵母提取物、2％细菌蛋白胨、1％葡萄糖、1％半乳糖)中30℃培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩，并通过SDS-PAGE分离。如图2B所示，携带有YGaT92-IL2(SEQ ID NO：58)和YGaT93-IL2的细胞分泌出SFP1衍生蛋白和hIL2(分别为泳道1和2)，但携带YGaT94-IL2的细胞没有分泌(泳道3)。结果表明以融合形式表达时，HL结构域对于SFP1衍生蛋白的分泌是非常重要的。

实施例3融合有SFP1衍生物的目标蛋白的表达

实施例2中从YGaT92构建的SFP1-92(SEQ ID NO：39)用于分泌制备Exendin-4(EXD4)，一种胰高糖素样肽1(GLP1)的39个氨基酸的肽类似物。为简单和有效地纯化完整的EXD4蛋白，将6-组氨酸标签和肠激酶裂解位点(DDDDK(SEQ ID NO：79)，D：天冬氨酸，K：赖氨酸)加入到SFP1的C-末端。因而，N-末端至C-末端的融合蛋白包括SFP1片段、6-组氨酸标签、肠激酶裂解位点和EXD4序列。为构建表达SFP1-92EXD4融合蛋白的YGaT92-EXD4载体，用GAL100引物(SEQ ID NO：10)和反向引物HDK-R(SEQ ID NO：17)从YGaT92载体扩增出SFP1-92基因，所述的反向引物HDK-R识别HL序列并含有6个组氨酸密码子。用含有18个与HDK-R引物和DDDDK密码子互补的正向引物HDK-F(SEQ ID NO：18)和含有18个GT50R(SEQ ID NO：14)引物序列的反向引物EXD-R(SEQ ID NO：19)扩增出EXD4基因。扩增出的SFP1-92和EXD4基因用GAL100/GT50R引物对通过重叠-延伸PCR进行融合。如实施例2所述，通过共转化融合的片段和BamHI/SalI酶切的YGaT92载体片段在体内重组直接构建携带YGaT92-EXD4载体的酿酒酵母2805菌株的重组子。

将用YGaT92-EXD4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐，评价其诱导分泌制备SFP1-92-EXD4融合蛋白的能力。使用种子培养基(6.7％不含氨基酸的酵母氮源、0.5％酪蛋白水解物和2％葡萄糖)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基(4％酵母提取物、1％蛋白胨、2％葡萄糖)作为初始发酵培养物OD600达到约15时，根据细胞生长速率提供不同用量的补料培养基(15％酵母提取物、30％葡萄糖、30％半乳糖)。培养48小时后，培养物OD600达到约160。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图3A-B)。与标准蛋白条带相比，分泌的SFP1-EXD4估算约为500mg/L。离心去除酵母细胞，收集上清液，浓缩并超滤脱盐(Quickstand，Amersham)。

融合蛋白，SFP1-92-EXD4用Ni-NTA亲和层析柱(QIAGEN，USA)纯化(图4，泳道1)。为了从SFP1-92融合蛋白中回收EXD-4，纯化的融合蛋白用不同浓度的肠激酶(Invitrogen，USA)进行消化。将样品溶于肠激酶缓冲液[20mM Tris-HCl(pH8.0)、50mM NaCl、2mM CaCl2]中。将等量的蛋白样品用0.1、0.2和0.3μl的肠激酶于37℃消化1小时。生成的蛋白用SDS-PAGE进行分析(图4，分别为泳道2、3和4)。

产生了数条小的蛋白条带，而不是两个条带。那些小的片段有可能是肠激酶非特异性消化SFP1的结果。SFP1蛋白含有DDK(第137个氨基酸)和EDK(第168个氨基酸)残基，其有可能是肠激酶的底物。

为进一步分析从SFP1-92-EXD4分离的EXD-4，通过HPLC分离肠激酶处理后的样品(图4，泳道3)(图5A)。HPLC谱图中检测到的蛋白峰用SDS-PAGE进行分析(图5B)。HPLC流分号41显示出预期为EXD-4的单个条带。通过MALDI-TOF(Korea Basic Science Institute，Daejeon，韩国)(图6)进一步分析该蛋白用于确定其分子量(MW)。从SFP1-92融合蛋白中制备的EXD-4的MW为4187.8Da，这与通过其氨基酸序列计算得到的MW相符。

为构建抗肠激酶的强SFP1-92融合配偶体，将DDK和EDK残基分别变为DGK和EGK残基(图7A)。为将DDK残基变成DGK残基，用GAL100引物(SEQ ID NO：8)和含有甘氨酸密码子而不是DDK残基的天冬氨酸密码子的反向突变引物H307(SEQ ID NO：20)，从YGaT92-EXD4中扩增5’SFP1-92片段。用与H307(SEQ ID NO：20)互补的正向引物H306(SEQ ID NO：21)和GT50R引物(SEQ ID NO：14)，从YGaT92-EXD4载体中扩增3’SFP1-92-EXD4片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/SalI消化后，将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列，并命名为含有SFP1-921的YGaT921-EXD4(SEQ ID NO：42)。

为将EDK残基变成EGK残基，用GAL100引物(SEQ ID NO：10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309(SEQ ID NO：22)，从YGaT92-EXD4中扩增5’SFP1片段。用与H309(SEQ ID NO：22)互补的正向引物H308(SEQ ID NO：23)和GT50R引物(SEQ ID NO：14)，从YGaT92-EXD4中扩增3’SFP1-92-EXD4片段。用GAL100/GT50R引物对进行重叠延伸PCR融合这些片段。用BamHI/SalI消化后，将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列，并命名为含有SFP 1-922的YGaT922-EXD4(SEQ ID NO：43)。

为了分别将DDK和EDK残基都变成DGK和EGK，用GAL100引物(SEQ ID NO：10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309(SEQ ID NO：22)，从YGaT91-EXD4中扩增5’SFP1片段。用与H309(SEQ ID NO：22)互补的正向引物H308(SEQ IDNO：23)和GT50R引物(SEQ ID NO：14)，从YGaT92-EXD4中扩增3’SFP1-EXD4片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/SalI消化后，将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列，并命名为含有SFP1-923的YGaT922-EXD4(图25)(SEQ ID NO：44)。

用载体YGaT92-EXD4、YGaT921-EXD4、YGaT922-EXD4和YGaT923-EXD4转化酿酒酵母2805菌株。从UD平板(0.67％无氨基酸酵母氮源、0.77g/l氨基酸混合物、2％葡萄糖和2％琼脂)上选择的单菌落于YPDG肉汤培养基(1％酵母提取物、2％细菌蛋白胨、1％葡萄糖、1％半乳糖)中30℃培养40小时。用0.4mL的丙酮沉淀含有蛋白的0.6mL培养物上清液，并溶于肠激酶缓冲液[20mM Tris-HCl(pH8.0)、50mM NaCl、2mM CaCl2]中。将等量的蛋白样品用0.1μl的肠激酶37℃消化1小时，并用SDS-PAGE进行分离。

如图7B所示，由YGaT92-EXD4转化子制备的SFP1被消化成大约15kDa的片段(图7B，泳道1)，但由YGaT921-EXD4和YGaT922-EXD4转化子制备的SFP1(图7B，分别为泳道2和3)比来自于YGaT92-EXD4的SFP1更抗内源肠激酶的消化。最终，由YGaT923-EXD4(SEQ ID NO：59)转化子制备的绝大多数的SFP1片段是完整的(图7B，泳道4)。因此，结果表明，YGaT923-EXD4的SFP1变体可成功应用于表达和纯化目标蛋白。

实施例4与SFP1的HL结构域融合的目标蛋白的分泌

如实施例2所示，HL结构域在目标蛋白的分泌中发挥着重要作用。HL在目标蛋白分泌中的功能可能是由于HL结构域内带电荷的酸性氨基酸，因为蛋白的可溶性与蛋白的净电荷紧密相关。为研究HL结构域作为融合配偶体的功能，我们使用HL结构域用于EXD4的分泌。

HL结构域融合到目标蛋白的N-末端。用H221(SEQ ID NO：24)/GT50R(SEQ ID NO：14)引物对从YGaT923-EXD4载体中扩增HL-EXD4基因，并用GAL100/LNK-R(SEQ ID NO：25)引物对扩增交配因子α(MFα)的pre-pro前导肽。由于H221和LNK-R引物(SEQ ID NO：25)含有互补的连接序列，这两个片段用GAL100(SEQ ID NO：8)/GT50R(SEQ ID NO：14)引物对通过重叠延伸PCR方法进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaMKH-EXD4(图26)转化子。YGaMKH-EXD4质粒在MFα的pre-pro前导肽和HL肽之间含有连接肽(AASASAGLALDKR)，用于体内被Kex2p加工。用YGaMKH-EXD4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备SFP1-92-EXD4融合蛋白的能力。使用种子培养基(6.7％不含氨基酸的酵母氮源、0.5％酪蛋白水解物和2％葡萄糖e)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基(4％酵母提取物、1％蛋白胨、2％葡萄糖)作为初始发酵培养物OD600达到约15时，根据细胞生长速率使用不同用量的补料培养基(15％酵母提取物、30％葡萄糖、30％半乳糖)。培养48小时后，培养物OD600达到约150。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图8)。与标准蛋白条带相比，分泌的HL-EXD4经估算约为200mg/L。

为测试HL肽的C-末端融合到目标蛋白的效果，构建质粒YGaST6-EXD-HL(图27)。用正向引物H412(SEQ ID NO：26)和反向引物H413(SEQ ID NO：27)从YGaMKH-EXD4中扩增出EXD4基因，并用HL-F(SEQ ID NO：28)和HL-GT50R(SEQ ID NO：29)从YGaMKH-EXD4中扩增出HL肽。由于H413引物(SEQ ID NO：27)含有与HL-F引物互补的序列，因此这两个片段用H412(SEQ ID NO：26)/GT50R引物对通过段重叠延伸PCR的方法进行融合。H412引物(SEQ ID NO：26)含有连接序列，并可以通过GAL100(SEQ ID NO：10)/LNK-R(SEQ ID NO：25)引物对融合到MFα的pre-pro前导肽中。每个扩增的片段以MFα的pre-pro前导序列、EXD4和HL结构域基因的顺序用GAL100/GT50R引物通过重叠延伸PCR进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaST6-EXD-HL转化子。用YGaST6-EXD4-HL转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备EXD4-HL融合蛋白的能力。培养48小时后，培养物OD600达到约160。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图9A和B)。与标准蛋白条带相比，分泌的EXD4-HL估算约为500mg/L。在HL融合到EXD4这种情况下，C-末端融合表现出比N-末端融合更高的EXD4分泌水平。因此，结果表明HL结构域无论是在目标蛋白的N-末端还是C-末端均有助于融合蛋白的分泌。然而，C-末端表现出更高的目标蛋白的分泌。

为进一步测试作为融合配偶体的HL结构域，将HL结构域用于表达人表皮生长因子(hEGF)。构建YGaMKH-EGF质粒(图28)。在YGaMKH-EGF中，HL结构域融合到hEGF的N-末端，用GAL100(SEQ ID NO：10)/DDK-R(SEQ ID NO：30)引物对从YGaMKH-EXD4载体中扩增MFα pre-pro肽-HL融合肽基因，并用含有与DDK-R引物互补的序列的正向引物H410(SEQ ID NO：31)和含有与GT50R(SEQ ID NO：14)相同的序列的反向引物H411(SEQ ID NO：32)扩增hEGF基因。每个扩增片段用GAL100/GT50R引物对通过重叠延伸PCR进行融合。用所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段共转化YGaMKH-EGF转化子。

用YGaMKH-EGF转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备HL-EGF融合蛋白的能力。培养48小时后，培养物OD600达到约155。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图10A和B)。与标准蛋白条带相比，分泌的HL-EGF估算约为400mg/L。

通过Ni-NTA亲和层析对HL-hEGF融合蛋白直接进行纯化(图11A)。为分离hEGF和HL肽，纯化后的融合蛋白用肠激酶进行消化，产生的片段再次用Ni-NTA亲和层析进行分离。如图11B所示，完整的纯hEGF(6kD)被有效地纯化出来。

HL结构域还用于分泌制备人甲状旁腺素(hPTH)。通过将HL结构域融合到hPTH的N-末端构建YGaMKH-PTH载体(图29)。用含有与DDK-R引物(SEQ ID NO：30)互补的序列的正向引物H310(SEQ ID NO：33)和含有与GT50R(SEQ ID NO：14)相同的序列的反向引物H311(SEQID NO：34)扩增hPTH基因。用GAL100(SEQ ID NO：10)/GT50R(SEQ ID NO：14)引物对通过重叠延伸PCR将这个片段和MFαpre-pro肽-HL融合肽基因进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaMKH-PTH转化子。用YGaMKH-PTH转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备HL-PTH融合蛋白的能力。培养48小时后，培养物OD600达到约120。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图12A和B)。与标准蛋白条带相比，分泌的HL-PTH估算约为400mg/L。检测到与HL-PTH相关的两条主要的条带。大部分的hPTH是以60kD的MFαpro-HL-PTH融合形式被检测到，这是由于其在体内被Kex2p不完全裂解。也同样检测到了显示Kex2p裂解的HL-PTH条带。与PTH相关的所有分泌蛋白估计大于500mg/L。发酵液上清液中的His标记蛋白通过Ni-NTA亲和层析直接进行纯化。纯化的蛋白在SDS-PAGE中分离出预期的两种条带(图13，泳道1)。比较大的条带(Pro-HL-PTH)通过体外Kex2p加工后消失了(图13，泳道2)。通过肠激酶的消化，融合蛋白(HL-PTH)被正确分离成HL肽和hPTH肽(泳道3)。

实施例1-4表明鉴定和修饰YGR106C基因的最佳区域导致了衍生自SFP1的有效多功能融合配偶体的构建，用于重组蛋白分泌制备和分离。

实施例5从酵母分泌蛋白质组中筛选分泌融合配偶体

本实施例阐明了用于鉴定作为融合配偶体的大量分泌蛋白的技术。

首先，分析正常酵母生长过程中，制备的总酵母分泌蛋白(酵母分泌蛋白质组)。为分离酵母分泌蛋白质组，将酿酒酵母2805菌株培养于基本培养基中(0.67％不含氨基酸的酵母氮源、0.5％酪蛋白水解物、2％葡萄糖和0.002％尿嘧啶)20小时(M1)和40小时(M2)。500mL的培养物上清液通过膜过滤进行浓缩，获得总分泌蛋白。用荧光染料hochest将酵母细胞染色后，用共焦激光扫描显微镜证实酵母细胞的完整性(图14A和B)。

M2分泌蛋白质组样品通过双向凝胶电泳进行分析(图15)。除了用于去除总蛋白样品中的核糖核酸污染而加入的RNaseA，分泌蛋白质组的大多数蛋白在酸性区进行鉴定。如图15所示，双向凝胶电泳不足以鉴定所有M2样品中存在的分泌蛋白。因此，还使用1-DE/MudPIT(多维蛋白质鉴定技术)方法来更加完整地鉴定酵母的分泌蛋白质组(图16)。结果表明，分别从M1和M2中鉴定出57个和83个蛋白。综合起来，鉴定出98个特异的蛋白。这中间，有42个蛋白是M1和M2样品中普遍检测到的。为证实该蛋白最有可能是分泌蛋白，使用两个程序WoLF PSORT和pTARGET进行蛋白的定位预测和信号预测。在42个蛋白中，预测有35个蛋白(80％)为分泌蛋白(表1)。

表1通过酵母分泌蛋白质组分析鉴定出的35个基因以及通过MASS分析确定的其蛋白丰富指数(PAI)。

	Gi编号	标准命名	系统命名	PAI
					1	6320260	PST1	YDR055W	15.4
2	6323331	EXG1	YLR300W	9.9
					3	6321718	SCW4	YGR279C	9.1
4	6324169	YGP1	YNL160W	7.2
					5	6321721	BGL2	YGR282C\	5.8
6	6324419	ZPS1	YOL154W	5.1
					7	6319552	ECM33	YBR078W	4.2
8	6323964	SCW10	YMR305C	3.4
					9	6323871	GAS3	YMR215W	3.4
10	6323967	GAS1	YMR307W	2.8
					11	6322895	UTH1	YKR042W	2.5
12	6323150	YPS3	YLR121C	2.2
					13	6319638	TOS1	YBR162C	2.2
14	6321628	CRH1	YGR189C	2.2
					15	6322754	CWP1	YKL096W	1.5
16	6324002	EGT2	YNL327W	1.5
					17	6324395	DSE4	YNR067C	1.5
18	6322303	CIS3	YJL158C	1.5
					19	6322068	SIM1	YIL123W	1.2
20	6324543	GAS5	YOL030W	1.0
					21	6323014	BPT1	YLL015W	1.0
22	6322864	PRY2	YKR013W	0.7
					23	6319568	PHO3	YBR092C	0.7
24	6321906	BZZ1	YHR114W	0.7
					25	6323288	HSP60	YLR259C	0.7
26	6323139	CCW12	YLR110C	0.6
					27	6323423	CCW14	YLR390W-A	0.6
28	6323009	KNS1	YLL019C	0.6
					29	6321410	SCW11	YGL028C	0.5

30	6322290	N/A	YJL171C	0.5
					31	6322287	KRE9	YJL174W	0.3
32	6322684	PIR1	YKL164C	0.3
					33	6324263	SUN4	YNL066W	0.2
34	6321496	SPR3	YGR059W	0.2
					35	6322753	CWP2	YKL096W-A	0.2

许多分泌蛋白被鉴定为细胞壁蛋白和GPI(糖基化磷脂酰肌醇)锚定蛋白。通过与分泌蛋白的数量成正比的PAI(蛋白丰富指数)确定大量分泌的蛋白(Rappsilber等，GenomeRes.12：1231-45(2002))。基于这种分析，筛选出20个大量分泌蛋白。

用19条不同的正向引物(SEQ ID NO：35)和反向引物(SEQ ID NO：36)从基因组DNA中扩增19个大量分泌蛋白的基因。扩增的DNA片段的5′和3′端分别含有一段与部分的GAL10启动子和GAL7终止子同源的序列，如上所述，用于和EcoRI-SalI消化的YEGα-HIR525进行体内重组。通过转化线性化载体和PCR片段，经过体内重组易于获得酵母转化子。从19个不同的PCR片段中获得的20个不同的转化子培养于YPDG培养基中(1％酵母提取物、2％蛋白胨、1％葡萄糖和1％半乳糖)。300μL的各个培养物上清液用丙酮浓缩。每个丙酮浓缩的培养物上清液用SDS-PAGE分析，结果如图17A所示。

为了将优良的候选SFP与较差的候选区别开来，通过与野生型蛋白分泌水平相比，确定强启动子下的大量分泌蛋白的分泌水平。与图17A中的泳道WT所示的野生型蛋白分泌水平相比，用强启动子表达出的受试蛋白的子集(11个)的条带特别强，表明蛋白过量分泌到培养物上清液中。糖苷酶、Endo-H处理每个样品产生了与从各蛋白的氨基酸序列中预期一致的合适蛋白大小(图17B)，表明绝大多数的过量分泌蛋白是糖基化的。将19个选择出的大量分泌蛋白中的11个即BGL2(SEQ ID NO：80)、GAS3(SEQ ID NO：81)、GAS5(SEQ ID NO：82)、PST1(SEQ ID NO：83)、SCW4(SEQ ID NO：84)、SCW10(SEQ ID NO：85)、SIMI(SEQ ID NO：86)、UTH1(SEQ ID NO：87)、YGP1(SEQ ID NO：88)、YPS1(SEQ ID NO：89)和ZPS1(SEQ ID NO：90)，作为用于异源蛋白分泌的候选SFP进行测试。这11个蛋白由下述的多核苷酸编码：BGL2(SEQ ID NO：62)、GAS3(SEQ ID NO：63)、GAS5(SEQ ID NO：64)、PST1(SEQ ID NO：65)、SCW4(SEQ ID NO：66)、SCW10(SEQ ID NO：67)、SIM1(SEQ ID NO：68)、UTH1(SEQ ID NO：69)、YGP1(SEQ ID NO：70)、YPS1(SEQ ID NO：71)和ZPS1(SEQ ID NO：72)。

使用编码各自融合到EXD4的11个过量表达蛋白的多核苷酸的开放阅读框构建融合蛋白的载体。检测11个融合蛋白分泌到培养物上清液中的水平。如图17中从产生各蛋白的各个转化子中获得YGa-ORF载体。为了构建各个融合蛋白的表达载体，用引物GAL100(SEQID NO：10)和11条不同的反向引物(SEQ ID NO：37)从11个含有不同ORF的YGa-ORF载体中扩增11个PCR片段。扩增的DNA片段的5′和3′端分别含有一段与GAL10启动子和毒蜥外泌肽(exendin)-4同源的序列。该11个PCR片段和用引物EXD-F(SEQ ID NO：46)和GT50R(SEQ IDNO：14)从YGaT92-EXD4扩增的毒蜥外泌肽-4作为模板进行11个不同的重叠延伸PCR，所用引物分别为GAL100(SEQ ID NO：10)和GT50R(SEQ ID NO：14)。将每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按如上方式进行转化。每个转化中的两个转化子培养于YPDG培养基(1％酵母提取物、2％蛋白胨、1％葡萄糖和1％半乳糖)中40小时。0.6mL的上清液样品用0.4mL的丙酮浓缩并用SDS-PAGE分析，结果如图18所示。发现6个融合蛋白(GAS3-EXD4、GAS5-EXD4、PST1-EXD4、SCW4-EXD4、YGP1-EXD4和YPS1-EXD4)被有效地分泌到胞外的培养基中。

实施例5表明，从酵母分泌蛋白质组中筛选出的大量分泌蛋白可有效作为分泌融合配偶体用于重组蛋白的分泌制备。尽管实施例5使用的是酵母分泌蛋白，但可使用如本申请说明书中所述的任何生物体的分泌多肽。如本实施例所示，本发明的筛选方法是鉴定SFP的有效方法，因为它将可能的候选SFP从35个分泌蛋白缩小到了11个，而其中的6个被证实是有效的SFP。

实施例6确定作为融合配偶体的SCW4基因的最佳大小

本实施例阐明了作为融合配偶体用于分泌目标蛋白如毒蜥外泌肽-4的SCW4最佳大小的确定。基于Kyte-Doolittle亲水性分析，构建了8个SCW4缺失克隆(图19A)。用GAL100(SEQ ID NO：10)和8个各自含有6个组氨酸序列的不同的反向引物H453-H460(SEQ ID NOs：47-54)扩增8个SCW4片段。分别使用引物GAL100(SEQ ID NO：10)和GT50R(SEQ ID NO：14)，通过重叠延伸PCR将扩增片段和用正向引物(SEQ ID NO：55)和GT50R(SEQ ID NO：14)从YGaT92-EXD4扩增出的EXD4基因进行融合。每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按上述实施例中所述的方法进行转化。8个不同转化子的三个克隆培养于YPDG培养基(1％酵母提取物、2％蛋白胨、1％葡萄糖和1％半乳糖)中。对每个样品的10μL肉汤培养物(不经浓缩)直接用SDS-PAGE分析。结果如图19B所示，含有不同SCW4的C-末端片段的SCW4-1、SCW4-2、SCW4-3和SCW4-4作为融合配偶体表现出分泌EXD4的强活性。作为融合配偶体用于分泌EXD4的最佳SCW4大小为小于整个SCW4蛋白(380个氨基酸)的169个氨基酸。

用YGaSCW4-1-EXD4(图30)和YGaSCW4-3-EXD4(图31)转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备融合蛋白的能力。培养48小时后，培养物OD600达到约130。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图20)。与标准蛋白条带相比，分泌的SCW4-1-EXD4(SEQ ID NO：60)和SCW4-3-EXD4(SEQ ID NO：61)估算约为3g/L以上。

为测试SCW4蛋白对肠激酶的抗性，发酵液不经纯化用肠激酶37℃消化1小时。融合蛋白被正确分离成SCW4蛋白和毒蜥外泌肽-4肽，结果如图21所示。因此，这些结果表明修饰的SCW4融合配偶体显著地提高了毒蜥外泌肽-4蛋白的产量并简化了纯化方法。

测试了SCW4作为一般的融合配偶体用于分泌其它蛋白的有效性。使用SCW4-1、SCW4-2、SCW4-3和SCW4-4来分泌制备人生长激素(hGH)。用正向引物(SEQ ID NO：56)和反向引物(SEQ ID NO：57)扩增hGH基因。该片段侧接于一段6个组氨酸和GAL7终止子序列。分别使用GAL100(SEQ ID NO：10)和GT50R(SEQ ID NO：14)引物通过重叠延伸PCR，将PCR扩增得到的SCW4-1、-2、-3和-4片段和hGH基因进行融合。每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按上述方法进行转化。4个不同转化子的2个克隆培养于YPDG培养基(1％酵母提取物、2％蛋白胨、1％葡萄糖和1％半乳糖)中。每个样品的10μL肉汤培养物(不经浓缩)直接用SDS-PAGE分析。结果如图22A所示，每个样品检测到不同大小的SCW4-hGH融合蛋白条带。为确认融合蛋白，培养液上清液用肠激酶37℃消化1小时，用于裂解融合蛋白。从SCW4-1-hGH、SCW4-2-hGH和SCW4-4-hGH重新获得了hGH正确的大小(图22B)。因此，SCW4的N-末端片段作为融合配偶体在分泌hGH以及EXD4方面表现出强活性。

用YGaSCW4-2-hGH(图32)转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐，用于测定诱导分泌制备融合蛋白的能力。培养48小时后，在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图23)。与标准蛋白条带相比，分泌的SCW4-2-hGH(SEQ ID NO：73)估算约为3g/L以上。

因此，实施例6的结果表明，SCW4和其片段作为融合配偶体可有效用于目标蛋白的重组表达，并可用于目标蛋白的大量制备。

工业实用性

本发明提供使用分泌融合配偶体超量分泌制备和有效纯化各种重组蛋白的方法，所述的分泌融合配偶体可通过分析分泌蛋白质组获得。重组蛋白与分泌融合配偶体以融合蛋白的形式在细胞外制备，并可通过体外的蛋白酶处理分离重组蛋白。本申请所述的SFP极大地提高了目标蛋白和多肽的分泌水平，有助于生物制药和生物产业。本发明的选择/筛选方法使得可对作为SFP的蛋白和该蛋白的片段和衍生物进行选择。通过本发明的选择/筛选方法选择出的SFP提高了用于生物制药和生物产业的蛋白重组制备。本发明还包括已经鉴定出的SFP和其片段和衍生物。

虽然已对本发明做出了完整的说明，但本领域技术人员应当理解，在不影响本发明范围或其任何实施方案下，在条件、制备和其它参数的较宽和等同范围内，同样可以实施。本申请中所引用的所有专利、专利申请和出版物均以引文形式全文并入本申请。

序列表

<110>韩国生命工学研究院

<120>大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中的应用

<130>OPA08114/PCT

<160>90

<170>PatentIn version 3.3

<210>1

<211>265

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>1

Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys

1 5 10 15

Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser

20 25 30

Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile

35 40 45

Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val

50 55 60

Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Asn Leu Met Ile Asp Glu

65 70 75 80

Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr

85 90 95

Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile

100 105 110

Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu

115 120 125

Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe

130 135 140

Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser

145 150 155 160

Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val

165 170 175

Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu

180 185 190

Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys

195 200 205

Glu Gly Asp Asp Asp Ile Leu Ser Ser Ile Trp Thr Glu Gly Leu Leu

210 215 220

Met Cys Leu Ile Val Ser Ala Leu Leu Leu Phe Ile Leu Ile Val Ala

225 230 235 240

Leu Ser Trp Ile Ser Asn Leu Asp Ile Thr Tyr Gly Ala Leu Glu Lys

245 250 255

Ser Thr Asn Pro Ile Lys Lys Asn Asn

260 265

<210>2

<211>24

<212>DNA

<213>人工序列

<220>

<223>合成的引物T9F

<400>2

ggatccatgg tgttcggtca gctg 24

<210>3

<211>39

<212>DNA

<213>人工序列

<220>

<223>合成的引物H159

<400>3

cactccgttc aagtcgactt aattgttttt ttttattgg 39

<210>4

<211>41

<212>DNA

<213>人工序列

<220>

<223>合成的引物H160

<400>4

cactccgttc aagtcgactt aatcatcgtc gccttcttta c 41

<210>5

<211>39

<212>DNA

<213>人工序列

<220>

<223>合成的引物H161

<400>5

cactccgttc aagtcgactt actcttctgt tgcatattc 39

<210>6

<211>40

<212>DNA

<213>人工序列

<220>

<223>合成的引物H162

<400>6

cactccgttc aagtcgactt aaaaagccca accaagagag 40

<210>7

<211>32

<212>DNA

<213>人工序列

<220>

<223>合成的引物H205

<400>7

atcggtcgac ttagtcgcca gatttatctt cc 32

<210>8

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物H204

<400>8

atcggtcgac ttaatcatct aaggagtatt catatag 37

<210>9

<211>33

<212>DNA

<213>人工序列

<220>

<223>合成的引物H203

<400>9

atcggtcgac ttaatcgtca tgaacagtta aac 33

<210>10

<211>21

<212>DNA

<213>人工序列

<220>

<223>合成的引物GALL00

<400>10

gtatatggtg gtaatgccat g 21

<210>11

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物H121

<400>11

tcttttatct aaggcgagat catcgtcgcc ttctttac 38

<210>12

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物IL2F

<400>12

ctcgccttag ataaaagagc acctacttca agttctac 38

<210>13

<211>39

<212>DNA

<213>人工序列

<220>

<223>合成的引物IL2R

<400>13

gtcactccgt tcaagtcgac ctaagttagt gttgagatg 39

<210>14

<211>50

<212>DNA

<213>人工序列

<220>

<223>合成的引物GT50R

<400>14

gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50

<210>15

<211>36

<212>DNA

<213>人工序列

<220>

<223>合成的引物H120

<400>15

tcttttatct aaggcgagct cttctgttgc atattc 36

<210>16

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物H119

<400>16

tcttttatct aaggcgagaa aagcccaacc aagagag 37

<210>17

<211>44

<212>DNA

<213>人工序列

<220>

<223>合成的引物HDK-R

<400>17

gtcatcgtca ccgtggtgat ggtgatgatg gctcaaagtc tctt 44

<210>18

<211>42

<212>DNA

<213>人工序列

<220>

<223>合成的引物HDK-F

<400>18

caccacggtg acgatgacga taaacatggt gaaggtactt tc 42

<210>19

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物EXD-R

<400>19

gtcactccgt tcaagtcgac ttaagatggt ggtggag 37

<210>20

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的引物H307

<400>20

gatgctttta ccatctaagg agtattcata 30

<210>21

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的引物H306

<400>21

tccttagatg gtaaaagcat cgttttgttc 30

<210>22

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的引物H309

<400>22

cgccagattt accttccaaa aacgataagc 30

<210>23

<211>30

<212>DNA

<213>人工序列

<220>

<223>合成的引物H308

<400>23

tttttggaag gtaaatctgg cgacaatttg 30

<210>24

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物H221

<400>24

ctcgccttag ataaaagagt tattaactct cttggttg 38

<210>25

<211>54

<212>DNA

<213>人工序列

<220>

<223>合成的引物LNK-R

<400>25

cttttatcta aggcgaggcc agcagaggcc gaggcggcca ccccttcttc ttta 54

<210>26

<211>36

<212>DNA

<213>人工序列

<220>

<223>合成的引物H412

<400>26

ctcgccttag ataaaagaca tggtgaaggt actttc 36

<210>27

<211>36

<212>DNA

<213>人工序列

<220>

<223>合成的引物H413

<400>27

accaagagag ttaataacag atggtggtgg agcacc 36

<210>28

<211>20

<212>DNA

<213>人工序列

<220>

<223>合成的引物HL-F

<400>28

gttattaact ctcttggttg 20

<210>29

<211>40

<212>DNA

<213>人工序列

<220>

<223>合成的引物HL-GT50R

<400>29

cactccgttc aagtcgactt agtggtgatg gtgatgatgg 40

<210>30

<211>24

<212>DNA

<213>人工序列

<220>

<223>合成的引物DDK-R

<400>30

cttatcgtca tcgtcaccgt ggtg 24

<210>31

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物H410

<400>31

ggtgacgatg acgataagaa ctccgactcc gagtgtc 37

<210>32

<211>36

<212>DNA

<213>人工序列

<220>

<223>合成的引物H411

<400>32

cactccgttc aagtcgactt actatcatct cagctc 36

<210>33

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物H310

<400>33

ggtgacgatg acgataagtc tgtgagtgaa atacagc 37

<210>34

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物H311

<400>34

cactccgttc aagtcgactt actgggattt agctttag 38

<210>35

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<220>

<221>misc_feature

<222>(20)..(37)

<223>n为a，c，g，或t

<400>35

gaaaattcaa gaattcatgn nnnnnnnnnn nnnnnnn 37

<210>36

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<220>

<221>misc_feature

<222>(21)..(38)

<223>n为a，c，g，或t

<400>36

actccgttca agtcgactta nnnnnnnnnn nnnnnnnn 38

<210>37

<211>36

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<220>

<221>misc_feature

<222>(19)..(36)

<223>n为a，c，g，或t

<400>37

gaaagtacct tcaccatgnn nnnnnnnnnn nnnnnn 36

<210>38

<211>798

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-91

<400>38

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatgata acaacaaggg taaagaaggc gacgatgata ttttaagctc catctggact 660

gaaggactac taatgtgttt aatagtttct gcgttgctat tgttcatttt gattgttgca 720

ctttcttgga tatctaattt ggatatcaca tatggtgcgt tggaaaaatc aacaaaccca 780

ataaaaaaaa acaattaa 798

<210>39

<211>639

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-92

<400>39

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatgata acaacaaggg taaagaaggc gacgatgat 639

<210>40

<211>591

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-93

<400>40

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga g 591

<210>41

<211>552

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-94

<400>41

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt tt 552

<210>42

<211>639

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-921

<400>42

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatgata acaacaaggg taaagaaggc gacgatgat 639

<210>43

<211>639

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-922

<400>43

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatgata acaacaaggg taaagaaggc gacgatgat 639

<210>44

<211>639

<212>DNA

<213>人工序列

<220>

<223>修饰后的酵母SFP1-923

<400>44

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatgata acaacaaggg taaagaaggc gacgatgat 639

<210>45

<211>114

<212>DNA

<213>人工序列

<220>

<223>合成的修饰后的HL结构域

<400>45

gttattaact ctcttggttg ggcttttgaa gatgaagatg gtgacgatga atatgcaaca 60

gaagagactt tgagccatca tgataacaac aagggtaaag aaggcgacga tgat 114

<210>46

<211>18

<212>DNA

<213>人工序列

<220>

<223>合成的引物EXD-F

<400>46

catggtgaag gtactttc 18

<210>47

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>47

cgtggtgatg gtgatgatga gcagcagcgg tagctac 37

<210>48

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>48

cgtggtgatg gtgatgatgg gaggctggag atgcggc 37

<210>49

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>49

cgtggtgatg gtgatgatga cctctgacac cagaggc 37

<210>50

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>50

cgtggtgatg gtgatgatgg tacaatctaa tgactgg 37

<210>51

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>51

cgtggtgatg gtgatgatgg tagtaaatac ctaaaaag 38

<210>52

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>52

cgtggtgatg gtgatgatgt tcgttaccaa tggaaac 37

<210>53

<211>37

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>53

cgtggtgatg gtgatgatgg ttgttgatca cagcaat 37

<210>54

<211>38

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>54

cgtggtgatg gtgatgatgg aaggcagtga ataagaag 38

<210>55

<211>54

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>55

catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttc 54

<210>56

<211>54

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>56

catcatcacc atcaccacgg tgacgatgac gataagttcc caaccattcc ctta 54

<210>57

<211>39

<212>DNA

<213>人工序列

<220>

<223>合成的引物

<400>57

cactccgttc aagtcgactt agaagccaca gctgccctc 39

<210>58

<211>1059

<212>DNA

<213>人工序列

<220>

<223>合成的YG2T92-IL2

<400>58

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatgata acaacaaggg taaagaaggc gacgatgatc tcgccttaga taaaagagca 660

cctacttcaa gttctacaaa gaaaacacag ctacaactgg agcatttact gctggattta 720

cagatgattt tgaatggaat taataattac aagaatccca aactcaccag gatgctcaca 780

tttaagtttt acatgcccaa gaaggccaca gaactgaaac atcttcagtg tctagaagaa 840

gaactcaaac ctctggagga agtgctaaat ttagctcaaa gcaaaaactt tcacttaaga 900

cccagggact taatcagcaa tatcaacgta atagttctgg aactaaaggg atctgaaaca 960

acattcatgt gtgaatatgc tgatgagaca gcaaccattg tagaatttct gaacagatgg 1020

attacctttt gtcaaagcat catctcaaca ctaacttaa 1059

<210>59

<211>756

<212>DNA

<213>人工序列

<220>

<223>合成的YGaT923-EXD4

<400>59

atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60

actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120

aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180

gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240

gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300

tcgcctttgc aaatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360

ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420

ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480

tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540

ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600

catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttcacctct 660

gatttgtcta agcaaatgga agaagaagct gttagattgt tcttggaatg gttgaagaac 720

ggtggtccat cctccggtgc tccaccacca tcttaa 756

<210>60

<211>408

<212>DNA

<213>人工序列

<220>

<223>合成的SCW4-1-EXD4

<400>60

atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60

cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120

accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180

gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240

accgctgctg ctcatcatca ccatcaccac ggtgacgatg acgataagca tggtgaaggt 300

actttcacct ctgatttgtc taagcaaatg gaagaagaag ctgttagatt gttcttggaa 360

tggttgaaga acggtggtcc atcctccggt gctccaccac catcttaa 408

<210>61

<211>561

<212>DNA

<213>人工序列

<220>

<223>合成的SCW4-3-EXD4

<400>61

atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60

cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120

accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180

gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240

accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300

tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360

tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtcatca tcaccatcac 420

cacggtgacg atgacgataa gcatggtgaa ggtactttca cctctgattt gtctaagcaa 480

atggaagaag aagctgttag attgttcttg gaatggttga agaacggtgg tccatcctcc 540

ggtgctccac caccatctta a 561

<210>62

<211>942

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>62

atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60

gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120

aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180

aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240

gagggattta ctatctttgt cggtgtttgg ccaacagacg acagtcatta cgctgctgaa 300

aaggctgctt tgcaaaccta tttgccaaaa attaaagaat ccactgttgc tggtttcttg 360

gttggttctg aagccttata ccgtaacgat ttgactgcct ctcaattatc agacaaaatt 420

aatgacgtcc gtagtgtcgt tgctgacatt tccgattctg acggaaagtc atactctggt 480

aagcaagtcg gtactgtcga ttcctggaat gttttggttg ctggttacaa ttctgccgtt 540

atcgaagctt ccgattttgt tatggctaac gcgttctcct actggcaagg tcaaaccatg 600

caaaatgcct cttactcatt ctttgatgat attatgcaag ctctacaggt tatccaatct 660

actaaaggtt ctaccgatat taccttctgg gttggtgaga ccggttggcc aactgatggt 720

accaactttg aaagttctta cccatctgtt gacaacgcca aacaattctg gaaagaaggt 780

atctgttcca tgagagcttg gggtgttaac gttattgttt ttgaagcctt tgatgaagat 840

tggaagccaa acacctctgg tacctctgat gtcgagaagc actggggtgt tttcacttca 900

agtgacaatt tgaaatactc cttggactgt gacttttcat ga 942

<210>63

<211>1575

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>63

atgcaactat ctaaaagtat actactggca gcattagctg ctacaccatc tctggtgaat 60

gccatgctcc ccatccatat caagaattat aggttcatta agccatcctc tgccacaaat 120

agcgaatccg ataacgaagt tttttttgtg aaaggtgtcg attatcagcc tggtgggtcg 180

tctggttacg atgctgactc tgatacagat attctttctg accctgaagt gtgtgccaga 240

gacgcctacg ctttccaaca acttggtgtc aacacagtga gaatttactc cctgaaccct 300

gacctaaatc atgacaagtg catgactatc ttcaacaatg ctggtatcta cgccattttg 360

gatgttaata gtggtaatta cggggagagt ttgaaccgtg ctgacccatc tggaacatat 420

gactctttgt atttgtcaag agtcttcaaa tttattgacg ctttcaagaa ctaccctaac 480

gtgctaggat tcttttctgg caacgaagtc ataaatgatc aaagcgacta tgcaaaaatt 540

gatcctccat acatccgcgc tgttcaaaga gatatgaaac agtatatttc aaaacatgcg 600

aacagaagca tcccagtcgg atattctgct gctgacaata ctgatttgag gttagcaacc 660

ttcaagtact tgcagtgtaa ttcgttggat ggaaacaaag tcaatgatga tttggacata 720

tctaaatctg atttctttgg cctaaatact tatgaatggt gctctggcac ttctagttgg 780

gaatcttctg gctatgacaa gttaaactca actttcgaag atgctgttat tccgttgata 840

ttttctgagt atggttgcaa caaaaataca ccaagaactt ttgacgaagt ctctgagggt 900

ttgtatggtg gtttaaagaa cgtcttctct ggtgggttgg tatacgaata cactgaagaa 960

gctaataatt acggtttggt taagcttgat gatagcggtt ctttaactta taaggatgat 1020

tttgttaatt tagaatcaca attgaagaac gtttcattgc caacaacaaa agaaagcgaa 1080

atatcttctg actctatcta caagtgcgat aacagtgcca tcaccaatat ttattctggc 1140

tttggaacga acaatttcac tttgccttct caaccagcag aaattgccaa tatgattgaa 1200

tacggtgtta atggcaccaa caccggtaag atattgactg attatgctgt tccaactact 1260

tttaactata caattaaaaa caataaagat gataccattt cagctactat ttcatacgac 1320

aaagctaact cactgaacga actagacgtc acagccacaa cggtcgcaaa gtcagcttcc 1380

acatcacaat catcttctcg ctccttaact tcaagcacca gtccatcttc aagcactggc 1440

tcatcttcaa gcaccggttc atcttcagct tcaagcagct ccaaaagtaa aggcgtcgga 1500

aatattgtta atgtttcctt tagtcagtct ggataccttg cattatttgc aggtctgatt 1560

tctgctctac tctga 1575

<210>64

<211>1455

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>64

atgttactac gttctcttac aagtgccttc gttttaagtg ctggtttggc tcaggctgct 60

agcagcagta acagttccac accatccatt gaaattaaag gcaatgcatt ttttaattcg 120

gaatcaggtg aaaggtttta tatccgtggt gttgattacc agcctggtgg ttcttctaac 180

ttgactgatc ccttagcaga cgcatctgtc tgtgacagag acgtccccgt tctgaaagat 240

ctagggataa atactgtcag agtttatact gtggataact cgcaagatca ttcccattgt 300

atgaaactat tgcaggagaa cggtatatac ttgatcctgg atgtcaatac ccccacgagt 360

gctatttctc gttacgatcc agcctgctcc tataacgctg actacttaca aaatgtcttt 420

gccaccattg atacctttgc tgattacgac aatgttctag gttttttcgc tggtaacgag 480

gtcatcaata gtgttaatac taccaacact gctacttatg tcaaggcagt ggtcagggac 540

atgaagaaat acatcaaggc tagaaaatac agacaaattc cggtaggtta ctcggctgct 600

gatatcgtcg ctaacagaca attggctgct gaatacttta actgtggtga tgaagctgac 660

gctagaatcg acatgtttgg tgttaatgac tattcttggt gtggtgaatc ttcatttgtg 720

gtatcgggtt attccaccaa gatgaagcta tatcaagatt actccgttcc tgtcttctta 780

agtgaatttg gttgtaacca agtcaagagc tctcgtccat tcacagaaat tgaagctatc 840

tattccactc aaatgtcttc tgtattctcc ggtgggctag tctacgaata ttccaatgaa 900

actaacaatt acgggctcgt tcaaattgat ggtgacaagg tcactaaatt gacagatttt 960

gaaaacttga aaaatgaata cagcaaagta tccaacccag aaggcaatgg tggttacagt 1020

acttccaaca actattctac atgtcctgat tatgaaaagg gtgtctggga agctaataac 1080

actttgcctg ctatgccaag tgctgcttct gcttacttca catctggagc aggttctcct 1140

atgggaaccg gaatcgccac ccaacaaagt tgtgatgcta aggacgatga cgacgaagaa 1200

gacgacgaca cctcctcttc atcctcttct tcctcttcat cttcatcttc cgcttcttca 1260

tcttctgaat catcatcctc gacttcaaag gcatcttcct cctccccttc tgctagcgaa 1320

acgagcttgc taaaatctgc cgcatctgct acttcgtcca gccaatcgtc ctcgaaatca 1380

aagggtgctg ccggaattat tgagattcct ttgatattcc gtgctttggc agaactttat 1440

aacttggttt tatga 1455

<210>65

<211>1335

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>65

atgcaattac attcacttat cgcttcaact gcgctcttaa taacgtcagc tttggctgct 60

acttcctctt cttccagcat accctcttcc tgtaccataa gctcacatgc cacggccaca 120

gctcagagtg acttagataa atatagccgc tgtgatacgt tagtcgggaa cttaactatt 180

ggtggtggtt tgaagactgg tgctttggct aatgttaaag aaatcaacgg gtctctaact 240

atatttaacg ctacaaatct aacctcattc gctgctgatt ccttggagtc catcacagat 300

tctttgaacc tacagagttt gacaatcttg acttctgctt catttgggtc tttacagagc 360

gttgatagta taaaactgat tactctaccc gccatctcca gttttacttc aaatatcaaa 420

tctgctaaca acatttatat ttccgacact tcgttacaat ctgtcgatgg attctcagcc 480

ttgaaaaaag ttaacgtgtt caacgtcaat aacaataaga aattaacctc gatcaaatct 540

ccagttgaaa cagtcagcga ttctttacaa ttttcgttca acggtaacca gactaaaatc 600

accttcgatg acttggtttg ggcaaacaat atcagtttga ccgatgtcca ctctgtttcc 660

ttcgctaact tgcaaaagat taactcttca ttgggtttca tcaacaactc catctcaagt 720

ttgaatttca ctaagctaaa caccattggc caaaccttca gtatcgtttc caatgactac 780

ttgaagaact tgtcgttctc taatttgtca accataggtg gtgctcttgt cgttgctaac 840

aacactggtt tacaaaaaat tggtggtctc gacaacctaa caaccattgg cggtactttg 900

gaagttgttg gtaacttcac ctccttgaac ctagactctt tgaagtctgt caagggtggc 960

gcagatgtcg aatcaaagtc aagcaatttc tcctgtaatg ctttgaaagc tttgcaaaag 1020

aaagggggta tcaagggtga atcttttgtc tgcaaaaatg gtgcatcatc cacatctgtt 1080

aaactatcgt ccacttccaa atctcaatca agccaaacta ctgccaaggt ttccaagtca 1140

tcttctaagg ccgaggaaaa gaagttcact tctggcgata tcaaggctgc tgcttctgcc 1200

tctagtgttt ctagttctgg cgcttccagc tctagctcta agagttccaa aggcaatgcc 1260

gctatcatgg caccaattgg ccaaacaacc cctttggtcg gtcttttgac ggcaatcatc 1320

atgtctataa tgtaa 1335

<210>66

<211>1161

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>66

atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60

cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120

accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180

gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240

accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300

tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360

tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtatcac ttatacccca 420

tacgagtcca gcggtgcttg taaatccgct tcggaagttg cttccgattt agctcaattg 480

actgacttcc cagtcattag attgtacggt accgactgta accaagttga aaatgttttc 540

aaggctaagg cttcgaacca aaaagtcttt ttaggtattt actacgttga ccaaatccaa 600

gacggtgtca acaccatcaa gtctgctgtt gaatcttacg gttcttggga cgatgtcacc 660

actgtttcca ttggtaacga attggttaac ggtaaccaag ctaccccatc ccaagtcggt 720

caatacattg actctggtag atctgccttg aaggctgccg gttacactgg tccagttgtt 780

tctgttgata cttttattgc tgtgatcaac aaccctgaat tgtgtgacta ctccgactac 840

atggctgtta atgcccatgc ttactttgac aagaacacag ttgcccaaga ctccggtaaa 900

tggttactag aacaaatcca aagagtctgg actgcttgtg atggtaagaa gaatgttgtt 960

atcactgagt ctggttggcc atcaaagggt gagacttacg gtgttgctgt tccatctaag 1020

gaaaatcaaa aggacgctgt ttccgccatt accagctcct gtggtgctga taccttctta 1080

ttcactgcct tcaacgacta ctggaaggcc gacggtgctt acggtgttga aaaatactgg 1140

ggtattctat ccaatgaata a 1161

<210>67

<211>1170

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>67

atgcgttttt caaatttcct aactgtatct gcattattaa ccggagctct aggagctcct 60

gctgttcgcc ataaacatga aaagcgtgac gttgttactg ccacagtcca tgcgcaggtt 120

actgttgtcg tttccggtaa cagcggcgaa actattgttc cagtgaacga gaatgctgtt 180

gtagctacta ccagcagtac tgcagttgct tctcaagcaa ctacatccac tttagaacca 240

acaacttccg ctaatgtcgt cacttctcaa caacaaacca gcactcttca atcttccgag 300

gcagcatcta cggttggttc ttcgacttca tcctcaccct catcctcatc ctcaacttca 360

tcttcagctt catcctccgc ttcatctagt atctcagcct ccggtgctaa gggtattact 420

tacagtcctt acaatgatga tgggtcctgt aaatctactg ctcaagtcgc ctcagattta 480

gaacagttga ctggttttga caacatcaga ttatatggcg ttgactgtag tcaggttgag 540

aatgtcttgc aagctaaaac ttcaagccag aaattattct taggcatata ttacgttgac 600

aaaattcaag acgccgttga tactattaaa tctgcagttg agtcttatgg ctcctgggat 660

gatattacca ctgtttctgt cggtaacgaa ctggtcaatg gcggttctgc cactacgacg 720

caagtcggtg aatacgtttc cacggccaag tcagctttaa cctctgctgg ttatacaggc 780

tcagtcgttt ccgttgatac cttcattgct gttataaata accctgacct gtgtaattat 840

tctgactata tggctgtcaa cgcccatgca tacttcgatg aaaatactgc ggcccaagat 900

gcaggaccat gggtactaga acaaatcgaa agggtttaca ctgcttgtgg tgggaaaaag 960

gacgtcgtta ttaccgaaac tggttggcca tctaagggtg atacttacgg cgaagctgtc 1020

ccatctaaag caaaccaaga agccgccatt tcttctatca aaagctcctg cggctcttca 1080

gcttacttat ttaccgcctt caatgatcta tggaaagatg atgggcaata cggtgttgaa 1140

aaatactggg gtattctatc aagtgattaa 1170

<210>68

<211>1428

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>68

atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60

ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120

tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180

gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240

tccgcagccg ctgggatagc cgcttccatt gctgtttcat ctgctgcctt agccaagaat 300

gagaaaatct ctgatgccgc tgcatctgcc actgcctcaa catctcaagg ggcatcctcc 360

tcctcctcct cctcctcggc aacttctacc ctagaaagca gctctgtttc ttcatctagt 420

gaagaagctg ctccaacatc tactgtcgtg tcaacttctt ccgcaaccca atctagtgct 480

tcttctgcca ctaaatctag tacttcttcc acttcaccat ctacttctac ttctacttcc 540

acttcttcta cttcctcttc ctcttcctcc tcctcctcct cttcttcttc ttcttctggc 600

agtggtagta tctacggtga tttggccgac ttttcaggcc caagtgagaa attccaagac 660

ggcactattc catgtgacaa attcccatct ggtcaaggtg tcatttctat tgactggatt 720

ggcgagggtg gatggtccgg tgtggaaaac accgacactt ccactggcgg ttcatgcaag 780

gaggggtcct actgttccta ctcctgccaa ccaggtatgt ctaagaccca atggccatcc 840

gatcaaccat ctgacggtag atctgtcggg ggtttgttgt gtaaaaatgg ttatttgtac 900

cgttctaaca ctgacgcgga ttacttatgt gaatggggtg tcgaggctgc ctatgttgtt 960

tctaaactaa gcaagggtgt cgccatttgc agaaccgact acccgggcac tgaaaacatg 1020

gttatcccaa cctatgttga agggggtagc tctttgccat tgaccgttgt tgaccaagat 1080

acttacttta cttgggaagg caaaaagaca tctgctcaat actacgttaa taacgccggc 1140

gtctcagttg aagatgggtg tatctggggt acttctggat ctggtattgg taactgggca 1200

ccattaaact ttggtgctgg ctccactggt ggagtgacat acttatcatt gattcctaac 1260

ccaaacaaca gcgacgcatt gaactacaac gtcaagatag ttgctgctga tgattcatcc 1320

aatgtcatcg gtgaatgtgt ttacgaaaat ggtgagttct ctggcggtgc tgacgggtgt 1380

accgtctctg ttacttccgg taaagctcat ttcgtcttat acaattaa 1428

<210>69

<211>1098

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>69

atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60

gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120

tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180

gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240

gccgctacta cctctgccgc cgcctcttct tcctcctctt cctcttcctc ctcttcctct 300

tcttcctctg ttggttctgg agattttgaa gatggtacca tttcctgttc tgatttccca 360

tccggacaag gtgctgtctc cttggactgg ttaggtctag gcggctgggc ttccatcatg 420

gacatgaacg gtaacaccgc cacctcttgt caagacggat actactgttc ttacgcttgt 480

tctccaggtt acgctaagac ccaatggcct tctgaacaac cttccgatgg tagatccgtt 540

ggtggtttat actgtaagaa cggtaaatta taccgttcca acaccgacac taacagtttg 600

tgtgtagaag gtcaaggctc tgctcaagct gttaacaagg tctccggctc cattgctatc 660

tgtggtaccg attatccagg ttctgaaaac atggtcgttc ctaccgtagt tggcgctggt 720

tcctcccaac caatcaacgt catcaaggag gactcctact atcaatggca aggtaagaag 780

acctctgccc aatactacgt taacaacgct ggtgtctctg tggaagatgg ttgtatctgg 840

ggtactgagg gttccggtgt cggtaactgg gccccagttg tcttgggtgc tggttacact 900

gatggtatca cttacttgtc catcattcca aacccaaaca acaaagaagc accaaacttt 960

aacatcaaga tcgttgccac cgatggctct accgtcaatg gtgcttgctc ttacgaaaat 1020

ggtgtctact ctggctctgg ctctgacggt tgtactgttt cagttacttc tggttctgct 1080

aactttgtct tctactag 1098

<210>70

<211>1065

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>70

atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60

ccaatcgaaa acctattcaa atacagggct gttaaggcat ctcacagtaa gaatatcaac 120

tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180

aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240

ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300

agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360

atccaagata agtcatccgc cggtgccgtt gttgttgcca acgccaaatc tttggaagct 420

gtctcattct tcttctctat catttttgac accgaaaagc ctattgttgt cactgaagat 480

tccgcttatg ccattccagt cgctaacaat aagaacgcta ccaaacgtgg tgtcttgtcc 540

gtcacttctg acaaattagt gtactccggt gtcttcactc cacctactgc ttgttcttac 600

ggtgctggtt tgcctgttgc tatcgttgat gaccaagacg aagttaaatg gttcttcgat 660

gcttctaagc caactttaat ctcttctgac tcgattatca gaaaggaata cagtaacttc 720

actactcctt atggtctatt agaaaacggt gttccaattg ttccaattgt ctatgacggt 780

ggttactctt ccagtttgat tgactccttg agttctgccg ttcaaggttt ggttgttgtt 840

tcttctggtt ctaccaactc aacctcatct actattgaaa gcactgaaat cccagtcgta 900

tatgctcaag ctaacactcc attaaacttt attgacaaca aagatgttcc aaagaacgct 960

gtgggtgctg gttacctatc cccaattaag gcccaaatct tgttgtccat tgctgccgtt 1020

aatggtgtca cctccaagtc cgctctggaa agcattttcc catga 1065

<210>71

<211>1710

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>71

atgaaactga aaactgtaag atctgcggtc ctttcgtcac tctttgcatc gcaggttctc 60

ggtaagataa taccagcagc aaacaagcgc gacgacgact cgaattccaa gttcgtcaag 120

ttgccctttc ataagcttta cggggactcg ctagaaaatg tgggaagcga caaaaaaccg 180

gaagtacgcc tattgaagag ggctgacggt tatgaagaaa ttataattac caaccagcaa 240

agtttctatt cggtggactt ggaagtgggc acgccaccac agaacgtaac ggtcctggtg 300

gacacaggct cctctgatct atggattatg ggctcggata atccatactg ttcttcgaac 360

agtatgggta gtagccggag acgtgttatt gacaaacgtg atgattcgtc aagcggcgga 420

tctttgatta atgatataaa cccatttggc tggttgacgg gaacgggcag tgccattggc 480

cccactgcta cgggcttagg aggcggttca ggtacggcaa ctcaatccgt gcctgcttcg 540

gaagccacca tggactgtca acaatacggg acattttcca cttcgggctc ttctacattt 600

agatcaaaca acacctattt cagtattagc tacggtgatg ggacttttgc ctccggtact 660

tttggtacgg atgttttgga tttaagcgac ttgaacgtta ccgggttgtc ttttgccgtt 720

gccaatgaaa cgaattctac tatgggtgtg ttaggtattg gtttgcccga attagaagtc 780

acttattctg gctctactgc gtctcatagt ggaaaagctt ataaatacga caacttcccc 840

attgtattga aaaattctgg tgctatcaaa agcaacacat attctttgta tttgaacgac 900

tcggacgcta tgcatggcac cattttgttc ggagccgtgg accacagtaa atataccggc 960

accttataca caatccccat cgtaaacact ctgagtgcta gtggatttag ctctcccatt 1020

caatttgatg tcactattaa tggtatcggt attagtgatt ctgggagtag taacaagacc 1080

ttgactacca ctaaaatacc tgctttgttg gattccggta ctactttgac ttatttacct 1140

caaacagtgg taagtatgat cgctactgaa ctaggtgcgc aatactcttc caggataggg 1200

tattacgtat tggactgtcc atctgatgat agtatggaaa tagtgttcga ttttggtggt 1260

tttcacatca atgcaccact ttcgagtttt atcttgagta ctggcactac atgtctttta 1320

ggtattatcc caacgagtga tgacacaggt accattttgg gtgattcatt tttgactaac 1380

gcgtacgtgg tttatgattt ggagaatctt gaaatatcca tggcacaagc tcgctataat 1440

accacaagcg aaaatatcga aattattaca tcctctgttc caagcgccgt aaaggcacca 1500

ggctatacaa acacttggtc cacaagtgca tctattgtta ccggtggtaa catatttact 1560

gtaaattcct cacaaactgc ttcctttagc ggtaacctga cgaccagtac tgcatccgcc 1620

acttctacat caagtaaaag aaatgttggt gatcatatag ttccatcttt acccctcaca 1680

ttaatttctc ttctttttgc attcatctga 1710

<210>72

<211>750

<212>DNA

<213>酵母(Saccharomyces sp.)

<400>72

atgaagttct cttccggcaa atctatcatc tttgcaacta ttgcttctct agctttgagt 60

gctcctgtca cttacgacac caactctact gctgagttac aatctccttc atctcaagaa 120

attctgggtt ggagtcacgc aacttttcct accatttacc aaacctgtaa tgagacgaac 180

gcaagaatgt tgaatgcagc ttttaaggat accgctgaaa tcaccgctta tggtaaagat 240

agacttttga actatggtgt cgatgacgtt tactacaaaa gatggtttgg taatggtagt 300

attttcaccg tcatgggtgt ctttgagcaa ttgatggagg cttccaaggg tgccatgctc 360

atgagatgtg atgatattga tggcttgtgt gcagctaatc caaactatta cgctggtcat 420

caccgtcaat ctgctccagc tgaaactgtt atttgtgatt acttctacac ttccaaaaag 480

ccactatcaa caatttgttt cgaaggtact attgtcgatg tcggtccaaa acattatgca 540

ggtattgata tgttacatcg ttacttgcac gtccctacca tgagtatgga tggatatgtt 600

ggcgagtacg cggaaactct tgaagaagtt gtggactaca cccagaacaa tgctacttac 660

gcagttagaa acaccgacaa ctatctttac tatctcgctg acgtttacag tgcttctgtt 720

atacctggtg gctgtctagg taacttgtaa 750

<210>73

<211>915

<212>DNA

<213>人工序列

<220>

<223>合成的SCW4-2-hGH

<400>73

atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60

cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120

accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180

gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240

accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300

tcccatcatc accatcacca cggtgacgat gacgataagt tcccaaccat tcccttatcc 360

aggctttttg acaacgctat gctccgcgcc catcgtctgc accagctggc ctttgacacc 420

taccaggagt ttgaagaagc ctatatccca aaggaacaga agtattcatt cctgcagaac 480

ccccagacct ccctctgttt ctcagagtct attccgacac cctccaacag ggaggaaaca 540

caacagaaat ccaacctaga gctgctccgc atctccctgc tgctcatcca gtcgtggctg 600

gagcccgtgc agttcctcag gagtgtcttc gccaacagcc tggtgtacgg cgcctctgac 660

agcaacgtct atgacctcct aaaggaccta gaggaaggca tccaaacgct gatggggagg 720

ctggaagatg gcagcccccg gactgggcag atcttcaagc agacctacag caagttcgac 780

acaaactcac acaacgatga cgcactactc aagaactacg ggctgctcta ctgcttcagg 840

aaggacatgg acaaggtcga gacattcctg cgcatcgtgc agtgccgctc tgtggagggc 900

agctgtggct tctaa 915

<210>74

<211>4

<212>PRT

<213>人工序列

<220>

<223>合成的酵母kex2-样蛋白酶识别序列

<400>74

Leu Asp Lys Arg

1

<210>75

<211>4

<212>PRT

<213>人工序列

<220>

<223>合成的因子Xa-蛋白酶识别序列

<400>75

Ile Glu Gly Arg

1

<210>76

<211>4

<212>PRT

<213>人工序列

<220>

<223>合成的枯草杆菌蛋白酶-识别序列

<400>76

Ala Ala His Tyr

1

<210>77

<211>7

<212>PRT

<213>人工序列

<220>

<223>合成的烟草蚀纹病毒蛋白酶-识别序列

<400>77

Glu Asn Leu Tyr Phe Gln Gly

1 5

<210>78

<211>4

<212>PRT

<213>人工序列

<220>

<223>合成的凝血酶-识别序列

<400>78

Arg Gly Pro Arg

1

<210>79

<211>5

<212>PRT

<213>人工序列

<220>

<223>合成的肠激酶裂解序列

<400>79

Asp Asp Asp Asp Lys

1 5

<210>80

<211>313

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>80

Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe

1 5 10 15

Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly

20 25 30

Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr

35 40 45

Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala

50 55 60

Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala

65 70 75 80

Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Thr Asp Asp Ser His

85 90 95

Tyr Ala Ala Glu Lys Ala Ala Leu Gln Thr Tyr Leu Pro Lys Ile Lys

100 105 110

Glu Ser Thr Val Ala Gly Phe Leu Val Gly Ser Glu Ala Leu Tyr Arg

115 120 125

Asn Asp Leu Thr Ala Ser Gln Leu Ser Asp Lys Ile Asn Asp Val Arg

130 135 140

Ser Val Val Ala Asp Ile Ser Asp Ser Asp Gly Lys Ser Tyr Ser Gly

145 150 155 160

Lys Gln Val Gly Thr Val Asp Ser Trp Asn Val Leu Val Ala Gly Tyr

165 170 175

Asn Ser Ala Val Ile Glu Ala Ser Asp Phe Val Met Ala Asn Ala Phe

180 185 190

Ser Tyr Trp Gln Gly Gln Thr Met Gln Asn Ala Ser Tyr Ser Phe Phe

195 200 205

Asp Asp Ile Met Gln Ala Leu Gln Val Ile Gln Ser Thr Lys Gly Ser

210 215 220

Thr Asp Ile Thr Phe Trp Val Gly Glu Thr Gly Trp Pro Thr Asp Gly

225 230 235 240

Thr Asn Phe Glu Ser Ser Tyr Pro Ser Val Asp Asn Ala Lys Gln Phe

245 250 255

Trp Lys Glu Gly Ile Cys Ser Met Arg Ala Trp Gly Val Asn Val Ile

260 265 270

Val Phe Glu Ala Phe Asp Glu Asp Trp Lys Pro Asn Thr Ser Gly Thr

275 280 285

Ser Asp Val Glu Lys His Trp Gly Val Phe Thr Ser Ser Asp Asn Leu

290 295 300

Lys Tyr Ser Leu Asp Cys Asp Phe Ser

305 310

<210>81

<211>524

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>81

Met Gln Leu Ser Lys Ser Ile Leu Leu Ala Ala Leu Ala Ala Thr Pro

1 5 10 15

Ser Leu Val Asn Ala Met Leu Pro Ile His Ile Lys Asn Tyr Arg Phe

20 25 30

Ile Lys Pro Ser Ser Ala Thr Asn Ser Glu Ser Asp Asn Glu Val Phe

35 40 45

Phe Val Lys Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Gly Tyr Asp

50 55 60

Ala Asp Ser Asp Thr Asp Ile Leu Ser Asp Pro Glu Val Cys Ala Arg

65 70 75 80

Asp Ala Tyr Ala Phe Gln Gln Leu Gly Val Asn Thr Val Arg Ile Tyr

85 90 95

Ser Leu Asn Pro Asp Leu Asn His Asp Lys Cys Met Thr Ile Phe Asn

100 105 110

Asn Ala Gly Ile Tyr Ala Ile Leu Asp Val Asn Ser Gly Asn Tyr Gly

115 120 125

Glu Ser Leu Asn Arg Ala Asp Pro Ser Gly Thr Tyr Asp Ser Leu Tyr

130 135 140

Leu Ser Arg Val Phe Lys Phe Ile Asp Ala Phe Lys Asn Tyr Pro Asn

145 150 155 160

Val Leu Gly Phe Phe Ser Gly Asn Glu Val Ile Asn Asp Gln Ser Asp

165 170 175

Tyr Ala Lys Ile Asp Pro Pro Tyr Ile Arg Ala Val Gln Arg Asp Met

180 185 190

Lys Gln Tyr Ile Ser Lys His Ala Asn Arg Ser Ile Pro Val Gly Tyr

195 200 205

Ser Ala Ala Asp Asn Thr Asp Leu Arg Leu Ala Thr Phe Lys Tyr Leu

210 215 220

Gln Cys Asn Ser Leu Asp Gly Asn Lys Val Asn Asp Asp Leu Asp Ile

225 230 235 240

Ser Lys Ser Asp Phe Phe Gly Leu Asn Thr Tyr Glu Trp Cys Ser Gly

245 250 255

Thr Ser Ser Trp Glu Ser Ser Gly Tyr Asp Lys Leu Asn Ser Thr Phe

260 265 270

Glu Asp Ala Val Ile Pro Leu Ile Phe Ser Glu Tyr Gly Cys Asn Lys

275 280 285

Asn Thr Pro Arg Thr Phe Asp Glu Val Ser Glu Gly Leu Tyr Gly Gly

290 295 300

Leu Lys Asn Val Phe Ser Gly Gly Leu Val Tyr Glu Tyr Thr Glu Glu

305 310 315 320

Ala Asn Asn Tyr Gly Leu Val Lys Leu Asp Asp Ser Gly Ser Leu Thr

325 330 335

Tyr Lys Asp Asp Phe Val Asn Leu Glu Ser Gln Leu Lys Asn Val Ser

340 345 350

Leu Pro Thr Thr Lys Glu Ser Glu Ile Ser Ser Asp Ser Ile Tyr Lys

355 360 365

Cys Asp Asn Ser Ala Ile Thr Asn Ile Tyr Ser Gly Phe Gly Thr Asn

370 375 380

Asn Phe Thr Leu Pro Ser Gln Pro Ala Glu Ile Ala Asn Met Ile Glu

385 390 395 400

Tyr Gly Val Asn Gly Thr Asn Thr Gly Lys Ile Leu Thr Asp Tyr Ala

405 410 415

Val Pro Thr Thr Phe Asn Tyr Thr Ile Lys Asn Asn Lys Asp Asp Thr

420 425 430

Ile Ser Ala Thr Ile Ser Tyr Asp Lys Ala Asn Ser Leu Asn Glu Leu

435 440 445

Asp Val Thr Ala Thr Thr Val Ala Lys Ser Ala Ser Thr Ser Gln Ser

450 455 460

Ser Ser Arg Ser Leu Thr Ser Ser Thr Ser Pro Ser Ser Ser Thr Gly

465 470 475 480

Ser Ser Ser Ser Thr Gly Ser Ser Ser Ala Ser Ser Ser Ser Lys Ser

485 490 495

Lys Gly Val Gly Asn Ile Val Asn Val Ser Phe Ser Gln Ser Gly Tyr

500 505 510

Leu Ala Leu Phe Ala Gly Leu Ile Ser Ala Leu Leu

515 520

<210>82

<211>484

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>82

Met Leu Leu Arg Ser Leu Thr Ser Ala Phe Val Leu Ser Ala Gly Leu

1 5 10 15

Ala Gln Ala Ala Ser Ser Ser Asn Ser Ser Thr Pro Ser Ile Glu Ile

20 25 30

Lys Gly Asn Ala Phe Phe Asn Ser Glu Ser Gly Glu Arg Phe Tyr Ile

35 40 45

Arg Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Asn Leu Thr Asp Pro

50 55 60

Leu Ala Asp Ala Ser Val Cys Asp Arg Asp Val Pro Val Leu Lys Asp

65 70 75 80

Leu Gly Ile Asn Thr Val Arg Val Tyr Thr Val Asp Asn Ser Gln Asp

85 90 95

His Ser His Cys Met Lys Leu Leu Gln Glu Asn Gly Ile Tyr Leu Ile

100 105 110

Leu Asp Val Asn Thr Pro Thr Ser Ala Ile Ser Arg Tyr Asp Pro Ala

115 120 125

Cys Ser Tyr Asn Ala Asp Tyr Leu Gln Asn Val Phe Ala Thr Ile Asp

130 135 140

Thr Phe Ala Asp Tyr Asp Asn Val Leu Gly Phe Phe Ala Gly Asn Glu

145 150 155 160

Val Ile Asn Ser Val Asn Thr Thr Asn Thr Ala Thr Tyr Val Lys Ala

165 170 175

Val Val Arg Asp Met Lys Lys Tyr Ile Lys Ala Arg Lys Tyr Arg Gln

180 185 190

Ile Pro Val Gly Tyr Ser Ala Ala Asp Ile Val Ala Asn Arg Gln Leu

195 200 205

Ala Ala Glu Tyr Phe Asn Cys Gly Asp Glu Ala Asp Ala Arg Ile Asp

210 215 220

Met Phe Gly Val Asn Asp Tyr Ser Trp Cys Gly Glu Ser Ser Phe Val

225 230 235 240

Val Ser Gly Tyr Ser Thr Lys Met Lys Leu Tyr Gln Asp Tyr Ser Val

245 250 255

Pro Val Phe Leu Ser Glu Phe Gly Cys Asn Gln Val Lys Ser Ser Arg

260 265 270

Pro Phe Thr Glu Ile Glu Ala Ile Tyr Ser Thr Gln Met Ser Ser Val

275 280 285

Phe Ser Gly Gly Leu Val Tyr Glu Tyr Ser Asn Glu Thr Asn Asn Tyr

290 295 300

Gly Leu Val Gln Ile Asp Gly Asp Lys Val Thr Lys Leu Thr Asp Phe

305 310 315 320

Glu Asn Leu Lys Asn Glu Tyr Ser Lys Val Ser Asn Pro Glu Gly Asn

325 330 335

Gly Gly Tyr Ser Thr Ser Asn Asn Tyr Ser Thr Cys Pro Asp Tyr Glu

340 345 350

Lys Gly Val Trp Glu Ala Asn Asn Thr Leu Pro Ala Met Pro Ser Ala

355 360 365

Ala Ser Ala Tyr Phe Thr Ser Gly Ala Gly Ser Pro Met Gly Thr Gly

370 375 380

Ile Ala Thr Gln Gln Ser Cys Asp Ala Lys Asp Asp Asp Asp Glu Glu

385 390 395 400

Asp Asp Asp Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser

405 410 415

Ser Ala Ser Ser Ser Ser Glu Ser Ser Ser Ser Thr Ser Lys Ala Ser

420 425 430

Ser Ser Ser Pro Ser Ala Ser Glu Thr Ser Leu Leu Lys Ser Ala Ala

435 440 445

Ser Ala Thr Ser Ser Ser Gln Ser Ser Ser Lys Ser Lys Gly Ala Ala

450 455 460

Gly Ile Ile Glu Ile Pro Leu Ile Phe Arg Ala Leu Ala Glu Leu Tyr

465 470 475 480

Asn Leu Val Leu

<210>83

<211>444

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>83

Met Gln Leu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile Thr Ser

1 5 10 15

Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser Cys Thr

20 25 30

Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp Lys Tyr

35 40 45

Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly Gly Leu

50 55 60

Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser Leu Thr

65 70 75 80

Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser Leu Glu

85 90 95

Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu Thr Ser

100 105 110

Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu Ile Thr

115 120 125

Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala Asn Asn

130 135 140

Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe Ser Ala

145 150 155 160

Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys Leu Thr

165 170 175

Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln Phe Ser

180 185 190

Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val Trp Ala

195 200 205

Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala Asn Leu

210 215 220

Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile Ser Ser

225 230 235 240

Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser Ile Val

245 250 255

Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser Thr Ile

260 265 270

Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys Ile Gly

275 280 285

Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val Val Gly

290 295 300

Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys Gly Gly

305 310 315 320

Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala Leu Lys

325 330 335

Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val Cys Lys

340 345 350

Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser Lys Ser

355 360 365

Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser Lys Ala

370 375 380

Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala Ser Ala

385 390 395 400

Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys Ser Ser

405 410 415

Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr Pro Leu

420 425 430

Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met

435 440

<210>84

<211>830

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>84

Met Gln Leu Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu

1 5 10 15

Ser Ala Ala Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys

20 25 30

Arg Ala Val Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val

35 40 45

Asn Gly Ala Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val

50 55 60

Val Asn Ser Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala

65 70 75 80

Ser Val Ala Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val

85 90 95

Ser Ala Ala Ala Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln

100 105 110

Ser Ser Ser Ser Ser Gln Ala Ser Ser Ser Ser Ser Ser Gly Glu Asp

115 120 125

Val Ser Ser Phe Ala Ser Gly Val Arg Gly Ile Thr Tyr Thr Pro Tyr

130 135 140

Glu Ser Ser Gly Ala Cys Lys Ser Ala Ser Glu Val Ala Ser Asp Leu

145 150 155 160

Ala Gln Leu Thr Asp Phe Pro Val Ile Arg Leu Tyr Gly Thr Asp Cys

165 170 175

Asn Gln Val Glu Asn Val Phe Lys Ala Lys Ala Ser Asn Gln Lys Val

180 185 190

Phe Leu Gly Ile Tyr Tyr Val Asp Gln Ile Gln Asp Gly Val Asn Thr

195 200 205

Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Val Thr Thr

210 215 220

Val Ser Ile Gly Asn Glu Leu Val Asn Gly Asn Gln Ala Thr Pro Ser

225 230 235 240

Gln Val Gly Gln Tyr Ile Asp Ser Gly Arg Ser Ala Leu Lys Ala Ala

245 250 255

Gly Tyr Thr Gly Pro Val Val Ser Val Asp Thr Phe Ile Ala Val Ile

260 265 270

Asn Asn Pro Glu Leu Cys Asp Tyr Ser Asp Tyr Met Ala Val Asn Ala

275 280 285

His Ala Tyr Phe Asp Lys Asn Thr Val Ala Gln Asp Ser Gly Lys Trp

290 295 300

Leu Leu Glu Gln Ile Gln Arg Val Trp Thr Ala Cys Asp Gly Lys Lys

305 310 315 320

Asn Val Val Ile Thr Glu Ser Gly Trp Pro Ser Lys Gly Glu Thr Tyr

325 330 335

Gly Val Ala Val Pro Ser Lys Glu Asn Gln Lys Asp Ala Val Ser Ala

340 345 350

Ile Thr Ser Ser Cys Gly Ala Asp Thr Phe Leu Phe Thr Ala Phe Asn

355 360 365

Asp Tyr Trp Lys Ala Asp Gly Ala Tyr Gly Val Glu Lys Tyr Trp Gly

370 375 380

Ile Leu Ser Asn Glu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile

385 390 395 400

Thr Ser Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser

405 410 415

Cys Thr Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp

420 425 430

Lys Tyr Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly

435 440 445

Gly Leu Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser

450 455 460

Leu Thr Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser

465 470 475 480

Leu Glu Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu

485 490 495

Thr Ser Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu

500 505 510

Ile Thr Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala

515 520 525

Asn Asn Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe

530 535 540

Ser Ala Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys

545 550 555 560

Leu Thr Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln

565 570 575

Phe Ser Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val

580 585 590

Trp Ala Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala

595 600 605

Asn Leu Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile

610 615 620

Ser Ser Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser

625 630 635 640

Ile Val Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser

645 650 655

Thr Ile Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys

660 665 670

Ile Gly Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val

675 680 685

Val Gly Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys

690 695 700

Gly Gly Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala

705 710 715 720

Leu Lys Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val

725 730 735

Cys Lys Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser

740 745 750

Lys Ser Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser

755 760 765

Lys Ala Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala

770 775 780

Ser Ala Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys

785 790 795 800

Ser Ser Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr

805 810 815

Pro Leu Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met

820 825 830

<210>85

<211>389

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>85

Met Arg Phe Ser Asn Phe Leu Thr Val Ser Ala Leu Leu Thr Gly Ala

1 5 10 15

Leu Gly Ala Pro Ala Val Arg His Lys His Glu Lys Arg Asp Val Val

20 25 30

Thr Ala Thr Val His Ala Gln Val Thr Val Val Val Ser Gly Asn Ser

35 40 45

Gly Glu Thr Ile Val Pro Val Asn Glu Asn Ala Val Val Ala Thr Thr

50 55 60

Ser Ser Thr Ala Val Ala Ser Gln Ala Thr Thr Ser Thr Leu Glu Pro

65 70 75 80

Thr Thr Ser Ala Asn Val Val Thr Ser Gln Gln Gln Thr Ser Thr Leu

85 90 95

Gln Ser Ser Glu Ala Ala Ser Thr Val Gly Ser Ser Thr Ser Ser Ser

100 105 110

Pro Ser Ser Ser Ser Ser Thr Ser Ser Ser Ala Ser Ser Ser Ala Ser

115 120 125

Ser Ser Ile Ser Ala Ser Gly Ala Lys Gly Ile Thr Tyr Ser Pro Tyr

130 135 140

Asn Asp Asp Gly Ser Cys Lys Ser Thr Ala Gln Val Ala Ser Asp Leu

145 150 155 160

Glu Gln Leu Thr Gly Phe Asp Asn Ile Arg Leu Tyr Gly Val Asp Cys

165 170 175

Ser Gln Val Glu Asn Val Leu Gln Ala Lys Thr Ser Ser Gln Lys Leu

180 185 190

Phe Leu Gly Ile Tyr Tyr Val Asp Lys Ile Gln Asp Ala Val Asp Thr

195 200 205

Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Ile Thr Thr

210 215 220

Val Ser Val Gly Asn Glu Leu Val Asn Gly Gly Ser Ala Thr Thr Thr

225 230 235 240

Gln Val Gly Glu Tyr Val Ser Thr Ala Lys Ser Ala Leu Thr Ser Ala

245 250 255

Gly Tyr Thr Gly Ser Val Val Ser Val Asp Thr Phe Ile Ala Val Ile

260 265 270

Asn Asn Pro Asp Leu Cys Asn Tyr Ser Asp Tyr Met Ala Val Asn Ala

275 280 285

His Ala Tyr Phe Asp Glu Asn Thr Ala Ala Gln Asp Ala Gly Pro Trp

290 295 300

Val Leu Glu Gln Ile Glu Arg Val Tyr Thr Ala Cys Gly Gly Lys Lys

305 310 315 320

Asp Val Val Ile Thr Glu Thr Gly Trp Pro Ser Lys Gly Asp Thr Tyr

325 330 335

Gly Glu Ala Val Pro Ser Lys Ala Asn Gln Glu Ala Ala Ile Ser Ser

340 345 350

Ile Lys Ser Ser Cys Gly Ser Ser Ala Tyr Leu Phe Thr Ala Phe Asn

355 360 365

Asp Leu Trp Lys Asp Asp Gly Gln Tyr Gly Val Glu Lys Tyr Trp Gly

370 375 380

Ile Leu Ser Ser Asp

385

<210>86

<211>475

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>86

Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile

1 5 10 15

Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln

20 25 30

His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val

35 40 45

Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr

50 55 60

Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser

65 70 75 80

Ser Ala Ala Ala Gly Ile Ala Ala Ser Ile Ala Val Ser Ser Ala Ala

85 90 95

Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr Ala

100 105 110

Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Ser Ser Ser Ser Ala Thr

115 120 125

Ser Thr Leu Glu Ser Ser Ser Val Ser Ser Ser Ser Glu Glu Ala Ala

130 135 140

Pro Thr Ser Thr Val Val Ser Thr Ser Ser Ala Thr Gln Ser Ser Ala

145 150 155 160

Ser Ser Ala Thr Lys Ser Ser Thr Ser Ser Thr Ser Pro Ser Thr Ser

165 170 175

Thr Ser Thr Ser Thr Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser

180 185 190

Ser Ser Ser Ser Ser Ser Ser Gly Ser Gly Ser Ile Tyr Gly Asp Leu

195 200 205

Ala Asp Phe Ser Gly Pro Ser Glu Lys Phe Gln Asp Gly Thr Ile Pro

2l0 215 220

Cys Asp Lys Phe Pro Ser Gly Gln Gly Val Ile Ser Ile Asp Trp Ile

225 230 235 240

Gly Glu Gly Gly Trp Ser Gly Val Glu Asn Thr Asp Thr Ser Thr Gly

245 250 255

Gly Ser Cys Lys Glu Gly Ser Tyr Cys Ser Tyr Ser Cys Gln Pro Gly

260 265 270

Met Ser Lys Thr Gln Trp Pro Ser Asp Gln Pro Ser Asp Gly Arg Ser

275 280 285

Val Gly Gly Leu Leu Cys Lys Asn Gly Tyr Leu Tyr Arg Ser Asn Thr

290 295 300

Asp Ala Asp Tyr Leu Cys Glu Trp Gly Val Glu Ala Ala Tyr Val Val

305 3l0 315 320

Ser Lys Leu Ser Lys Gly Val Ala Ile Cys Arg Thr Asp Tyr Pro Gly

325 330 335

Thr Glu Asn Met Val Ile Pro Thr Tyr Val Glu Gly Gly Ser Ser Leu

340 345 350

Pro Leu Thr Val Val Asp Gln Asp Thr Tyr Phe Thr Trp Glu Gly Lys

355 360 365

Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val Ser Val Glu

370 375 380

Asp Gly Cys Ile Trp Gly Thr Ser Gly Ser Gly Ile Gly Asn Trp Ala

385 390 395 400

Pro Leu Asn Phe Gly Ala Gly Ser Thr Gly Gly Val Thr Tyr Leu Ser

405 410 415

Leu Ile Pro Asn Pro Asn Asn Ser Asp Ala Leu Asn Tyr Asn Val Lys

420 425 430

Ile Val Ala Ala Asp Asp Ser Ser Asn Val Ile Gly Glu Cys Val Tyr

435 440 445

Glu Asn Gly Glu Phe Ser Gly Gly Ala Asp Gly Cys Thr Val Ser Val

450 455 460

Thr Ser Gly Lys Ala His Phe Val Leu Tyr Asn

465 470 475

<210>87

<211>365

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>87

Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu

l 5 10 15

Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys

20 25 30

Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val

35 40 45

Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys

50 55 60

Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala

65 70 75 80

Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser Ser Ser

85 90 95

Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu Asp Gly

100 105 110

Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val Ser Leu

115 120 125

Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met Asn Gly

130 135 140

Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr Ala Cys

145 150 155 160

Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro Ser Asp

165 170 175

Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu Tyr Arg

180 185 190

Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly Ser Ala

195 200 205

Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly Thr Asp

210 215 220

Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly Ala Gly

225 230 235 240

Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr Gln Trp

245 250 255

Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val

260 265 270

Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly Val Gly

275 280 285

Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly Ile Thr

290 295 300

Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro Asn Phe

305 310 315 320

Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly Ala Cys

325 330 335

Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly Cys Thr

340 345 350

Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr

355 360 365

<210>88

<211>719

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>88

Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala

1 5 10 15

Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys

20 25 30

Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly

35 40 45

Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr

50 55 60

Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly

65 70 75 80

Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr

85 90 95

Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn

100 105 110

Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Lys Ser Ser Ala Gly

115 120 125

Ala Val Val Val Ala Asn Ala Lys Ser Leu Glu Ala Val Ser Phe Phe

130 135 140

Phe Ser Ile Ile Phe Asp Thr Glu Lys Pro Ile Val Val Thr Glu Asp

145 150 155 160

Ser Ala Tyr Ala Ile Pro Val Ala Asn Asn Lys Asn Ala Thr Lys Arg

165 170 175

Gly Val Leu Ser Val Thr Ser Asp Lys Leu Val Tyr Ser Gly Val Phe

180 185 190

Thr Pro Pro Thr Ala Cys Ser Tyr Gly Ala Gly Leu Pro Val Ala Ile

195 200 205

Val Asp Asp Gln Asp Glu Val Lys Trp Phe Phe Asp Ala Ser Lys Pro

2l0 215 220

Thr Leu Ile Ser Ser Asp Ser Ile Ile Arg Lys Glu Tyr Ser Asn Phe

225 230 235 240

Thr Thr Pro Tyr Gly Leu Leu Glu Asn Gly Val Pro Ile Val Pro Ile

245 250 255

Val Tyr Asp Gly Gly Tyr Ser Ser Ser Leu Ile Asp Ser Leu Ser Ser

260 265 270

Ala Val Gln Gly Leu Val Val Val Ser Ser Gly Ser Thr Asn Ser Thr

275 280 285

Ser Ser Thr Ile Glu Ser Thr Glu Ile Pro Val Val Tyr Ala Gln Ala

290 295 300

Asn Thr Pro Leu Asn Phe Ile Asp Asn Lys Asp Val Pro Lys Asn Ala

305 310 315 320

Val Gly Ala Gly Tyr Leu Ser Pro Ile Lys Ala Gln Ile Leu Leu Ser

325 330 335

Ile Ala Ala Val Asn Gly Val Thr Ser Lys Ser Ala Leu Glu Ser Ile

340 345 350

Phe Pro Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala

355 360 365

Val Leu Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn

370 375 380

Asp Lys Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly

385 390 395 400

Ala Val Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp

405 4l0 415

Gly Lys Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr

420 425 430

Ala Ala Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser

435 440 445

Ser Ser Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu

450 455 460

Asp Gly Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val

465 470 475 480

Ser Leu Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met

485 490 495

Asn Gly Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr

500 505 5l0

Ala Cys Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro

515 520 525

Ser Asp Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu

530 535 540

Tyr Arg Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly

545 550 555 560

Ser Ala Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly

565 570 575

Thr Asp Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly

580 585 590

Ala Gly Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr

595 600 605

Gln Trp Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala

6l0 615 620

Gly Val Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly

625 630 635 640

Val Gly Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly

645 650 655

Ile Thr Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro

660 665 670

Asn Phe Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly

675 680 685

Ala Cys Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly

690 695 700

Cys Thr Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr

705 710 715

<210>89

<211>569

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>89

Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser Leu Phe Ala

1 5 10 15

Ser Gln Val Leu Gly Lys Ile Ile Pro Ala Ala Asn Lys Arg Asp Asp

20 25 30

Asp Ser Asn Ser Lys Phe Val Lys Leu Pro Phe His Lys Leu Tyr Gly

35 40 45

Asp Ser Leu Glu Asn Val Gly Ser Asp Lys Lys Pro Glu Val Arg Leu

50 55 60

Leu Lys Arg Ala Asp Gly Tyr Glu Glu Ile Ile Ile Thr Asn Gln Gln

65 70 75 80

Ser Phe Tyr Ser Val Asp Leu Glu Val Gly Thr Pro Pro Gln Asn Val

85 90 95

Thr Val Leu Val Asp Thr Gly Ser Ser Asp Leu Trp Ile Met Gly Ser

100 105 110

Asp Asn Pro Tyr Cys Ser Ser Asn Ser Met Gly Ser Ser Arg Arg Arg

115 120 125

Val Ile Asp Lys Arg Asp Asp Ser Ser Ser Gly Gly Ser Leu Ile Asn

130 135 140

Asp Ile Asn Pro Phe Gly Trp Leu Thr Gly Thr Gly Ser Ala Ile Gly

145 150 155 160

Pro Thr Ala Thr Gly Leu Gly Gly Gly Ser Gly Thr Ala Thr Gln Ser

165 170 175

Val Pro Ala Ser Glu Ala Thr Met Asp Cys Gln Gln Tyr Gly Thr Phe

180 185 190

Ser Thr Ser Gly Ser Ser Thr Phe Arg Ser Asn Asn Thr Tyr Phe Ser

195 200 205

Ile Ser Tyr Gly Asp Gly Thr Phe Ala Ser Gly Thr Phe Gly Thr Asp

210 215 220

Val Leu Asp Leu Ser Asp Leu Asn Val Thr Gly Leu Ser Phe Ala Val

225 230 235 240

Ala Asn Glu Thr Asn Ser Thr Met Gly Val Leu Gly Ile Gly Leu Pro

245 250 255

Glu Leu Glu Val Thr Tyr Ser Gly Ser Thr Ala Ser His Ser Gly Lys

260 265 270

Ala Tyr Lys Tyr Asp Asn Phe Pro Ile Val Leu Lys Asn Ser Gly Ala

275 280 285

Ile Lys Ser Asn Thr Tyr Ser Leu Tyr Leu Asn Asp Ser Asp Ala Met

290 295 300

His Gly Thr Ile Leu Phe Gly Ala Val Asp His Ser Lys Tyr Thr Gly

305 310 315 320

Thr Leu Tyr Thr Ile Pro Ile Val Asn Thr Leu Ser Ala Ser Gly Phe

325 330 335

Ser Ser Pro Ile Gln Phe Asp Val Thr Ile Asn Gly Ile Gly Ile Ser

340 345 350

Asp Ser Gly Ser Ser Asn Lys Thr Leu Thr Thr Thr Lys Ile Pro Ala

355 360 365

Leu Leu Asp Ser Gly Thr Thr Leu Thr Tyr Leu Pro Gln Thr Val Val

370 375 380

Ser Met Ile Ala Thr Glu Leu Gly Ala Gln Tyr Ser Ser Arg Ile Gly

385 390 395 400

Tyr Tyr Val Leu Asp Cys Pro Ser Asp Asp Ser Met Glu Ile Val Phe

405 410 415

Asp Phe Gly Gly Phe His Ile Asn Ala Pro Leu Ser Ser Phe Ile Leu

420 425 430

Ser Thr Gly Thr Thr Cys Leu Leu Gly Ile Ile Pro Thr Ser Asp Asp

435 440 445

Thr Gly Thr Ile Leu Gly Asp Ser Phe Leu Thr Asn Ala Tyr Val Val

450 455 460

Tyr Asp Leu Glu Asn Leu Glu Ile Ser Met Ala Gln Ala Arg Tyr Asn

465 470 475 480

Thr Thr Ser Glu Asn Ile Glu Ile Ile Thr Ser Ser Val Pro Ser Ala

485 490 495

Val Lys Ala Pro Gly Tyr Thr Asn Thr Trp Ser Thr Ser Ala Ser Ile

500 505 510

Val Thr Gly Gly Asn Ile Phe Thr Val Asn Ser Ser Gln Thr Ala Ser

515 520 525

Phe Ser Gly Asn Leu Thr Thr Ser Thr Ala Ser Ala Thr Ser Thr Ser

530 535 540

Ser Lys Arg Asn Val Gly Asp His Ile Val Pro Ser Leu Pro Leu Thr

545 550 555 560

Leu Ile Ser Leu Leu Phe Ala Phe Ile

565

<210>90

<211>249

<212>PRT

<213>酵母(Saccharomyces sp.)

<400>90

Met Lys Phe Ser Ser Gly Lys Ser Ile Ile Phe Ala Thr Ile Ala Ser

1 5 10 15

Leu Ala Leu Ser Ala Pro Val Thr Tyr Asp Thr Asn Ser Thr Ala Glu

20 25 30

Leu Gln Ser Pro Ser Ser Gln Glu Ile Leu Gly Trp Ser His Ala Thr

35 40 45

Phe Pro Thr Ile Tyr Gln Thr Cys Asn Glu Thr Asn Ala Arg Met Leu

50 55 60

Asn Ala Ala Phe Lys Asp Thr Ala Glu Ile Thr Ala Tyr Gly Lys Asp

65 70 75 80

Arg Leu Leu Asn Tyr Gly Val Asp Asp Val Tyr Tyr Lys Arg Trp Phe

85 90 95

Gly Asn Gly Ser Ile Phe Thr Val Met Gly Val Phe Glu Gln Leu Met

100 105 110

Glu Ala Ser Lys Gly Ala Met Leu Met Arg Cys Asp Asp Ile Asp Gly

115 120 125

Leu Cys Ala Ala Asn Pro Asn Tyr Tyr Ala Gly His His Arg Gln Ser

130 135 140

Ala Pro Ala Glu Thr Val Ile Cys Asp Tyr Phe Tyr Thr Ser Lys Lys

145 150 155 160

Pro Leu Ser Thr Ile Cys Phe Glu Gly Thr Ile Val Asp Val Gly Pro

165 170 175

Lys His Tyr Ala Gly Ile Asp Met Leu His Arg Tyr Leu His Val Pro

180 185 190

Thr Met Ser Met Asp Gly Tyr Val Gly Glu Tyr Ala Glu Thr Leu Glu

195 200 205

Glu Val Val Asp Tyr Thr Gln Asn Asn Ala Thr Tyr Ala Val Arg Asn

210 215 220

Thr Asp Asn Tyr Leu Tyr Tyr Leu Ala Asp Val Tyr Ser Ala Ser Val

225 230 235 240

Ile Pro Gly Gly Cys Leu Gly Asn Leu

245

Claims

1.一种从分离自酵母的分泌蛋白质组鉴定分泌融合配偶体而未使用报告蛋白的方法，所述方法由以下步骤组成：

(i)用可操作地连接有编码分泌多肽的多核苷酸的异源启动子转化第一宿主细胞；

(ii)与所述分泌多肽的天然启动子连接到所述编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比，确定所述第一宿主细胞是否过量分泌所述分泌多肽；

(iii)用包含编码毒蜥外泌肽-4的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞，其中，在所述异源启动子的控制下，所述第一多核苷酸和所述第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；

(iv)在培养条件下培养所述第二宿主细胞，其中所述构建体表达所述分泌融合配偶体-4和所述过量分泌多肽的融合多肽；和

(v)确定所述融合多肽是否分泌到培养基中；从而鉴定所述过量分泌多肽是否为分泌融合配偶体，

其中所述分泌融合配偶体选自下组：SEQ ID NO:80表示的BGL2、SEQ ID NO:81表示的GAS3、SEQ ID NO:82表示的GAS5、SEQ ID NO:83表示的PST1、SEQ ID NO:85表示的SCW10、SEQ ID NO:86表示的SIMI、SEQ ID NO:87表示的UTH1、SEQ ID NO:88表示的YGP1、SEQ IDNO:89表示的YPS1和SEQ ID NO:90表示的ZPS1。

2.一种从分离自酵母的分泌蛋白质组鉴定分泌融合配偶体而未使用报告蛋白的方法，所述方法由以下步骤组成：

(iii)用包含编码分泌融合配偶体-4的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞，其中，在所述异源启动子的控制下，所述第一多核苷酸和所述第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内；

(iv)在培养条件下培养所述第二宿主细胞，其中所述构建体表达所述分泌融合配偶体-4和所述过量分泌多肽的融合多肽；

(v)确定所述融合多肽是否分泌到培养基中；从而鉴定所述过量分泌多肽是否为分泌融合配偶体，和

(vi)确定用于分泌所述融合多肽的所述分泌融合配偶体的最佳大小，

3.如权利要求2所述的方法，其中所述最佳大小通过所述分泌融合配偶体的缺失分析而确定。

4.如权利要求1所述的方法，其中所述异源启动子为原核、真核或病毒的启动子。

5.如权利要求4所述的方法，其中所述异源启动子选自下组：λ噬菌体PR启动子、λ噬菌体PL启动子、λII、大肠杆菌trp启动子、大肠杆菌recA启动子、大肠杆菌热休克启动子、大肠杆菌lacZ启动子、SV40早期启动子、酵母GAPDH启动子、PGK启动子、ADH启动子、PHO5启动子、TEF启动子、GAL1启动子、GAL10启动子、鼠乳腺瘤病毒启动子、人免疫缺陷病毒长末端重复启动子、maloney病毒启动子、巨细胞病毒即刻早期启动子、Epstein Barr病毒启动子、劳斯氏肉瘤病毒启动子、人肌动蛋白启动子、人肌球蛋白启动子、人血红蛋白启动子、人肌酸启动子和人金属硫蛋白启动子。

6.如权利要求5所述的方法，其中所述异源启动子为GAL10。

7.如权利要求1所述的方法，其中所述分泌多肽为糖基化的分泌多肽。

8.如权利要求1所述的方法，其中所述第一宿主细胞选自植物、细菌、真菌、酵母或动物细胞。

9.如权利要求8所述的方法，其中所述第一宿主细胞为酵母细胞。

10.如权利要求9所述的方法，其中所述第一宿主细胞选自下组：念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。

11.如权利要求10所述的方法，其中所述第一宿主细胞选自下组：产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。

12.如权利要求1所述的方法，其中所述第二宿主细胞选自植物、细菌、真菌、酵母或动物细胞。

13.如权利要求12所述的方法，其中所述第二宿主细胞为酵母细胞。

14.如权利要求13所述的方法，其中所述第二宿主细胞选自下组：念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。

15.如权利要求14所述的方法，其中所述第二宿主细胞选自下组：产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。