CN102239183B - 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用 - Google Patents

大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用 Download PDF

Info

Publication number
CN102239183B
CN102239183B CN200880132268.3A CN200880132268A CN102239183B CN 102239183 B CN102239183 B CN 102239183B CN 200880132268 A CN200880132268 A CN 200880132268A CN 102239183 B CN102239183 B CN 102239183B
Authority
CN
China
Prior art keywords
ser
ala
thr
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880132268.3A
Other languages
English (en)
Other versions
CN102239183A (zh
Inventor
孙廷薰
裴贞勋
金炫辰
林光默
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Korea Research Institute of Bioscience and Biotechnology KRIBB
Original Assignee
Korea Research Institute of Bioscience and Biotechnology KRIBB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Korea Research Institute of Bioscience and Biotechnology KRIBB filed Critical Korea Research Institute of Bioscience and Biotechnology KRIBB
Priority to CN201410174695.5A priority Critical patent/CN103952425B/zh
Publication of CN102239183A publication Critical patent/CN102239183A/zh
Application granted granted Critical
Publication of CN102239183B publication Critical patent/CN102239183B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1051Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及鉴定用于超量分泌制备重组蛋白质的合适的分泌融合配偶体(SFP)的方法。SFP可通过分泌蛋白质组分析获得。重组蛋白可与分泌融合配偶体(SFP)一起以融合蛋白形式制备得到,并通过体外蛋白酶处理与SFP相分离。本发明的SFP极大地提高了目标蛋白和肽的分泌水平,所述目标蛋白和肽对于生物制药和生物产业很有价值。

Description

大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制 备中应用
技术领域
本发明属于重组蛋白质表达领域。特别是,本发明涉及分泌融合配偶体和筛选合适的分泌融合配偶体(SFP)的技术。本发明公开了用于实现高水平分泌目标多肽的最佳SFP。本发明的SFP可诱导超量分泌制备重组蛋白质。
背景技术
目标蛋白质的重组表达是广泛用来生产大量用于研究目的或治疗和其它商业用途的蛋白质的方法。本领域已知有多种重组表达系统,包括细菌、酵母和哺乳动物宿主细胞系统,并且许多不同蛋白质已在这些系统中成功生产。然而,使用现有表达系统还有许多蛋白质很难生产,导致很少或没有蛋白质表达和分泌。提高重组表达蛋白质分泌的方法,例如过量表达分子伴侣和折叠酶(Hackel等人,Pharm Res 23:790(2006);Poewer和Robinson,Biotechnol Prog 23:364(2007);Shusta等人,Nat Biotechnol 16:773(1998))、过量表达与分泌途径相关的基因((Carla Fama等人,Biochim Biophys Acta 1773:232(2007);Wentz和Shusta等人,Appl Environ Microbiol 73:1189(1998))、对前导序列进行操作(Clements等人,Gene 106:267(1991);Kjaerulff和Jensen,Biochem Biophys Res Commun336:974(2005);Sagiya等人,Microbiol.Biotechnol 42:358(1994);Li等人,BitechnolProg 18:831(2002))已在特定的目标蛋白上取得一定成功。
提高蛋白质生产能力的另一种方法是将目标蛋白连接到融合配偶体上。作为融合配偶体使用的分泌蛋白包括人血清白蛋白(Kang等人,Protein Expr Purif 53:331(2007);Huang等人,J.Pept.Sci 14:588(2008))、α-乳白蛋白(WO1995027782A1)、红素氧还蛋白(WO2000039310A1)、人胰高血糖素(WO2000053777A1)、八目鳗抗菌肽相关肽(WO2005019242A2)、磷酸核酮糖激酶(US6500647B1)、蛋白质二硫键异构酶(Kajino等人,Appl Environ Microbiol 66:638(2000)、葡萄球菌A蛋白(Moreno等人,Protein ExprPurif 18:242(2000)、Hsp150蛋白(Sievi等人,Biotechnol.Prog.19:1368(2003)、纤维素结合域(Ahn等人,Appl Microbiol Biotechnol.64:833(2004))和金结合肽(US20050106625A1)已在特定的目标蛋白上取得一定成功。
为了鉴定分泌蛋白和新信号序列,已开发了数个信号序列捕获系统。美国专利No.6,228,590描述了一种筛选哺乳动物信号序列的技术,其使用含有哺乳动物编码序列且与报告蛋白融合的核酸转化报告蛋白缺乏的酵母,并检测分泌报告蛋白的细胞。一种使用缺乏转化酶的酵母和转化酶报告蛋白的类似系统公开于欧洲专利EP0907727中。基于酵母的信号序列捕获已用于鉴定来自人DNA(Klein等人,Proc.Natl.Acad.Sci.USA 93:7108(1996);Jacobs等人,Gene 198:289(1997))、鼠DNA(Gallicioti等人,J.MembraneBiol.183:175(2001))、斑马鱼DNA(Crosier等人,Dev.Dynamics 222:637(2001))、拟南芥DNA(Goo等人,Plant Mol.Biol.41:415(1999))、马铃薯DNA(Surpili等人,Anais deAcademia Brasileira de Ciencias 74:599(2002))和白色念珠菌DNA(Monteoliva等人,Eukaryotic Cell 1:514(2002))的分泌蛋白。已开发了使用哺乳动物宿主细胞(Gallicioti等人,J.Membrane Biol.183:175(2001))和细菌宿主细胞(Ferguson等人,Cancer Res.65:8209(2000)的类似捕获系统。已用于信号序列捕获的报告蛋白包括转化酶(Klein等人,Proc.Natl.Acad.Sci.USA 93:7108(1996))、α-淀粉酶(U.S.Patent No.6,228,590)、酸性磷酸酯酶(PHO5)(Surpili等人,Anais de Academia Brasileira deCiencias 74:599(2002))和β-内酰胺酶(Ferguson等人,Cancer Res.65:8209(2000))。
鉴定对目标蛋白分泌有用的翻译融合配偶体(TFPs)的方法公开于WO 2005/068658中。该方法包含:(i)制备多个宿主细胞,所述的宿主细胞用包含核酸片段的文库和与编码报告蛋白的核苷酸序列融合的编码目标蛋白的核苷酸序列的多种载体进行转化;其中所述的宿主细胞缺乏报告蛋白;和(ii)从宿主细胞中鉴定出TFP文库,其中该TFP文库包含单独诱导目标蛋白分泌的核酸片段。
在酵母中分泌制备极少分泌型蛋白的翻译融合配偶体(TFP)技术描述于WO 2007/015178。在从酵母基因组中筛选TFP的过程中,发现了YGR106C(Voa1p)基因。目前鉴定出Voa1p蛋白在ER膜上的细胞定位(Ryan等人,Mol.Biol.Cell,Epub ahead of print,Sep17,2008)。Voa1p被认为是5个用于液泡ATP酶的V0装配因子中的一个。
因此本领域仍亟需能提高蛋白表达的其它序列,以及鉴定这些序列的方法。
发明内容
技术问题
本发明涉及使用分泌融合配偶体(SFP)超量分泌制备和有效纯化各种重组蛋白质,所述的分泌融合配偶体可通过分泌蛋白质组分析获得。重组蛋白质以含有分泌融合配偶体的融合体形式在胞外制备,并且可通过体外蛋白酶处理从SFP上分离出来。本发明所述SFP极大地提高了目标蛋白的分泌水平并改良了对生物制药和生物产业有价值的多肽。还描述了选择/筛选SFP的方法。尽管可以确定甚至可以预测是否分泌出特定的蛋白质,但不可能预测出分泌的蛋白质是否具有SFP的功能。本发明的选择/筛选方法使得可能选择出具有SFP功能的蛋白质和该蛋白质的片段或衍生物。用本发明的选择/筛选方法选择出的SFP提高了可用于生物制药和生物产业的蛋白质的重组制备。本发明还包括鉴定出的SFP及其片段和衍生物。
技术方案
因此,本发明的一个目的在于提供鉴定分泌融合配偶体(SFP)的方法,所述的方法包括:
(i)用可操作地连接有异源启动子的编码分泌多肽的多核苷酸转化第一宿主细胞;
(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述的第一宿主细胞是否过量分泌所述的分泌多肽;
(iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞,其中,所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;
(iv)在培养条件下培养所述的第二宿主细胞,其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽;和
(v)确定所述的融合多肽是否分泌到培养基中;从而鉴定所述的过量分泌多肽是否为SFP。
本发明的另一个目的在于提供一种分离的融合多肽,其包括:(i)上述的SFP或其片段或衍生物;和(ii)目标多肽。
本发明另一个目的还在于提供一种分离的融合多肽,其包括:(i)包括含有SEQ IDNO:1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物,其中所述SFP没有跨膜结构域(TM);和(ii)目标多肽。
本发明另一个目的还在于提供一种构建体,其包括:(i)启动子;(ii)编码SEQ IDNO:1的176-213位的氨基酸或其片段或衍生物的第一多核苷酸,其中所述SFP无跨膜结构域(TM);和(iii)编码目标多肽或其衍生物的第二多核苷酸。
本发明的另一个目的还在于提供一种包含上述构建体的宿主细胞。
本发明的另一个目的还在于提供一种重组制备目标多肽的方法,其包括:(i)用编码SFP的多核苷酸和编码目标多肽的多核苷酸转化宿主细胞;(ii)在培养条件下培养所述的宿主细胞,其中从所述的宿主细胞中制备并分泌出包含融合到所述目标多肽的所述SFP的融合多肽;和
(iii)分离所述的融合多肽。
本发明的另一个目的还在于提供一种用上述方法重组制备的目标多肽。
附图说明
从下述的详细说明并结合所附的附图,将更加清楚地理解本发明上述及其它目的、特征和优点。
图1所示为(A)预测的氨基酸序列和SFP1蛋白的结构域;(B)表达连续缺失的SFP1基因的载体示意图;(C)SDS-PAGE分析SFP1蛋白的相对表达水平。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:用YGaT91载体转化的2805株的培养物;2:用YGaT92载体转化的2805株的培养物;3:用YGaT93载体转化的2805株的肉汤培养物;4:用YGaT94载体转化的2805株的肉汤培养物;5:用YGaT95载体转化的2805株的肉汤培养物;6:用YGaT96载体转化的2805株的肉汤培养物;7:用YGaT97载体转化的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。
图2所示为(A)表达SFP1-IL2融合蛋白的载体示意图;(B)SDS-PAGE分析SFP1-IL2融合蛋白表达水平。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:用YGaT92-IL2载体转化的2805株的肉汤培养物;泳道2:用YGaT93-IL2载体转化的2805株的肉汤培养物;泳道3:用YGaT94-IL2载体转化的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)
图3为含有YGaT92-EXD4的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
图4所示为SDS-PAGE分析用不同浓度的肠激酶(Invitrogen,USA)消化纯化后的SFP1-EXD4融合蛋白的结果。泳道1:纯化后的SFP1-EXD4融合蛋白;泳道2:用0.1μl肠激酶37℃消化1小时后纯化的SFP1-EXD4融合蛋白;泳道3:用0.2μl肠激酶37℃消化1小时后纯化的SFP1-EXD4融合蛋白;泳道4:用0.3μl肠激酶37℃消1小时后化纯化的SFP1-EXD4融合蛋白;泳道M:预染色的蛋白质大小标记(Invitrogen)。
图5所示为(A)HPLC分析肠激酶消化的SFP1-EXD4融合蛋白;(B)SDS-PAGE分析HPLC片段。凝胶上的数字表述HPLC片段的编号。
图6所示为MALDI-TOF分析纯化的EXD4蛋白。
图7所示为(A)表达SFP1突变体-EXD4融合蛋白的载体示意图;(B)SDS-PAGE分析SFP1突变体-EXD4融合蛋白表达水平。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:用YGaT92-EXD4载体转化的2805株的肉汤培养物;泳道2:用YGaT921-EXD4载体转化的2805株的肉汤培养物;泳道3:用YGaT922-EXD4载体转化的2805株的肉汤培养物;泳道4:用YGaT923-EXD4载体转化的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。
图8所示为含有YGaMKH-EXD4的重组酵母株在指定发酵时间的分批补料发酵的SDS-PAGE分析。
图9为含有YGaST6-EXD4-HL的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
图10所示为含有YGaMKH-EGF的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
图11所示为(A)HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析和(B)用肠激酶消化后的HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析。
图12为含有YGaMKH-PTH的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
图13所示为SDS-PAGE分析用分泌形式的重组子Kex2p(JH Sohn,KRIBB)和肠激酶(Invitrogen,USA)消化后纯化的HL-PTH融合蛋白。泳道1:纯化后的HL-PTH融合蛋白;泳道2:用Kex2p于37℃消化1小时后纯化的HL-PTH融合蛋白;泳道3:用肠激酶37℃消化1小时后纯化的HL-PTH融合蛋白;泳道M:预染色的蛋白质大小标记(Invitrogen)。
图14所示为(A)2805株的生长曲线,箭头所指是取样点;(B)样品细胞经荧光染料hochest染色后的共焦激光扫描显微镜结果。
图15所示为样品M2的双向凝胶电泳结果。
图16所示为1-DE/MudPIT的SDS-PAGE分析1-DE/MudPIT(多维蛋白质鉴定技术,Multidimensional Protein Identification Technology)。
图17所示为(A)表达19个选自分泌蛋白质组分析的基因的Y2805转化株培养物上清液的SDS-PAGE分析。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:过量表达BGL2基因的2805株的肉汤培养物;泳道2:过量表达CIS3基因的2805株的肉汤培养物;泳道3:过量表达CRH1基因的2805株的肉汤培养物;泳道4:过量表达CWP1基因的2805株的肉汤培养物;泳道5:过量表达DSE4基因的2805株的肉汤培养物;泳道7:过量表达EGT2基因的2805株的肉汤培养物;泳道8:过量表达EXG1基因的2805株的肉汤培养物;泳道9:过量表达GAS1基因的2805株的肉汤培养物;泳道10:过量表达GAS3基因的2805株的肉汤培养物;泳道11:过量表达GAS5基因的2805株的肉汤培养物;泳道12:过量表达PST1基因的2805株的肉汤培养物;泳道13:过量表达SCW4基因的2805株的肉汤培养物;泳道15:过量表达SIM1基因的2805株的肉汤培养物;泳道16:过量表达TOS1基因的2805株的肉汤培养物;泳道17:过量表达UTH1基因的2805株的肉汤培养物;泳道18:过量表达YGP1基因的2805株的肉汤培养物;泳道19:过量表达YPS1基因的2805株的肉汤培养物;泳道20:过量表达ZPS1基因的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。SDS-PAGE分析用Endo-H处理后的培养物上清液(B)。
图18所示为SDS-PAGE分析表达出分别与EXD4融合的11个基因的Y2805转化株培养物上清液。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:过量表达BGL2-EXD4基因的2805株的肉汤培养物;泳道2:过量表达GAS3-EXD4基因的2805株的肉汤培养物;泳道3:过量表达GAS5-EXD4基因的2805株的肉汤培养物;泳道4:过量表达PST1-EXD4基因的2805株的肉汤培养物;泳道5:过量表达SCW4-EXD4基因的2805株的肉汤培养物;泳道6:过量表达SCW10-EXD4基因的2805株的肉汤培养物;泳道7:过量表达SIM1-EXD4基因的2805株的肉汤培养物;泳道8:过量表达UTH1-EXD4基因的2805株的肉汤培养物;泳道9:过量表达YGP1-EXD4基因的2805株的肉汤培养物;泳道10:过量表达YPS1-EXD4基因的2805株的肉汤培养物;泳道11:过量表达ZPS1-EXD4基因的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。
图19所示为(A)Kyte-Doolittle亲水性分析和SCW4和EXD4融合体的缺失片段的示意图;(B)SDS-PAGE分析含有逐渐缺失的SCW4-EXD4融合片段的各个转化体培养物上清液。
图20所示为分析分别含有YGa-SCW4-1-EXD4和YGa-SCW4-3-EXD4的重组酵母株2805在分批补料发酵过程中分泌到培养液中的蛋白质的SDS-PAGE结果。
图21所示为分析用肠激酶处理前后分泌的融合蛋白、SCW4-1-EXD4和SCW4-3-EXD4的SDS-PAGE结果。
图22所示为(A)分泌到培养基中的SCW4-hGH的SDS-PAGE结果,肉汤培养10μL含有各自载体的细胞;(B)用肠激酶处理前后的样品。
图23所示为根据发酵时间,分析含有YGa-SCW4-2-hGH的重组酵母株分批补料发酵过程中分泌到培养基中的蛋白质的SDS-PAGE结果。
图24为IL-2表达载体pYGaT92-IL2的载体图。
图25为毒蜥外泌肽-4表达载体pYGaT923-EXD4的载体图。
图26为毒蜥外泌肽-4表达载体pYGaMKH-EXD4的载体图。
图27为毒蜥外泌肽-4表达载体pYGaST6-EXD-HL的载体图。
图28为EGF表达载体pYGaMKH-EGF的载体图。
图29为PTH表达载体pYGaMKH-PTH的载体图。
图30为毒蜥外泌肽-4表达载体pYGaSCW4-1-EXD4的载体图。
图31为毒蜥外泌肽-4表达载体pYGaSCW4-3-EXD4的载体图。
图32为hGH表达载体pYGaSCW4-2-hGH的载体图。
具体实施方式
本发明满足了高水平地分泌目标多肽和快速、有效地筛选可用于获得高水平分泌的目标多肽的SFP鉴定技术。本发明有助于优化任何蛋白的重组表达,尤其有助于因在已知表达系统中表达水平低而不能大规模和/或低成本制备的蛋白质制备。优化后的SFP可获得高水平的目标多肽的分泌。
定义:
应当注意,术语“一”或“一个”个体是指一个或多个体;如“一个载体”应当理解为一个或多个载体。同样,术语“一”(或“一个”)、“一个或多个”和“至少一个”在本申请中可以互换使用。
本发明中,术语“多肽”包括单个的“多肽”以及多个“多肽”,是指通过酰胺键(也称肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或多个氨基酸的任何链,不是指产物具体的长度。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或其它用于指代两个或多个氨基酸的链的任何术语都包括在“多肽”的定义内,而且术语“多肽”用这些中的任何一个替代或可互换使用。术语“多肽”还指多肽表达后修饰的产物,包括但不限于:糖基化、酰基化、磷酸化、酰胺化、用已知的保护/保卫基团衍生物、蛋白水解裂解或用非天然的氨基酸修饰。多肽可来源于天然的生物或通过重组技术制备,但不一定翻译自特定的核酸序列。其可以用任何方法生成,包括化学合成。
“分离的多肽”或其片段、变体或衍生物是指不在其天然环境下的多肽。不需要特别的纯化程度。例如,分离的多肽可移取自其原生的和天然的环境。为本发明目的,在宿主细胞中重组制备的多肽和蛋白被看做进行了分离,其被认为是已经被任何合适的技术分开、分离、部分或基本纯化的原生或重组的多肽。
本发明的多肽还包括前述多肽的片段、衍生物、类似物或变体和其任意组合。当术语“片段”、“变体”、“衍生物”和“类似物”是指本发明的多肽时,包括至少保留一些相应原始多肽的生物学、抗原或免疫的特性。本发明的多肽片段包括蛋白水解片段以及缺失片段,此外还包括其它本申请其它地方描述的特定片段。本发明多肽的变体包括如上所述的片段,还包括由于氨基酸取代、缺失或插入导致氨基酸序列改变的多肽。变体可自然发生或非自然发生。非自然发生的变体可通过使用本领域公知的诱变技术进行制备。多肽变体可包括保守的或非保守的氨基酸取代、缺失或增加。本发明多肽的衍生物包括为具有原始多肽所不具有的额外特性而已经发生改变的多肽。多肽变体在本申请中还指“多肽类似物”。本申请中,多肽的“衍生物”指具有通过功能侧基反应后化学衍生出的一个或多个残基的主体多肽(subject polypeptide)。“衍生物”还包括含有20个基本氨基酸的一个或多个天然氨基酸衍生物的肽。例如,4-羟基脯氨酸可用来取代脯氨酸;5-羟基赖氨酸可用来取代赖氨酸;3-甲基组氨酸可用来取代组氨酸;高丝氨酸可用来取代丝氨酸以及鸟氨酸可用来取代赖氨酸。
“参考氨基酸序列”是指没有任何引入任何氨基酸取代的特异序列。作为本领域技术人员应当理解,如果没有发生取代,本发明“分离的多肽”包括与参考氨基酸序列相同的氨基酸序列。
本发明所述的多肽可具有多种改变,如取代、缺失或插入。可在多肽中取代的典型的氨基酸包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。
还包括与本申请所述的多肽和参考多肽具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的相应多肽片段。
序列一致性的计算是通过比较两个在比较区域进行最佳排列的序列,确定相同氨基酸残基或核苷酸在两个序列中所处位置的数目以获得匹配位置的数目,用比较区域(例如窗口大小)的位置总数目除以匹配位置的数目并将其结果乘以100来获得序列一致性的百分数。一方面;当长度为100个氨基酸或核苷酸的四个空位可被引入以使比对最大化时,一致性百分比的计算是指两个序列中的较小序列氨基酸残基或核苷酸的百分数,其中所述的两个序列与被比序列中的相同氨基酸残基或核苷酸比对(Dayhoff,in Atlas ofProteinSequence and Structure(蛋白质序列和结构地图集),Vol.5,p.124,NationalBiochemical Research Foundation(全国生化研究基金会),Washington,D.C.(1972),作为引文并入本申请)。一致性的确定通常通过本领域已知的计算机同源性程序进行。典型程序为Gap程序(Wisconsin Sequenc Analysis Package(Wisconsin序列分析软件包),Version 8 for UNIX,Genetics Computer Group,University Research Park,Madison,WI),使用默认设置,应用Smith和Waterman的算法(Adv.Appl.Math.,1981,2:482-489,其以引文形式整体并入本申请)。
优选的,任何取代为保守氨基酸的取代。“保守氨基酸取代”是指氨基酸残基用具有相似侧链的氨基酸残基替代。具有相似侧链的氨基酸残基家族在本领域内已有定义。这些家族包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。
在一个实施方案中,本发明涉及一种鉴定分泌融合配偶体(SFP)的方法,所述的方法包括:(i)用可操作地与编码分泌多肽的多核苷酸连接的异源启动子转化第一宿主细胞;(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述第一宿主细胞是否过量分泌所述的分泌多肽;(iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞,其中,所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;(iv)在培养条件下培养所述的第二宿主细胞,其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽;和(v)确定所述的融合多肽是否分泌到培养基中;从而鉴定所述的过量分泌多肽是否为SFP。
在本发明的方法中,可从“分泌蛋白质组”或“总分泌多肽”中鉴定SFP。分泌蛋白质组包括分泌到胞外培养基并从胞外培养基中收集的多肽。任何真核或原核生物的DNA可编码分泌蛋白质组,包括细菌、真菌(如酵母)、植物和动物(如哺乳动物)。适合的细菌包括但不限于:埃希氏杆菌属和芽孢杆菌属。适合的酵母包括但不限于:念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体的物种实例包括:产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。其它可作为DNA来源的真菌包括但不限于:曲霉属、青霉属、根霉属和木霉属。可作为DNA来源的植物包括但不限于:拟南芥、玉米、烟草和马铃薯。适合的动物细胞包括但不限于:人、鼠、白鼠、兔子、狗、猫和猴子。在一个实施方案中,分泌蛋白质组可源自酵母、细菌、植物或动物。
可使用本领域可获得的技术分析分泌蛋白质组用于筛选大量分泌的多肽。例如,从浓缩的培养物上清液中分离出的总分泌多肽可通过双向凝胶电泳和/或多维蛋白质鉴定技术(1-DE/MudPIT)进行分析。可通过任何一种蛋白质纯化柱从分泌蛋白质组分析多肽,如离子交换柱、疏水交互作用柱、凝胶过滤柱、亲和层析柱和反相柱。
在一个实施方案中,分析正常的酵母细胞生长过程中制备的总分泌多肽(酵母分泌蛋白质组)。正常的细胞生长是指细胞培养于基本培养基(如0.67%无氨基酸的酵母含氮碱基、0.5%酪蛋白水解物、2%葡萄糖和0.002%尿嘧啶)。可使用改变的条件,所述条件可包括用不同的碳源替代葡萄糖,如半乳糖、木糖、果糖、甘露糖、蔗糖、棉子糖和纤维二糖。改变的条件还可包括限制培养基中任何组分的水平,如氮或磷。
术语“大量分泌”是指分泌多肽的水平达到至少40%、45%、50%、55%、60%、65%或70%的分泌蛋白质组。大量分泌多肽可通过PAI(蛋白丰富指数,protein abundanceindex)确定(Rappsilber等人,Genome Res.12:1231-45(2002)),其可与分泌蛋白质的量成正比。大量分泌的蛋白的实例列于表1中。
术语“过量分泌”被定义为宿主细胞的多肽分泌水平至少超过用天然启动子表达的多肽分泌水平的5X、6X、7X、8X、9X或10X。还可通过与野生型蛋白分泌水平和大量分泌的多肽分泌水平相比,确定过量分泌。例如,野生型酵母在正常细胞生产过程中,分泌的蛋白不超过20mg/L的分泌水平,然而连接到一个强异源启动子后,一些这样的蛋白就过量分泌,分泌水平超过了20mg/L。
在一个实施方案中,本发明的方法还包括确定用于分泌融合多肽的SFP的最佳大小。SFP的最佳大小可通过缺失分析所述SFP进行确定,其中,比较各自含有不同SFP的缺失构建体的融合多肽的分泌水平。一些SFP可能具有最佳的大小,从而使其融合多肽的表达水平可能甚至高于最初鉴定的SFP的表达水平。与目标多肽融合到次优的SFP上时目标多肽的分泌水平相比,最佳大小的SFP可增加目标多肽的分泌水平。SFP的最佳大小可随目标多肽而变,但只要SFP被首次鉴定后,就可使用本申请的方法或本领域公知的方法进行确定。
在一个实施方案中,选择以亲水序列结束的SFP缺失片段。蛋白的亲水结构域通常定位于蛋白表面的附近。因此,SFP和目标多肽的结合点连接可轻易地暴露于两个多肽之间,使得蛋白酶更易在体外切割连接点而释放目标多肽。
术语“其片段”,如SFP所使用的,是指含有任意部分的SFP的氨基酸序列的多肽,其中该片段基本保留了诱导与其融合的目标多肽分泌的能力。
本申请中所用的术语“基本上保留诱导与其融合的目标多肽分泌的能力”是指保留原始SFP的诱导与其融合的目标多肽分泌的能力至少50%的片段或其衍生物。在一些实施方案。至少保留60、65、70、75、80、85、90或95%诱导与其融合的目标蛋白分泌的能力。诱导目标多肽分泌的能力可通过本领域公知和前述的常规技术来确定。
术语“其衍生物”,如SFP所使用的,是指由与SFP的氨基酸序列至少70%相同的氨基酸序列组成的多肽,其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中,该衍生物包含与SFP的氨基酸序列至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的氨基酸序列。该衍生物还可包含对SFP氨基酸序列的增加、删除、取代或其组合。衍生物可包括用1、2、3、4、5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。
SFP的衍生物的实例包括但不限于:缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)SFP中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术,如文所引的参考文献中所述,制备SFP的衍生物或编码SFP的核酸的衍生物,并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。
在一个实施方案中,用本发明的方法鉴定SFP或其衍生物或片段。在另一个实施方案中,编码SFP的核苷酸序列选自下述:BGL2(SEQ ID NO:62)、GAS3(SEQ ID NO:63)、GAS5(SEQ ID NO:64)、PST1(SEQ ID NO:65)、SCW4(SEQ ID NO:66)、SCW10(SEQ ID NO:67)、SIMI(SEQ ID NO:68)、UTH1(SEQ ID NO:69)、YGP1(SEQ ID NO:70)、YPS1(SEQ ID NO:71)和ZPS1(SEQ ID NO:72)。在另一个实施方案中,SFP选自下述:BGL2(SEQ ID NO:80)、GAS3(SEQ IDNO:81)、GAS5(SEQ ID NO:82)、PST1(SEQ ID NO:83)、SCW4(SEQ ID NO:84)、SCW10(SEQ IDNO:85)、SIMI(SEQ ID NO:86)、UTH1(SEQ ID NO:87)、YGP1(SEQ ID NO:88)、YPS 1(SEQ IDNO:89)和ZPS1(SEQ ID NO:90)。
本发明的方法可使用术语“目标多肽”或其衍生物,它们为被期望有高水平重组表达的多肽。术语“其衍生物”如所用于“目标多肽”,是指由与多肽的氨基酸序列至少70%相同的氨基酸序列组成的多肽,其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中,该衍生物包含与目标多肽的氨基酸序列至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。该衍生物还可包含对目标多肽的氨基酸序列的增加、缺失、取代或其组合。衍生物可包括用1、2、3、4、5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。
目标蛋白或目标多肽的衍生物的实例包括但不限于:缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)目标多肽中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术,如本文所引的参考文献中所述,制备目标多肽的衍生物或编码目标多肽的核酸的衍生物,并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。
如目标多肽融合到SFP,目标多肽和SFP就不是同样的天然存在蛋白的多肽。目标多肽可为正以研究目的而研究的多肽或正以商业为目的如制药和产业用途而生产的多肽。目标多肽可来自于任何植物、动物或微生物,只要它可以被核酸编码,可以是天然发生的或经过修饰的。在一个实施方案中,目标多肽为人类蛋白。在另一个实施方案中,目标多肽为细胞因子、血清蛋白、集落刺激因子、生长因子、激素或酶。
例如,目标多肽可选自下述:白细胞介素、凝结因子、干扰素-α、-β或-γ、粒细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子、组织生长因子、上皮生长因子、TGFα、TGFβ、表皮生长因子、血小板衍生生长因子、成纤维细胞生长因子、促卵泡激素、促甲状腺激素、抗利尿激素、色素性激素、甲状旁腺激素、促黄体生成激素释放激素、碳水化合物特异性酶、蛋白水解酶、脂肪酶、氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、免疫球蛋白、细胞因子受体、乳铁蛋白、磷脂酶A2激活蛋白、胰岛素、胖瘤坏死因子、降钙素、降钙素基因相关肽、脑啡肽、生长调节素、促红细胞生成素、下丘脑释放因子、催乳素、绒毛膜促性腺激素、组织纤溶酶原激活物、生长激素释放肽、胸腺体液因子、抗癌肽或抗菌肽。具体实例包括但不限于:人白细胞介素-2(hIL-2)、毒蜥外泌肽-3、毒蜥外泌肽-4(EXD4)、胰高血糖素样肽-1(GLP-1)、甲状腺激素(PTH)、人白细胞介素-1β、人白细胞介素-6、人白细胞介素-32α、-32β或32γ、VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β或-γ、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β-1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖醛酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、牛半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YM1 & 2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白24、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。
在一个实施方案中,目标多肽为很难用常规的重组制备方法制备的多肽,也即不能制备或仅以很低的水平进行制备。在另一个实施方案中,目标多肽为易于用已知的表达系统进行制备的多肽,但期望其获得更高水平的表达。
在一个实施方案中,本发明的融合多肽是指包含分泌多肽以任何顺序融合到目标多肽而形成的多肽。在另一个实施方案中,本发明涉及包含融合到目标多肽的本发明SFP的分离融合多肽。
术语“融合的”在本申请中是指重组制备的融合多肽。在一个实施方案中,融合多肽包含融合到目标多肽的分泌多肽,其中分泌多肽和目标多肽以任何顺序进行融合。在另一个实施方案中,SFP在目标多肽的N-末端或C-末端进行融合。SFP和目标多肽可使用或不使用插入的氨基酸如由连接DNA编码的氨基酸进行融合。在一些实施方案中,SFP和目标多肽的距离可为0~10;0~20;0~30;0~40个或更多氨基酸。在一些实施方案中,融合多肽包含蛋白酶识别序列和或亲和标签。
在一个实施方案中,分离的融合多肽包括含有SEQ ID NO:1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物和目标多肽。在一个实施方案中,修饰的HL结构域由SEQ ID NO:45编码。
本发明还涉及使用本发明的SFP重组制备目标蛋白的方法。在一个实施方案中,该方法包括:制备构建体,所述构建体包含编码目标蛋白的核苷酸序列,该核苷酸序列可操作性地连接至编码SFP或其衍生物或片段的核苷酸序列;用所述构建体转化宿主细胞;在宿主细胞生成和分泌目标蛋白的条件下培养宿主细胞;再从所述的目标多肽中分离出SFP。
目标蛋白可使用任何本领域已知表达系统重组制备。优选地,目标蛋白在例如细菌、酵母或哺乳动物细胞培养物中重组表达。重组表达包括:制备包含编码目标蛋白的多核苷酸的载体,运送载体至宿主细胞,在目标蛋白表达条件下培养宿主细胞,以及分离目标蛋白。制备重组载体和使用同样的载体转化宿主细胞、在宿主细胞中复制载体和表达生物活性外源多肽和蛋白质的方法和材料在前面讨论且描述于Sambrook等人,MolecularCloning(《分子克隆》),第三版,Cold Spring Harbor Laboratory(冷泉港实验室),2001和Ausubel等人,Current Protocols in Molecular Biology(《现代分子生物学教程》),JohnWiley & Sons,New York第三版(2000),均以参阅的方式纳入本申请。
目标蛋白可从宿主细胞生长的培养基中分离出来,通过本领域已知的纯化方法例如常规色谱方法包括免疫亲和层析法、受体亲和层析法、流水作用色谱法、凝集素亲和层析法、尺寸排阻过滤法、阳离子或阴离子交换色谱法、高效液相色谱法(HPLC)、反相HPLC等。其它纯化方法还包括那些预期多肽作为融合多肽被表达和纯化的方法,其中所述的融合多肽具有特定的亲和肽、标签、标记或被特定结合配偶体或试剂识别的螫合部分。经纯化的蛋白质可断裂以获得预期蛋白,或可作为完整的融合蛋白被保存。作为断裂过程的结果,亲和标签组分的断裂可生成具有其它氨基酸残基的预期蛋白质形式。在一个实施方案中,亲和标签为GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、S-标签或其组合。
本发明的目标多肽与分泌融合配偶体以融合形式在胞外制备,并可通过体外蛋白酶处理从SFP中分离出来。如果被分离的目标蛋白在采用分离操作后没有生物活性,可使用多种方法使多肽发生“重折叠”或转化成其三级结构并生成二硫键使之恢复生物活性。本领域普通技术人员已知的方法包括在特定浓度的离液剂存在下将溶解的多肽的pH调节至通常大于7。离液剂的选择类似于包涵体增溶作用的选择,但是通常浓度较低且不必要和增溶作用使用同种离液剂。可能需要使用还原剂或特定比例的还原剂和其氧化形式,以得到特定的氧化还原电位使蛋白质的半脱氨酸桥形成中可发生二硫键的转移。一些常用的氧化还原对包括半脱氨酸/胱胺、谷胱苷肽(GSH)/二硫代谷胱甘肽、氯化铜、二硫苏糖醇(DTT)/二噻烷DTT、2-巯基乙醇(bME)/二硫代-b(ME)。为了增加重折叠效率,可能有必要使用助溶剂,例如甘油、多种分子量的聚乙二醇和精氨酸。
术语“多核苷酸”包括单个核酸以及多个核酸,是指分离的核酸分子或构建体,如信使RNA(mRNA)、病毒来源的RNA或质粒DNA(pDNA)。多核苷酸可包括常规的磷酸二酯键或非常规的键(如酰胺键,例如发现于肽核酸中(PNA))。术语“核酸”是存在于多核苷酸的指任何一种或多种核酸片段,如DNA或RNA片段。“分离的”核酸或多核苷酸是指从它的原始环境中移取的核酸分子,DNA或RNA。例如,载体中所含的编码治疗用多肽的重组多核苷酸被认为是为本发明目的的分离的重组多核苷酸。分离的多核苷酸的进一步的实例包括异源宿主细胞中维持的重组多核苷酸或溶液中的(部分地或大体上地)纯化的多核苷酸。分离的RNA分子包括本发明体内或体外的RNA转录本以及本申请公开的瘟病毒载体的正链和负链形式和双链形式。
本发明分离的多核苷酸或核酸包括该合成制备的分子。此外,多核苷酸或核酸可为或可包括调控元件,如启动子、核糖体结合位点或转录终止子。
本申请使用的“编码区域”为含有翻译成氨基酸的密码子的核酸的一部分。尽管“终止子”(TAG、TGA或TAA)不翻译成氨基酸,但它被认为是编码区域的一部分,但如果存在任何侧翼序列,如启动子、核糖体结合位点、转录终止子、内含子、5′和3′非编码区等则不是编码区的一部分。本发明的两个或多个编码区可存在于单个的多核苷酸构建体如在单个载体中,或分别存在于多核苷酸构建体如分别(不同)的载体中。此外,任何载体可含有单个编码区或可包含两个或多个编码区,如本发明的载体可编码一个或多个多肽,其通过蛋白酶裂解翻译后或共翻译分离出最终的多肽。此外,本发明的载体、多核苷酸、或核酸可编码异源编码区,可以融合或不融合到本发明的第一或第二编码区或其变体或衍生物。异源编码区包括不受限的特殊的元件或基序,如分泌的信号肽或异源功能域。
在某些实施方案中,多核苷酸或核酸为DNA。对于DNA,多核苷酸包括核酸,其通常编码包括启动子和/或其它转录或翻译控制元件可操作地与一个或多个编码区相连的多肽。当基因产物,如多肽的编码区可操作地与一个或多个调节序列连接时,这样在调控序列的影响或控制下进行基因产物的表达。如果启动子功能的诱导导致了编码所期望的基因产物的mRNA的诱导,如果两个DNA片段之间的自然的连接没有干扰表达调节序列直接表达基因产物的能力,或没有干扰的表达或转录DNA模板的能力,那么两个DNA片段(如多肽编码区和与之相连的启动子)是“可操作性地连接”的,因此,如果启动子可影响核酸的转录,那么启动子区是可操作性地与编码多肽的核酸相连。启动子可以为细胞特异性启动子,其基本上只在预定的细胞内的指导DNA的大量转录。除启动子外的其它的转录控制元件,如增强子、操作子、抑制子和转录终止信号可与多核苷酸可操作性地相连,以指导细胞特异性转录。本申请公开了合适的启动子和其它转录控制区域。
各种转录转录控制区域是本领域技术人员公知的。它们包括但不限于:在脊椎动物中发挥功能的转录控制区域,例如不限于巨细胞病毒的启动子和增强元件(如与内含子A相连的即刻早期启动子)、猴病毒40(如早期启动子)和逆转录病毒(如劳氏肉瘤病毒)。其它转录控制区域包括来自于脊椎动物基因,如肌动蛋白、热激蛋白、牛生长激素和兔β-球蛋白的启动子以及其它可在真核生物细胞中控制基因表达的序列。此外合适的转录控制区域包括组织特异性启动子和增强子以及淋巴因子可诱导启动子(如可被干扰素或白细胞介素诱导的启动子)。
同样的,各种翻译控制元件是本领域技术人员公知的。它们包括但不限于:核糖体结合位点、翻译起始和终止密码子和源自病毒系统的元件(特别为内部核糖体进入位点,或IRES,也被称为CITE序列)。
本发明的多核苷酸可包括RNA,如信使RNA(mRNA)形式的。本发明的RNA可以是单链或双链的。
本发明的多核苷酸和核酸编码区域可与其它的编码分泌或信号多肽的编码区域相关,其指导本发明多核苷酸编码的多肽分泌。根据信号假说,哺乳动物细胞分泌的蛋白具有信号肽或分泌前导序列,其在穿越粗面内质网的生长中蛋白链开始输出时裂解自成熟蛋白。本领域技术人员应当了解,通过脊椎动物的细胞分泌的多肽通常具有融合到多肽N-末端的信号肽,其裂解自全部或“全长”多肽中而产生分泌的或“成熟”形式的多肽。在某些实施方案中,使用了天然的信号肽如免疫球蛋白的重链或轻链信号肽,或使用与多肽可操作性相连、保留指导多肽分泌能力的序列的功能性衍生物。或者,可使用异源哺乳动物信号肽或其功能性衍生物。例如,野生型前导序列可被人组织型纤维蛋白溶酶原激活剂(TPA)或鼠β-葡糖酸醛酶的前导序列取代。
术语“构建体”是指非天然存在的核酸分子。构建体是编码融合多肽的多核苷酸。在一个实施方案中,构建体编码含有SFP或候选的SFP和目标多肽的融合多肽。构建体可进一步包括环状或线性载体,并可与其它多核苷酸组合,如进行同源重组。
如本申请所使用的,术语“载体”是指能够转运与其相连的另一个核酸的核酸分子。一种载体是“质粒”,它是指能连接其它DNA片段的环状双链DNA环。另一种载体是病毒载体,其中其它DNA片段可连接到该病毒基因组中。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌的复制起始区的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)一旦引入至宿主细胞后就整合至宿主细胞的基因组中从而随着宿主基因组复制。本发明的载体能够指导编码与它们可操作性连接的目标蛋白基因的表达。这些载体在本文中称为“表达载体”。一般而言,在重组DNA技术中有用的表达载体通常是质粒的形式。在本说明书中,“质粒”和“载体”可互换使用,因为质粒是载体的最常用形式。但是,本发明也包括具有相同功能的其它形式的表达载体,例如病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺伴随病毒)。
载体DNA可通过常规的转化或转染技术导入到原核或真核细胞内。如本申请所使用的,术语“转化”和“转染”是指各种本领域公知的将外源核酸(如DNA)引入到宿主DNA的技术,包括磷酸钙或氯化钙共沉淀法、DEAE-dextran介导的转染法、脂质体转染法或电转法。适合转化或转染宿主细胞的方法可见Sambrook等人的(MOLECULAR CLONING:A LABORATORYMANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.,1989)和其它实验室手册。
已知的是,哺乳动物细胞的稳定转染取决于表达载体和所用的转染技术,仅有一小部分的细胞可将外源DNA整合到其基因组中。为鉴定和选择这些整合体,通常将编码选择标记(如抗抗生素)的基因随目标基因一起导入到宿主细胞内。各种选择标记包括那些抗药标记,如G418、潮霉素和甲胺嘌呤。可将编码选择标记的基因和编码目标多肽的基因在同一个载体或在各自的载体上导入宿主细胞。用导入的核酸稳定地转染过的细胞可通过药物选择、营养缺陷型的选择、基质组合物、碳源选择或其它本领域公知的方法(如含有选择标记基因的成活,而其它细胞死亡)鉴别。
在一个实施方案中,编码本发明的方法中所使用的多肽或其片段或衍生物的核苷酸序列还可在5′端和3′端包含用于与本发明的线性载体进行体内同源重组的DNA。当5′端和3′端DNA共转化到宿主细胞内时,它们能提供足够的序列以允许编码多肽或其片段或衍生物的核苷酸序列和线性载体之间进行体内重组。在一个实施方案中,5′端和3′端DNA各自包含至少20个与线性载体序列重叠的碱基对,如至少30个或40个碱基对。可使用常规的重组技术添加5′和3′DNA,如PCR和/或限制性内切酶消化和连接。
本发明的多核苷酸还可编码亲和标签,如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、或S-标签。亲和标签可由连接DNA编码或由本发明其它部分的多核苷酸编码,如融合蛋白编码区域的5′或3′部分。
本发明的多核苷酸还可包括连接DNA。在一个实施方案中,连接DNA编码连接肽。
本发明的连接DNA可足够长,并与线性载体的核苷酸序列部分具有足够的一致性,从而在它们共转化到宿主细胞内后,允许编码多肽的核苷酸序列和线性载体之间发生体内重组。在一个实施方案中,连接DNA的长度至少为20个碱基对,或至少长度为30个或40个碱基对。在进一步的实施方案中,连接DNA至少与相应的线性载体的序列具有80%的一致性,例如至少85%、90%、95%或99%的一致性。
在一个实施方案中,连接DNA编码蛋白酶识别序列,从而允许在SFP和目标多肽的连接点发生裂解。例如,连接DNA可编码酵母kex2p-或Kex2样蛋白酶识别序列(如含有Lys-Arg、Arg-Arg或Leu-Asp-Lys-Arg(SEQ ID NO:74)的氨基酸)、哺乳动物弗林蛋白酶识别序列(如含有Arg-X-X-Arg的氨基酸序列)、因子Xa-识别序列(如含有Ile-Glu-Gly-Arg(SEQID NO:75)的氨基酸序列)、肠激酶-识别序列(如含有Asp-Asp-Lys的氨基酸序列)、枯草杆菌蛋白酶-识别序列(如含有Ala-Ala-His-Tyr(SEQ ID NO:76)的氨基酸序列)、烟草蚀刻病毒蛋白酶-识别序列(如含有Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:77)的氨基酸),泛素水解酶-识别序列(如含有Arg-Gly-Gly的氨基酸)或凝血酶-识别序列(如含有Arg-Gly-Pro-Arg(SEQ ID NO:78)的氨基酸)。
在连接子的蛋白酶位点内或在分泌多肽或目标多肽内,优选通过内源宿主蛋白酶避免融合多肽的不想要的裂解。同样,在目标多肽或分泌多肽或SFP或其片段或衍生物内,优选通过用于从目标多肽中裂解分泌多肽的蛋白酶避免裂解。因此,如果作为编码融合多肽的多核苷酸一部分,编码蛋白酶识别序列的连接DNA被转化入宿主细胞时,则所述宿主细胞优选不表达识别连接子内蛋白酶序列的蛋白酶。宿主细胞既可以天然地不表达蛋白酶,或宿主细胞也可以经过修饰而不表达蛋白酶(如kex2突变体宿主细胞、Kex2样蛋白酶突变体宿主细胞和弗林蛋白酶突变体宿主细胞)。如果融合多肽包含分泌多肽和目标多肽,则分泌多肽或SFP或其片段或衍生物和/或目标多肽可天然不包含宿主蛋白酶识别序列,或分泌多肽或SFP或其片段和衍生物和/或目标多肽可以经过修饰而不含有被宿主蛋白酶识别的序列。如果融合多肽包含分泌多肽或SFP或其片段或衍生物、目标多肽和含有蛋白酶识别序列的肽连接子,则分泌序列或SFP或其片段或衍生物和/或目标多肽可天然地不含有蛋白酶识别序列,或分泌多肽或SFP或其片段或衍生物和/或目标多肽可以经过修饰而不含有被肽连接子的蛋白酶识别的序列识别的序列。
在另一个实施方案中,连接DNA编码亲和标签,如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD或S-tag.
在进一步的实施方案中,连接DNA编码限制性内切酶识别位点和蛋白酶识别序列(如kex2p样蛋白酶或kex-2p-识别序列)。
原核生物中多肽表达的实施,可使用含有指导目标蛋白-报告蛋白融合的表达的组成型或诱导型启动子的载体。适合的大肠杆菌表达载体的实例包括pTrc(Amrann等,Gene69:301-315(1988))和pET(Studier等,GENE EXPRES SION TECHNOLOGY:METHODS INENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)。
为了在酵母细胞中表达,合适的酵母表达载体包括,但不限于pYepSecl(Baldari等,EMBO J.6:229-234(1987)),pMFa(Kurjan等,细胞30:933-943(1982))、pJRY88(Schultz等,Gene 54:113-123(1987)),pYES2(Invitrogen Corporation,San Diego,Calif.)和picZ(Invitrogen Corp,San Diego,Cal.)。
为了在昆虫细胞中表达,可使用杆状病毒表达载体。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等,Mol.Cell.Biol.3:2156-2165(1983))和pVL系列(Lucklow等,Virology 170:31-39(1989))。
在另一个实施方案中,宿主细胞是哺乳动物细胞而载体是哺乳动物表达载体。哺乳动物表达载体的实例包括pCDM8(Seed,Nature 329:840(1987))和pMT2PC(Kaufman等,EMBO J.6:187-195(1987))。当用于哺乳动物细胞时,表达载体的调控功能常常由病毒调控元件提供。例如,通常使用的启动子来源于多瘤腺病毒2、巨细胞病毒和猿猴病毒40。其它适合的用于原核和真核细胞两者的表达系统参见例如Sambrook等人,MOLECULAR CLONING:ALABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,N.Y.,1989。
优选的载体包括但不限于:质粒、噬菌体、粘粒、游离基因、病毒颗粒或病毒和整合的DNA片段(例如通过同源重组可整合至宿主基因组的片段)。优选的病毒颗粒包括但不限于腺病毒、杆状病毒、细小病毒、疱疹病毒、痘病毒、腺相关病毒、塞姆利基森林病毒、痘苗病毒和逆转录病毒。优选的表达载体包括但不限于:pcDNA3(Invitrogen)和pSVL(PharmaciaBiotech)。其它表达载体包括但不限于:pSPORTTM载体、pGEMTM载体(Promega)、pPROEX载体TM(LTI、Besda、MD)、BluescriptTM载体(Strata基因)、pQETM载体(Qiagen)、pSE420TM(Invitrogen)和pYES2TM(Invitrogen)。
在一个实施方案中,表达载体是复制型DNA构建体,其中编码目标多肽的DNA序列可操作性地连接或结合至能够影响目标多肽在合适宿主中表达的合适调控序列中。当它们的功能彼此相关时,DNA区域可操作性地连接或结合。例如,如果启动子能调控该编码序列的转录,则将该启动子可操作性地连接或结合于编码序列。扩增载体不需要表达调控域,而相反,仅需要由复制起始区赋予的在宿主中进行复制的能力和帮助识别转化体的选择基因。表达载体对调控序列的需要取决于选择的宿主和选择的转化方法。一般来说,调控序列包括但不限于:转录启动子、增强子、控制转录的可选操纵子序列、多腺苷酸化信号、编码适合的结合核糖体的mRNA的序列和调控转录和翻译终止的序列。这些调控序列描述于例如,Goeddel,GENR EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)。调控序列包括那些在多种类型的宿主细胞中指导核苷酸序列的组成型表达和那些仅在特定宿主细胞中指导核苷酸序列表达(如组织特异性调控序列)的调控序列。本领域技术人员应当理解表达载体的设计取决于所选择的要转化的宿主细胞、预期的蛋白质表达的水平等等这些因素。
本发明的表达载体可导入宿主细胞从而制备蛋白质或肽,包括本文描述的由核酸编码的融合蛋白或肽。优选载体含有可被宿主生物体识别的启动子。
在一个实施方案中,本发明的启动子是强异源启动子,其用于重组制备外源多肽。异源启动子可以是诱导型或组成型启动子。优选异源启动子为那些用于常规制备蛋白质的启动子,如上文所述的那些。本发明的异源启动子可分为天然或野生型SFP启动子。
本发明的启动子序列可以是原核、真核或病毒的序列。合适的原核序列实例包括λ噬菌体的PR和PL启动子(The bacteriophage Lambda,Hershey,A.D.,Ed.,Cold SpringHarbor Press,Cold Spring Harbor,NY(1973)其以参阅的方式全文并入本申请;λII,Hendrix,R.W.,Ed.,Cold Spring Harbor Press,Cold Spring Harbor,NY(1980),其以参阅的方式全文并入本申请);大肠杆菌的trp、recA、热休克和lacZ启动子以及SV40早期启动子(Benoist等,Nature,290:304-310(1981),其以参阅的方式全文并入本申请)。对于酵母,合适的启动子的实例包括但不限于:GAPDH、PGK、ADH、PHOS、GALI和GAL10。其它启动子包括但不限于:小鼠乳腺瘤病毒、人免疫缺陷症病毒长末端复制、maloney病毒、巨细胞病毒立即早期启动子、EB病毒(Epstein Bar virus)、劳氏肉瘤病毒、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌酸和人金属硫蛋白。
其它调控序列也可包括在优选的载体中。合适的调控序列的实例以噬菌体MS-2的复制酶基因和λ噬菌体的cII基因的夏因-达尔加诺序列为代表。
此外,合适的表达载体可包括允许筛选转化的宿主细胞的适当标记。所选宿主的转化使用本领域技术人员公知和先前Sambrook等人描述的各种技术中的任意一种来进行。
复制起始区还可通过构建载体以包括外源的起始区来提供或通过宿主细胞染色体复制机制提供,如果将载体整合入宿主细胞染色体,后者就足够了。或者,相比使用含有病毒复制起始区的载体,本领域技术人员可使用用选择性标记和目标蛋白DNA共转化的方法来转化哺乳动物细胞。合适标记的一个实例是二氢叶酸还原酶(DHFR)或胸苷激酶(参见美国专利4,399,216)。
编码目标蛋白的核苷酸序列可用载体DNA利用常规技术重组,包括平末端或粘末端(staggered)连接、限制性酶消化来提供适当的末端、适当补平粘性末端、碱性磷酸酶处理以避免非预期的连接以及用适当的连接酶连接。这些操作的技术先前由Sambrook等人公开且在本领域内公知。构建哺乳动物表达载体的方法公开于例如Okayama等人,Mol.Cell.Biol.3:280(1983),Cosman等,Mol.Immunol.23:935(1986),Cosman等,Nature312:768(1984)、EP-A-0367566和WO 91/18982,它们各自均以参阅的方式全文并入本申请。
本发明所用的宿主细胞可以是本领域技术人员公知的任何宿主细胞。合适的宿主细胞包括细菌、真菌、(例如酵母)、植物或动物(例如哺乳动物或昆虫)细胞。合适的酵母细胞包括念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体实例包括产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。其它合适的真菌包括曲霉属、青霉属、根霉属和木霉属。可用作宿主细胞的细菌包括埃希氏杆菌属、假单胞菌属和杆菌属。合适的植物宿主细胞包括拟南芥、玉米、烟草和马铃薯。动物细胞包括人、小鼠、大鼠、兔、狗、猫、猴和昆虫。实例包括CHO、COS1、COS 7、BSC1、BSC40、BMT 10和Sf9细胞。在一个具体的实施方案中,宿主细胞为酵母细胞。
本发明的多核苷酸可导入宿主细胞作为环状质粒的部分或作为包含分离蛋白质编码区域的线性DNA或病毒载体。本领域公知且常规进行的将DNA导入宿主细胞的方法包括转化、转染、电穿孔法、核注射或与载体如脂质体、胶束、血影细胞和原生质体融合。
任何可快速有效检测的报告蛋白可用于本发明。在一个实施方案中,为了使筛选过程自动化,报告蛋白具有可被积极选择的活性。在另一个实施方案中,报告蛋白是分泌至细胞外间隙的蛋白质,例如转化酶、蔗糖酶、纤维素酶、木聚糖酶、麦芽糖酶、淀粉酶、葡萄糖淀粉酶、半乳糖苷酶(例如α-半乳糖苷酶、β-半乳糖苷酶、蜜二糖酶)、磷酸酶(例如PHO5)、β-内酰胺酶、脂肪酶或蛋白酶。在一个具体的实施方案中,分泌蛋白允许细胞在特定底物上生长。作为哺乳动物细胞中报告基因系统的实例,CD2/新霉素-磷酸转移酶(Ceo)基因可用作含有抗生素G418的培养基中的分泌报告基因以捕获在小鼠胚胎干细胞中的分泌通路基因(De-Zolt等,Nucleic Acid Res.34:e25(2006))。
在一个实施方案中,宿主细胞是酵母,报告蛋白是转化酶,转化的酵母细胞根据它们在蔗糖或蜜三糖上生长的能力来选择。在另一个实施方案中,宿主细胞是酵母,报告蛋白是蜜二糖酶;转化的酵母细胞根据它们在蜜二糖上生长的能力来选择。在另一个实施方案中,宿主细胞是酵母,报告蛋白是淀粉酶(例如内淀粉酶、外淀粉酶、β-淀粉酶或葡萄糖淀粉酶),酵母细胞是非淀粉分解的,转化的细胞根据它们降解淀粉的能力来筛选。在另一个实施方案中,鉴定具有报告蛋白活性的细胞的步骤通过使用具有生长抑制因子抗性的报告蛋白来进行,例如抗生素。在另一个实施方案中,报告蛋白是能够目测的蛋白质,例如绿色荧光蛋白或荧光素酶。在一个实施方案中,鉴定显示报告蛋白活性的细胞的步骤通过使用两个或多个报告蛋白例如脂肪酶和转化酶来进行。
本发明的宿主细胞不显示报告蛋白活性。在一个实施方案中,宿主细胞不天然表达报告蛋白。在其它实施方案中,编码报告蛋白的基因已被全部或部分缺失或已突变以使得报告蛋白不表达或以无活性形式表达。使一个细胞缺乏一种特定蛋白质的方法在本领域内公知;并且任何此种方法可用来制备本发明的宿主细胞(前述Sambrook等人)。对于酵母来说,报告蛋白缺乏可使用公知的基因置换技术来引入(Rothstein,Meth.Enzymol.194:281(1991))。
可使用本领域技术公知的技术从任何来源获得编码目标多肽的核酸,包括从基因组或cDNA中分离、通过PCR扩增或化学合成。
可从任何形式的DNA,包括基因组DNA、cDNA、合成的DNA和重组DNA获得核酸或其片段的文库。除DNA外,还可使用核酸,包括RNA和非天然存在的核酸。可通过多样化预先鉴定核酸片段,如单一缺失、突变、功能性序列的增加(如糖基化位点)或核酸片段之间的前和后信号序列的交换获得预先选定的核酸片段文库。在一个实施方案中,核酸片段大小小于1000碱基对,如小于700、500或300个碱基对。核酸片段的文库可通过DNA酶切割、DNA合成或重组DNA技术(如单一缺失、突变)构建。
核酸片段可源自生物的整个基因组,如整个基因组或cDNA文库。片段还可源自整个基因组的子集,如扣除文库或一定大小的文库(sized library)。
下列实施例用于说明而非限制本发明的方法和组合物。其它对在临床治疗中经常遇到的各种条件和参数的合适的修饰和调节对本领域技术人员显而易见的,也在本发明的精神和范围内。
实施例
实施例1确定胞外分泌用YGR106C基因的最佳大小
本实施例阐释了胞外分泌所需的YGR106的最佳区域。如图1A所示,YGR106C(下称分泌融合配偶体1,SFP1)蛋白(SEQ ID NO:1)由包含信号肽的256个氨基酸残基、三个糖基化位点、一个亲水性结构域(HL)和一个跨膜结构域组成。
在GAL10启动子的调控下过量表达完整的YGR106C基因在培养基中没有产生YGR106C蛋白。然而,在酵母GAL10启动子的调控下,使用C-末端截短形式的YGR106C,在培养基中高水平地分泌出截短的SFP1(SEQ ID NO:1的氨基酸1-213)。
确定用于分泌的SFP1基因最佳区域进一步鉴定。通过Kyte-Doolittle亲水性分析(图1A)确定几种SFP1蛋白的功能结构域,如分泌信号(SEQ ID NO:1的氨基酸1-19)、亲水结构域(HL)(SEQ ID NO:1的氨基酸176-213)和跨膜结构域(TM)(SEQ ID NO:1的氨基酸220-247)。
构建含有具有连续缺失的SFP1基因的不同载体的重组酿酒酵母(Saccharomycescerevisiae)2805菌株(Mat a ura3 INV2 pep4::HIS3 can1)并比较各个载体分泌的SFP1相关蛋白(图1B)。起初,为表达完整的SFP1蛋白,用PCR引物、含有BamHI位点的正向引物T9F(SEQ ID NO:2)和含有SalI位点的反向引物H159(SEQ ID NO:3),从酿酒酵母2805基因组DNA扩增出SFP1的开放阅读框(ORF)。用Pfu聚合酶(Stratagene,USA)或Ex-Taq DNA聚合酶(TaKaRa Korea Biomedical Inc.,韩国首尔)进行PCR扩增。PCR条件包括:94℃变性5min,94℃进行25个扩增循环30sec,55℃30sec和72℃1min,最后72℃延伸7min。扩增出的SFP1ORF用BamHI-SalI酶切,再亚克隆到YEGα-HIR525的BamHI-SalI位点(Sohn等,ProcessBiochem.30:653(1995)),生成的质粒命名为YGaT91。
为表达C末端缺失TM结构域的截短SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H160(SEQ ID NO:4),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT92。
为表达C末端缺失一半HL结构域的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H161(SEQ ID NO:5),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT93。
为表达C末端缺失HL结构域的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H162(SEQ ID NO:6),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT94。
为表达C末端缺失第三个糖基化位点的截短的SFP1蛋白,用正向引物T9F(SEQ IDNO:2)和反向引物H205(SEQ ID NO:7),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT95。
为表达C末端缺失第二个糖基化位点的截短的SFP1蛋白,用正向引物T9F(SEQ IDNO:2)和反向引物H204(SEQ ID NO:8),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT96。
为表达C末端缺失第一个糖基化位点的截短的SFP1蛋白,用正向引物T9F(SEQ IDNO:2)和反向引物H203(SEQ ID NO:9),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT97。
用构建的载体(YGaT91、YGaT92、YGaT93、YGaT94、YGaT95、YGaT96和YGaT97)转化酿酒酵母2805菌株。从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、1%葡萄糖、1%半乳糖)中30℃培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩,并通过SDS-PAGE分离。如图1C所示,只在携带YGaT92、YGaT93和YGaT94的细胞中检测到SFP1相关蛋白(分别为泳道2、3和4)。在所有的三个阳性菌株中均检测到两条带,一条为糖基化形式,另一条为非糖基化形式。但其它细胞,YGaT91、YGaT95、YGaT96和YGaT97没有这些条带(分别为泳道1、5、6和7)。该结果表明去除TM结构域并保留所含的所有三个糖基化位点使SFP1可进行胞外分泌。
实施例2确定作为融合配偶体用于分泌目标蛋白的SFP1基因的最佳大小
本实施例阐释了SFP1衍生物作为融合配偶体的应用。为测试SFP1衍生物作为融合配偶体用于示例性目标蛋白人白介素-2(hIL-2)的分泌,分别用YGaT92、YGaT93和YGaT94的三个SFP1衍生物(SFP1-92(SEQ ID NO:39)、SFP1-93(SEQ ID NO:40)和SFP1-94(SEQ IDNO:41)),构建了三个载体以表达融合蛋白hIL-2(图2A)。还生成了hIL-2和SFP1-91(SEQ IDNO:38)的融合蛋白,数据未示出。为了用YGaT92的SFP1-92融合hIL2基因,用识别GAL10启动子的正向引物GAL100(SEQ ID NO:10)和反向引物H121(SEQ ID NO:11)从YGaT92载体扩增出SFP1基因片段。为方便与hIL2基因融合从而诱导酵母二肽蛋白酶Kex2p体内裂解hIL2融合蛋白(Mizuno K等,Biochem.Biophys.Res.Commun.156:246(1988)),设计了H121引物(SEQ ID NO:11)以含有Kex2p裂解序列和N-末端hIL2序列。用含有与H121引物(SEQ ID NO:11)互补的部分SFP1序列的正向引物IL2F(SEQ ID NO:12)和反向引物IL2R(SEQ ID NO:13)扩增人IL-2基因。IL2R引物含有部分GAL7终止子序列。使用GAL100和GT50R(SEQ ID NO:14)引物,使扩增得到的含有SFP1-92和hIL-2基因的PCR片段通过重叠-衍生PCR进行融合。GT50R引物为识别GAL7终止子的反向引物。生成的PCR产物含有100bp的GAL10启动子和50bp的GAL7终止子侧翼序列。酿酒酵母作为表达宿主的一个优点在于可以使用有效和正确的同源重组策略。本领域公知的是线性化载体和在片段末端每一侧共有DNA序列重叠的的DNA片段可进行重组,恢复质粒的环状拓扑(Kunes等,Genetics.115:73(1987))。酿酒酵母的这一特性被用来构建表达宿主系统。
为使用YGaT92载体作为体内重组的骨架,将YGaT92载体用BamHI/SalI酶切。用凝胶回收试剂盒(Bioneer,韩国)从琼脂糖凝胶中回收线性化载体。用GAL100/GT50R引物扩增获得的PCR产物与线性化载体有50个共有的核苷酸。体内重组最小的要求为约30个核苷酸的重叠(Oldenberg等,Nucleic Acids Res.25:451(1997)。50个核苷酸的重叠足以在酿酒酵母中进行质粒的重新构建。通过共转化上述的PCR产物和载体片段直接构建酿酒酵母2805的重组子。通过重组构建的质粒命名为YGaT92-IL2(图24)。为构建转化YGaT93-IL2载体的酿酒酵母2805菌株,除了使用(SEQ ID NO:15)代替H121引物(SEQ ID NO:11),我们使用与YGaT92-IL2质粒构建中相同的方法。H120引物为识别YGaT93载体的SFP1基因的3’末端并含有Kex2p裂解序列和hIL2的N-末端序列的反向引物。为用YGaT94-IL2载体转化酿酒酵母2805株,除了使用H119引物(SEQ ID NO:16)代替H121引物(SEQ ID NO:11),使用如YGaT92-IL2质粒构建中相同的方法。H119引物为识别YGaT9载体的SFP1基因的3’末端并含有hIL2的N-末端序列的反向引物。
从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、1%葡萄糖、1%半乳糖)中30℃培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩,并通过SDS-PAGE分离。如图2B所示,携带有YGaT92-IL2(SEQ ID NO:58)和YGaT93-IL2的细胞分泌出SFP1衍生蛋白和hIL2(分别为泳道1和2),但携带YGaT94-IL2的细胞没有分泌(泳道3)。结果表明以融合形式表达时,HL结构域对于SFP1衍生蛋白的分泌是非常重要的。
实施例3融合有SFP1衍生物的目标蛋白的表达
实施例2中从YGaT92构建的SFP1-92(SEQ ID NO:39)用于分泌制备Exendin-4(EXD4),一种胰高糖素样肽1(GLP1)的39个氨基酸的肽类似物。为简单和有效地纯化完整的EXD4蛋白,将6-组氨酸标签和肠激酶裂解位点(DDDDK(SEQ ID NO:79),D:天冬氨酸,K:赖氨酸)加入到SFP1的C-末端。因而,N-末端至C-末端的融合蛋白包括SFP1片段、6-组氨酸标签、肠激酶裂解位点和EXD4序列。为构建表达SFP1-92EXD4融合蛋白的YGaT92-EXD4载体,用GAL100引物(SEQ ID NO:10)和反向引物HDK-R(SEQ ID NO:17)从YGaT92载体扩增出SFP1-92基因,所述的反向引物HDK-R识别HL序列并含有6个组氨酸密码子。用含有18个与HDK-R引物和DDDDK密码子互补的正向引物HDK-F(SEQ ID NO:18)和含有18个GT50R(SEQ ID NO:14)引物序列的反向引物EXD-R(SEQ ID NO:19)扩增出EXD4基因。扩增出的SFP1-92和EXD4基因用GAL100/GT50R引物对通过重叠-延伸PCR进行融合。如实施例2所述,通过共转化融合的片段和BamHI/SalI酶切的YGaT92载体片段在体内重组直接构建携带YGaT92-EXD4载体的酿酒酵母2805菌株的重组子。
将用YGaT92-EXD4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐,评价其诱导分泌制备SFP1-92-EXD4融合蛋白的能力。使用种子培养基(6.7%不含氨基酸的酵母氮源、0.5%酪蛋白水解物和2%葡萄糖)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基(4%酵母提取物、1%蛋白胨、2%葡萄糖)作为初始发酵培养物OD600达到约15时,根据细胞生长速率提供不同用量的补料培养基(15%酵母提取物、30%葡萄糖、30%半乳糖)。培养48小时后,培养物OD600达到约160。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图3A-B)。与标准蛋白条带相比,分泌的SFP1-EXD4估算约为500mg/L。离心去除酵母细胞,收集上清液,浓缩并超滤脱盐(Quickstand,Amersham)。
融合蛋白,SFP1-92-EXD4用Ni-NTA亲和层析柱(QIAGEN,USA)纯化(图4,泳道1)。为了从SFP1-92融合蛋白中回收EXD-4,纯化的融合蛋白用不同浓度的肠激酶(Invitrogen,USA)进行消化。将样品溶于肠激酶缓冲液[20mM Tris-HCl(pH8.0)、50mM NaCl、2mM CaCl2]中。将等量的蛋白样品用0.1、0.2和0.3μl的肠激酶于37℃消化1小时。生成的蛋白用SDS-PAGE进行分析(图4,分别为泳道2、3和4)。
产生了数条小的蛋白条带,而不是两个条带。那些小的片段有可能是肠激酶非特异性消化SFP1的结果。SFP1蛋白含有DDK(第137个氨基酸)和EDK(第168个氨基酸)残基,其有可能是肠激酶的底物。
为进一步分析从SFP1-92-EXD4分离的EXD-4,通过HPLC分离肠激酶处理后的样品(图4,泳道3)(图5A)。HPLC谱图中检测到的蛋白峰用SDS-PAGE进行分析(图5B)。HPLC流分号41显示出预期为EXD-4的单个条带。通过MALDI-TOF(Korea Basic Science Institute,Daejeon,韩国)(图6)进一步分析该蛋白用于确定其分子量(MW)。从SFP1-92融合蛋白中制备的EXD-4的MW为4187.8Da,这与通过其氨基酸序列计算得到的MW相符。
为构建抗肠激酶的强SFP1-92融合配偶体,将DDK和EDK残基分别变为DGK和EGK残基(图7A)。为将DDK残基变成DGK残基,用GAL100引物(SEQ ID NO:8)和含有甘氨酸密码子而不是DDK残基的天冬氨酸密码子的反向突变引物H307(SEQ ID NO:20),从YGaT92-EXD4中扩增5’SFP1-92片段。用与H307(SEQ ID NO:20)互补的正向引物H306(SEQ ID NO:21)和GT50R引物(SEQ ID NO:14),从YGaT92-EXD4载体中扩增3’SFP1-92-EXD4片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/SalI消化后,将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列,并命名为含有SFP1-921的YGaT921-EXD4(SEQ ID NO:42)。
为将EDK残基变成EGK残基,用GAL100引物(SEQ ID NO:10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309(SEQ ID NO:22),从YGaT92-EXD4中扩增5’SFP1片段。用与H309(SEQ ID NO:22)互补的正向引物H308(SEQ ID NO:23)和GT50R引物(SEQ ID NO:14),从YGaT92-EXD4中扩增3’SFP1-92-EXD4片段。用GAL100/GT50R引物对进行重叠延伸PCR融合这些片段。用BamHI/SalI消化后,将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列,并命名为含有SFP 1-922的YGaT922-EXD4(SEQ ID NO:43)。
为了分别将DDK和EDK残基都变成DGK和EGK,用GAL100引物(SEQ ID NO:10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309(SEQ ID NO:22),从YGaT91-EXD4中扩增5’SFP1片段。用与H309(SEQ ID NO:22)互补的正向引物H308(SEQ IDNO:23)和GT50R引物(SEQ ID NO:14),从YGaT92-EXD4中扩增3’SFP1-EXD4片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/SalI消化后,将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列,并命名为含有SFP1-923的YGaT922-EXD4(图25)(SEQ ID NO:44)。
用载体YGaT92-EXD4、YGaT921-EXD4、YGaT922-EXD4和YGaT923-EXD4转化酿酒酵母2805菌株。从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、1%葡萄糖、1%半乳糖)中30℃培养40小时。用0.4mL的丙酮沉淀含有蛋白的0.6mL培养物上清液,并溶于肠激酶缓冲液[20mM Tris-HCl(pH8.0)、50mM NaCl、2mM CaCl2]中。将等量的蛋白样品用0.1μl的肠激酶37℃消化1小时,并用SDS-PAGE进行分离。
如图7B所示,由YGaT92-EXD4转化子制备的SFP1被消化成大约15kDa的片段(图7B,泳道1),但由YGaT921-EXD4和YGaT922-EXD4转化子制备的SFP1(图7B,分别为泳道2和3)比来自于YGaT92-EXD4的SFP1更抗内源肠激酶的消化。最终,由YGaT923-EXD4(SEQ ID NO:59)转化子制备的绝大多数的SFP1片段是完整的(图7B,泳道4)。因此,结果表明,YGaT923-EXD4的SFP1变体可成功应用于表达和纯化目标蛋白。
实施例4与SFP1的HL结构域融合的目标蛋白的分泌
如实施例2所示,HL结构域在目标蛋白的分泌中发挥着重要作用。HL在目标蛋白分泌中的功能可能是由于HL结构域内带电荷的酸性氨基酸,因为蛋白的可溶性与蛋白的净电荷紧密相关。为研究HL结构域作为融合配偶体的功能,我们使用HL结构域用于EXD4的分泌。
HL结构域融合到目标蛋白的N-末端。用H221(SEQ ID NO:24)/GT50R(SEQ ID NO:14)引物对从YGaT923-EXD4载体中扩增HL-EXD4基因,并用GAL100/LNK-R(SEQ ID NO:25)引物对扩增交配因子α(MFα)的pre-pro前导肽。由于H221和LNK-R引物(SEQ ID NO:25)含有互补的连接序列,这两个片段用GAL100(SEQ ID NO:8)/GT50R(SEQ ID NO:14)引物对通过重叠延伸PCR方法进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaMKH-EXD4(图26)转化子。YGaMKH-EXD4质粒在MFα的pre-pro前导肽和HL肽之间含有连接肽(AASASAGLALDKR),用于体内被Kex2p加工。用YGaMKH-EXD4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备SFP1-92-EXD4融合蛋白的能力。使用种子培养基(6.7%不含氨基酸的酵母氮源、0.5%酪蛋白水解物和2%葡萄糖e)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基(4%酵母提取物、1%蛋白胨、2%葡萄糖)作为初始发酵培养物OD600达到约15时,根据细胞生长速率使用不同用量的补料培养基(15%酵母提取物、30%葡萄糖、30%半乳糖)。培养48小时后,培养物OD600达到约150。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图8)。与标准蛋白条带相比,分泌的HL-EXD4经估算约为200mg/L。
为测试HL肽的C-末端融合到目标蛋白的效果,构建质粒YGaST6-EXD-HL(图27)。用正向引物H412(SEQ ID NO:26)和反向引物H413(SEQ ID NO:27)从YGaMKH-EXD4中扩增出EXD4基因,并用HL-F(SEQ ID NO:28)和HL-GT50R(SEQ ID NO:29)从YGaMKH-EXD4中扩增出HL肽。由于H413引物(SEQ ID NO:27)含有与HL-F引物互补的序列,因此这两个片段用H412(SEQ ID NO:26)/GT50R引物对通过段重叠延伸PCR的方法进行融合。H412引物(SEQ ID NO:26)含有连接序列,并可以通过GAL100(SEQ ID NO:10)/LNK-R(SEQ ID NO:25)引物对融合到MFα的pre-pro前导肽中。每个扩增的片段以MFα的pre-pro前导序列、EXD4和HL结构域基因的顺序用GAL100/GT50R引物通过重叠延伸PCR进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaST6-EXD-HL转化子。用YGaST6-EXD4-HL转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备EXD4-HL融合蛋白的能力。培养48小时后,培养物OD600达到约160。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图9A和B)。与标准蛋白条带相比,分泌的EXD4-HL估算约为500mg/L。在HL融合到EXD4这种情况下,C-末端融合表现出比N-末端融合更高的EXD4分泌水平。因此,结果表明HL结构域无论是在目标蛋白的N-末端还是C-末端均有助于融合蛋白的分泌。然而,C-末端表现出更高的目标蛋白的分泌。
为进一步测试作为融合配偶体的HL结构域,将HL结构域用于表达人表皮生长因子(hEGF)。构建YGaMKH-EGF质粒(图28)。在YGaMKH-EGF中,HL结构域融合到hEGF的N-末端,用GAL100(SEQ ID NO:10)/DDK-R(SEQ ID NO:30)引物对从YGaMKH-EXD4载体中扩增MFα pre-pro肽-HL融合肽基因,并用含有与DDK-R引物互补的序列的正向引物H410(SEQ ID NO:31)和含有与GT50R(SEQ ID NO:14)相同的序列的反向引物H411(SEQ ID NO:32)扩增hEGF基因。每个扩增片段用GAL100/GT50R引物对通过重叠延伸PCR进行融合。用所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段共转化YGaMKH-EGF转化子。
用YGaMKH-EGF转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备HL-EGF融合蛋白的能力。培养48小时后,培养物OD600达到约155。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图10A和B)。与标准蛋白条带相比,分泌的HL-EGF估算约为400mg/L。
通过Ni-NTA亲和层析对HL-hEGF融合蛋白直接进行纯化(图11A)。为分离hEGF和HL肽,纯化后的融合蛋白用肠激酶进行消化,产生的片段再次用Ni-NTA亲和层析进行分离。如图11B所示,完整的纯hEGF(6kD)被有效地纯化出来。
HL结构域还用于分泌制备人甲状旁腺素(hPTH)。通过将HL结构域融合到hPTH的N-末端构建YGaMKH-PTH载体(图29)。用含有与DDK-R引物(SEQ ID NO:30)互补的序列的正向引物H310(SEQ ID NO:33)和含有与GT50R(SEQ ID NO:14)相同的序列的反向引物H311(SEQID NO:34)扩增hPTH基因。用GAL100(SEQ ID NO:10)/GT50R(SEQ ID NO:14)引物对通过重叠延伸PCR将这个片段和MFαpre-pro肽-HL融合肽基因进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaMKH-PTH转化子。用YGaMKH-PTH转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备HL-PTH融合蛋白的能力。培养48小时后,培养物OD600达到约120。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图12A和B)。与标准蛋白条带相比,分泌的HL-PTH估算约为400mg/L。检测到与HL-PTH相关的两条主要的条带。大部分的hPTH是以60kD的MFαpro-HL-PTH融合形式被检测到,这是由于其在体内被Kex2p不完全裂解。也同样检测到了显示Kex2p裂解的HL-PTH条带。与PTH相关的所有分泌蛋白估计大于500mg/L。发酵液上清液中的His标记蛋白通过Ni-NTA亲和层析直接进行纯化。纯化的蛋白在SDS-PAGE中分离出预期的两种条带(图13,泳道1)。比较大的条带(Pro-HL-PTH)通过体外Kex2p加工后消失了(图13,泳道2)。通过肠激酶的消化,融合蛋白(HL-PTH)被正确分离成HL肽和hPTH肽(泳道3)。
实施例1-4表明鉴定和修饰YGR106C基因的最佳区域导致了衍生自SFP1的有效多功能融合配偶体的构建,用于重组蛋白分泌制备和分离。
实施例5从酵母分泌蛋白质组中筛选分泌融合配偶体
本实施例阐明了用于鉴定作为融合配偶体的大量分泌蛋白的技术。
首先,分析正常酵母生长过程中,制备的总酵母分泌蛋白(酵母分泌蛋白质组)。为分离酵母分泌蛋白质组,将酿酒酵母2805菌株培养于基本培养基中(0.67%不含氨基酸的酵母氮源、0.5%酪蛋白水解物、2%葡萄糖和0.002%尿嘧啶)20小时(M1)和40小时(M2)。500mL的培养物上清液通过膜过滤进行浓缩,获得总分泌蛋白。用荧光染料hochest将酵母细胞染色后,用共焦激光扫描显微镜证实酵母细胞的完整性(图14A和B)。
M2分泌蛋白质组样品通过双向凝胶电泳进行分析(图15)。除了用于去除总蛋白样品中的核糖核酸污染而加入的RNaseA,分泌蛋白质组的大多数蛋白在酸性区进行鉴定。如图15所示,双向凝胶电泳不足以鉴定所有M2样品中存在的分泌蛋白。因此,还使用1-DE/MudPIT(多维蛋白质鉴定技术)方法来更加完整地鉴定酵母的分泌蛋白质组(图16)。结果表明,分别从M1和M2中鉴定出57个和83个蛋白。综合起来,鉴定出98个特异的蛋白。这中间,有42个蛋白是M1和M2样品中普遍检测到的。为证实该蛋白最有可能是分泌蛋白,使用两个程序WoLF PSORT和pTARGET进行蛋白的定位预测和信号预测。在42个蛋白中,预测有35个蛋白(80%)为分泌蛋白(表1)。
表1通过酵母分泌蛋白质组分析鉴定出的35个基因以及通过MASS分析确定的其蛋白丰富指数(PAI)。
Gi编号 标准命名 系统命名 PAI
1 6320260 PST1 YDR055W 15.4
2 6323331 EXG1 YLR300W 9.9
3 6321718 SCW4 YGR279C 9.1
4 6324169 YGP1 YNL160W 7.2
5 6321721 BGL2 YGR282C\ 5.8
6 6324419 ZPS1 YOL154W 5.1
7 6319552 ECM33 YBR078W 4.2
8 6323964 SCW10 YMR305C 3.4
9 6323871 GAS3 YMR215W 3.4
10 6323967 GAS1 YMR307W 2.8
11 6322895 UTH1 YKR042W 2.5
12 6323150 YPS3 YLR121C 2.2
13 6319638 TOS1 YBR162C 2.2
14 6321628 CRH1 YGR189C 2.2
15 6322754 CWP1 YKL096W 1.5
16 6324002 EGT2 YNL327W 1.5
17 6324395 DSE4 YNR067C 1.5
18 6322303 CIS3 YJL158C 1.5
19 6322068 SIM1 YIL123W 1.2
20 6324543 GAS5 YOL030W 1.0
21 6323014 BPT1 YLL015W 1.0
22 6322864 PRY2 YKR013W 0.7
23 6319568 PHO3 YBR092C 0.7
24 6321906 BZZ1 YHR114W 0.7
25 6323288 HSP60 YLR259C 0.7
26 6323139 CCW12 YLR110C 0.6
27 6323423 CCW14 YLR390W-A 0.6
28 6323009 KNS1 YLL019C 0.6
29 6321410 SCW11 YGL028C 0.5
30 6322290 N/A YJL171C 0.5
31 6322287 KRE9 YJL174W 0.3
32 6322684 PIR1 YKL164C 0.3
33 6324263 SUN4 YNL066W 0.2
34 6321496 SPR3 YGR059W 0.2
35 6322753 CWP2 YKL096W-A 0.2
许多分泌蛋白被鉴定为细胞壁蛋白和GPI(糖基化磷脂酰肌醇)锚定蛋白。通过与分泌蛋白的数量成正比的PAI(蛋白丰富指数)确定大量分泌的蛋白(Rappsilber等,GenomeRes.12:1231-45(2002))。基于这种分析,筛选出20个大量分泌蛋白。
用19条不同的正向引物(SEQ ID NO:35)和反向引物(SEQ ID NO:36)从基因组DNA中扩增19个大量分泌蛋白的基因。扩增的DNA片段的5′和3′端分别含有一段与部分的GAL10启动子和GAL7终止子同源的序列,如上所述,用于和EcoRI-SalI消化的YEGα-HIR525进行体内重组。通过转化线性化载体和PCR片段,经过体内重组易于获得酵母转化子。从19个不同的PCR片段中获得的20个不同的转化子培养于YPDG培养基中(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)。300μL的各个培养物上清液用丙酮浓缩。每个丙酮浓缩的培养物上清液用SDS-PAGE分析,结果如图17A所示。
为了将优良的候选SFP与较差的候选区别开来,通过与野生型蛋白分泌水平相比,确定强启动子下的大量分泌蛋白的分泌水平。与图17A中的泳道WT所示的野生型蛋白分泌水平相比,用强启动子表达出的受试蛋白的子集(11个)的条带特别强,表明蛋白过量分泌到培养物上清液中。糖苷酶、Endo-H处理每个样品产生了与从各蛋白的氨基酸序列中预期一致的合适蛋白大小(图17B),表明绝大多数的过量分泌蛋白是糖基化的。将19个选择出的大量分泌蛋白中的11个即BGL2(SEQ ID NO:80)、GAS3(SEQ ID NO:81)、GAS5(SEQ ID NO:82)、PST1(SEQ ID NO:83)、SCW4(SEQ ID NO:84)、SCW10(SEQ ID NO:85)、SIMI(SEQ ID NO:86)、UTH1(SEQ ID NO:87)、YGP1(SEQ ID NO:88)、YPS1(SEQ ID NO:89)和ZPS1(SEQ ID NO:90),作为用于异源蛋白分泌的候选SFP进行测试。这11个蛋白由下述的多核苷酸编码:BGL2(SEQ ID NO:62)、GAS3(SEQ ID NO:63)、GAS5(SEQ ID NO:64)、PST1(SEQ ID NO:65)、SCW4(SEQ ID NO:66)、SCW10(SEQ ID NO:67)、SIM1(SEQ ID NO:68)、UTH1(SEQ ID NO:69)、YGP1(SEQ ID NO:70)、YPS1(SEQ ID NO:71)和ZPS1(SEQ ID NO:72)。
使用编码各自融合到EXD4的11个过量表达蛋白的多核苷酸的开放阅读框构建融合蛋白的载体。检测11个融合蛋白分泌到培养物上清液中的水平。如图17中从产生各蛋白的各个转化子中获得YGa-ORF载体。为了构建各个融合蛋白的表达载体,用引物GAL100(SEQID NO:10)和11条不同的反向引物(SEQ ID NO:37)从11个含有不同ORF的YGa-ORF载体中扩增11个PCR片段。扩增的DNA片段的5′和3′端分别含有一段与GAL10启动子和毒蜥外泌肽(exendin)-4同源的序列。该11个PCR片段和用引物EXD-F(SEQ ID NO:46)和GT50R(SEQ IDNO:14)从YGaT92-EXD4扩增的毒蜥外泌肽-4作为模板进行11个不同的重叠延伸PCR,所用引物分别为GAL100(SEQ ID NO:10)和GT50R(SEQ ID NO:14)。将每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按如上方式进行转化。每个转化中的两个转化子培养于YPDG培养基(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)中40小时。0.6mL的上清液样品用0.4mL的丙酮浓缩并用SDS-PAGE分析,结果如图18所示。发现6个融合蛋白(GAS3-EXD4、GAS5-EXD4、PST1-EXD4、SCW4-EXD4、YGP1-EXD4和YPS1-EXD4)被有效地分泌到胞外的培养基中。
实施例5表明,从酵母分泌蛋白质组中筛选出的大量分泌蛋白可有效作为分泌融合配偶体用于重组蛋白的分泌制备。尽管实施例5使用的是酵母分泌蛋白,但可使用如本申请说明书中所述的任何生物体的分泌多肽。如本实施例所示,本发明的筛选方法是鉴定SFP的有效方法,因为它将可能的候选SFP从35个分泌蛋白缩小到了11个,而其中的6个被证实是有效的SFP。
实施例6确定作为融合配偶体的SCW4基因的最佳大小
本实施例阐明了作为融合配偶体用于分泌目标蛋白如毒蜥外泌肽-4的SCW4最佳大小的确定。基于Kyte-Doolittle亲水性分析,构建了8个SCW4缺失克隆(图19A)。用GAL100(SEQ ID NO:10)和8个各自含有6个组氨酸序列的不同的反向引物H453-H460(SEQ ID NOs:47-54)扩增8个SCW4片段。分别使用引物GAL100(SEQ ID NO:10)和GT50R(SEQ ID NO:14),通过重叠延伸PCR将扩增片段和用正向引物(SEQ ID NO:55)和GT50R(SEQ ID NO:14)从YGaT92-EXD4扩增出的EXD4基因进行融合。每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按上述实施例中所述的方法进行转化。8个不同转化子的三个克隆培养于YPDG培养基(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)中。对每个样品的10μL肉汤培养物(不经浓缩)直接用SDS-PAGE分析。结果如图19B所示,含有不同SCW4的C-末端片段的SCW4-1、SCW4-2、SCW4-3和SCW4-4作为融合配偶体表现出分泌EXD4的强活性。作为融合配偶体用于分泌EXD4的最佳SCW4大小为小于整个SCW4蛋白(380个氨基酸)的169个氨基酸。
用YGaSCW4-1-EXD4(图30)和YGaSCW4-3-EXD4(图31)转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备融合蛋白的能力。培养48小时后,培养物OD600达到约130。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图20)。与标准蛋白条带相比,分泌的SCW4-1-EXD4(SEQ ID NO:60)和SCW4-3-EXD4(SEQ ID NO:61)估算约为3g/L以上。
为测试SCW4蛋白对肠激酶的抗性,发酵液不经纯化用肠激酶37℃消化1小时。融合蛋白被正确分离成SCW4蛋白和毒蜥外泌肽-4肽,结果如图21所示。因此,这些结果表明修饰的SCW4融合配偶体显著地提高了毒蜥外泌肽-4蛋白的产量并简化了纯化方法。
测试了SCW4作为一般的融合配偶体用于分泌其它蛋白的有效性。使用SCW4-1、SCW4-2、SCW4-3和SCW4-4来分泌制备人生长激素(hGH)。用正向引物(SEQ ID NO:56)和反向引物(SEQ ID NO:57)扩增hGH基因。该片段侧接于一段6个组氨酸和GAL7终止子序列。分别使用GAL100(SEQ ID NO:10)和GT50R(SEQ ID NO:14)引物通过重叠延伸PCR,将PCR扩增得到的SCW4-1、-2、-3和-4片段和hGH基因进行融合。每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按上述方法进行转化。4个不同转化子的2个克隆培养于YPDG培养基(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)中。每个样品的10μL肉汤培养物(不经浓缩)直接用SDS-PAGE分析。结果如图22A所示,每个样品检测到不同大小的SCW4-hGH融合蛋白条带。为确认融合蛋白,培养液上清液用肠激酶37℃消化1小时,用于裂解融合蛋白。从SCW4-1-hGH、SCW4-2-hGH和SCW4-4-hGH重新获得了hGH正确的大小(图22B)。因此,SCW4的N-末端片段作为融合配偶体在分泌hGH以及EXD4方面表现出强活性。
用YGaSCW4-2-hGH(图32)转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备融合蛋白的能力。培养48小时后,在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图23)。与标准蛋白条带相比,分泌的SCW4-2-hGH(SEQ ID NO:73)估算约为3g/L以上。
因此,实施例6的结果表明,SCW4和其片段作为融合配偶体可有效用于目标蛋白的重组表达,并可用于目标蛋白的大量制备。
工业实用性
本发明提供使用分泌融合配偶体超量分泌制备和有效纯化各种重组蛋白的方法,所述的分泌融合配偶体可通过分析分泌蛋白质组获得。重组蛋白与分泌融合配偶体以融合蛋白的形式在细胞外制备,并可通过体外的蛋白酶处理分离重组蛋白。本申请所述的SFP极大地提高了目标蛋白和多肽的分泌水平,有助于生物制药和生物产业。本发明的选择/筛选方法使得可对作为SFP的蛋白和该蛋白的片段和衍生物进行选择。通过本发明的选择/筛选方法选择出的SFP提高了用于生物制药和生物产业的蛋白重组制备。本发明还包括已经鉴定出的SFP和其片段和衍生物。
虽然已对本发明做出了完整的说明,但本领域技术人员应当理解,在不影响本发明范围或其任何实施方案下,在条件、制备和其它参数的较宽和等同范围内,同样可以实施。本申请中所引用的所有专利、专利申请和出版物均以引文形式全文并入本申请。
序列表
<110>韩国生命工学研究院
<120>大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中的应用
<130>OPA08114/PCT
<160>90
<170>PatentIn version 3.3
<210>1
<211>265
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>1
Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys
1 5 10 15
Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser
20 25 30
Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile
35 40 45
Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val
50 55 60
Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Asn Leu Met Ile Asp Glu
65 70 75 80
Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr
85 90 95
Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile
100 105 110
Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu
115 120 125
Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe
130 135 140
Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser
145 150 155 160
Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val
165 170 175
Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu
180 185 190
Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys
195 200 205
Glu Gly Asp Asp Asp Ile Leu Ser Ser Ile Trp Thr Glu Gly Leu Leu
210 215 220
Met Cys Leu Ile Val Ser Ala Leu Leu Leu Phe Ile Leu Ile Val Ala
225 230 235 240
Leu Ser Trp Ile Ser Asn Leu Asp Ile Thr Tyr Gly Ala Leu Glu Lys
245 250 255
Ser Thr Asn Pro Ile Lys Lys Asn Asn
260 265
<210>2
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成的引物T9F
<400>2
ggatccatgg tgttcggtca gctg 24
<210>3
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的引物H159
<400>3
cactccgttc aagtcgactt aattgttttt ttttattgg 39
<210>4
<211>41
<212>DNA
<213>人工序列
<220>
<223>合成的引物H160
<400>4
cactccgttc aagtcgactt aatcatcgtc gccttcttta c 41
<210>5
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的引物H161
<400>5
cactccgttc aagtcgactt actcttctgt tgcatattc 39
<210>6
<211>40
<212>DNA
<213>人工序列
<220>
<223>合成的引物H162
<400>6
cactccgttc aagtcgactt aaaaagccca accaagagag 40
<210>7
<211>32
<212>DNA
<213>人工序列
<220>
<223>合成的引物H205
<400>7
atcggtcgac ttagtcgcca gatttatctt cc 32
<210>8
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物H204
<400>8
atcggtcgac ttaatcatct aaggagtatt catatag 37
<210>9
<211>33
<212>DNA
<213>人工序列
<220>
<223>合成的引物H203
<400>9
atcggtcgac ttaatcgtca tgaacagtta aac 33
<210>10
<211>21
<212>DNA
<213>人工序列
<220>
<223>合成的引物GALL00
<400>10
gtatatggtg gtaatgccat g 21
<210>11
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物H121
<400>11
tcttttatct aaggcgagat catcgtcgcc ttctttac 38
<210>12
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物IL2F
<400>12
ctcgccttag ataaaagagc acctacttca agttctac 38
<210>13
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的引物IL2R
<400>13
gtcactccgt tcaagtcgac ctaagttagt gttgagatg 39
<210>14
<211>50
<212>DNA
<213>人工序列
<220>
<223>合成的引物GT50R
<400>14
gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50
<210>15
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物H120
<400>15
tcttttatct aaggcgagct cttctgttgc atattc 36
<210>16
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物H119
<400>16
tcttttatct aaggcgagaa aagcccaacc aagagag 37
<210>17
<211>44
<212>DNA
<213>人工序列
<220>
<223>合成的引物HDK-R
<400>17
gtcatcgtca ccgtggtgat ggtgatgatg gctcaaagtc tctt 44
<210>18
<211>42
<212>DNA
<213>人工序列
<220>
<223>合成的引物HDK-F
<400>18
caccacggtg acgatgacga taaacatggt gaaggtactt tc 42
<210>19
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物EXD-R
<400>19
gtcactccgt tcaagtcgac ttaagatggt ggtggag 37
<210>20
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成的引物H307
<400>20
gatgctttta ccatctaagg agtattcata 30
<210>21
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成的引物H306
<400>21
tccttagatg gtaaaagcat cgttttgttc 30
<210>22
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成的引物H309
<400>22
cgccagattt accttccaaa aacgataagc 30
<210>23
<211>30
<212>DNA
<213>人工序列
<220>
<223>合成的引物H308
<400>23
tttttggaag gtaaatctgg cgacaatttg 30
<210>24
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物H221
<400>24
ctcgccttag ataaaagagt tattaactct cttggttg 38
<210>25
<211>54
<212>DNA
<213>人工序列
<220>
<223>合成的引物LNK-R
<400>25
cttttatcta aggcgaggcc agcagaggcc gaggcggcca ccccttcttc ttta 54
<210>26
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物H412
<400>26
ctcgccttag ataaaagaca tggtgaaggt actttc 36
<210>27
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物H413
<400>27
accaagagag ttaataacag atggtggtgg agcacc 36
<210>28
<211>20
<212>DNA
<213>人工序列
<220>
<223>合成的引物HL-F
<400>28
gttattaact ctcttggttg 20
<210>29
<211>40
<212>DNA
<213>人工序列
<220>
<223>合成的引物HL-GT50R
<400>29
cactccgttc aagtcgactt agtggtgatg gtgatgatgg 40
<210>30
<211>24
<212>DNA
<213>人工序列
<220>
<223>合成的引物DDK-R
<400>30
cttatcgtca tcgtcaccgt ggtg 24
<210>31
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物H410
<400>31
ggtgacgatg acgataagaa ctccgactcc gagtgtc 37
<210>32
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物H411
<400>32
cactccgttc aagtcgactt actatcatct cagctc 36
<210>33
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物H310
<400>33
ggtgacgatg acgataagtc tgtgagtgaa atacagc 37
<210>34
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物H311
<400>34
cactccgttc aagtcgactt actgggattt agctttag 38
<210>35
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<220>
<221>misc_feature
<222>(20)..(37)
<223>n为a,c,g,或t
<400>35
gaaaattcaa gaattcatgn nnnnnnnnnn nnnnnnn 37
<210>36
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<220>
<221>misc_feature
<222>(21)..(38)
<223>n为a,c,g,或t
<400>36
actccgttca agtcgactta nnnnnnnnnn nnnnnnnn 38
<210>37
<211>36
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<220>
<221>misc_feature
<222>(19)..(36)
<223>n为a,c,g,或t
<400>37
gaaagtacct tcaccatgnn nnnnnnnnnn nnnnnn 36
<210>38
<211>798
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-91
<400>38
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgata ttttaagctc catctggact 660
gaaggactac taatgtgttt aatagtttct gcgttgctat tgttcatttt gattgttgca 720
ctttcttgga tatctaattt ggatatcaca tatggtgcgt tggaaaaatc aacaaaccca 780
ataaaaaaaa acaattaa 798
<210>39
<211>639
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-92
<400>39
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210>40
<211>591
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-93
<400>40
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga g 591
<210>41
<211>552
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-94
<400>41
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt tt 552
<210>42
<211>639
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-921
<400>42
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210>43
<211>639
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-922
<400>43
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210>44
<211>639
<212>DNA
<213>人工序列
<220>
<223>修饰后的酵母SFP1-923
<400>44
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgat 639
<210>45
<211>114
<212>DNA
<213>人工序列
<220>
<223>合成的修饰后的HL结构域
<400>45
gttattaact ctcttggttg ggcttttgaa gatgaagatg gtgacgatga atatgcaaca 60
gaagagactt tgagccatca tgataacaac aagggtaaag aaggcgacga tgat 114
<210>46
<211>18
<212>DNA
<213>人工序列
<220>
<223>合成的引物EXD-F
<400>46
catggtgaag gtactttc 18
<210>47
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>47
cgtggtgatg gtgatgatga gcagcagcgg tagctac 37
<210>48
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>48
cgtggtgatg gtgatgatgg gaggctggag atgcggc 37
<210>49
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>49
cgtggtgatg gtgatgatga cctctgacac cagaggc 37
<210>50
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>50
cgtggtgatg gtgatgatgg tacaatctaa tgactgg 37
<210>51
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>51
cgtggtgatg gtgatgatgg tagtaaatac ctaaaaag 38
<210>52
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>52
cgtggtgatg gtgatgatgt tcgttaccaa tggaaac 37
<210>53
<211>37
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>53
cgtggtgatg gtgatgatgg ttgttgatca cagcaat 37
<210>54
<211>38
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>54
cgtggtgatg gtgatgatgg aaggcagtga ataagaag 38
<210>55
<211>54
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>55
catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttc 54
<210>56
<211>54
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>56
catcatcacc atcaccacgg tgacgatgac gataagttcc caaccattcc ctta 54
<210>57
<211>39
<212>DNA
<213>人工序列
<220>
<223>合成的引物
<400>57
cactccgttc aagtcgactt agaagccaca gctgccctc 39
<210>58
<211>1059
<212>DNA
<213>人工序列
<220>
<223>合成的YG2T92-IL2
<400>58
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatgata acaacaaggg taaagaaggc gacgatgatc tcgccttaga taaaagagca 660
cctacttcaa gttctacaaa gaaaacacag ctacaactgg agcatttact gctggattta 720
cagatgattt tgaatggaat taataattac aagaatccca aactcaccag gatgctcaca 780
tttaagtttt acatgcccaa gaaggccaca gaactgaaac atcttcagtg tctagaagaa 840
gaactcaaac ctctggagga agtgctaaat ttagctcaaa gcaaaaactt tcacttaaga 900
cccagggact taatcagcaa tatcaacgta atagttctgg aactaaaggg atctgaaaca 960
acattcatgt gtgaatatgc tgatgagaca gcaaccattg tagaatttct gaacagatgg 1020
attacctttt gtcaaagcat catctcaaca ctaacttaa 1059
<210>59
<211>756
<212>DNA
<213>人工序列
<220>
<223>合成的YGaT923-EXD4
<400>59
atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60
actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120
aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180
gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240
gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300
tcgcctttgc aaatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360
ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420
ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480
tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540
ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600
catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttcacctct 660
gatttgtcta agcaaatgga agaagaagct gttagattgt tcttggaatg gttgaagaac 720
ggtggtccat cctccggtgc tccaccacca tcttaa 756
<210>60
<211>408
<212>DNA
<213>人工序列
<220>
<223>合成的SCW4-1-EXD4
<400>60
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg ctcatcatca ccatcaccac ggtgacgatg acgataagca tggtgaaggt 300
actttcacct ctgatttgtc taagcaaatg gaagaagaag ctgttagatt gttcttggaa 360
tggttgaaga acggtggtcc atcctccggt gctccaccac catcttaa 408
<210>61
<211>561
<212>DNA
<213>人工序列
<220>
<223>合成的SCW4-3-EXD4
<400>61
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300
tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360
tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtcatca tcaccatcac 420
cacggtgacg atgacgataa gcatggtgaa ggtactttca cctctgattt gtctaagcaa 480
atggaagaag aagctgttag attgttcttg gaatggttga agaacggtgg tccatcctcc 540
ggtgctccac caccatctta a 561
<210>62
<211>942
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>62
atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60
gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120
aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180
aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240
gagggattta ctatctttgt cggtgtttgg ccaacagacg acagtcatta cgctgctgaa 300
aaggctgctt tgcaaaccta tttgccaaaa attaaagaat ccactgttgc tggtttcttg 360
gttggttctg aagccttata ccgtaacgat ttgactgcct ctcaattatc agacaaaatt 420
aatgacgtcc gtagtgtcgt tgctgacatt tccgattctg acggaaagtc atactctggt 480
aagcaagtcg gtactgtcga ttcctggaat gttttggttg ctggttacaa ttctgccgtt 540
atcgaagctt ccgattttgt tatggctaac gcgttctcct actggcaagg tcaaaccatg 600
caaaatgcct cttactcatt ctttgatgat attatgcaag ctctacaggt tatccaatct 660
actaaaggtt ctaccgatat taccttctgg gttggtgaga ccggttggcc aactgatggt 720
accaactttg aaagttctta cccatctgtt gacaacgcca aacaattctg gaaagaaggt 780
atctgttcca tgagagcttg gggtgttaac gttattgttt ttgaagcctt tgatgaagat 840
tggaagccaa acacctctgg tacctctgat gtcgagaagc actggggtgt tttcacttca 900
agtgacaatt tgaaatactc cttggactgt gacttttcat ga 942
<210>63
<211>1575
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>63
atgcaactat ctaaaagtat actactggca gcattagctg ctacaccatc tctggtgaat 60
gccatgctcc ccatccatat caagaattat aggttcatta agccatcctc tgccacaaat 120
agcgaatccg ataacgaagt tttttttgtg aaaggtgtcg attatcagcc tggtgggtcg 180
tctggttacg atgctgactc tgatacagat attctttctg accctgaagt gtgtgccaga 240
gacgcctacg ctttccaaca acttggtgtc aacacagtga gaatttactc cctgaaccct 300
gacctaaatc atgacaagtg catgactatc ttcaacaatg ctggtatcta cgccattttg 360
gatgttaata gtggtaatta cggggagagt ttgaaccgtg ctgacccatc tggaacatat 420
gactctttgt atttgtcaag agtcttcaaa tttattgacg ctttcaagaa ctaccctaac 480
gtgctaggat tcttttctgg caacgaagtc ataaatgatc aaagcgacta tgcaaaaatt 540
gatcctccat acatccgcgc tgttcaaaga gatatgaaac agtatatttc aaaacatgcg 600
aacagaagca tcccagtcgg atattctgct gctgacaata ctgatttgag gttagcaacc 660
ttcaagtact tgcagtgtaa ttcgttggat ggaaacaaag tcaatgatga tttggacata 720
tctaaatctg atttctttgg cctaaatact tatgaatggt gctctggcac ttctagttgg 780
gaatcttctg gctatgacaa gttaaactca actttcgaag atgctgttat tccgttgata 840
ttttctgagt atggttgcaa caaaaataca ccaagaactt ttgacgaagt ctctgagggt 900
ttgtatggtg gtttaaagaa cgtcttctct ggtgggttgg tatacgaata cactgaagaa 960
gctaataatt acggtttggt taagcttgat gatagcggtt ctttaactta taaggatgat 1020
tttgttaatt tagaatcaca attgaagaac gtttcattgc caacaacaaa agaaagcgaa 1080
atatcttctg actctatcta caagtgcgat aacagtgcca tcaccaatat ttattctggc 1140
tttggaacga acaatttcac tttgccttct caaccagcag aaattgccaa tatgattgaa 1200
tacggtgtta atggcaccaa caccggtaag atattgactg attatgctgt tccaactact 1260
tttaactata caattaaaaa caataaagat gataccattt cagctactat ttcatacgac 1320
aaagctaact cactgaacga actagacgtc acagccacaa cggtcgcaaa gtcagcttcc 1380
acatcacaat catcttctcg ctccttaact tcaagcacca gtccatcttc aagcactggc 1440
tcatcttcaa gcaccggttc atcttcagct tcaagcagct ccaaaagtaa aggcgtcgga 1500
aatattgtta atgtttcctt tagtcagtct ggataccttg cattatttgc aggtctgatt 1560
tctgctctac tctga 1575
<210>64
<211>1455
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>64
atgttactac gttctcttac aagtgccttc gttttaagtg ctggtttggc tcaggctgct 60
agcagcagta acagttccac accatccatt gaaattaaag gcaatgcatt ttttaattcg 120
gaatcaggtg aaaggtttta tatccgtggt gttgattacc agcctggtgg ttcttctaac 180
ttgactgatc ccttagcaga cgcatctgtc tgtgacagag acgtccccgt tctgaaagat 240
ctagggataa atactgtcag agtttatact gtggataact cgcaagatca ttcccattgt 300
atgaaactat tgcaggagaa cggtatatac ttgatcctgg atgtcaatac ccccacgagt 360
gctatttctc gttacgatcc agcctgctcc tataacgctg actacttaca aaatgtcttt 420
gccaccattg atacctttgc tgattacgac aatgttctag gttttttcgc tggtaacgag 480
gtcatcaata gtgttaatac taccaacact gctacttatg tcaaggcagt ggtcagggac 540
atgaagaaat acatcaaggc tagaaaatac agacaaattc cggtaggtta ctcggctgct 600
gatatcgtcg ctaacagaca attggctgct gaatacttta actgtggtga tgaagctgac 660
gctagaatcg acatgtttgg tgttaatgac tattcttggt gtggtgaatc ttcatttgtg 720
gtatcgggtt attccaccaa gatgaagcta tatcaagatt actccgttcc tgtcttctta 780
agtgaatttg gttgtaacca agtcaagagc tctcgtccat tcacagaaat tgaagctatc 840
tattccactc aaatgtcttc tgtattctcc ggtgggctag tctacgaata ttccaatgaa 900
actaacaatt acgggctcgt tcaaattgat ggtgacaagg tcactaaatt gacagatttt 960
gaaaacttga aaaatgaata cagcaaagta tccaacccag aaggcaatgg tggttacagt 1020
acttccaaca actattctac atgtcctgat tatgaaaagg gtgtctggga agctaataac 1080
actttgcctg ctatgccaag tgctgcttct gcttacttca catctggagc aggttctcct 1140
atgggaaccg gaatcgccac ccaacaaagt tgtgatgcta aggacgatga cgacgaagaa 1200
gacgacgaca cctcctcttc atcctcttct tcctcttcat cttcatcttc cgcttcttca 1260
tcttctgaat catcatcctc gacttcaaag gcatcttcct cctccccttc tgctagcgaa 1320
acgagcttgc taaaatctgc cgcatctgct acttcgtcca gccaatcgtc ctcgaaatca 1380
aagggtgctg ccggaattat tgagattcct ttgatattcc gtgctttggc agaactttat 1440
aacttggttt tatga 1455
<210>65
<211>1335
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>65
atgcaattac attcacttat cgcttcaact gcgctcttaa taacgtcagc tttggctgct 60
acttcctctt cttccagcat accctcttcc tgtaccataa gctcacatgc cacggccaca 120
gctcagagtg acttagataa atatagccgc tgtgatacgt tagtcgggaa cttaactatt 180
ggtggtggtt tgaagactgg tgctttggct aatgttaaag aaatcaacgg gtctctaact 240
atatttaacg ctacaaatct aacctcattc gctgctgatt ccttggagtc catcacagat 300
tctttgaacc tacagagttt gacaatcttg acttctgctt catttgggtc tttacagagc 360
gttgatagta taaaactgat tactctaccc gccatctcca gttttacttc aaatatcaaa 420
tctgctaaca acatttatat ttccgacact tcgttacaat ctgtcgatgg attctcagcc 480
ttgaaaaaag ttaacgtgtt caacgtcaat aacaataaga aattaacctc gatcaaatct 540
ccagttgaaa cagtcagcga ttctttacaa ttttcgttca acggtaacca gactaaaatc 600
accttcgatg acttggtttg ggcaaacaat atcagtttga ccgatgtcca ctctgtttcc 660
ttcgctaact tgcaaaagat taactcttca ttgggtttca tcaacaactc catctcaagt 720
ttgaatttca ctaagctaaa caccattggc caaaccttca gtatcgtttc caatgactac 780
ttgaagaact tgtcgttctc taatttgtca accataggtg gtgctcttgt cgttgctaac 840
aacactggtt tacaaaaaat tggtggtctc gacaacctaa caaccattgg cggtactttg 900
gaagttgttg gtaacttcac ctccttgaac ctagactctt tgaagtctgt caagggtggc 960
gcagatgtcg aatcaaagtc aagcaatttc tcctgtaatg ctttgaaagc tttgcaaaag 1020
aaagggggta tcaagggtga atcttttgtc tgcaaaaatg gtgcatcatc cacatctgtt 1080
aaactatcgt ccacttccaa atctcaatca agccaaacta ctgccaaggt ttccaagtca 1140
tcttctaagg ccgaggaaaa gaagttcact tctggcgata tcaaggctgc tgcttctgcc 1200
tctagtgttt ctagttctgg cgcttccagc tctagctcta agagttccaa aggcaatgcc 1260
gctatcatgg caccaattgg ccaaacaacc cctttggtcg gtcttttgac ggcaatcatc 1320
atgtctataa tgtaa 1335
<210>66
<211>1161
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>66
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300
tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360
tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtatcac ttatacccca 420
tacgagtcca gcggtgcttg taaatccgct tcggaagttg cttccgattt agctcaattg 480
actgacttcc cagtcattag attgtacggt accgactgta accaagttga aaatgttttc 540
aaggctaagg cttcgaacca aaaagtcttt ttaggtattt actacgttga ccaaatccaa 600
gacggtgtca acaccatcaa gtctgctgtt gaatcttacg gttcttggga cgatgtcacc 660
actgtttcca ttggtaacga attggttaac ggtaaccaag ctaccccatc ccaagtcggt 720
caatacattg actctggtag atctgccttg aaggctgccg gttacactgg tccagttgtt 780
tctgttgata cttttattgc tgtgatcaac aaccctgaat tgtgtgacta ctccgactac 840
atggctgtta atgcccatgc ttactttgac aagaacacag ttgcccaaga ctccggtaaa 900
tggttactag aacaaatcca aagagtctgg actgcttgtg atggtaagaa gaatgttgtt 960
atcactgagt ctggttggcc atcaaagggt gagacttacg gtgttgctgt tccatctaag 1020
gaaaatcaaa aggacgctgt ttccgccatt accagctcct gtggtgctga taccttctta 1080
ttcactgcct tcaacgacta ctggaaggcc gacggtgctt acggtgttga aaaatactgg 1140
ggtattctat ccaatgaata a 1161
<210>67
<211>1170
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>67
atgcgttttt caaatttcct aactgtatct gcattattaa ccggagctct aggagctcct 60
gctgttcgcc ataaacatga aaagcgtgac gttgttactg ccacagtcca tgcgcaggtt 120
actgttgtcg tttccggtaa cagcggcgaa actattgttc cagtgaacga gaatgctgtt 180
gtagctacta ccagcagtac tgcagttgct tctcaagcaa ctacatccac tttagaacca 240
acaacttccg ctaatgtcgt cacttctcaa caacaaacca gcactcttca atcttccgag 300
gcagcatcta cggttggttc ttcgacttca tcctcaccct catcctcatc ctcaacttca 360
tcttcagctt catcctccgc ttcatctagt atctcagcct ccggtgctaa gggtattact 420
tacagtcctt acaatgatga tgggtcctgt aaatctactg ctcaagtcgc ctcagattta 480
gaacagttga ctggttttga caacatcaga ttatatggcg ttgactgtag tcaggttgag 540
aatgtcttgc aagctaaaac ttcaagccag aaattattct taggcatata ttacgttgac 600
aaaattcaag acgccgttga tactattaaa tctgcagttg agtcttatgg ctcctgggat 660
gatattacca ctgtttctgt cggtaacgaa ctggtcaatg gcggttctgc cactacgacg 720
caagtcggtg aatacgtttc cacggccaag tcagctttaa cctctgctgg ttatacaggc 780
tcagtcgttt ccgttgatac cttcattgct gttataaata accctgacct gtgtaattat 840
tctgactata tggctgtcaa cgcccatgca tacttcgatg aaaatactgc ggcccaagat 900
gcaggaccat gggtactaga acaaatcgaa agggtttaca ctgcttgtgg tgggaaaaag 960
gacgtcgtta ttaccgaaac tggttggcca tctaagggtg atacttacgg cgaagctgtc 1020
ccatctaaag caaaccaaga agccgccatt tcttctatca aaagctcctg cggctcttca 1080
gcttacttat ttaccgcctt caatgatcta tggaaagatg atgggcaata cggtgttgaa 1140
aaatactggg gtattctatc aagtgattaa 1170
<210>68
<211>1428
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>68
atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60
ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120
tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180
gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240
tccgcagccg ctgggatagc cgcttccatt gctgtttcat ctgctgcctt agccaagaat 300
gagaaaatct ctgatgccgc tgcatctgcc actgcctcaa catctcaagg ggcatcctcc 360
tcctcctcct cctcctcggc aacttctacc ctagaaagca gctctgtttc ttcatctagt 420
gaagaagctg ctccaacatc tactgtcgtg tcaacttctt ccgcaaccca atctagtgct 480
tcttctgcca ctaaatctag tacttcttcc acttcaccat ctacttctac ttctacttcc 540
acttcttcta cttcctcttc ctcttcctcc tcctcctcct cttcttcttc ttcttctggc 600
agtggtagta tctacggtga tttggccgac ttttcaggcc caagtgagaa attccaagac 660
ggcactattc catgtgacaa attcccatct ggtcaaggtg tcatttctat tgactggatt 720
ggcgagggtg gatggtccgg tgtggaaaac accgacactt ccactggcgg ttcatgcaag 780
gaggggtcct actgttccta ctcctgccaa ccaggtatgt ctaagaccca atggccatcc 840
gatcaaccat ctgacggtag atctgtcggg ggtttgttgt gtaaaaatgg ttatttgtac 900
cgttctaaca ctgacgcgga ttacttatgt gaatggggtg tcgaggctgc ctatgttgtt 960
tctaaactaa gcaagggtgt cgccatttgc agaaccgact acccgggcac tgaaaacatg 1020
gttatcccaa cctatgttga agggggtagc tctttgccat tgaccgttgt tgaccaagat 1080
acttacttta cttgggaagg caaaaagaca tctgctcaat actacgttaa taacgccggc 1140
gtctcagttg aagatgggtg tatctggggt acttctggat ctggtattgg taactgggca 1200
ccattaaact ttggtgctgg ctccactggt ggagtgacat acttatcatt gattcctaac 1260
ccaaacaaca gcgacgcatt gaactacaac gtcaagatag ttgctgctga tgattcatcc 1320
aatgtcatcg gtgaatgtgt ttacgaaaat ggtgagttct ctggcggtgc tgacgggtgt 1380
accgtctctg ttacttccgg taaagctcat ttcgtcttat acaattaa 1428
<210>69
<211>1098
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>69
atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60
gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120
tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180
gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240
gccgctacta cctctgccgc cgcctcttct tcctcctctt cctcttcctc ctcttcctct 300
tcttcctctg ttggttctgg agattttgaa gatggtacca tttcctgttc tgatttccca 360
tccggacaag gtgctgtctc cttggactgg ttaggtctag gcggctgggc ttccatcatg 420
gacatgaacg gtaacaccgc cacctcttgt caagacggat actactgttc ttacgcttgt 480
tctccaggtt acgctaagac ccaatggcct tctgaacaac cttccgatgg tagatccgtt 540
ggtggtttat actgtaagaa cggtaaatta taccgttcca acaccgacac taacagtttg 600
tgtgtagaag gtcaaggctc tgctcaagct gttaacaagg tctccggctc cattgctatc 660
tgtggtaccg attatccagg ttctgaaaac atggtcgttc ctaccgtagt tggcgctggt 720
tcctcccaac caatcaacgt catcaaggag gactcctact atcaatggca aggtaagaag 780
acctctgccc aatactacgt taacaacgct ggtgtctctg tggaagatgg ttgtatctgg 840
ggtactgagg gttccggtgt cggtaactgg gccccagttg tcttgggtgc tggttacact 900
gatggtatca cttacttgtc catcattcca aacccaaaca acaaagaagc accaaacttt 960
aacatcaaga tcgttgccac cgatggctct accgtcaatg gtgcttgctc ttacgaaaat 1020
ggtgtctact ctggctctgg ctctgacggt tgtactgttt cagttacttc tggttctgct 1080
aactttgtct tctactag 1098
<210>70
<211>1065
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>70
atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60
ccaatcgaaa acctattcaa atacagggct gttaaggcat ctcacagtaa gaatatcaac 120
tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180
aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240
ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300
agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360
atccaagata agtcatccgc cggtgccgtt gttgttgcca acgccaaatc tttggaagct 420
gtctcattct tcttctctat catttttgac accgaaaagc ctattgttgt cactgaagat 480
tccgcttatg ccattccagt cgctaacaat aagaacgcta ccaaacgtgg tgtcttgtcc 540
gtcacttctg acaaattagt gtactccggt gtcttcactc cacctactgc ttgttcttac 600
ggtgctggtt tgcctgttgc tatcgttgat gaccaagacg aagttaaatg gttcttcgat 660
gcttctaagc caactttaat ctcttctgac tcgattatca gaaaggaata cagtaacttc 720
actactcctt atggtctatt agaaaacggt gttccaattg ttccaattgt ctatgacggt 780
ggttactctt ccagtttgat tgactccttg agttctgccg ttcaaggttt ggttgttgtt 840
tcttctggtt ctaccaactc aacctcatct actattgaaa gcactgaaat cccagtcgta 900
tatgctcaag ctaacactcc attaaacttt attgacaaca aagatgttcc aaagaacgct 960
gtgggtgctg gttacctatc cccaattaag gcccaaatct tgttgtccat tgctgccgtt 1020
aatggtgtca cctccaagtc cgctctggaa agcattttcc catga 1065
<210>71
<211>1710
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>71
atgaaactga aaactgtaag atctgcggtc ctttcgtcac tctttgcatc gcaggttctc 60
ggtaagataa taccagcagc aaacaagcgc gacgacgact cgaattccaa gttcgtcaag 120
ttgccctttc ataagcttta cggggactcg ctagaaaatg tgggaagcga caaaaaaccg 180
gaagtacgcc tattgaagag ggctgacggt tatgaagaaa ttataattac caaccagcaa 240
agtttctatt cggtggactt ggaagtgggc acgccaccac agaacgtaac ggtcctggtg 300
gacacaggct cctctgatct atggattatg ggctcggata atccatactg ttcttcgaac 360
agtatgggta gtagccggag acgtgttatt gacaaacgtg atgattcgtc aagcggcgga 420
tctttgatta atgatataaa cccatttggc tggttgacgg gaacgggcag tgccattggc 480
cccactgcta cgggcttagg aggcggttca ggtacggcaa ctcaatccgt gcctgcttcg 540
gaagccacca tggactgtca acaatacggg acattttcca cttcgggctc ttctacattt 600
agatcaaaca acacctattt cagtattagc tacggtgatg ggacttttgc ctccggtact 660
tttggtacgg atgttttgga tttaagcgac ttgaacgtta ccgggttgtc ttttgccgtt 720
gccaatgaaa cgaattctac tatgggtgtg ttaggtattg gtttgcccga attagaagtc 780
acttattctg gctctactgc gtctcatagt ggaaaagctt ataaatacga caacttcccc 840
attgtattga aaaattctgg tgctatcaaa agcaacacat attctttgta tttgaacgac 900
tcggacgcta tgcatggcac cattttgttc ggagccgtgg accacagtaa atataccggc 960
accttataca caatccccat cgtaaacact ctgagtgcta gtggatttag ctctcccatt 1020
caatttgatg tcactattaa tggtatcggt attagtgatt ctgggagtag taacaagacc 1080
ttgactacca ctaaaatacc tgctttgttg gattccggta ctactttgac ttatttacct 1140
caaacagtgg taagtatgat cgctactgaa ctaggtgcgc aatactcttc caggataggg 1200
tattacgtat tggactgtcc atctgatgat agtatggaaa tagtgttcga ttttggtggt 1260
tttcacatca atgcaccact ttcgagtttt atcttgagta ctggcactac atgtctttta 1320
ggtattatcc caacgagtga tgacacaggt accattttgg gtgattcatt tttgactaac 1380
gcgtacgtgg tttatgattt ggagaatctt gaaatatcca tggcacaagc tcgctataat 1440
accacaagcg aaaatatcga aattattaca tcctctgttc caagcgccgt aaaggcacca 1500
ggctatacaa acacttggtc cacaagtgca tctattgtta ccggtggtaa catatttact 1560
gtaaattcct cacaaactgc ttcctttagc ggtaacctga cgaccagtac tgcatccgcc 1620
acttctacat caagtaaaag aaatgttggt gatcatatag ttccatcttt acccctcaca 1680
ttaatttctc ttctttttgc attcatctga 1710
<210>72
<211>750
<212>DNA
<213>酵母(Saccharomyces sp.)
<400>72
atgaagttct cttccggcaa atctatcatc tttgcaacta ttgcttctct agctttgagt 60
gctcctgtca cttacgacac caactctact gctgagttac aatctccttc atctcaagaa 120
attctgggtt ggagtcacgc aacttttcct accatttacc aaacctgtaa tgagacgaac 180
gcaagaatgt tgaatgcagc ttttaaggat accgctgaaa tcaccgctta tggtaaagat 240
agacttttga actatggtgt cgatgacgtt tactacaaaa gatggtttgg taatggtagt 300
attttcaccg tcatgggtgt ctttgagcaa ttgatggagg cttccaaggg tgccatgctc 360
atgagatgtg atgatattga tggcttgtgt gcagctaatc caaactatta cgctggtcat 420
caccgtcaat ctgctccagc tgaaactgtt atttgtgatt acttctacac ttccaaaaag 480
ccactatcaa caatttgttt cgaaggtact attgtcgatg tcggtccaaa acattatgca 540
ggtattgata tgttacatcg ttacttgcac gtccctacca tgagtatgga tggatatgtt 600
ggcgagtacg cggaaactct tgaagaagtt gtggactaca cccagaacaa tgctacttac 660
gcagttagaa acaccgacaa ctatctttac tatctcgctg acgtttacag tgcttctgtt 720
atacctggtg gctgtctagg taacttgtaa 750
<210>73
<211>915
<212>DNA
<213>人工序列
<220>
<223>合成的SCW4-2-hGH
<400>73
atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60
cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120
accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180
gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240
accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300
tcccatcatc accatcacca cggtgacgat gacgataagt tcccaaccat tcccttatcc 360
aggctttttg acaacgctat gctccgcgcc catcgtctgc accagctggc ctttgacacc 420
taccaggagt ttgaagaagc ctatatccca aaggaacaga agtattcatt cctgcagaac 480
ccccagacct ccctctgttt ctcagagtct attccgacac cctccaacag ggaggaaaca 540
caacagaaat ccaacctaga gctgctccgc atctccctgc tgctcatcca gtcgtggctg 600
gagcccgtgc agttcctcag gagtgtcttc gccaacagcc tggtgtacgg cgcctctgac 660
agcaacgtct atgacctcct aaaggaccta gaggaaggca tccaaacgct gatggggagg 720
ctggaagatg gcagcccccg gactgggcag atcttcaagc agacctacag caagttcgac 780
acaaactcac acaacgatga cgcactactc aagaactacg ggctgctcta ctgcttcagg 840
aaggacatgg acaaggtcga gacattcctg cgcatcgtgc agtgccgctc tgtggagggc 900
agctgtggct tctaa 915
<210>74
<211>4
<212>PRT
<213>人工序列
<220>
<223>合成的酵母kex2-样蛋白酶识别序列
<400>74
Leu Asp Lys Arg
1
<210>75
<211>4
<212>PRT
<213>人工序列
<220>
<223>合成的因子Xa-蛋白酶识别序列
<400>75
Ile Glu Gly Arg
1
<210>76
<211>4
<212>PRT
<213>人工序列
<220>
<223>合成的枯草杆菌蛋白酶-识别序列
<400>76
Ala Ala His Tyr
1
<210>77
<211>7
<212>PRT
<213>人工序列
<220>
<223>合成的烟草蚀纹病毒蛋白酶-识别序列
<400>77
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210>78
<211>4
<212>PRT
<213>人工序列
<220>
<223>合成的凝血酶-识别序列
<400>78
Arg Gly Pro Arg
1
<210>79
<211>5
<212>PRT
<213>人工序列
<220>
<223>合成的肠激酶裂解序列
<400>79
Asp Asp Asp Asp Lys
1 5
<210>80
<211>313
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>80
Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe
1 5 10 15
Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly
20 25 30
Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr
35 40 45
Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala
50 55 60
Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala
65 70 75 80
Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Thr Asp Asp Ser His
85 90 95
Tyr Ala Ala Glu Lys Ala Ala Leu Gln Thr Tyr Leu Pro Lys Ile Lys
100 105 110
Glu Ser Thr Val Ala Gly Phe Leu Val Gly Ser Glu Ala Leu Tyr Arg
115 120 125
Asn Asp Leu Thr Ala Ser Gln Leu Ser Asp Lys Ile Asn Asp Val Arg
130 135 140
Ser Val Val Ala Asp Ile Ser Asp Ser Asp Gly Lys Ser Tyr Ser Gly
145 150 155 160
Lys Gln Val Gly Thr Val Asp Ser Trp Asn Val Leu Val Ala Gly Tyr
165 170 175
Asn Ser Ala Val Ile Glu Ala Ser Asp Phe Val Met Ala Asn Ala Phe
180 185 190
Ser Tyr Trp Gln Gly Gln Thr Met Gln Asn Ala Ser Tyr Ser Phe Phe
195 200 205
Asp Asp Ile Met Gln Ala Leu Gln Val Ile Gln Ser Thr Lys Gly Ser
210 215 220
Thr Asp Ile Thr Phe Trp Val Gly Glu Thr Gly Trp Pro Thr Asp Gly
225 230 235 240
Thr Asn Phe Glu Ser Ser Tyr Pro Ser Val Asp Asn Ala Lys Gln Phe
245 250 255
Trp Lys Glu Gly Ile Cys Ser Met Arg Ala Trp Gly Val Asn Val Ile
260 265 270
Val Phe Glu Ala Phe Asp Glu Asp Trp Lys Pro Asn Thr Ser Gly Thr
275 280 285
Ser Asp Val Glu Lys His Trp Gly Val Phe Thr Ser Ser Asp Asn Leu
290 295 300
Lys Tyr Ser Leu Asp Cys Asp Phe Ser
305 310
<210>81
<211>524
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>81
Met Gln Leu Ser Lys Ser Ile Leu Leu Ala Ala Leu Ala Ala Thr Pro
1 5 10 15
Ser Leu Val Asn Ala Met Leu Pro Ile His Ile Lys Asn Tyr Arg Phe
20 25 30
Ile Lys Pro Ser Ser Ala Thr Asn Ser Glu Ser Asp Asn Glu Val Phe
35 40 45
Phe Val Lys Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Gly Tyr Asp
50 55 60
Ala Asp Ser Asp Thr Asp Ile Leu Ser Asp Pro Glu Val Cys Ala Arg
65 70 75 80
Asp Ala Tyr Ala Phe Gln Gln Leu Gly Val Asn Thr Val Arg Ile Tyr
85 90 95
Ser Leu Asn Pro Asp Leu Asn His Asp Lys Cys Met Thr Ile Phe Asn
100 105 110
Asn Ala Gly Ile Tyr Ala Ile Leu Asp Val Asn Ser Gly Asn Tyr Gly
115 120 125
Glu Ser Leu Asn Arg Ala Asp Pro Ser Gly Thr Tyr Asp Ser Leu Tyr
130 135 140
Leu Ser Arg Val Phe Lys Phe Ile Asp Ala Phe Lys Asn Tyr Pro Asn
145 150 155 160
Val Leu Gly Phe Phe Ser Gly Asn Glu Val Ile Asn Asp Gln Ser Asp
165 170 175
Tyr Ala Lys Ile Asp Pro Pro Tyr Ile Arg Ala Val Gln Arg Asp Met
180 185 190
Lys Gln Tyr Ile Ser Lys His Ala Asn Arg Ser Ile Pro Val Gly Tyr
195 200 205
Ser Ala Ala Asp Asn Thr Asp Leu Arg Leu Ala Thr Phe Lys Tyr Leu
210 215 220
Gln Cys Asn Ser Leu Asp Gly Asn Lys Val Asn Asp Asp Leu Asp Ile
225 230 235 240
Ser Lys Ser Asp Phe Phe Gly Leu Asn Thr Tyr Glu Trp Cys Ser Gly
245 250 255
Thr Ser Ser Trp Glu Ser Ser Gly Tyr Asp Lys Leu Asn Ser Thr Phe
260 265 270
Glu Asp Ala Val Ile Pro Leu Ile Phe Ser Glu Tyr Gly Cys Asn Lys
275 280 285
Asn Thr Pro Arg Thr Phe Asp Glu Val Ser Glu Gly Leu Tyr Gly Gly
290 295 300
Leu Lys Asn Val Phe Ser Gly Gly Leu Val Tyr Glu Tyr Thr Glu Glu
305 310 315 320
Ala Asn Asn Tyr Gly Leu Val Lys Leu Asp Asp Ser Gly Ser Leu Thr
325 330 335
Tyr Lys Asp Asp Phe Val Asn Leu Glu Ser Gln Leu Lys Asn Val Ser
340 345 350
Leu Pro Thr Thr Lys Glu Ser Glu Ile Ser Ser Asp Ser Ile Tyr Lys
355 360 365
Cys Asp Asn Ser Ala Ile Thr Asn Ile Tyr Ser Gly Phe Gly Thr Asn
370 375 380
Asn Phe Thr Leu Pro Ser Gln Pro Ala Glu Ile Ala Asn Met Ile Glu
385 390 395 400
Tyr Gly Val Asn Gly Thr Asn Thr Gly Lys Ile Leu Thr Asp Tyr Ala
405 410 415
Val Pro Thr Thr Phe Asn Tyr Thr Ile Lys Asn Asn Lys Asp Asp Thr
420 425 430
Ile Ser Ala Thr Ile Ser Tyr Asp Lys Ala Asn Ser Leu Asn Glu Leu
435 440 445
Asp Val Thr Ala Thr Thr Val Ala Lys Ser Ala Ser Thr Ser Gln Ser
450 455 460
Ser Ser Arg Ser Leu Thr Ser Ser Thr Ser Pro Ser Ser Ser Thr Gly
465 470 475 480
Ser Ser Ser Ser Thr Gly Ser Ser Ser Ala Ser Ser Ser Ser Lys Ser
485 490 495
Lys Gly Val Gly Asn Ile Val Asn Val Ser Phe Ser Gln Ser Gly Tyr
500 505 510
Leu Ala Leu Phe Ala Gly Leu Ile Ser Ala Leu Leu
515 520
<210>82
<211>484
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>82
Met Leu Leu Arg Ser Leu Thr Ser Ala Phe Val Leu Ser Ala Gly Leu
1 5 10 15
Ala Gln Ala Ala Ser Ser Ser Asn Ser Ser Thr Pro Ser Ile Glu Ile
20 25 30
Lys Gly Asn Ala Phe Phe Asn Ser Glu Ser Gly Glu Arg Phe Tyr Ile
35 40 45
Arg Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Asn Leu Thr Asp Pro
50 55 60
Leu Ala Asp Ala Ser Val Cys Asp Arg Asp Val Pro Val Leu Lys Asp
65 70 75 80
Leu Gly Ile Asn Thr Val Arg Val Tyr Thr Val Asp Asn Ser Gln Asp
85 90 95
His Ser His Cys Met Lys Leu Leu Gln Glu Asn Gly Ile Tyr Leu Ile
100 105 110
Leu Asp Val Asn Thr Pro Thr Ser Ala Ile Ser Arg Tyr Asp Pro Ala
115 120 125
Cys Ser Tyr Asn Ala Asp Tyr Leu Gln Asn Val Phe Ala Thr Ile Asp
130 135 140
Thr Phe Ala Asp Tyr Asp Asn Val Leu Gly Phe Phe Ala Gly Asn Glu
145 150 155 160
Val Ile Asn Ser Val Asn Thr Thr Asn Thr Ala Thr Tyr Val Lys Ala
165 170 175
Val Val Arg Asp Met Lys Lys Tyr Ile Lys Ala Arg Lys Tyr Arg Gln
180 185 190
Ile Pro Val Gly Tyr Ser Ala Ala Asp Ile Val Ala Asn Arg Gln Leu
195 200 205
Ala Ala Glu Tyr Phe Asn Cys Gly Asp Glu Ala Asp Ala Arg Ile Asp
210 215 220
Met Phe Gly Val Asn Asp Tyr Ser Trp Cys Gly Glu Ser Ser Phe Val
225 230 235 240
Val Ser Gly Tyr Ser Thr Lys Met Lys Leu Tyr Gln Asp Tyr Ser Val
245 250 255
Pro Val Phe Leu Ser Glu Phe Gly Cys Asn Gln Val Lys Ser Ser Arg
260 265 270
Pro Phe Thr Glu Ile Glu Ala Ile Tyr Ser Thr Gln Met Ser Ser Val
275 280 285
Phe Ser Gly Gly Leu Val Tyr Glu Tyr Ser Asn Glu Thr Asn Asn Tyr
290 295 300
Gly Leu Val Gln Ile Asp Gly Asp Lys Val Thr Lys Leu Thr Asp Phe
305 310 315 320
Glu Asn Leu Lys Asn Glu Tyr Ser Lys Val Ser Asn Pro Glu Gly Asn
325 330 335
Gly Gly Tyr Ser Thr Ser Asn Asn Tyr Ser Thr Cys Pro Asp Tyr Glu
340 345 350
Lys Gly Val Trp Glu Ala Asn Asn Thr Leu Pro Ala Met Pro Ser Ala
355 360 365
Ala Ser Ala Tyr Phe Thr Ser Gly Ala Gly Ser Pro Met Gly Thr Gly
370 375 380
Ile Ala Thr Gln Gln Ser Cys Asp Ala Lys Asp Asp Asp Asp Glu Glu
385 390 395 400
Asp Asp Asp Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
405 410 415
Ser Ala Ser Ser Ser Ser Glu Ser Ser Ser Ser Thr Ser Lys Ala Ser
420 425 430
Ser Ser Ser Pro Ser Ala Ser Glu Thr Ser Leu Leu Lys Ser Ala Ala
435 440 445
Ser Ala Thr Ser Ser Ser Gln Ser Ser Ser Lys Ser Lys Gly Ala Ala
450 455 460
Gly Ile Ile Glu Ile Pro Leu Ile Phe Arg Ala Leu Ala Glu Leu Tyr
465 470 475 480
Asn Leu Val Leu
<210>83
<211>444
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>83
Met Gln Leu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile Thr Ser
1 5 10 15
Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser Cys Thr
20 25 30
Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp Lys Tyr
35 40 45
Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly Gly Leu
50 55 60
Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser Leu Thr
65 70 75 80
Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser Leu Glu
85 90 95
Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu Thr Ser
100 105 110
Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu Ile Thr
115 120 125
Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala Asn Asn
130 135 140
Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe Ser Ala
145 150 155 160
Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys Leu Thr
165 170 175
Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln Phe Ser
180 185 190
Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val Trp Ala
195 200 205
Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala Asn Leu
210 215 220
Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile Ser Ser
225 230 235 240
Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser Ile Val
245 250 255
Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser Thr Ile
260 265 270
Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys Ile Gly
275 280 285
Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val Val Gly
290 295 300
Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys Gly Gly
305 310 315 320
Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala Leu Lys
325 330 335
Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val Cys Lys
340 345 350
Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser Lys Ser
355 360 365
Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser Lys Ala
370 375 380
Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala Ser Ala
385 390 395 400
Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys Ser Ser
405 410 415
Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr Pro Leu
420 425 430
Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met
435 440
<210>84
<211>830
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>84
Met Gln Leu Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu
1 5 10 15
Ser Ala Ala Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys
20 25 30
Arg Ala Val Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val
35 40 45
Asn Gly Ala Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val
50 55 60
Val Asn Ser Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala
65 70 75 80
Ser Val Ala Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val
85 90 95
Ser Ala Ala Ala Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln
100 105 110
Ser Ser Ser Ser Ser Gln Ala Ser Ser Ser Ser Ser Ser Gly Glu Asp
115 120 125
Val Ser Ser Phe Ala Ser Gly Val Arg Gly Ile Thr Tyr Thr Pro Tyr
130 135 140
Glu Ser Ser Gly Ala Cys Lys Ser Ala Ser Glu Val Ala Ser Asp Leu
145 150 155 160
Ala Gln Leu Thr Asp Phe Pro Val Ile Arg Leu Tyr Gly Thr Asp Cys
165 170 175
Asn Gln Val Glu Asn Val Phe Lys Ala Lys Ala Ser Asn Gln Lys Val
180 185 190
Phe Leu Gly Ile Tyr Tyr Val Asp Gln Ile Gln Asp Gly Val Asn Thr
195 200 205
Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Val Thr Thr
210 215 220
Val Ser Ile Gly Asn Glu Leu Val Asn Gly Asn Gln Ala Thr Pro Ser
225 230 235 240
Gln Val Gly Gln Tyr Ile Asp Ser Gly Arg Ser Ala Leu Lys Ala Ala
245 250 255
Gly Tyr Thr Gly Pro Val Val Ser Val Asp Thr Phe Ile Ala Val Ile
260 265 270
Asn Asn Pro Glu Leu Cys Asp Tyr Ser Asp Tyr Met Ala Val Asn Ala
275 280 285
His Ala Tyr Phe Asp Lys Asn Thr Val Ala Gln Asp Ser Gly Lys Trp
290 295 300
Leu Leu Glu Gln Ile Gln Arg Val Trp Thr Ala Cys Asp Gly Lys Lys
305 310 315 320
Asn Val Val Ile Thr Glu Ser Gly Trp Pro Ser Lys Gly Glu Thr Tyr
325 330 335
Gly Val Ala Val Pro Ser Lys Glu Asn Gln Lys Asp Ala Val Ser Ala
340 345 350
Ile Thr Ser Ser Cys Gly Ala Asp Thr Phe Leu Phe Thr Ala Phe Asn
355 360 365
Asp Tyr Trp Lys Ala Asp Gly Ala Tyr Gly Val Glu Lys Tyr Trp Gly
370 375 380
Ile Leu Ser Asn Glu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile
385 390 395 400
Thr Ser Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser
405 410 415
Cys Thr Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp
420 425 430
Lys Tyr Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly
435 440 445
Gly Leu Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser
450 455 460
Leu Thr Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser
465 470 475 480
Leu Glu Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu
485 490 495
Thr Ser Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu
500 505 510
Ile Thr Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala
515 520 525
Asn Asn Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe
530 535 540
Ser Ala Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys
545 550 555 560
Leu Thr Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln
565 570 575
Phe Ser Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val
580 585 590
Trp Ala Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala
595 600 605
Asn Leu Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile
610 615 620
Ser Ser Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser
625 630 635 640
Ile Val Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser
645 650 655
Thr Ile Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys
660 665 670
Ile Gly Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val
675 680 685
Val Gly Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys
690 695 700
Gly Gly Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala
705 710 715 720
Leu Lys Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val
725 730 735
Cys Lys Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser
740 745 750
Lys Ser Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser
755 760 765
Lys Ala Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala
770 775 780
Ser Ala Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys
785 790 795 800
Ser Ser Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr
805 810 815
Pro Leu Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met
820 825 830
<210>85
<211>389
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>85
Met Arg Phe Ser Asn Phe Leu Thr Val Ser Ala Leu Leu Thr Gly Ala
1 5 10 15
Leu Gly Ala Pro Ala Val Arg His Lys His Glu Lys Arg Asp Val Val
20 25 30
Thr Ala Thr Val His Ala Gln Val Thr Val Val Val Ser Gly Asn Ser
35 40 45
Gly Glu Thr Ile Val Pro Val Asn Glu Asn Ala Val Val Ala Thr Thr
50 55 60
Ser Ser Thr Ala Val Ala Ser Gln Ala Thr Thr Ser Thr Leu Glu Pro
65 70 75 80
Thr Thr Ser Ala Asn Val Val Thr Ser Gln Gln Gln Thr Ser Thr Leu
85 90 95
Gln Ser Ser Glu Ala Ala Ser Thr Val Gly Ser Ser Thr Ser Ser Ser
100 105 110
Pro Ser Ser Ser Ser Ser Thr Ser Ser Ser Ala Ser Ser Ser Ala Ser
115 120 125
Ser Ser Ile Ser Ala Ser Gly Ala Lys Gly Ile Thr Tyr Ser Pro Tyr
130 135 140
Asn Asp Asp Gly Ser Cys Lys Ser Thr Ala Gln Val Ala Ser Asp Leu
145 150 155 160
Glu Gln Leu Thr Gly Phe Asp Asn Ile Arg Leu Tyr Gly Val Asp Cys
165 170 175
Ser Gln Val Glu Asn Val Leu Gln Ala Lys Thr Ser Ser Gln Lys Leu
180 185 190
Phe Leu Gly Ile Tyr Tyr Val Asp Lys Ile Gln Asp Ala Val Asp Thr
195 200 205
Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Ile Thr Thr
210 215 220
Val Ser Val Gly Asn Glu Leu Val Asn Gly Gly Ser Ala Thr Thr Thr
225 230 235 240
Gln Val Gly Glu Tyr Val Ser Thr Ala Lys Ser Ala Leu Thr Ser Ala
245 250 255
Gly Tyr Thr Gly Ser Val Val Ser Val Asp Thr Phe Ile Ala Val Ile
260 265 270
Asn Asn Pro Asp Leu Cys Asn Tyr Ser Asp Tyr Met Ala Val Asn Ala
275 280 285
His Ala Tyr Phe Asp Glu Asn Thr Ala Ala Gln Asp Ala Gly Pro Trp
290 295 300
Val Leu Glu Gln Ile Glu Arg Val Tyr Thr Ala Cys Gly Gly Lys Lys
305 310 315 320
Asp Val Val Ile Thr Glu Thr Gly Trp Pro Ser Lys Gly Asp Thr Tyr
325 330 335
Gly Glu Ala Val Pro Ser Lys Ala Asn Gln Glu Ala Ala Ile Ser Ser
340 345 350
Ile Lys Ser Ser Cys Gly Ser Ser Ala Tyr Leu Phe Thr Ala Phe Asn
355 360 365
Asp Leu Trp Lys Asp Asp Gly Gln Tyr Gly Val Glu Lys Tyr Trp Gly
370 375 380
Ile Leu Ser Ser Asp
385
<210>86
<211>475
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>86
Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile
1 5 10 15
Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln
20 25 30
His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val
35 40 45
Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr
50 55 60
Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser
65 70 75 80
Ser Ala Ala Ala Gly Ile Ala Ala Ser Ile Ala Val Ser Ser Ala Ala
85 90 95
Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr Ala
100 105 110
Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Ser Ser Ser Ser Ala Thr
115 120 125
Ser Thr Leu Glu Ser Ser Ser Val Ser Ser Ser Ser Glu Glu Ala Ala
130 135 140
Pro Thr Ser Thr Val Val Ser Thr Ser Ser Ala Thr Gln Ser Ser Ala
145 150 155 160
Ser Ser Ala Thr Lys Ser Ser Thr Ser Ser Thr Ser Pro Ser Thr Ser
165 170 175
Thr Ser Thr Ser Thr Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser
180 185 190
Ser Ser Ser Ser Ser Ser Ser Gly Ser Gly Ser Ile Tyr Gly Asp Leu
195 200 205
Ala Asp Phe Ser Gly Pro Ser Glu Lys Phe Gln Asp Gly Thr Ile Pro
2l0 215 220
Cys Asp Lys Phe Pro Ser Gly Gln Gly Val Ile Ser Ile Asp Trp Ile
225 230 235 240
Gly Glu Gly Gly Trp Ser Gly Val Glu Asn Thr Asp Thr Ser Thr Gly
245 250 255
Gly Ser Cys Lys Glu Gly Ser Tyr Cys Ser Tyr Ser Cys Gln Pro Gly
260 265 270
Met Ser Lys Thr Gln Trp Pro Ser Asp Gln Pro Ser Asp Gly Arg Ser
275 280 285
Val Gly Gly Leu Leu Cys Lys Asn Gly Tyr Leu Tyr Arg Ser Asn Thr
290 295 300
Asp Ala Asp Tyr Leu Cys Glu Trp Gly Val Glu Ala Ala Tyr Val Val
305 3l0 315 320
Ser Lys Leu Ser Lys Gly Val Ala Ile Cys Arg Thr Asp Tyr Pro Gly
325 330 335
Thr Glu Asn Met Val Ile Pro Thr Tyr Val Glu Gly Gly Ser Ser Leu
340 345 350
Pro Leu Thr Val Val Asp Gln Asp Thr Tyr Phe Thr Trp Glu Gly Lys
355 360 365
Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val Ser Val Glu
370 375 380
Asp Gly Cys Ile Trp Gly Thr Ser Gly Ser Gly Ile Gly Asn Trp Ala
385 390 395 400
Pro Leu Asn Phe Gly Ala Gly Ser Thr Gly Gly Val Thr Tyr Leu Ser
405 410 415
Leu Ile Pro Asn Pro Asn Asn Ser Asp Ala Leu Asn Tyr Asn Val Lys
420 425 430
Ile Val Ala Ala Asp Asp Ser Ser Asn Val Ile Gly Glu Cys Val Tyr
435 440 445
Glu Asn Gly Glu Phe Ser Gly Gly Ala Asp Gly Cys Thr Val Ser Val
450 455 460
Thr Ser Gly Lys Ala His Phe Val Leu Tyr Asn
465 470 475
<210>87
<211>365
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>87
Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu
l 5 10 15
Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys
20 25 30
Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val
35 40 45
Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys
50 55 60
Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala
65 70 75 80
Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser Ser Ser
85 90 95
Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu Asp Gly
100 105 110
Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val Ser Leu
115 120 125
Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met Asn Gly
130 135 140
Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr Ala Cys
145 150 155 160
Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro Ser Asp
165 170 175
Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu Tyr Arg
180 185 190
Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly Ser Ala
195 200 205
Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly Thr Asp
210 215 220
Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly Ala Gly
225 230 235 240
Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr Gln Trp
245 250 255
Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val
260 265 270
Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly Val Gly
275 280 285
Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly Ile Thr
290 295 300
Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro Asn Phe
305 310 315 320
Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly Ala Cys
325 330 335
Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly Cys Thr
340 345 350
Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr
355 360 365
<210>88
<211>719
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>88
Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala
1 5 10 15
Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys
20 25 30
Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly
35 40 45
Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr
50 55 60
Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly
65 70 75 80
Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr
85 90 95
Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn
100 105 110
Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Lys Ser Ser Ala Gly
115 120 125
Ala Val Val Val Ala Asn Ala Lys Ser Leu Glu Ala Val Ser Phe Phe
130 135 140
Phe Ser Ile Ile Phe Asp Thr Glu Lys Pro Ile Val Val Thr Glu Asp
145 150 155 160
Ser Ala Tyr Ala Ile Pro Val Ala Asn Asn Lys Asn Ala Thr Lys Arg
165 170 175
Gly Val Leu Ser Val Thr Ser Asp Lys Leu Val Tyr Ser Gly Val Phe
180 185 190
Thr Pro Pro Thr Ala Cys Ser Tyr Gly Ala Gly Leu Pro Val Ala Ile
195 200 205
Val Asp Asp Gln Asp Glu Val Lys Trp Phe Phe Asp Ala Ser Lys Pro
2l0 215 220
Thr Leu Ile Ser Ser Asp Ser Ile Ile Arg Lys Glu Tyr Ser Asn Phe
225 230 235 240
Thr Thr Pro Tyr Gly Leu Leu Glu Asn Gly Val Pro Ile Val Pro Ile
245 250 255
Val Tyr Asp Gly Gly Tyr Ser Ser Ser Leu Ile Asp Ser Leu Ser Ser
260 265 270
Ala Val Gln Gly Leu Val Val Val Ser Ser Gly Ser Thr Asn Ser Thr
275 280 285
Ser Ser Thr Ile Glu Ser Thr Glu Ile Pro Val Val Tyr Ala Gln Ala
290 295 300
Asn Thr Pro Leu Asn Phe Ile Asp Asn Lys Asp Val Pro Lys Asn Ala
305 310 315 320
Val Gly Ala Gly Tyr Leu Ser Pro Ile Lys Ala Gln Ile Leu Leu Ser
325 330 335
Ile Ala Ala Val Asn Gly Val Thr Ser Lys Ser Ala Leu Glu Ser Ile
340 345 350
Phe Pro Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala
355 360 365
Val Leu Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn
370 375 380
Asp Lys Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly
385 390 395 400
Ala Val Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp
405 4l0 415
Gly Lys Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr
420 425 430
Ala Ala Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser
435 440 445
Ser Ser Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu
450 455 460
Asp Gly Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val
465 470 475 480
Ser Leu Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met
485 490 495
Asn Gly Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr
500 505 5l0
Ala Cys Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro
515 520 525
Ser Asp Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu
530 535 540
Tyr Arg Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly
545 550 555 560
Ser Ala Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly
565 570 575
Thr Asp Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly
580 585 590
Ala Gly Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr
595 600 605
Gln Trp Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala
6l0 615 620
Gly Val Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly
625 630 635 640
Val Gly Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly
645 650 655
Ile Thr Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro
660 665 670
Asn Phe Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly
675 680 685
Ala Cys Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly
690 695 700
Cys Thr Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr
705 710 715
<210>89
<211>569
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>89
Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser Leu Phe Ala
1 5 10 15
Ser Gln Val Leu Gly Lys Ile Ile Pro Ala Ala Asn Lys Arg Asp Asp
20 25 30
Asp Ser Asn Ser Lys Phe Val Lys Leu Pro Phe His Lys Leu Tyr Gly
35 40 45
Asp Ser Leu Glu Asn Val Gly Ser Asp Lys Lys Pro Glu Val Arg Leu
50 55 60
Leu Lys Arg Ala Asp Gly Tyr Glu Glu Ile Ile Ile Thr Asn Gln Gln
65 70 75 80
Ser Phe Tyr Ser Val Asp Leu Glu Val Gly Thr Pro Pro Gln Asn Val
85 90 95
Thr Val Leu Val Asp Thr Gly Ser Ser Asp Leu Trp Ile Met Gly Ser
100 105 110
Asp Asn Pro Tyr Cys Ser Ser Asn Ser Met Gly Ser Ser Arg Arg Arg
115 120 125
Val Ile Asp Lys Arg Asp Asp Ser Ser Ser Gly Gly Ser Leu Ile Asn
130 135 140
Asp Ile Asn Pro Phe Gly Trp Leu Thr Gly Thr Gly Ser Ala Ile Gly
145 150 155 160
Pro Thr Ala Thr Gly Leu Gly Gly Gly Ser Gly Thr Ala Thr Gln Ser
165 170 175
Val Pro Ala Ser Glu Ala Thr Met Asp Cys Gln Gln Tyr Gly Thr Phe
180 185 190
Ser Thr Ser Gly Ser Ser Thr Phe Arg Ser Asn Asn Thr Tyr Phe Ser
195 200 205
Ile Ser Tyr Gly Asp Gly Thr Phe Ala Ser Gly Thr Phe Gly Thr Asp
210 215 220
Val Leu Asp Leu Ser Asp Leu Asn Val Thr Gly Leu Ser Phe Ala Val
225 230 235 240
Ala Asn Glu Thr Asn Ser Thr Met Gly Val Leu Gly Ile Gly Leu Pro
245 250 255
Glu Leu Glu Val Thr Tyr Ser Gly Ser Thr Ala Ser His Ser Gly Lys
260 265 270
Ala Tyr Lys Tyr Asp Asn Phe Pro Ile Val Leu Lys Asn Ser Gly Ala
275 280 285
Ile Lys Ser Asn Thr Tyr Ser Leu Tyr Leu Asn Asp Ser Asp Ala Met
290 295 300
His Gly Thr Ile Leu Phe Gly Ala Val Asp His Ser Lys Tyr Thr Gly
305 310 315 320
Thr Leu Tyr Thr Ile Pro Ile Val Asn Thr Leu Ser Ala Ser Gly Phe
325 330 335
Ser Ser Pro Ile Gln Phe Asp Val Thr Ile Asn Gly Ile Gly Ile Ser
340 345 350
Asp Ser Gly Ser Ser Asn Lys Thr Leu Thr Thr Thr Lys Ile Pro Ala
355 360 365
Leu Leu Asp Ser Gly Thr Thr Leu Thr Tyr Leu Pro Gln Thr Val Val
370 375 380
Ser Met Ile Ala Thr Glu Leu Gly Ala Gln Tyr Ser Ser Arg Ile Gly
385 390 395 400
Tyr Tyr Val Leu Asp Cys Pro Ser Asp Asp Ser Met Glu Ile Val Phe
405 410 415
Asp Phe Gly Gly Phe His Ile Asn Ala Pro Leu Ser Ser Phe Ile Leu
420 425 430
Ser Thr Gly Thr Thr Cys Leu Leu Gly Ile Ile Pro Thr Ser Asp Asp
435 440 445
Thr Gly Thr Ile Leu Gly Asp Ser Phe Leu Thr Asn Ala Tyr Val Val
450 455 460
Tyr Asp Leu Glu Asn Leu Glu Ile Ser Met Ala Gln Ala Arg Tyr Asn
465 470 475 480
Thr Thr Ser Glu Asn Ile Glu Ile Ile Thr Ser Ser Val Pro Ser Ala
485 490 495
Val Lys Ala Pro Gly Tyr Thr Asn Thr Trp Ser Thr Ser Ala Ser Ile
500 505 510
Val Thr Gly Gly Asn Ile Phe Thr Val Asn Ser Ser Gln Thr Ala Ser
515 520 525
Phe Ser Gly Asn Leu Thr Thr Ser Thr Ala Ser Ala Thr Ser Thr Ser
530 535 540
Ser Lys Arg Asn Val Gly Asp His Ile Val Pro Ser Leu Pro Leu Thr
545 550 555 560
Leu Ile Ser Leu Leu Phe Ala Phe Ile
565
<210>90
<211>249
<212>PRT
<213>酵母(Saccharomyces sp.)
<400>90
Met Lys Phe Ser Ser Gly Lys Ser Ile Ile Phe Ala Thr Ile Ala Ser
1 5 10 15
Leu Ala Leu Ser Ala Pro Val Thr Tyr Asp Thr Asn Ser Thr Ala Glu
20 25 30
Leu Gln Ser Pro Ser Ser Gln Glu Ile Leu Gly Trp Ser His Ala Thr
35 40 45
Phe Pro Thr Ile Tyr Gln Thr Cys Asn Glu Thr Asn Ala Arg Met Leu
50 55 60
Asn Ala Ala Phe Lys Asp Thr Ala Glu Ile Thr Ala Tyr Gly Lys Asp
65 70 75 80
Arg Leu Leu Asn Tyr Gly Val Asp Asp Val Tyr Tyr Lys Arg Trp Phe
85 90 95
Gly Asn Gly Ser Ile Phe Thr Val Met Gly Val Phe Glu Gln Leu Met
100 105 110
Glu Ala Ser Lys Gly Ala Met Leu Met Arg Cys Asp Asp Ile Asp Gly
115 120 125
Leu Cys Ala Ala Asn Pro Asn Tyr Tyr Ala Gly His His Arg Gln Ser
130 135 140
Ala Pro Ala Glu Thr Val Ile Cys Asp Tyr Phe Tyr Thr Ser Lys Lys
145 150 155 160
Pro Leu Ser Thr Ile Cys Phe Glu Gly Thr Ile Val Asp Val Gly Pro
165 170 175
Lys His Tyr Ala Gly Ile Asp Met Leu His Arg Tyr Leu His Val Pro
180 185 190
Thr Met Ser Met Asp Gly Tyr Val Gly Glu Tyr Ala Glu Thr Leu Glu
195 200 205
Glu Val Val Asp Tyr Thr Gln Asn Asn Ala Thr Tyr Ala Val Arg Asn
210 215 220
Thr Asp Asn Tyr Leu Tyr Tyr Leu Ala Asp Val Tyr Ser Ala Ser Val
225 230 235 240
Ile Pro Gly Gly Cys Leu Gly Asn Leu
245

Claims (15)

1.一种从分离自酵母的分泌蛋白质组鉴定分泌融合配偶体而未使用报告蛋白的方法,所述方法由以下步骤组成:
(i)用可操作地连接有编码分泌多肽的多核苷酸的异源启动子转化第一宿主细胞;
(ii)与所述分泌多肽的天然启动子连接到所述编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述第一宿主细胞是否过量分泌所述分泌多肽;
(iii)用包含编码毒蜥外泌肽-4的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞,其中,在所述异源启动子的控制下,所述第一多核苷酸和所述第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;
(iv)在培养条件下培养所述第二宿主细胞,其中所述构建体表达所述分泌融合配偶体-4和所述过量分泌多肽的融合多肽;和
(v)确定所述融合多肽是否分泌到培养基中;从而鉴定所述过量分泌多肽是否为分泌融合配偶体,
其中所述分泌融合配偶体选自下组:SEQ ID NO:80表示的BGL2、SEQ ID NO:81表示的GAS3、SEQ ID NO:82表示的GAS5、SEQ ID NO:83表示的PST1、SEQ ID NO:85表示的SCW10、SEQ ID NO:86表示的SIMI、SEQ ID NO:87表示的UTH1、SEQ ID NO:88表示的YGP1、SEQ IDNO:89表示的YPS1和SEQ ID NO:90表示的ZPS1。
2.一种从分离自酵母的分泌蛋白质组鉴定分泌融合配偶体而未使用报告蛋白的方法,所述方法由以下步骤组成:
(i)用可操作地连接有编码分泌多肽的多核苷酸的异源启动子转化第一宿主细胞;
(ii)与所述分泌多肽的天然启动子连接到所述编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述第一宿主细胞是否过量分泌所述分泌多肽;
(iii)用包含编码分泌融合配偶体-4的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞,其中,在所述异源启动子的控制下,所述第一多核苷酸和所述第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;
(iv)在培养条件下培养所述第二宿主细胞,其中所述构建体表达所述分泌融合配偶体-4和所述过量分泌多肽的融合多肽;
(v)确定所述融合多肽是否分泌到培养基中;从而鉴定所述过量分泌多肽是否为分泌融合配偶体,和
(vi)确定用于分泌所述融合多肽的所述分泌融合配偶体的最佳大小,
其中所述分泌融合配偶体选自下组:SEQ ID NO:80表示的BGL2、SEQ ID NO:81表示的GAS3、SEQ ID NO:82表示的GAS5、SEQ ID NO:83表示的PST1、SEQ ID NO:85表示的SCW10、SEQ ID NO:86表示的SIMI、SEQ ID NO:87表示的UTH1、SEQ ID NO:88表示的YGP1、SEQ IDNO:89表示的YPS1和SEQ ID NO:90表示的ZPS1。
3.如权利要求2所述的方法,其中所述最佳大小通过所述分泌融合配偶体的缺失分析而确定。
4.如权利要求1所述的方法,其中所述异源启动子为原核、真核或病毒的启动子。
5.如权利要求4所述的方法,其中所述异源启动子选自下组:λ噬菌体PR启动子、λ噬菌体PL启动子、λII、大肠杆菌trp启动子、大肠杆菌recA启动子、大肠杆菌热休克启动子、大肠杆菌lacZ启动子、SV40早期启动子、酵母GAPDH启动子、PGK启动子、ADH启动子、PHO5启动子、TEF启动子、GAL1启动子、GAL10启动子、鼠乳腺瘤病毒启动子、人免疫缺陷病毒长末端重复启动子、maloney病毒启动子、巨细胞病毒即刻早期启动子、Epstein Barr病毒启动子、劳斯氏肉瘤病毒启动子、人肌动蛋白启动子、人肌球蛋白启动子、人血红蛋白启动子、人肌酸启动子和人金属硫蛋白启动子。
6.如权利要求5所述的方法,其中所述异源启动子为GAL10。
7.如权利要求1所述的方法,其中所述分泌多肽为糖基化的分泌多肽。
8.如权利要求1所述的方法,其中所述第一宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
9.如权利要求8所述的方法,其中所述第一宿主细胞为酵母细胞。
10.如权利要求9所述的方法,其中所述第一宿主细胞选自下组:念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
11.如权利要求10所述的方法,其中所述第一宿主细胞选自下组:产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。
12.如权利要求1所述的方法,其中所述第二宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
13.如权利要求12所述的方法,其中所述第二宿主细胞为酵母细胞。
14.如权利要求13所述的方法,其中所述第二宿主细胞选自下组:念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
15.如权利要求14所述的方法,其中所述第二宿主细胞选自下组:产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。
CN200880132268.3A 2008-12-04 2008-12-05 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用 Active CN102239183B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410174695.5A CN103952425B (zh) 2008-12-04 2008-12-05 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11997208P 2008-12-04 2008-12-04
US61/119,972 2008-12-04
PCT/KR2008/007231 WO2010064748A1 (en) 2008-12-04 2008-12-05 Screening of abundantly secreted proteins and their use as fusion partners for the production of recombinant proteins

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201410174695.5A Division CN103952425B (zh) 2008-12-04 2008-12-05 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

Publications (2)

Publication Number Publication Date
CN102239183A CN102239183A (zh) 2011-11-09
CN102239183B true CN102239183B (zh) 2017-06-30

Family

ID=42233390

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880132268.3A Active CN102239183B (zh) 2008-12-04 2008-12-05 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用
CN201410174695.5A Active CN103952425B (zh) 2008-12-04 2008-12-05 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201410174695.5A Active CN103952425B (zh) 2008-12-04 2008-12-05 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

Country Status (6)

Country Link
US (1) US9550997B2 (zh)
EP (3) EP2573122A3 (zh)
JP (2) JP5524977B2 (zh)
KR (3) KR101498668B1 (zh)
CN (2) CN102239183B (zh)
WO (1) WO2010064748A1 (zh)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1713930B1 (en) 2004-01-17 2010-11-03 Korea Research Institute of Bioscience and Biotechnology Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
WO2012060666A2 (ko) * 2010-11-04 2012-05-10 한국생명공학연구원 효모에서 인체 상피세포 성장인자를 대량 생산하는 방법
CN103180442A (zh) * 2010-11-05 2013-06-26 旭硝子株式会社 裂殖酵母属酵母的转化体及其制造方法
CN102206615B (zh) * 2011-04-27 2013-06-12 珠海市御品堂生物科技有限公司 一种用酶解法制备乙醇脱氢酶的工艺
CN102732549B (zh) * 2012-06-20 2014-04-23 上海普欣生物技术有限公司 一种重组胰岛素样生长因子-i的制备方法
WO2015001460A2 (en) * 2013-07-01 2015-01-08 Biocon Limited Signal sequence for protein expression in pichia pastoris
EP2871235A1 (en) * 2013-11-07 2015-05-13 Centre National de la Recherche Scientifique (CNRS) New methods to produce active hTERT
CN103709253A (zh) * 2013-12-20 2014-04-09 南开大学 一种生物合成制备glp-1及其类似物的方法
WO2015141705A1 (ja) * 2014-03-19 2015-09-24 独立行政法人産業技術総合研究所 耐酸耐塩性付与方法と耐酸耐塩性酵母を用いた有用物質生産
CN104232666A (zh) * 2014-09-01 2014-12-24 江苏海王生物制药有限公司 表达重组艾塞那肽的基因及其载体
MX2017006866A (es) * 2014-12-01 2017-11-15 Pfenex Inc Pares de unión para producción de péptidos.
CN105219663B (zh) * 2015-09-18 2018-10-23 上海交通大学 合成海藻糖的专用菌株及其用于合成海藻糖的方法
WO2017120890A1 (zh) * 2016-01-15 2017-07-20 江南大学 一种利用磷脂酶融合表达以提高外源蛋白表达量的方法
CN108192910A (zh) * 2017-09-19 2018-06-22 陈玉皎 培育降血糖和降血栓的转基因植物
CN110863046B (zh) * 2018-08-28 2021-11-30 博尔诚(北京)科技有限公司 用于检测食道癌的组合物及其用途
EP3752617A1 (en) * 2018-02-12 2020-12-23 Lonza Ltd. Host cell for producing a protein of interest
WO2019178056A1 (en) * 2018-03-12 2019-09-19 Massachusetts Institute Of Technology Computational platform for in silico combinatorial sequence space exploration and artificial evolution of peptides
CN108707634B (zh) * 2018-06-05 2021-08-24 江南大学 一种多酶偶联生产海藻糖的方法及其应用
CN110373340A (zh) * 2019-07-12 2019-10-25 广东利世康低碳科技有限公司 一种降解餐厨废弃物的产朊假丝酵母单基因表达菌株及其构建方法
CN110498859B (zh) * 2019-07-29 2021-07-02 因之彩生物科技(武汉)有限公司 重组PLB-hbFGF融合蛋白及其应用
CN110734490A (zh) * 2019-11-28 2020-01-31 苏州华研医用科技有限公司 重组人金属硫蛋白ⅲ纯品的制备方法
KR102613936B1 (ko) * 2020-11-13 2023-12-15 한국생명공학연구원 자가분해능이 저하된 켁신 효소 및 이의 생산 방법
CN113087787B (zh) * 2021-05-19 2023-03-21 广西医科大学第二附属医院(广西医科大学第二临床医学院) 一种蚯蚓血红蛋白分离及纯化方法
CN116554298A (zh) * 2022-02-25 2023-08-08 南京工业大学 一种强化细菌卷曲菌毛提高人表皮生长因子分泌生产效率的方法
CN115925805B (zh) * 2022-07-08 2023-12-22 华兰基因工程(河南)有限公司 一种人质膜膜泡关联蛋白pv-1融合蛋白及其制备方法
CN115807023B (zh) * 2022-09-20 2024-06-25 中国科学院天津工业生物技术研究所 一种提高α-乳白蛋白在酵母菌中表达的分子伴侣及其组合
CN116355932B (zh) * 2022-11-04 2024-01-23 北京百奥茵诺生物科技有限公司 重组载体和制备μ-芋螺毒素的方法
CN116064617A (zh) * 2022-11-16 2023-05-05 美药星(南京)制药有限公司 一种提高欧洲牡蛎溶菌酶产量的方法
CN117867007B (zh) * 2024-03-11 2024-06-04 北京国科星联科技有限公司 一种合成人源乳铁蛋白的马克斯克鲁维酵母的构建方法与应用
CN117903295B (zh) * 2024-03-19 2024-05-31 北京国科星联科技有限公司 一种用于分泌表达乳铁蛋白的马克斯克鲁维酵母及其构建方法与应用
CN118580980B (zh) * 2024-08-07 2024-10-15 通化安睿特生物制药股份有限公司 一种用于制备重组人白蛋白的重组工程菌及其应用

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007015178A2 (en) * 2005-07-15 2007-02-08 Korea Research Institute Of Bioscience And Biotechnology Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
ATE110111T1 (de) 1986-05-02 1994-09-15 Gist Brocades Nv Sekretionssignal-selektionsvektoren für extrazelluläre proteinsynthese in bazillen.
WO1990005183A1 (en) 1988-10-31 1990-05-17 Immunex Corporation Interleukin-4 receptors
US5486599A (en) * 1989-03-29 1996-01-23 The Board Of Trustees Of The Leland Stanford Junior University Construction and use of synthetic constructs encoding syndecan
FR2648713B1 (fr) 1989-06-26 1994-06-10 Commissariat Energie Atomique Proteines hybrides entre une enzyme extracytoplasmique et une autre proteine, leur procede de preparation, ainsi que leur application comme agent de diagnostic
US5212058A (en) 1990-05-09 1993-05-18 Massachusetts Institute Of Technology Nucleic acid encoding ubiquitin-specific proteases
AU651596B2 (en) 1990-06-05 1994-07-28 Immunex Corporation Type II interleukin-1 receptors
US5547871A (en) 1993-01-25 1996-08-20 American Cyanamid Company Heterologous signal sequences for secretion of insect controlling proteins
US5536637A (en) 1993-04-07 1996-07-16 Genetics Institute, Inc. Method of screening for cDNA encoding novel secreted mammalian proteins in yeast
US5563046A (en) 1993-08-02 1996-10-08 Celtrix Pharmaceuticals, Inc. Fusion polypeptides and proteins
ATE197608T1 (de) 1993-12-10 2000-12-15 Korea Inst Sci & Tech Signalsequenzen für die secretion heterologer proteine von hefe
DE4344350C2 (de) * 1993-12-23 1995-09-21 Max Planck Gesellschaft Bakterien zur Herstellung stabiler Fusionsproteine und Verfahren zu deren Nachweis
GB9406974D0 (en) 1994-04-08 1994-06-01 Pharmaceutical Proteins Ltd Transgenic production
EP0907727B1 (en) 1996-04-24 2002-10-09 Genetics Institute, LLC Yeast invertase gene as reporter system for isolating cytokines
EP1170366A1 (en) 1996-04-24 2002-01-09 Genetics Institute, Inc. Secreted proteins obtained by using Yeast invertase gene as reporter system
CN1247786C (zh) * 1996-11-18 2006-03-29 诺沃奇梅兹生物技术有限公司 在芽孢杆菌细胞的枯草菌脂肽突变体中生产多肽的方法
US5952171A (en) 1996-11-19 1999-09-14 Millennium Biotherapeutics, Inc. Method for identifying genes encoding secreted or membrane-associated proteins
US6136569A (en) 1997-02-27 2000-10-24 Genentech, Inc. Method of creating a cDNA library enriched in signal sequences
KR100230578B1 (ko) 1997-07-25 1999-12-01 허영섭 포스포리불로키나제를 융합파트너로 이용하는 재조합 인간 부갑상선호르몬의 발현벡터
US6548633B1 (en) 1998-12-22 2003-04-15 Genset, S.A. Complementary DNA's encoding proteins with signal peptides
US20060009633A9 (en) 1997-11-13 2006-01-12 Genset, S.A. Complementary DNAs encoding proteins with signal peptides
US6150098A (en) 1998-02-20 2000-11-21 Amgen Inc. Methods for identifying novel secreted mammalian polypeptides
US6228590B1 (en) 1998-03-23 2001-05-08 Genentech, Inc. Method of selection for genes encoding secreted and transmembrane proteins
WO2001000803A2 (en) 1999-06-25 2001-01-04 Genset Apolipoprotein a-iv-related protein: polypeptide, polynucleotide sequences and biallelic markers thereof
WO2000039310A1 (en) 1998-12-29 2000-07-06 The University Of Georgia Research Foundation, Inc. Rubredoxin fusion proteins, protein expression system and methods
KR100368073B1 (ko) 1999-03-09 2003-01-24 한국생명공학연구원 융합파트너를 이용한 재조합 단백질의 제조방법
US7029842B2 (en) 2000-04-07 2006-04-18 Novozymes A/S Signal sequence trapping
DK1276857T3 (da) * 2000-04-07 2008-10-06 Novozymes As Signalsekvens indfangning
DE60211329T2 (de) * 2001-01-16 2007-05-24 Regeneron Pharmaceuticals, Inc. Isolierung von sezernierte proteine exprimierenden zellen
WO2002066669A1 (en) * 2001-02-23 2002-08-29 Biovitrum Ab Method for purification of soluble ssao
US20020127557A1 (en) 2001-03-09 2002-09-12 Ruoying Tan Method for identification of cDNAs encoding signal peptides
WO2005019242A2 (en) 2003-08-18 2005-03-03 E.I. Dupont De Nemours And Company Recombinant expression of the hag1 antimicrobial peptide: use as fusion partner for the expression of alpha helical antimicrobial peptides
US20050106625A1 (en) 2003-09-26 2005-05-19 Biohesion Incorporated Recombinant fusion proteins with high affinity binding to gold and applications thereof
ATE420169T1 (de) 2003-10-16 2009-01-15 Novozymes As Verfahren zum screening auf proteinsezernierende rekombinante wirtszellen
SE0303093D0 (sv) * 2003-11-18 2003-11-18 Darcy Birse Expression vector, host cell and method for producing fusion proteins
EP1713930B1 (en) 2004-01-17 2010-11-03 Korea Research Institute of Bioscience and Biotechnology Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
CN101128487B (zh) 2004-12-02 2012-10-10 杜门蒂斯有限公司 靶向血清白蛋白和glp-1或pyy的双特异性结构域抗体
CN101155828A (zh) * 2005-02-11 2008-04-02 安米林药品公司 Gip类似物和具有可选择性质的杂合多肽
US8658174B2 (en) * 2005-07-27 2014-02-25 Qinghua Wang GLP/1/exendin 4 IgG Fc fusion constructs for treatment of diabetes
CN1935846A (zh) * 2005-09-14 2007-03-28 王庆华 一种用于治疗糖尿病的融合蛋白及其制备方法和应用
CN101313216A (zh) * 2005-09-22 2008-11-26 普洛茨股份有限公司 酵母突变体中产生的糖基化多肽及其使用方法
JP5354559B2 (ja) * 2005-11-24 2013-11-27 独立行政法人産業技術総合研究所 高効率分泌シグナルペプチド及びそれらを利用したタンパク質発現系
US7579005B2 (en) * 2005-11-28 2009-08-25 E. I. Du Pont De Nemours And Company Process for recombinant expression and purification of antimicrobial peptides using periplasmic targeting signals as precipitable hydrophobic tags
EP2505651A3 (en) * 2006-12-10 2013-01-09 Dyadic International, Inc. Isolated fungus with reduced protease activity
JP2008263975A (ja) * 2007-03-29 2008-11-06 Toyota Central R&D Labs Inc 細胞表層結合性タンパク質及びその利用

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007015178A2 (en) * 2005-07-15 2007-02-08 Korea Research Institute Of Bioscience And Biotechnology Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Heterologous protein secretion in Lactococcus lactis : a novel antigen delivery system.;P. Langella, et al.;《Brazilian Journal of Medical and Biological Research》;19991231;第32卷;191-198 *

Also Published As

Publication number Publication date
KR20130091797A (ko) 2013-08-19
EP2573122A3 (en) 2013-07-10
KR20110104512A (ko) 2011-09-22
EP2370470A1 (en) 2011-10-05
JP2012510808A (ja) 2012-05-17
KR101387693B1 (ko) 2014-04-21
KR101498668B1 (ko) 2015-03-06
EP2370470A4 (en) 2012-04-11
KR20130091798A (ko) 2013-08-19
EP2573122A2 (en) 2013-03-27
JP5955875B2 (ja) 2016-07-20
CN103952425B (zh) 2017-04-12
EP2370470B1 (en) 2016-10-05
CN103952425A (zh) 2014-07-30
EP2918606A2 (en) 2015-09-16
WO2010064748A1 (en) 2010-06-10
CN102239183A (zh) 2011-11-09
JP2014138600A (ja) 2014-07-31
US9550997B2 (en) 2017-01-24
EP2918606A3 (en) 2015-10-28
US20100159465A1 (en) 2010-06-24
KR101431091B1 (ko) 2014-08-26
JP5524977B2 (ja) 2014-06-18
EP2918606B1 (en) 2018-07-11

Similar Documents

Publication Publication Date Title
CN102239183B (zh) 大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用
EP1904656B1 (en) Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
US9012367B2 (en) Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
KR101026526B1 (ko) 대장균에서 외래단백질을 분비 생산하는 방법
KR100798894B1 (ko) 재조합단백질 생산용 단백질융합인자
CN114480346B (zh) 一种dna水解酶及其制备方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent for invention or patent application
CB03 Change of inventor or designer information

Inventor after: Sun Tingxun

Inventor after: Pei Zhenxun

Inventor after: Jin Xuanchen

Inventor after: Lin Guangmo

Inventor before: Sun Tingxun

Inventor before: Pei Zhenxun

Inventor before: Jin Xuanchen

Inventor before: Lin Guangmo

Inventor before: Jin Chengyi

COR Change of bibliographic data

Free format text: CORRECT: INVENTOR; FROM: SUN TINGXUN PEI ZHENXUN JIN XUANCHEN LIN GUANGMO JIN CHENGYI TO: SUN TINGXUN PEI ZHENXUN JIN XUANCHEN LIN GUANGMO

GR01 Patent grant
GR01 Patent grant