CN1701119A - 增加宿主细胞重组多肽产量的方法 - Google Patents

增加宿主细胞重组多肽产量的方法 Download PDF

Info

Publication number
CN1701119A
CN1701119A CNA038252848A CN03825284A CN1701119A CN 1701119 A CN1701119 A CN 1701119A CN A038252848 A CNA038252848 A CN A038252848A CN 03825284 A CN03825284 A CN 03825284A CN 1701119 A CN1701119 A CN 1701119A
Authority
CN
China
Prior art keywords
leu
glu
lys
ser
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038252848A
Other languages
English (en)
Inventor
L·荣松
J·F·雷费尔德
A·H·约翰森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CYM1P AS
Original Assignee
CYM1P AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CYM1P AS filed Critical CYM1P AS
Publication of CN1701119A publication Critical patent/CN1701119A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • C12N9/60Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi from yeast
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/58Atrial natriuretic factor complex; Atriopeptin; Atrial natriuretic peptide [ANP]; Cardionatrin; Cardiodilatin
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/595Gastrins; Cholecystokinins [CCK]
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Toxicology (AREA)
  • Endocrinology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Mycology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Cardiology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了包含编码重组多肽的核酸序列的宿主细胞,其中天然存在的包含序列HXXEH的金属蛋白酶的产生通过遗传操作得到降低或抑制。本发明还涉及通过破坏金属蛋白酶的合成或活性而提高细胞产生多肽的方法。本发明尤其涉及提高自宿主细胞例如但不限于酵母和细菌细胞分泌重组多肽的方法。金属蛋白酶为蛋白酶pitrilysin亚家族的成员,其特征在于包含序列HXXEH,其中X为任一氨基酸。

Description

增加宿主细胞重组多肽产量的方法
发明领域
本发明涉及通过破坏ME集团(M16家族)的金属蛋白酶的合成或活性来提高细胞中多肽产量的方法。本发明尤其涉及提高自宿主细胞的重组多肽分泌的方法,提高例如但不限于酵母和细菌细胞中重组多肽分泌的方法。
发明背景
缩胆囊素(CCK)为肠和脑组织中表达的脊椎动物神经内分泌肽激素。生物活性CCK肽的成熟依赖于翻译后的酪氨酸硫酸盐化作用、内肽酶切割、外切蛋白酶修剪和羧基端酰胺化。N-端内切蛋白酶加工过程已经鉴定出CCK-83、-58、-39、-33、-22、-8和-5。大多数CCK肽在单一的精氨酸残基处切割后得到合成,然而CCK-22需要单一的赖氨酸残基之后的加工。
许多重组多肽已经在酵母中以融合蛋白的形式,表达为酿酒酵母α-因子前原肽(prepropeptide)以通过分泌途径指导分泌。特征最清楚的酵母蛋白酶为丝氨酸内切蛋白酶Kex2p(Fuller等,1989),其参与α-交配信息素和杀伤毒素的成熟过程(Julius等,1984)。另一个酵母蛋白酶为属于糖基磷脂酰肌醇(GPI)-锚定的天冬氨酰蛋白酶yapsin家族的Yps1p,其在kex2突变体中过量表达能拯救交配缺陷(Egel-Mitani等,1990)。外源蛋白质的表达表明Yps1p和Yps2p含有内切蛋白酶活性。
宿主细胞用于重组多肽的表达大大简化了大量商业价值多肽的生产,否则其只能通过从天然来源纯化而获得。目前可获得的表达系统有多种选择,可从中选择以生产任一特定的多肽,包括真细菌和真核宿主。选择适当的表达系统中一个重要因素为宿主细胞产生充足多肽产量的能力。然而,常常遇到的问题是特定宿主细胞或培养基中产生的高水平蛋白水解酶。因此,需要提高宿主细胞中重组多肽产量的其他方法。
金属蛋白酶为四种主要蛋白酶类型中最为多样的一种,目前已经鉴定出30多个家族。在这些酶中,二价阳离子通常为锌活化水分子。锌金属蛋白酶可基于锌结合位点而分为例如Zincins和Inverzincins(Hooper,N.M.1994)。金属离子通过通常数量为3个的氨基酸配基固定。已知的金属配基为组氨酸、谷氨酸、天冬氨酸或赖氨酸和至少一个其他残基,其起到催化所需的亲电作用。已知的金属蛋白酶中大约一半含有HEXXH基元,晶体学研究表明其形成部分金属结合位点。
研究表明活性依赖于二价阳离子的许多蛋白酶属于一个家族,即肽酶M16家族。这包括胰岛素酶、线粒体加工蛋白酶、pitrilysin、nardilysin和许多细菌蛋白质。这些蛋白质共有不多序列相似性的区域,但其中最值得注意的为N-端部分。这一区域包括保守的组氨酸,其后为两个残基,然后为一个谷氨酸和另一个组氨酸。已经表明pitrilysin中的此HXXEH基元参与了酶活性(Becker等,1992);两个组氨酸结合锌,谷氨酸为催化活性必需的。X可为任一氨基酸。此家族中的无活性成员丢失这些活性位点残基中的一到三个残基。
以前在例如US 5,861,280(WO98/12300)中建议提供这样的产生蛋白质的宿主细胞和方法,其在丝状真菌宿主细胞中通过表达水平显著降低的遗传修饰来表达水平显著降低的含有HEXXH基元的金属蛋白酶。
其他人还提供了蛋白酶缺乏的丝状真菌,其特征在于丝状真菌含有造成该丝状真菌金属蛋白酶活性降低的DNA位点选择性破坏,并提供了从丝状真菌中获得的编码具有金属蛋白酶活性蛋白质的经分离DNA序列(WO97/46689)。另外,所述金属蛋白酶含有HEXXH基元。
然而,这样的金属蛋白酶还尚未描述,其可通过遗传修饰降低以在非丝状真菌宿主细胞和含有非HEXXH基元的其他细胞中表达水平显著降低的所述金属蛋白酶。
发明概述
研究重组宿主细胞中多种蛋白酶在加工proCCK过程中所起的作用的同时,本发明者惊奇地注意到CYM1的缺失/破坏能提高重组多肽的产量和分泌。另一方面,本发明者发现Cym1p属于金属蛋白酶家族,其活性下调可提高宿主细胞生产的重组多肽水平。
因此,本发明首先在一方面提供了包含编码重组多肽的核酸序列的宿主细胞,其中包含SEQ ID NO:1所述序列的天然存在金属蛋白酶的产量通过遗传操作被减少或抑制。
宿主细胞可以为任何天然状态下拥有金属蛋白酶的细胞。因此宿主细胞可为真核或原核细胞。优选的真核细胞例子包括但不限于哺乳动物细胞、植物细胞和真菌细胞。在优选的实施方案中,宿主细胞为酵母细胞。更优选地,酵母细胞选自但不限于酵母属(Saccharomyces sp.)的某些种例如酿酒酵母(Saccharomyces cerevisiae)、奇异酵母(Saccharomycesparadoxus)、Saccharomyces.mikatae、贝酵母(Saccharomyces bayanus)、Saccharomyces castellii和克鲁弗酵母(Saccharomyces kluyveri)、裂殖酵母属的某些种(Schizosaccharomyces sp.)例如粟酒裂殖酵母(Schizosaccharomyces pombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉逊酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichia pastoris)、甲醇毕赤酵母(Pichia methanolica)、克鲁弗毕赤酵母(Pichia kluyveri)、Yarrowia lipolytica、产朊假丝酵母(Candida utilis)、可可假丝酵母(Candidacacaoi)和发酵地霉(Geotrichum fermentans)。
金属蛋白酶属于水解酶,其中对肽键的亲核攻击由水分子介导。这是天冬氨酸蛋白酶共有的特征,但在金属蛋白酶中通常为锌有时为钴或锰的二价阳离子活化水分子。金属离子通常通过数量为3个的氨基酸配基固定,金属蛋白酶中已知的金属配基为组氨酸、谷氨酸、天冬氨酸或赖氨酸残基。
金属蛋白酶可依照催化所需的金属离子分成两个主要的组,在文献中金属蛋白酶分成至少8个不同的集团:MA、MB、MC、MD、ME、MF、MG和MH。由此表明这组蛋白酶的复杂多样性。这种分类基于配基结合的不同共有序列,并且这样每一个家族具有不同的生物底物和/或功能。
根据本发明下调的金属蛋白酶为蛋白酶pitrilysin亚家族(ME)的一员,其特征在于包含HXXEH(SEQ ID NO:1)序列,其中X为任一氨基酸。目前有180多个成员为Swissprot的ME集团。这样最优选的实施方案中金属蛋白酶包含SEQ ID NO:1提供的序列。另一个实施方案中,金属蛋白酶包含SEQ ID NO:2提供的序列。甚至更优选的,金属蛋白酶包含SEQ IDNO:3提供的序列。此外,金属蛋白酶优选地包含SEQ ID NO:1和第二个组氨酸残基C-端70-80位氨基酸之间的谷氨酸残基。此外,金属蛋白酶优选地包含选自SEQ ID NO:1、SEQ ID NO:2和SEQ ID NO:3的序列以及选自以下的序列:
i)由SEQ ID NO:4到15组成的组中的任何一个序列和
ii)与SEQ ID NO:4到15任何一个至少80%相同的序列。
金属蛋白酶更优选地包含SEQ ID NO:1或SEQ ID NO:2或SEQ IDNO:3以及选自下组中的序列:
i)SEQ ID NO:4或5的任何一个序列和
ii)与SEQ ID NO:4或5任何一个至少80%相同的序列。
金属蛋白酶优选地包含与SEQ ID NO:4或15中的任何一个序列至少85%相同的序列,例如至少90%相同,例如至少95%相同,例如至少99%相同。
在尤其优选的实施方案中,金属蛋白酶包含SEQ ID NO:4提供的序列,或者与其至少80%相同的序列,例如至少90%,例如至少95%,例如至少99%相同的序列。
宿主细胞可通过任何本领域已知的方法进行遗传操作,只要与未进行遗传操作的亲本宿主细胞相比金属蛋白酶得到降低或抑制。此类遗传操作宿主细胞的方法包括但不限于:基因敲除、基因破坏、随机或定点诱变、引入显性失活的金属蛋白酶、使用dsRNA的RNA干扰(RNAi)、催化核酸(例如核酶和DNA酶)和反义核酸。遗传操作优选地直接作用于编码金属蛋白酶的基因、基因转录的mRNA或产生改变金属蛋白酶活性的蛋白质,例如与金属蛋白酶竞争结合于底物但例如不具有催化活性的显性失活突变体。然而,可对宿主细胞进行遗传操作,从而使其间接影响金属蛋白酶的产量或活性。例如,遗传操作可靶向于参与转录金属蛋白酶基因编码的mRNA的转录因子,这样至少降低所操作的宿主细胞产生的金属蛋白酶水平。
此外,宿主细胞可进一步遗传操作以使其缺少至少一个其他天然存在的宿主细胞金属蛋白酶,或者至少一个其他天然存在的宿主细胞金属蛋白酶具有降低的活性。蛋白酶可为其酶活性的抑制能增加宿主细胞重组多肽产量的任何酶。蛋白酶可为内肽酶、氨肽酶或羧肽酶。优选的蛋白酶包括丝氨酸蛋白酶、天冬氨酸蛋白酶、半胱氨酸蛋白酶和其他金属蛋白酶。
在一个实施方案中,宿主细胞为酵母细胞,其他天然存在的蛋白酶为任何以下蛋白酶基因编码的至少一个蛋白酶,所述蛋白酶基因选自KEX2、YPS1(以前已知的YAP3),YPS2(以前已知的MKC7)、YPS3、YPS6、YPS7、BAR1、STE13、KEX1、PRC1、PEP4(也称为PRA1)、APE1、APE2、APE3和CPS1。宿主细胞优选地为酵母细胞并且KEX2的产生得到破坏。除了在此特别描述的金属蛋白酶之外,其他非酵母宿主细胞中相似的天然存在蛋白酶也可破坏和/或遗传操作以获得进一步的产量提高。
重组多肽可为宿主细胞中能产生的任一目的多肽。重组多肽可包含天然存在的序列或人为干涉产生的序列(例如天然存在蛋白质的突变体或截短,或至少两个不同多肽的融合)。重组多肽一般具有商业价值,例如在疾病治疗中具有商业价值。
重组多肽可为任意大小。重组多肽一般地大小范围为约30个氨基酸到约4,500个氨基酸。在一个实施方案中,重组多肽长度在约30个到约200个氨基酸之间。
至少在一些产生重组多肽的宿主细胞表达系统中,需要指导重组多肽从宿主细胞中分泌。这样在优选的实施方案中,核酸包含编码指导重组多肽从宿主细胞分泌的信号序列。信号序列优选地为N-端疏水信号序列。此类N-端疏水信号序列为本领域已知,并包括例如但不限于来源于真菌淀粉葡糖苷酶(AG)基因的前导序列,例如来源于曲霉菌某些种(Aspergillussp.)的galA(包括18和24氨基酸形式);酵母属某些种(Saccharomycessp.)和克鲁维酵母某些种(Kluyveromyces sp)酵母的α-因子基因;裂殖酵母某些种(Schizosaccharomyces sp.)的P-因子和芽孢杆菌属某些种(Bacillus sp.)α-淀粉酶基因。在一个实施方案中,重组多肽以N-端疏水信号序列和编码与信号序列不同来源的重组多肽的第二多肽序列的融合形式表达。
编码重组多肽的核酸可使用本领域任何已知的技术提供给宿主细胞。在一个实施方案中,核酸使用例如基于同源重组的技术插入宿主细胞的基因组。在另一个实施方案中,核酸在保留于染色体外的表达构建体中转染或转化入宿主细胞。例如,表达构建体可以为质粒或病毒。此外,载体优选地包含选择性标记,其可用于有选择地繁殖包含载体的宿主细胞。此类选择性标记和其用途也为本领域已知。
第二方面,本发明提供了产生重组多肽的方法,方法包括在适当的条件下培养根据第二方面的宿主细胞以产生重组多肽,以及收获重组多肽。
因为金属蛋白酶的蛋白水解作用降低或抑制,本发明第二方面的方法提高了宿主细胞产生的重组多肽的稳定性。
在优选的实施方案中,重组多肽从宿主细胞中分泌。此外,分泌的蛋白质优选地在包含宿主细胞的培养物的指数生长阶段收获。
所收获的重组多肽的量优选地高于使用亲本宿主细胞的情况。更优选地,所收获的重组多肽的量比使用亲本宿主细胞的情况高50%。
第三方面,本发明提供了在碱性残基处切割多肽的方法,方法包括在二价阳离子存在的条件下使多肽与包含选自下组序列的金属蛋白酶接触:
i)SEQ ID NO:4到15中的任何一个序列;
ii)与SEQ ID NO:4到15任何一个至少80%相同的序列。
在尤其优选的实施方案中,金属蛋白酶包含如SEQ ID NO:4提供的序列,或与其至少80%相同的序列,例如至少90%,例如至少95%和例如99%相同。
金属蛋白酶优选地在选自Lys、Arg、ArgArg、LysLys、ArgLys和LysArg的氨基酸或氨基酸序列的C-端侧切割多肽,因此,多肽优选地包含Lys、Arg、ArgArg、LysLys、ArgLys或LysArg。其他序列要求也为切割所必需,然而这些可通过常规实验容易地确定。
二价阳离子优选地选自Zn2+,Co2+和Mn2+
第三方面的方法可在产生金属蛋白酶的重组宿主细胞体内进行,或在适当的反应条件下体外进行。鉴于本公布,熟练的技术人员可以容易地进行第三方面的方法。在此提供了用特定的金属蛋白酶切割多肽的体外系统的实例。在这种情况下,将多肽与在0.1M NaH2PO4(pH4.5)并存在1mMMn2+和1mM苯丁抑制素的酵母细胞粗提取物中提供的金属蛋白酶接触。在另一个实例中,金属蛋白酶可以带有适当“标记”的融合蛋白形式重组产生,例如能简化融合蛋白纯化的His-标记。此类“标记”优选地在金属蛋白酶暴露于底物多肽之前去掉(例如通过酶促切割)。
第四方面,本发明提供了鉴定抑制包含SEQ ID NO:1所述序列的金属蛋白酶活性的试剂的方法,方法包括下列步骤:
a)在二价阳离子和适当底物存在的条件下将金属蛋白酶与试剂孵育;
b)确定金属蛋白酶对底物的活性;
c)将步骤b)中获得的活性与未与所述试剂孵育的对照样品的活性比较;
d)选择抑制金属蛋白酶活性的试剂。
底物可为被金属蛋白酶和检测到的切割事件切割的任一多肽。在此公开的一个实施例使用CCK作为底物,其中切割事件通过CCK-22的产生检测。可以容易地开发相似的鉴定法用于其他底物。
第四方面优选的实施方案中,金属蛋白酶包含如SEQ ID NO:4提供的序列,或包含与其至少80%相同的序列,例如至少90%,例如至少95%和例如99%相同的序列。
第五方面,本发明提供了产生重组多肽的方法,方法包括在适当的条件下培养包含编码重组多肽的核酸序列的宿主细胞以产生重组多肽。以及收获重组多肽,其中所述的培养包括金属蛋白酶抑制剂的存在,所述金属蛋白酶包含SEQ ID NO:1提供的序列。
抑制剂优选地根据第四方面的方法鉴定。
本发明一个方面优选的特征和特性显然可以应用于本发明其他方面。
整篇说明书中,单词“包含”或例如其复数或动名词的变化形式应理解为指包括成分、整数或步骤、或成分、整数或步骤的组,但不排除任一其他成分、整数或步骤、或成分、整数或步骤的组。
本发明以下列非限制性的图和实施例形式描述。
附图简述
图1.缩胆囊素表达构建体。显示了PreproMfα1p-proCCK融合蛋白质在融合位点附近和原始切割位点的氨基酸序列。下面显示了分泌的CCK主要形式的N-端和C-端氨基酸残基。
图2.CCK-22在细胞中和培养基中的成熟过程作为细胞生长的函数。表达preproMfα1p-proCCK融合蛋白的BJ2168。使用Ab89009通过RIA测量CCK-22免疫反应性,并在胰蛋白酶切割后用Ab89009测量总CCK含量。空心圆代表分泌的CCK-22级分而CCK-22胞内级分以实心三角形表示。细胞生长通过OD600(空心方框)测量。数据代表两个独立实验的平均值。
图3.BJ2168中分泌的正常CCK和K→A突变CCK的层析分析。pRS426 preproMfα1p-proCCK和pRS426 preproMfα1p-proCCK(K→A)转化的酵母培养基用于G-50凝胶层析并用对甘氨酸延伸CCK特异性的Ab7270(A和C)和CCK-22 N-端特异性的Ab89009(B和D)测量CCK免疫反应性。
图4.包括抑制剂和激活剂的体外蛋白酶鉴定法。CCK-22级分计算为将使用Ab89009的免疫反应性除以胰蛋白酶处理后用Ab89009测量的成熟CCK-22和N-端延伸CCK-22的总量。A,不同抑制剂的影响。B,蛋白酶活性用1mM EDTA抑制的提取物中通过加入1.2mM二价金属离子再活化蛋白酶。数据代表三个独立实验的平均值±SD。
图5.使用Zn2+和Mn2+的蛋白酶再活化。用LJY123细胞提取物进行体外蛋白酶测定,其中活性用1mM EDTA(实心方框)抑制并通过加入1.2mM Mn2+(空心圆)或1.2mM Zn2+(实心圆)再活化。活性测定为孵育30、60和120分钟后的成熟CCK-22级分。CCK-22级分计算为将使用Ab89009的免疫反应性除以胰蛋白酶处理后用Ab89009测量的成熟CCK-22和N-端延伸CCK-22的总量。数据代表平均值±SD(n=3)。
图6.yapsin家族成员引起的胞外CCK-22成熟过程。完整细胞加工胞外CCK的能力如“实验方法”所述分析BY4705和同基因yps1、yps1 yps3和yps1 yps2 yps3菌株。CCK-22级分计算为将使用Ab89009的免疫反应性除以胰蛋白酶处理后用Ab89009测量的成熟CCK-22和N-端延伸CCK-22的总量。数据代表平均值±SD(n=4)。统计使用实验方法所述的非成对t检验进行。(***=P<0.001,**=P<0.01和*=P<0.05)。
图7.Cym1p过量表达之后的蛋白水解增加。用pRS425空质粒(A)和含有CYM1的pRS425(B)转化的BJ2168的细胞提取物进行体外蛋白酶测定。使用Ab89009(实心方框和圆)随时间测量CCK-22免疫反应性并在胰蛋白酶处理之后用Ab89009测量成熟的CCK-22和N-端延伸的CCK-22总量(空心方框和圆)。数据代表三个独立实验的平均值±SD。
图8.KEX2和CYM1缺失对proCCK分泌和CCK-22成熟过程的影响。在指数期收获proCCK表达构建体转化的酵母细胞并收集培养基。胰蛋白酶处理之后用Ab89009测量总CCK的胞内量(A)和胞外量(B)。胞内CCK-22级分(C)和分泌的CCK-22级分(D)计算为将胰蛋白酶切割前使用Ab89009的免疫反应性除以在(A)和(B)测量的CCK总量。kex2、cym1和kex2 cym1菌株是BJ2168的同基因。数据以平均值±SD(n=4)给出。统计使用非成对t检验进行(***=P<0.001,**=P<0.01和*=P<0.05)。括号中的星号为kex2和kex2 cym1菌株间的比较。
图9.CCK的胞内降解依赖于Cymp1对CCK-22的切割。在BJ2168和与BJ2168同基因的CYM1受破坏菌株中表达野生型CCK、preproMfα1p-proCCK和CCK突变体preproMfα1p-proCCK(K→A)。指数生长过程中沉淀细胞并在胰蛋白酶和羧肽酶B处理后用对Gly-延伸CCK的特异性抗体Ab7270测量CCK总量(带阴影的框)。成熟Gly-延伸CCK的量(取决于移位到分泌途径、Kex2p和羧肽酶活性)测定为胰蛋白酶切割和羧肽酶B处理之前使用Ab7270的免疫反应性。数据以平均值±SD(n=3)给出。
图10.天冬胺酰蛋白酶参与了CCK-22的成熟过程。在BY4705和同基因yapsin缺失菌YPS1、YPS2和YPS3株中表达野生型proCCK。在指数生长过程中测量合成的CCK-22的胞内级分(A)和胞外级分(B)。成熟CCK-22级分计算为将胰蛋白酶切割前使用Ab89009的免疫反应性除以在CCK-22的总量。数据以平均值±SD(n=3)表示。统计如实验方法所述使用非成对t检验进行。(***=P<0.001,**=P<0.01和*=P<0.05)。
图11.Cym1p对Lys和Arg残基C端的加工。CYM1缺失将分泌的CCK数量提高到野生型CCK和Lys61→Arg61突变体的两倍多。在BJ2168和BJ2168同基因的CYM1破坏体中表达野生型CCK、preproMfα1p-proCCK和CCK突变体preproMfα1p-proCCK(Lys61→Arg61)。指数期收获酵母细胞并收集培养基。胰蛋白酶处理后用Ab89009测量总CCK的胞内数量(A)和胞外数量(B)。数据以平均值±SD(n=3)给出。
图12.通过质谱鉴定分泌的proCCK片段。CCK-数字指C-端酰胺化CCK。除了*表示平均值外分子量以单一同位素值给出。菌株A,液泡蛋白酶缺陷菌株(BJ2168);菌株B,KEX1 KEX2破坏的同基因菌株(LJY22)。
图13.产生C-端延伸CCK(A)和GLP2(B)的模型。这些融合肽的表达应在sec61突变体中进行或者应去掉α-交配因子的前序列(pre-sequence)以避免移位到内质网。显示了融合位点附近的氨基酸序列。下划线为Gly-延伸CCK-22和GLP1的N-端和C-端氨基酸。
图14.A.preproMfα1p-proBNP表达构建体。
B.preproMfα1p-KREAEA-BNP-32表达构建体。
C.preproMfα1p-KR-BNP-32表达构建体。
图15.A.preproMfα1p-proBNP表达构建体转化BJ2168、LJY430(cym1突变体)、LJY431(yps1突变体)和LJY432(cym1yps1双突变体)。对到达稳定期的细胞使用proBNP N-端特异的抗体Ab98192分析培养基。cym1、yps1和cym1yps1菌株为BJ2168同基因。数据以平均值±SD(n=3)给出。统计如实验方法所述使用非成对t检验进行。(***=P<0.001,**=P<O.01和*=P<0.05)。括号中的星号为野生型菌株BJ2168和cym1、BJ2168和yps1、yps1和yps1cym1之间的比较。
(ns,=不显著)。
B.分析cym1突变体中分泌的proCCK片段。含10皮摩尔proBNP的培养基用于Akta纯化系统的Superdex 200柱。使用proBNP N-端特异的抗体98192测量所收集级分中的proBNP含量。
序列表说明:
SEQ ID NO:1-pitrilysin蛋白酶的共有序列。
SEQ ID NO:2-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO:3-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO:4-酿酒酵母Cym1p(Swissprot登录号P32898)。
SEQ ID NO:5-粟酒裂殖酵母C119.7(Swissprot登录号O42908)。
SEQ ID NO:6-产气荚膜梭菌(Clostridium perfringens)HypA蛋白质(Swissprot登录号Q46205)。
SEQ ID NO:7-布氏疏螺旋体(Borrelia burgdorferi)蛋白质BB0228(Swissprot登录号O51246)。
SEQ ID NO:8-秀丽隐杆线虫(Caenorhabditis elegans)C05D11.1蛋白质(Swissprot登录号P48053)。
SEQ ID NO:9-大肠杆菌(E.coli)蛋白酶III(Swissprot登录号P05458)。
SEQ ID NO:10-大鼠NRD转换酶(Swissprot登录号P47245)。
SEQ ID NO:11-人胰岛素崩解酶(Swissprot登录号P14735)。
SEQ ID NO:12-拟南芥(Arabidopsis thaliana)CPE(Genbank登录号T03302)。
SEQ ID NO:13-人金属蛋白酶I部分序列(GenBank登录号AAH01150),人金属蛋白酶I全长序列(Swissprot登录号O95204)。
SEQ ID NO:14-枯草芽孢杆菌(Bacillus subtilis)锌蛋白酶ymxG(GenBank登录号Q04805)。
SEQ ID NO:15-结核分枝杆菌(Mycobacterium tuberculosis)锌蛋白酶Rv2782c(GenBank登录号O33324)。
SEQ ID NO 16至42-寡核苷酸。
SEQ ID NO 43至52-图12提供的序列。
SEQ ID NO 53至55-图1提供的序列。
SEQ ID NO 56至65-寡核苷酸。
SEQ ID NO:66-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO:67-至少为一些pitrilysin蛋白酶的共有序列。
SEQ ID NO:68-至少为一些pitrilysin蛋白酶的共有序列。
发明详述
本发明提供了对表达多肽有用的宿主细胞,所述细胞经遗传操作以至少产生与亲本细胞相比降低水平的特定金属蛋白酶。这样宿主细胞能由于金属蛋白酶的蛋白水解作用得到降低或抑制从而以较高量表达目的蛋白质,这也提高了目的蛋白质的稳定性。
通过本发明的方法,金属蛋白酶的蛋白水解作用得到降低或抑制,因此改善了所获产物的稳定性。
这样本发明的一个实施方案涉及对表达目的蛋白质有用的宿主细胞,其中所述的细胞经遗传修饰以在相同条件下表达与相应未修饰细胞相比显著降低水平的包含HXXEH基元(SEQ ID NO:1)的金属蛋白酶。
需要根据本发明下调的金属蛋白酶不共有许多序列相似性区域,最值得注意的在N-端部分。这个区域包括保守的组氨酸,其后两个残基为一个谷氨酸和另一个组氨酸。pitrilysin中表明此HXXEH基元参与酶促活性。两个组氨酸结合锌,谷氨酸为催化活性所必需。此家族的非活性成员丢失这些活性位点残基中的1到3个残基。
根据本发明下调的金属蛋白酶家族目前分类为ME集团M16家族的成员。此家族通常分为4个亚家族:
包含pitrilysin的M16A
包含线粒体加工肽酶-β亚基(酿酒酵母)的M16B
包含eupitrilysin(人(Homo sapiens))的M16C
包含痘苗病毒型金属内肽酶(痘苗病毒)的M44
这些蛋白质的序列比对表明存在几个序列相似。这些序列相似高度保守并可用于区分此家族成员与非成员。
在这些序列相似中,几个独立的氨基酸高度保守并易于在距离HXXEH基元的特定位点处识别。
这样本发明的一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端70至80个氨基酸之间的谷氨酸残基。
本发明另一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第一个组氨酸残基N-端3个氨基酸的甘氨酸残基。
本发明另一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端5个氨基酸的甘氨酸残基。
本发明另一个实施方案涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端8个氨基酸的赖氨酸残基。
本发明的一个实施方案也涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端9个氨基酸的酪氨酸残基。
此外,本发明涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端10个氨基酸的脯氨酸残基。
序列相似中有几个氨基酸区域也高度保守并易于识别。这样在目前优选的实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含SEQID NO 2的共有序列。
在另一个目前优选的实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含SEQ ID NO 3的共有序列。
在目前最优选的实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含位于HXXEH基元第二个组氨酸残基C-端20和30个氨基酸之间的NAXTXXXXT基元。
在目前另一个实施方案中,本发明涉及这样的宿主细胞,其中金属蛋白酶包含SEQ ID NO 66-68的共有序列。本发明的一个实施方案涉及对表达目的蛋白质有用的宿主细胞,其中所述的细胞经遗传操作以表达与亲本细胞相比降低水平的金属蛋白酶,其与SEQ ID NO:4-15的任何一个至少80%相同。
本篇中,术语“目的蛋白质”涉及大量天然存在的极复杂底物中的任何一个,例如但不限于由通过肽键连接的氨基酸残基组成的蛋白质、酶和/或抗体。本发明优选实施方案的目的就是提供此类为宿主细胞自身产物的天然蛋白质和/或异源蛋白质、融和蛋白、重组蛋白质、真核蛋白质、原核蛋白质、溶酶体蛋白质、液泡蛋白质、前体蛋白、酶原蛋白质、前原蛋白和分泌蛋白质。
所要求权利的方法的优选实施方案由于目的蛋白质的较高产量很有利,这样,与在相同条件下培养的相应未修饰细胞中产量相比,如在此描述的经修饰宿主细胞中生产的任何目的蛋白质的量增加都在本发明的范围之内。
熟练技术人员可以评价在此所述修饰的宿主细胞中目的蛋白质提高的产量并与相应未修饰细胞的产量比较的鉴定法,通过在相同条件下培养两种不同宿主细胞并通过使用目的蛋白质特异抗体的放射免疫测定法测量产生的目的蛋白质的量。本说明书的实施例中更详细地描述了一个这样的鉴定法。
本发明的一个实施方案涉及这样的宿主细胞,其中在相同条件下培养时,目的蛋白质总量与相应未修饰的细胞相比增加至少5%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少10%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少20%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少50%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少100%,例如在相同条件下培养时与相应未修饰的细胞相比增加至少200%,甚至在相同条件下培养时与相应未修饰的细胞相比增加至少1000%。
本文中,术语“宿主细胞”涉及能产生目的蛋白质的任何细胞。这样在优选的实施方案中,宿主为原核细胞。在另一个优选的实施方案中,宿主细胞为真核细胞,例如但不限于丝状真菌细胞和非丝状真菌细胞。非局限性的例子为酵母菌株,尤其是酿酒酵母菌株。
在此描述的涉及本发明方法的所有特征也适用于涉及宿主细胞的实施方案,并且反之亦然。
本申请中描述的方法涉及宿主细胞中目的蛋白质的产量,其中所述的宿主细胞经遗传修饰,当在相同条件下培养时,这包括:
a)将编码目的蛋白质的核酸序列导入宿主细胞;
b)在适当的生长培养基中培养步骤(a)的宿主细胞以产生目的蛋白质;
c)分离目的蛋白质,
与亲本细胞相比,其表达显著降低水平的与SEQ ID NO:4至少80%相同的金属蛋白酶。
本发明的一个实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中的宿主细胞通过选自基因敲除、基因破坏、随机或定点诱变、引入显性失活的金属蛋白酶、使用dsRNA的RNA干涉、催化核酸(如核酶和DNA酶)、反义核酸或其组合的方法遗传修饰。
在目前最优选的实施方案中,宿主细胞基本上不含任何金属蛋白酶活性。
本发明一个优选的实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中目的蛋白质为真核蛋白质,其选自胰岛素、生长激素、胰高血糖素、促生长素抑制素、干扰素、促肾上腺皮质激素、血管紧张素原、心房肽、强啡肽、内啡肽、甘丙肽、胃分泌素、胃分泌素释放肽、神经肽Y片段、胰抑制素、胰多肽、促胰液素、血管活性肠肽、生长激素释放因子、促黑激素、神经降压素、肾上腺肽、甲状旁腺激素及相关肽、生长激素抑制素及相关肽、脑钠肽、降钙素、促肾上腺皮质激素释放因子(CRF)、受可卡因和安非他明调节的转录产物(CART)、胸腺素、硬骨鱼紧张肽、胰高血糖素及胰高血糖素样肽(GLP-1和GLP-2)、生长激素抑制素、干扰素、血管内皮细胞生长因子(VEGF)、血小板衍生生长因子(PDGF)、因子VII、因子VIII、因子V、因子IX,白细胞介素、尿激酶、促红细胞生成素(EPO)、凝乳酶、组织纤维蛋白溶酶原激活剂、正辅因子2谷氨酰胺/富含Q的相关蛋白(Positive cofactor 2 glutamine/Q-rich-associated protein,PCAP)、肽酪氨酸酪氨酸(PYY)、血液生长素、增食因子、β-新内啡肽-强啡肽前体、CCK或血清白蛋白。
本发明另一个实施方案涉及在宿主细胞中生产目的蛋白质的方法,其中目的蛋白质为选自淀粉分解酶、α-淀粉酶、β-淀粉酶、糖淀粉酶、α-半乳糖苷酶、溶细胞酶、脂肪分解酶、木聚糖水解酶、蛋白水解酶、氧化还原酶、过氧化物酶、漆酶、果胶酶、或角质酶的真菌来源蛋白质。
本发明另一个优选实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中目的蛋白质为选自淀粉分解酶、α-淀粉酶、β-淀粉酶、糖淀粉酶、β-半乳糖苷酶、  溶细胞酶、脂肪分解酶、木聚糖水解酶、蛋白水解酶、氧化还原酶、过氧化物酶、漆酶、果胶酶、或角质酶的细菌蛋白质。
本发明特别的实施方案涉及在宿主细胞中产生目的蛋白质的方法,其中目的蛋白质为前体,即酶原、杂合蛋白、以前序列或原前序列(preprosequence)获得的或未成熟形式蛋白质。
普通分子生物学
除非特别说明,本发明使用的重组DNA技术为本领域技术人员所熟知的常规方法。此类技术在整篇的下列来源中描述和解释并在此引用作为参考,例如J.Perbal,A Practicai Guide to Molecular Cloning,John Wileyand Sons(1984),J.Sambrook等,Molecular Cloning:A LaboratoryManual,Cold Spring Harbour Laboratory Press(1989),T.A.Brown(编辑),Essential Molecular Biology:A Practical Approach,卷1和2,IRLPress(1991),D.M.Glover和B.D.Hames(编辑),DNA Cloning:A PracticalApproach,卷1-4,IRL Press(1995和1996),F.M.Ausubel等(编辑),Current Protocols in Molecular Biology,Greene Pub.Associates和Wiley-Interscience(1988,包括至今所有更新),Methods in Enzymology.Vol 194.Guide to Yeast Genetics and Molecular Biology.(1991)EdGunthrie and Fink Academic Press,Methods in Microbiology Vol.26.Yeast Gene Analysis.(1998)Brown和Tuite编辑.Academic Press,Miller,J.H.(1992)A Short Course in Bacterial Genetics(Manual,L.编辑),ColdSpring Harbor Laboratory,Cold Spring Harbor,NY,Johnston,J.R.(1994)Molecular Genetics of Yeast(A Practical Approach)Oxford UniversityPress,Oxford,以及Molecular Genetics of Yeast:A Practical Approach,Ed.J.R.Johnston编辑,IRL Press(1994)。
多肽同源性百分比通过缺口创建罚分=5和缺口延伸罚分=0.3的GAP(Needleman和Wunsch,1970)分析(GCG程序)确定。所查询序列长度至少为15个氨基酸,GAP分析比对两序列至少15个氨基酸的区域。更优选地所查询序列长度至少为50个氨基酸,GAP分析比对两序列至少50个氨基酸的区域。甚至更优选地,所查询序列长度至少为100个氨基酸,GAP分析比对两序列至少100个氨基酸的区域。更优选地,所查询序列长度至少为250个氨基酸,GAP分析比对两序列至少250个氨基酸的区域。甚至更优选地,所查询序列长度至少为500个氨基酸,GAP分析比对两序列至少500个氨基酸的区域。
金属蛋白酶pitrilysin亚家族
金属蛋白酶pitrilysin亚家族的特征在于存在HXXEH基元(SEQ IDNO:1)。Rawlings和Barrett(1995)提供了这个亚家族的综述。此家族成员包括但不限于酿酒酵母Cym1p(SEQ ID NO:4)(Swissprot登录号P32898)、粟酒裂殖酵母C119.7(SEQ ID NO:5)(Swissprot登录号O42908)、产气荚膜梭菌(Clostridium perfringens)HypA蛋白质(SEQ IDNO:6)(Swissprot登录号Q46205)、布氏疏螺旋体蛋白质BB0228(SEQ IDNO:7)(Swissprot登录号O51246)、秀丽隐杆线虫C05D11.1蛋白质(SEQID NO:8)(Swissprot登录号P48053)、大肠杆菌蛋白酶III(也称为pitrilysin)(SEQ ID NO:9)(Swissprot登录号P05458)、大鼠NRD转化酶(SEQ ID NO:10)(Swissprot登录号P47245)、人胰岛溶素(SEQ ID NO:11)(Swissprot登录号P14735)、拟南芥CPE(SEQ ID NO:12)(Genbank登录号T03302)、人金属蛋白酶I(部分)(SEQ ID NO:13)(GenBank登录号AAH01150)(全长序列:Swissprot登录号O95204)、枯草芽孢杆菌(Bacillus subtilis)锌蛋白酶ymxG(SEQ ID NO:14)(GenBank登录号Q04805)和结核分歧杆菌(Mycobacterium tuberculosis)锌蛋白酶Rv2782c(SEQ ID NO:15)(GenBank登录号O33324)。对大肠杆菌金属蛋白酶III(SEQ ID NO:9),表明SEQ ID NO:1中的组氨酸残基和谷氨酸-169参与二价阳离子的结合同时与组氨酸残基相邻的谷氨酸残基为催化残基。
编码pitrilysin金属蛋白酶的基因可通过杂交编码全部或部分金属蛋白酶的核酸序列的筛选方法很容易地鉴定,例如使用合成寡核苷酸探针,其可基于cDNA序列,如根据常规技术制备的编码SEQ ID NO:4到15的金属蛋白酶中的任何一个的核苷酸序列。
遗传操作
本发明经遗传操作以产生降低水平的特定金属蛋白酶的宿主细胞可使用本领域技术人员已知的常规重组DNA技术来修饰。引起金属蛋白酶产生的基因序列可以失活或全部消除。
在特定的实施方案中,本发明的宿主细胞在金属蛋白酶基因的编码或调节区域进行遗传操作。已知并有用的技术包括但不限于基因敲除、基因破坏、随机或定点诱变、引入显性失活金属蛋白酶、使用dsRNA的RNA干涉、催化核酸(例如核酶和DNA酶)和反义核酸或其组合。
诱变使用适当的物理或化学诱变剂进行。适于此目的的物理或化学诱变剂的例子包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、蚁酸和核苷类似物。当使用此类诱变剂时,一般通过在适于诱变发生的条件下在所选诱变剂中孵育待诱变细胞,并选择显著降低金属蛋白酶产量的突变细胞进行诱变。
遗传操作也可通过引入、替代或去除金属蛋白酶编码序列或其转录或翻译所需的调节元件中一个或多个核苷酸来完成。例如可插入或去除核苷酸以造成终止密码子的引入,起始密码子的去除或开放阅读框的变化。结构序列或调节元件的修饰或失活可根据本领域已知的方法通过定点诱变或PCR产生诱变而完成。
失活或降低宿主细胞金属蛋白酶产量的便利方法基于基因间断原则。此方法包括使用与待破坏内源基因或基因片段对应的DNA序列。DNA序列为在体外突变成缺陷基因并转化宿主细胞。缺陷基因通过同源重组替代内源基因或基因片段。可能需要编码用于重组体选择的标记的缺陷基因或基因片段,其中编码金属蛋白酶的基因已经得到修饰或破坏。
在此使用的术语“反义”指与特定核酸序列互补的核苷酸序列。反义分子可通过任何方法生产,其包括通过将目的基因与允许互补链合成的病毒启动子反向连接来合成。一旦导入宿主细胞,其经转录链与细胞产生的编码金属蛋白酶的天然序列结合形成双链体。这些双链体阻止进一步的转录或者进一步的翻译。突变表型可以这种方式产生。
术语“催化核酸”指特异识别特定底物并催化此底物化学修饰的DNA分子、含DNA的分子(也是本领域已知的“脱氧核酶)、RNA或者含RNA的分子(也是本领域已知的“核酶”)。催化核酸中的核酸碱基可以为碱基A、C、G、T和U,也可为其衍生物。这些碱基的衍生物为本领域所熟知。
催化核酸一般地含有特异识别目的核酸的反义序列和切割性酶促活性的核酸,在此也称为“催化结构域”。本发明中尤其有用的核酶类型为锤头状核酶(Haseloff和Gerlach,1988)和发卡状核酶(Shippy等,1999)。
对本发明方法有用的核酶和编码核酶的DNA可使用本领域熟知的方法化学合成。核酶也可以从可操作地与RNA聚合酶启动子连接的DNA分子(一旦转录产生RNA分子)制备,其中所述启动子例如T7RNA聚合酶或SP6RNA聚合酶的启动子。当载体还含有可操作地与DNA分子连接的RNA聚合酶启动子时,可通过与RNA聚合酶和核苷酸孵育体外产生核酶。在独立的实施方案中,DNA可插入表达盒或转录盒。合成之后,RNA分子可通过与具有稳定核酶并使其抵抗RNA酶能力的DNA分子连接来修饰。作为一种选择,核酶可修饰成用于脂质体递送系统中的硫代磷酸(phosphothio)类似物。这种修饰也使核酶具有抵抗核酸内切酶的活性。
dsRNA(RNAi)对特异抑制特定蛋白质产生尤其有用。此技术依赖于含有与目的基因的mRNA基本上一致序列的dsRNA分子的存在,在这种情况下所述mRNA编码金属蛋白酶。dsRNA可方便地在重组载体或宿主细胞中的一个开放阅读框中产生,其中有义与反义序列与无关序列相邻,其能使有义与反义序列杂交以形成dsRNA分子,而无关序列形成环状结构。用于遗传操作的适当dsRNA分子的设计和产生为本领域技术人员能力范围之内所熟知的,尤其见Waterhouse等(1998),Elbashir等(2001),WO99/32619,WO99/53050,WO99/49029和WO01/34815。
本发明的宿主细胞由于遗传操作表达显著降低水平的金属蛋白酶。在优选的实施方案中宿主细胞表达的金属蛋白酶水平降低大于约25%,例如大于约30%,例如大于约35%,例如大于约40%,例如大于约45%,例如大于约50%,例如大于约55%,例如大于约60%,例如大于约65%,例如大于约70%,例如大于约75%,例如大于约80%,例如大于约85%,例如大于约90%,例如大于约95%,例如大于约98%和例如大于约99%。
在目前最优选的实施方案中,宿主细胞表达的产物基本不具有任何所述的金属蛋白酶活性。
在本文中,术语“基本不具有”指这样的宿主,其中所述宿主细胞表达的金属蛋白酶降低到所述金属蛋白酶的功能对目的蛋白质产生没有生物学上使所述蛋白质显著降低的影响。
目的蛋白质
术语“多肽”、“蛋白质”和“肽”在此可替换地使用并且在本文中涉及大量天然存在的极复杂物质中的任何一个,例如但不限于由肽键连接的氨基酸残基组成的酶或抗体,其含有碳元素、氢元素、氮元素、氧元素,通常含有硫元素并且偶尔含有其他元素例如但不限于磷或铁;为所有活细胞的必需成分;在植物中自原材料天然合成但在动物中以单个氨基酸同化;虽然对许多所述物质已得到结晶但天然状态下其为酸性、碱性并通常为胶体,且可被酸、碱、蛋白水解酶和腐败细菌水解成多肽、简单肽并最终水解成α-氨基酸。
正如在此定义的,“重组多肽”为宿主细胞的非天然蛋白质,或天然蛋白质中已进行修饰以改变天然序列,或对天然蛋白质表达需要的天然调节序列例如启动子、核酶结合位点等等的操作或者其他通过重组DNA技术对宿主细胞的操作,造成表达得到量上的改变的天然蛋白质。
由于所述金属蛋白酶活性的消失或降低,宿主细胞表达的至少一部分多肽可能为前体蛋白质,例如酶原、杂合蛋白质、以前序列或原前序列或未成熟形式获得的蛋白质。
在更特定的实施方案中,重组多肽为真核来源如胰岛素、促肾上腺皮质激素、血管紧张素原、心房钠尿肽、强啡肽、内啡肽、甘丙肽、胃分泌素、胃分泌素释放肽、神经肽Y片段、胰抑制素、胰多肽、促胰液素、血管活性肠肽、生长激素释放因子、促黑激素、神经降压素、肾上腺肽、甲状旁腺激素及相关肽、生长激素抑制素及相关肽、脑钠肽、降钙素、促肾上腺皮质激素释放因子(CRF)、受可卡因和安非他明调节的转录产物(CART)、胸腺素、硬骨鱼紧张肽、胰高血糖素及胰高血糖素样肽(GLP-1和GLP-2)、生长激素抑制素、干扰素、血管内皮细胞生长因子(VEGF)、血小板衍生生长因子(PDGF)、因子VII、因子VIII、因子V、因子IX、白细胞介素、尿激酶、促红细胞生成素(EPO)、凝乳酶、组织纤维蛋白溶酶原激活剂、CCK或血清白蛋白。
特别要提到“胰高血糖素及胰高血糖素样肽”,在此使用的此术语指人或其他动物来源的和重组或半合成来源的多肽,其包括胰高血糖素家族全部成员,例如GRPP(胰高血糖素样肽相关多肽)、胰高血糖素、GLP-1(胰高血糖素样肽1)和GLP-2(胰高血糖素样肽2),其包括截短和/或N-端延伸的形式例如GLP-1(7-36)并包括类似物GLP-1(7-35)R36A GLP-2 F22Y、GLP-2 A19T+34Y.GLP2 A2G和GLP-2 A19T,以及其他具有1到3个氨基酸改变、添加和/或缺失的类似物。
宿主细胞及由其表达的重组多肽
本发明使用的宿主细胞可为原核或真核宿主细胞。本发明使用的真核宿主细胞可为例如真菌、哺乳动物、植物或昆虫细胞。宿主细胞优选地为酵母细胞。
为产生目的多肽,本发明的宿主细胞包含编码重组多肽的核酸序列和指导目的产物表达的调节序列例如包含如转录、翻译和终止必需的核苷酸序列的区域。本发明宿主细胞的遗传设计可由本领域技术人员使用转化或转染宿主细胞的常规重组DNA技术完成。
宿主细胞优选地通过本领域已知的导入例如质粒或病毒载体中的、包含编码重组多肽的核酸的适当表达盒方法来修饰。
表达盒可通过多种技术引入宿主细胞,包括但不限于作为自主复制质粒或整合入染色体。表达盒可含有调节序列,例如转录控制序列、翻译控制序列、复制起点和与重组细胞相容以及控制编码重组多肽的核酸表达的其他调节序列。本发明的重组核酸分子尤其包括转录控制序列。转录控制序列为控制转录起始、延伸和终止的序列。尤其重要的转录控制序列为控制转录起始的序列,例如启动子、增强子、操纵子和阻遏子序列。适当的转录控制序列包括至少可在本发明的一种重组细胞中发挥功能的任何转录控制序列。多种这样的转录控制序列为本领域技术人员已知。优选的转录控制序列包括在细菌、酵母、节肢动物和哺乳动物细胞中发挥功能的序列,例如但不限于tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、λ噬菌体、T7噬菌体、T7lac、T3噬菌体、SP6噬菌体、SP01噬菌体、金属硫蛋白、α-交配因子、毕赤酵母醇氧化酶、甲病毒亚基因组启动子(例如辛德毕斯病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、玉米夜蛾(HeliothisZea)昆虫病毒、痘苗病毒、疱疹病毒、浣熊痘病毒、其他痘病毒、腺病毒、巨细胞病毒(如中早期启动子)、猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复、劳斯肉瘤病毒、热休克、磷酸盐和硝酸盐转录控制序列和能在原核或真核细胞中控制基因表达的其他序列。本发明的转录控制序列最优选地为天然存在的酵母相关控制序列。酿酒酵母适当的启动子包括MFα1启动子、半乳糖诱导型启动子例如GAL1、GAL7和GAL10启动子、包括TPI1和PGK1启动子、TRP1启动子、CYCI启动子、CUP1启动子、PHOS启动子、ADH1启动子和HSP启动子的糖酵解酶启动子。毕赤酵母属中适当的启动子为AOXI(甲醇利用)启动子。
本发明的重组多肽也可含有(a)分泌信号,使表达的多肽从产生所述多肽的细胞分泌和/或(b)引起融合蛋白表达的融合序列。适当的信号片段的例子包括能指导融合蛋白分泌的任何信号片段。优选的信号片段包括但不限于组织纤溶酶原激活剂(t-PA)、干扰素、白细胞介素、生长激素、组织相容性和病毒包膜糖蛋白信号片段、来源于真菌淀粉葡糖苷酶(AG)基因例如galA的前导序列(例如来源于曲霉属某些种(Aspergillus sp.)的18个和24个氨基酸形式)、来源于酵母如芽殖酵母某些种和克鲁维酵母某些种的α-因子基因、裂殖酵母某些种的P-因子和芽孢杆菌某些种的α-淀粉酶基因以及天然信号序列。
克隆载体也可包含选择性标记,例如其产物弥补宿主细胞缺陷的基因或给予抗生素抗性的基因例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的基因。
分别用于连接本发明的DNA构建体、启动子、终止子和其他元件以及将其插入含有复制必需信息的适当克隆载体的方法为本领域技术人员熟知。
可使用重组DNA技术通过如操作宿主细胞中核酸分子的拷贝数量、操作转录核酸分子的效率、操作得到的转录物的翻译效率和操作翻译后修饰的效率提高经转化核酸分子的表达。对本发明方法有用的增加核酸分子表达的重组技术包括但不限于可操纵地将核酸分子与高拷贝数质粒连接、将核酸分子整合入一条或多条宿主细胞染色体、在质粒中加入载体稳定序列、替代或修饰转录控制信号(如启动子、操纵子和增强子)、替代或修饰翻译控制信号(如核糖体结合位点、SD序列)、修饰核酸分子使其与宿主细胞密码子使用对应和去掉使转录物不稳定的序列。本发明表达的重组多肽的活性可通过片段化、修饰或衍生化编码此类蛋白质的多聚核苷酸分子来提高。
产生重组多肽的方法
已经用编码重组多肽的核酸转染或转化的宿主细胞在本领域技术人员查阅在此公开的资料已知的适当条件下培养充足的时间以允许多肽的产生,并且优选地允许多肽的分泌,然后收获目的产物。
此外,由于金属蛋白酶活性降低,宿主细胞表达的重组多肽可以前体蛋白质形式获得,即酶原、杂合蛋白质、以前序列或原前序列或未成熟形式获得的蛋白质
用于培养的肉汤或培养基为适于提到的宿主细胞生长的任何常规培养基,并可根据现有技术的原理合成。培养基优选地含有碳源和氮源以及其他无机盐。适当的培养基如基本培养基或复合培养基可获自供应商或可根据出版的方法制备。
谈及酵母宿主细胞,在二倍体酵母培养中产生异源多肽经常是有利的,因为可能的遗传缺陷可在单倍体酵母培养如生产规模的连续发酵中为表型形式表达,还因为其产量更高。Molecular Genetics of Yeast:A PracticalApproach,Ed.J.R.Johnston,IRL Press(1994)中描述了在酵母宿主细胞中产生重组多肽,其在此引用作为参考。
培养之后,蛋白质通过从培养肉汤中分离和纯化蛋白质的常规方法收获。众所周知的纯化方法包括通过离心或过滤从培养基中分离细胞、通过盐如硫酸铵方法沉淀蛋白质成分和层析方法如离子交换层析、凝胶过滤层析、亲和层析等。
本发明通过显示CCK和proBNP总量与未修饰宿主细胞相比分别增加约60%和100%作为例证。所述实例由此表明本发明的宿主细胞能增加多种蛋白质的产量
此外,实施例公开其他蛋白酶的额外破坏提高目的蛋白质的产量,例如KEX2和CYM1的破坏造成CCK生产中产量上的加性效应(几乎100%)。
此外,熟练的技术人员应理解一些所述基元中的特殊氨基酸,尤其是组氨酸、谷氨酸、天冬氨酸或赖氨酸通过作为金属配基起作用而为金属蛋白酶功能所必需。
此外,应认识到本发明的金属蛋白酶在本文中作为pitrilysin家族、胰岛素降解酶家族、胰岛素酶家族、inverzincin家族和ME集团M16亚家族成员广泛地做过解释。
因此,应理解与任何这些注释的不同家族相关的上述任何特征和/或方面同样可应用于文中所述的金属蛋白酶,其均包括HXXEH基元。
然而,请注意单独的pitrilysin(其后不接家族)是指大肠杆菌金属蛋白酶ME集团的特定成员。
实施例
材料和方法
酵母菌株和生长条件
使用的酵母菌株列于表I中。菌株构建使用两步基因破坏技术(Rothstein,1991)或(Brachmann等,1998)基于PCR的方法进行。培养基购自Difco,氨基酸和其他添加成分购自Sigma-Aldrich。酵母细胞30℃下在YPD(1%酵母提取物,2%蛋白胨和2%葡萄糖)或在基于酵母氮碱的具有硫酸铵、丁二酸、NaOH和适当氨基酸的合成完全培养基(SC)中生长。使用改良的所述醋酸锂方法(Gietz等,1995)用线性DNA或质粒进行转化。由于CCK-22生物合成的连续性,对异源表达的CCK的分析是在生长至对数期的酵母中进行的,其与来自稳定期酵母的结果相反(图2)。从细胞提取物和5A600单位细胞/毫升合成的完全培养基中分析proCCK加工。细胞生长通过600nM吸光度跟踪。
表I.本研究中使用的酿酒酵母菌株。假定的金属蛋白酶无效突变体通过基因型的ORF命名,(*)代表线粒体蛋白酶。
菌株 基因型 来源
BY4705 MATα ade2Δ∷hisG his3Δ200 leu2Δ0 lys2Δ0ura3Δ0 (Brachmann等,1998)
LJY13 MATα ade2Δ∷hisG his3Δ200 leu2Δ0 lys2Δ0ura3Δ0 yps1∷TRP1 本研究
LJY14 MATα ade2Δ∷hisG his3Δ200 leu2Δ0 lys2Δ0ura3Δ0 yps1∷TRP1 yps3∷LEU2 本研究
LJY15 MATα ade2Δ∷hisG his3Δ200 leu2Δ0 ly2Δ0ura3Δ0.yps1∷TRP1 yps3∷LEU2 yps2∷URA3 本研究
BJ2168 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 (Jones,1991)
LJY21 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 kex1∷LEU2 本研究
LJY22 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 kex1∷LEU2 kex2∷TRP1 本研究
LJY23 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 kex2∷TRP1 本研究
LJY122 MATα ape1∷KANMX ape2∷LYS2 his3Δ0 leu2Δ0lys2Δ0 ura3Δ0 本研究
LJY123 MATα ape1∷KANMX ape2∷LYS2 ape3∷LEU2his3Δ0 leu2Δ0 lys2Δ0 ura3Δ0 本研究
LJY201 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 axl1∷LEU2 本研究
LJY202 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1 本研究
ura3-52 gal2 ste24∷LEU2
LJY203 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 prd1:LEU2 本研究
LJY204 MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 yil108w∷LEU2 本研究
Y15298 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0ste23∷KANMX Euroscarf
Y11874 MATα his3Δ1 leu2Δ0 lys2Δ0  ura3Δ0aap1∷KANMX Euroscarf
Y10148(*) MATα his3Δ1 leu2Δ0 lys2Δ0  ura3Δ0afg3∷KANMX Euroscarf
Y14953 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0ape1∷KANMX Euroscarf
Y16224(*) MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0rca1∷KANMX Euroscarf
Y14984(*) MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0mip1∷KANMX Euroscarf
Y17144 MATα his3A1 leu2Δ0 lys2Δ0 ura3Δ0yme1∷KANMX Euroscarf
Y13211 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0ybr074w∷KANMX Euroscarf
Y13801 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0ydl104c∷KANMX Euroscarf
Y11941 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0yhr113w∷KANMX Euroscarf
Y11960 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0yhr132c∷KANMX Euroscarf
Y12296 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0yil137c∷KANMX Euroscarf
Y15370 MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0ynl045w∷KANMX Euroscarf
10864B MATα ura3-Δ851 leu2-Δ1 his3Δ200 lys2Δ202 Euroscarf
 ykr035c-ykr038c∷URA3
Y11749  MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0y0l057w∷KANMX Eurosearf
Y16248  MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0yol098c∷KANMX Euroscarf
10231B  MATα his3Δ200 leu2Δ1 trp1Δ63 ura3-52yol154w(4,744)∷KANMX Euroscarf
Y14266  MATα his3Δ1 leu2Δ0 lys2Δ0 ura3Δ0ydr430c∷KANMX Euroscarf
LJY430  MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 ydr430c∷LEU2 本研究
LJY432  MATα prc1-407 prb1-1122 pep4-3 leu2 trp1ura3-52 gal2 kex2∷TRP1 ydr430c∷LEU2 本研究
DNA提取和扩增
酵母基因组DNA按所述(Philippsen等,1991)分离。聚合酶链式反应(PCR)使用Pwo聚合酶或基于Taq、Pwo和Pfu聚合酶(扩展长距离PCR试剂盒,XL-PCR)的混合酶,均为Roche生产。所有PCR产品通过琼脂糖凝胶电泳观察,PCR产物或者用凝胶提取试剂盒(Qiagen)从凝胶中纯化或者通过PCR纯化旋转柱(GENOMED)从反应混合物中纯化。基于PCR的一步基因破坏使用50ng pRS400系列质粒(Brachmann等,1998)作为模板进行。使用具有20个质粒核苷酸和50个与目的基因相邻的核苷酸的寡核苷酸进行标记的扩增(表2)。所有其他DNA操作根据标准方法进行(Sambrook等,1989)。
质粒构建
proCCK的表达在pRS426[2μURA3](Brachmann等,1998)中使用磷酸甘油酸激酶启动子(PGK1p)和终止子(PGK1t)进行。PGK1启动子使用100ng酵母基因组DNA作为模板用PGK1p5′HindIII和PGK1p3′MCS扩增(表2)并随后克隆到pGEM-11(Promega)的HindIII和SacI限制性酶位点中。终止子用PGK1t5′BglII和PGK1t3′SacI扩增(表2)并连接到在SacI和EcoRI限制性酶位点处含有启动子的质粒。然后此构建体pGEM-11PGK1pMCSPGK1t含有PGK1-启动子、带有限制性酶位点EcoRI、BamHI、XbaI和BglII的多克隆位点(MCS)然后为PGK1终止子。preproMfα1p-proCCK融合物(Rourke等,1997)(图1)亚克隆到pGEM-11PGK1pMCSPGK1t的EcoRI和XbaI位点处,最后全长基因克隆到pRS423和pRS426中以分别完成酵母CCK表达构建体pRS423preproMfα1p-proCCK和pRS426 preproMfα1p-proCCK。多拷贝质粒上CYM1的表达通过扩增CYM1的开放阅读框(ORF)以及额外的5’端926bp和3’端703bp构建。扩增使用100ng酵母基因组DNA和寡核苷酸CYM15’ApaI和CYMl3’XhoI(表2)通过XL-PCR进行。PCR产物在旋转柱上纯化并随后克隆入pRS425的ApaI和XhoI限制性酶位点中。
表2.所用的寡核苷酸
    寡聚物     寡核苷酸序列(5’-3’)     用途
PGK1p5’HindIII     AATAGAAGCTTGTCGACTGATCTATCCAAAACTG(SEQ ID NO:16) 表达构建体
PGK1p3’MCS     AAAAGAGCTCGGCCAGATCTTCTAGAGGATCCAAGAATTCTGTTTTATATTTGTTGTAAAAAGTAG(SEQ ID NO:17) 表达构建体
PGK1t5’BglII     TTTTGAATTCCAAGATCTCCCATGTCTCTACTGGTGG(SEQID NO:18) 表达构建体
PGK1t3’SacI     CCCCGAGCTCGTCGACCCTTCTCGAAAGCTTTAACGAACGC(SEQ ID NO:19) 表达构建体
5’MFα1-EcoRI     TTTTGAATTCAAAGAATGAGATTTCCTTCAATTTTTACTGCAG(SEQ ID NO:20) preproMfα1p-proCCK
CCK3’-XbaI     TTTTTCTAGACTAGGAGGGGT     preproMfα1p-pro
  ACTCATACTCCTCGGC(SEQID NO:21) CCK
CCK-22K→A(S)   CGAATGTCCATCGTT GCGAACCTGCAGAACCTG(SEQ ID NO:22) Lys61→Ala61突变
CCK-22K→A(AS)   CAGGTTCTGCAGGTT CCTAACGATGGACATTCG(SEQ ID NO:23) Lys61→Ala61突变
CCK-22K→R(S)   CGAATGTCCATCGTT AGGAACCTGCAGAACCTG(SEQ ID NO:24) Lys61→Arg61突变
CCK-22K→R(AS)   CAGGTTCTGCAGGTT CCTAACGATGGACATTCG(SEQ ID NO:25) Lys61→Arg61突变
CCK-22seq   TCGCAGAGAACGGATGGC(SEQ ID NO:26) 测序
CYM15’ApaI   TTTTGGGCCCTTCATGGTGATACGGTATCTCTTGGC(SEQ IDNO:27) 克隆CYM1
CYM13’XhoI   TTTTCTCGAGAAGGTGGAACATACTGCCCTGGGATGG(SEQID NO:28) 克隆CYM1
KEX25’   TTTTGAGCTCGTTTAGGAAACGTCCTTGGCGGAGATGC(SEQID NO:29) 克隆KEX2
KEX23’   TTTTTCTAGACACTGCGAATCCATGGTATAAACCAAAACC(SEQ ID NO:30) KEX2克隆
KEXDC5’   GTCGTTGTTCATGGACATACCTCC(SEQ ID NO:31) 克隆Δkex2
KEX2DC3’   TACAAATGTTCTTCTGCCATTTCTGG(SEQ ID NO:32) 控制Δkex2
TRP15’NdeI   GGTTCATATGCGCCGGAGCT 克隆TRP1
    CCTCGACAGCAG(SEQ ID NO:33)
TRP13’AvrII     GGTTCCTAGGATCCGCAAGTTTGATTCCATTGCGGTG(SEQ ID NO:34) 克隆TRP1
KEX15′GD400     TTAAAGAGTACCTTGGCTATAGAATACCGTAGAGATAAAGACCTGAATAGAGATTGTACTGAGAGTGCAC(SEQ ID NO:35) 删除KEX1
KEX13′GD400     AGGTATTATAACTATTTTTCTGTATTTTTTATATATTTTTATTTGCCAAGCTGTGCGGTATTTCACACCG(SEQ ID NO:36) 删除KEX1
KEX15′DC400     CTTTGGTTAAAGAGTACCTTGGC(SEQ ID NO:37) 控制Δkex1
KEX13′DC400     TACTACGAAAAGCGTGTGCGAGG(SEQ ID NO:38) 控制Δkex1
CYM15′GD400     TAGAAGGCTACTCAAAAGAATAAAGTTACTATAAAATATACTGCGGTATATAGATTGTACTGAGAGTGCAC(SEQ ID NO:39) 删除CYM1
CYM13′GD400     GATCGGCAAGAAACTTTGAAGCAGTATATTTACAGGATTAAATTATATATCTGTGCGGTATTTCACACCG(SEQ ID NO:40) 删除CYM1
CYM15′DC400     CGGAGGGGCTCTATGATAAAGG(SEQ ID NO:41) 控制Δcym1
CYM13′DC400     GAGTAACTAGGGCTTCTCTTCCC(SEQ ID NO:42) 控制Δcym1
认为对蛋白水解proCCK释放CCK-22很关键的Lys61残基通过定点诱变用丙氨酸替换(Horton等。1993)。替换通过使用Pwo聚合酶(BoehringerMannheim)的PCR进行,其中两个产物用寡核苷酸组PGK1p5’HindIII/CCK-22K→A(反义)和CCK-22K→A(有义)/PGK1t3’SacI(表2)和每个反应50ng pRS426 preproMfα1p-proCCK作为模板扩增。两产物进行琼脂糖凝胶电泳,切出每一产物的约1mm2在第三次PCR反应中直接作为模板使用。在这次反应中,编码融合蛋白的全长cDNA使用PGK1p5’HindII和PGK1T3’SacI扩增(表2)。PCR产物亚克隆到pCR-Blunt II(Invitrogen)中并用CCK特异引物CCK-22seq.测序。最后,PGK1ppreproMfα1p-proCCK(K→A)PGK1t产物克隆到pRS426的HindIII和SacI位点中构建表达质粒proCCK(K→A)。用精氨酸替代赖氨酸如上所述通过用CCK-22K→R(反义)和CCK-22K→R(有义)替换CCK特异引物构建proCCK(K→R)载体进行。
菌株构建
部分KEX2破坏的构建通过使用100ng酵母基因组DNA作为模板和寡核苷酸KEX2 5’SacI和KEX2 3’XbaI(表2)的XL-PCR扩增全长KEX2基因ORF每一位点的1000bp在BJ2168中进行。PCR产物在旋转柱上纯化并克隆到pCR-BluntII中(Invitrogen)。TRP1的扩增通过使用TRP15’NdeI和TRP1 3’AvrII(表2)在ORF5’端925bp引入NdeI位点和终止子3’端212bp引入AvrII位点进行XL-PCR。纯化PCR产物并亚克隆到去除KEX2 2018bp和启动子170bp的KEX2中的NdeI和AvrII位点处。Kex2∷TRP1构建体使用限制性酶NotI和SpeI从pCR-Blunt II切下并随后转化BJ2168。在SC-Trp平板上选择转化体,然后通过使用覆盖全部标记加上KEX2每一位点的额外1200bp的kex2 DC5’和kex2 DC3’(表2)寡核苷酸进行菌落PCR筛选,以检测正确的整合。kex2 kex1菌株的构建通过使用LEU2标记的两步基因破坏技术(Rothstein,1991)进行。LEU2的扩增通过使用50ng pRS405作为模板以及kex15’GD400和kex13’GD400(表2)的XL-PCR进行。PCR产物用PCR纯化旋转柱纯化(GENPMED)并随后转化LJY23。在SC-Leu平板上选择转化体,正确的整合通过使用kex15′DC以及kex13’DC(表2)的基于PCR的菌落筛选来检测。
BJ2168背景下的Δcym1∷LEU2(LJY430)菌株通过上述用于Δkex1菌株的一步基因破坏技术构建,其使用寡核苷酸CYM15′GD400和CYM13′GD400(表2)用于基因破坏,使用cym15′DC和cym13′DC(表2)用于破坏控制。通过此方法建立的所有无效突变体用针对与5′和3′UTR相邻的50碱基并带有与含有多种标记的pRS400系列载体特异的3’端设计的寡核苷酸制备(Brachmann等,1998)。在适当的琼脂板上选择转化体然后通过使用覆盖全部标记加上每一位点的额外200bp的寡核苷酸进行菌落PCR筛选,以检测正确的整合。表2只显示了不位于上述位置的寡核苷酸。
使用PCR破坏技术(Brachmann等,1998)和以pRS405[LEU2]作为模板在BJ2168中进行STE24、AXL1、PRD1和YIL108w的基因缺失。
含有APE1、-2和-3基因缺失的LJY123用PCR破坏技术从Y14953衍生(Brachmann等,1998)。APE2最初用LYS2(pRS317[cen;LYS2])代替,其中PCR产物在转化之前从琼脂糖凝胶中纯化并且APE3用LEU2标记(pRS405[LEU2])代替。
yps1yps2yps3三联突变体(LJY15)在BY4705中使用PCR破坏技术构建(Brachmann等,1998)。YPS1的ORF最初通过插入TRP1基因座(pRS404)来删除,以产生LJY13。然后此菌株用作宿主,通过插入LEU2标记(pRS405)删除YPS3,最后通过插入pRS406[URA3]扩增的URA3标记删除YPS2,从而构建LJY15(表I)。
CCK和CYM1的表达
人proCCK以酵母α-交配因子前原前导序列和proCCK之间的融合蛋白形式表达(preproMfα1p-proCCK)。融合构建体在多拷贝质粒上表达,具有自磷酸甘油酸激酶启动子进行的组成型基因转录。“ProCCK表达”指使用pRS426 preproMfα1p-proCCK的表达,其用于除了BY4705和从pRS423 preproMfα1p-proCCK表达proCCK的同基因yapsins缺失菌株之外的所有酵母菌株中。CYM1表达通过自身启动子驱动。所用的质粒构建体和寡核苷酸列于表2。
酶促处理
使用1mg/ml胰蛋白酶(Worthington Biochemical Corporation)在50mM磷酸钠缓冲液(pH7.5)中室温30分钟进行胰蛋白酶处理并通过浸入沸水10分钟终止处理。在0.1mM磷酸钠缓冲液(pH7.5)中室温30分钟进行4μg/ml终浓度的羧肽酶B(Boehringer Mannheim)处理。反应通过浸入沸水10分钟终止。
凝胶层析
生长到晚对数期的酵母转化体于15000g离心收集细胞,4℃下将500μl培养基直接加样至Sephadex G-50特级(Pharmacia)柱(1×100cm)。样品用VBA缓冲液(20mM巴比妥缓冲液,0.11%牛血清白蛋白和0.6mM硫柳汞)以3.5ml/小时的流速洗脱并每17分钟收集级分。通过包括125I-白蛋白(V0)和22NaCl(Vt)进行校准。Ve处洗脱的峰的洗脱常数Kd按Kd=(Ve-V0)/(VtV0)计算。
放射免疫测定法
两种不同的抗血清用于确定加工的缩胆囊素量。Ab89009(Paloheimo等,1994)对CCK-22的N-端特异,Ab7270(Hilsted等,1986)对甘氨酸-延伸的CCK特异。加工成CCK-22的CCK级分通过将Ab89009测量的免疫反应性除以样品用胰蛋白酶处理后用相同抗体测量的数量来计算而测量N-端延伸的CCK-22总量。
酵母提取物和蛋白酶测定法
生长到对数期的酵母细胞10个A600单位通过3000g离心5分钟沉淀,用25mlH2O洗一次并转入2ml Eppendorf管中。加入等量酸洗过的玻璃珠(Sigma-Aldrich)然后加入包括多种抑制因子(150μM苯丁酸抑制素,30μM E-64,10μM亮抑酶肽,1μM胃酶抑制剂A,1mM苯甲基磺酰氟(PMSF)、1mM EDTA和1mM 1,10-邻二氮杂菲或每2.5ml 0.1MNaH2PO4(Boehringer Mannheim)含或不含EDTA的1片完全抑制剂)的0.1M NaH2PO4(pH4.5)200μl。细胞通过3×20秒涡旋破碎然后提取物通过15000g离心10分钟澄清。所有步骤在4℃进行。蛋白酶分析使用20pmol合成酰胺化CCK-33(Peninsula Laboratorie Europe,Merseyside,England)或Ac-CCK-33-甘氨酸(Cambridge Research Biochemicals,Stockton,England)作为底物、20μl酵母提取物、多种抑制因子和激活剂以总体积30μl进行。混合物在30℃孵育1小时,通过加入500μl VBA缓冲液终止反应然后立即浸入沸水浴10分钟。
使用金属蛋白酶缺陷菌株进行蛋白酶分析
分析如上所述进行,但加入1mM苯丁酸抑制素和1mM Mn2+以减少N-端降解。
使用完整酵母细胞进行蛋白酶分析
沉淀对数生长细胞的5个A600单位,在5mlH2O中洗一次并在SC培养基(pH6.0)中洗一次,然后细胞重悬于25μl SC培养基中。蛋白酶分析通过加入20pmol合成Ac-CCK-33-甘氨酸作为底物30℃轻摇孵育混合物1小时进行。通过加入500μlVBA终止反应,通过离心去除细胞然后上清浸入沸水10分钟。
通过MALDI-TOF分析分泌的CCK
CCK转化的酵母细胞的50个A600单位加入25ml新鲜培养基中,然后孵育3小时。15000g离心10分钟去除细胞,500μl培养基通过使用ZipTipC18柱(Millipore)反向浓缩和除盐。肽用10ul 50%乙腈洗脱。纯化的多肽在使用时间滞后调焦(延时提取)的反射模式操作的基质辅助激光吸附/离子化飞行时间质谱仪(Biflex,Bruker-Franzen,Bremen,Germany)中分析。0.5μl样品与0.5μl基质溶液(溶于乙腈/甲醇的α-氰-4-羟基肉桂酸,Hewlett Packard)混合用于分析。然后将0.5μl混合物加入探测器并在导入质谱仪之前允许其干燥。
统计学分析
使用非成对students t-检验分析表达proCCK的野生型酵母和野生型菌株同基因突变体的proCCK表达的变化或成熟CCK-22级分的变化是否是统计学上显著的而进行统计学计算。所计算的yapsin突变体间CCK-22加工的P-值为将BY4705与每一突变体进行的比较,而括号分别代表BY4705 yps1和BY4705 yps1 yps3,以及BY4 705 yps1 yps3和BY4705yps1 yps2 yps3之间的比较。
在酿酒酵母中表达proBNP-yps1突变体的构建
preproBNP的克隆
使用Quickprep Micro mRNA纯化试剂盒(Amersham PharmaciaBiotech)从500mg人心脏活组织中分离信使RNA。第一链cDNA从2μgmRNA在含有2.5μl 10×第一链缓冲液(Promega)、2.5μl 100mM DTT、2.5μl 10mM dNTP、2.5μl焦磷酸钠、10pmol Oligo(dT)18、10个单位反转录酶AMV(Promega),并补充H2O到25μl的反应中制备。加热信使RNA和Oligo(dT)18到70℃5分钟,cDNA合成之前将其冰上冷却5分钟。42℃60分钟进行第一链cDNA合成。
使用Pwo聚合酶(Roche),1μl第一链cDNA,5μl包括MgCl2的10×Pwo缓冲液(Roche),5μl 2.5mM dNTP,每一引物30pmol(BNP5’EcoRI和BNP3’XbaI)扩增编码preproBNP的cDNA。编码preproBNP的PCR产物克隆到pBluescriptII(Stratagene)中。所有后续PCR反应如上所述进行。
编码α-交配因子前原序列和proBNP的cDNA的融合使用突出端延伸PCR进行,其中建立两个PCR反应。一个使用50ng pRS426preproMfα1p-proCCK作为模板,MFα15’EcoRI和MF1BNP(AS)作为引物;另一个使用50ng克隆到pBluescript中的preproBNP并且引物为MF1BNP(S)和BNP3’XbaI。第三个PCR反应中两初始PCR中每一PCR产物约50ng使用凝胶提取试剂盒(Qiagen)从琼脂糖凝胶中纯化并用作两个寡核苷酸MFα15’EcoRI和BNP3’XbaI的模板。preproMfα1p-proBNP编码构建体亚克隆到pCR-BluntII(Invitrogen)中,并在亚克隆到pGEM-11PGK1pMCSPGK1t的EcoRI和XbaI位点之前用载体特异的寡核苷酸测序。最后将完整基因克隆到pRS426中完成酵母proBNP表达构建体pRS426preproMfα1p-proBNP。
另外,构建两个其他构建体,其中已去除了proBNP片段(1-76)。这些构建体与preproMfα1p-proBNP的构建相似但仅合成BNP-32。第一个构建体中,Kex2p切割位点和preproMfα1p的间隔肽不变(KREAEA)(图14B),而另一个构建体中去除间隔肽(图14C)。野生型酵母和同基因CYM1破坏体的BNP-32表达分析使用Electra-Box Diagnostica ApS的Shionoria-BNP系统通过RIA分析。此鉴定法为BNP-32特异的。
proCCK,proBNP和Cym1p的表达
人proCCK以酵母α-交配因子前原前导序列和proCCK的融合蛋白形式表达(preproMfα1p-proCCK)。融合构建体在多拷贝质粒中表达,自磷酸甘油酸激酶启动子起始进行组成型基因转录。“ProCCK表达”指使用pRS426 preproMfα1p-proCCK的表达,其用于除BY4705和proCCK从pRS423 preproMfα1p-proCCK表达的同基因yapsins缺失菌株外的所有酵母菌株中。人proBNP也以酵母α-交配因子前原前导序列和proBNP(preproMfα1p-proBNP)的融合蛋白形式表达(图14A)。CYM1在自身启动子驱动下表达。质粒构建体和所用的寡核苷酸列于表2。
BNP放射免疫测定
98192抗体对proBNP N-端特异( 等,2002)。
层析
FPLC层析在kta净化装置(Amersham Pharmacia Biotech)的Superdex 200柱上进行。50mM磷酸钠缓冲液中包括100mM NaCl和6M胍。
菌株构建
BJ2168背景中的Δyps1∷TRP1(LJY440)和Δcym1∷LEU2 Δyps1∷TRP1(LJY431)菌株如上所述使用用于基因破坏的寡核苷酸YPS15′GD400和YPS13′GD400(表2)通过一步基因破坏技术构建。PCR产物转化入BJ2168和LJY430。通过使用yps15′DC和yps13′DC(表2)的PCR分析确认破坏盒的正确整合。
鉴定巴斯德毕赤酵母或甲醇毕赤酵母中编码Cym1直向同源的基因
从巴斯德毕赤酵母和甲醇毕赤酵母中鉴定编码酿酒酵母Cym1p直向同源物的未知基因使用下面提到的相同系列的简并引物以类似方式进行。巴斯德毕赤酵母和甲醇毕赤酵母在下文中以毕赤酵母形式提及。
通过比对克鲁弗酵母和粟酒裂殖酵母的直向同源Cym1蛋白质和酿酒酵母的Cym1p鉴定出许多相同的氨基酸序列。从这些序列可合成与所有三个物种CYM1的互补DNA链结合的简并寡聚核苷酸(表3),并且也和毕赤酵母的CYM基因结合。基因组序列的扩增最初通过使用高质量基因组DNA作为模板,Pichia-CYM1-Ia和Pichia-CYM1-Ib和Pwo聚合酶(Roche)进行。扩增的预期为525bp大小的序列克隆到pBlunt或类似载体中并用载体特异引物测序。如果最初扩增未出现带,使用第一次PCR反应1μl作为模板用两个嵌套引物Pichia-CYM1-IIa和Pichia-CYM1-IIb进行第二轮PCR循环。预期产物约为270bp然后克隆到pBlunt中并用M13正向和M13反向引物测序。从获得的序列可合成序列特异性引物、两个嵌套正义特异性引物和两个嵌套反义特异性引物。使用正义引物之一可能使用高质量基因组DNA作为模板获得带有Pichia-CYM1-IIIb的PCR产物。克隆并测序此~2100bp产物。如果未产生~2100bp的带,就必需如ClontechMarathon cDNA Amplification Kit操作手册(BD(Becton,Dickinson andCompany))中所述从毕赤酵母中分离mRNA,产生双链cDNA并在末端连上接头。使用两个序列特异性正义引物可能获得mRNA 3’端约2600bp序列并且使用序列特异性反义引物扩增包括编码假定活性部位HXXEH基元序列的5’端。通过从5’和3’非翻译区合成序列特异性寡核苷酸,可克隆编码毕赤酵母Cym1直向同源物的全长cDNA。
表3
氨基酸序列寡聚物Plchia-CYM1-Ia     KYPVRDP5′AARTAYCCXGTXMGXGAYCC 3′
氨基酸序列寡聚物Pichia-CYM1-Ib     HPSNAK3′GTRGGXWSXTTRCGXTTY 5′
氨基酸序列寡聚物Pichia-CYM1-IIa     DPFFKM5′GAYCCXTTYTTYAARATG 3′
氨基酸序列寡聚物Plchia-CYM1-IIb     GVVYNEM3′CCXCAXCAXATRTTRCTYTAC 5′
氨基酸序列寡聚物Pichia-CYM1-IIIb     EKGGAYG3′CTYTTYCCXCCXCGXATRCC 5′
X-次黄嘌呤核苷,简并寡核苷酸按照国际生物化学协会设计( http://www.chem.qmul.ac.uk/iubmb/misc/naseq.html)。
巴斯德毕赤酵母或甲醇毕赤酵母中Cym1直向同源物的基因破坏
将编码毕赤酵母Cym1直向同源物的序列克隆到像pBluescript-II的载体的HindIII和Sac I中或类似的载体中,条件是其不存在于ORF中。将ORF插入HindIII和Sac I位点中去掉了载体多克隆位点中的大多数,这使得易于发现只存在于ORF中的限制性酶位点。克隆ORF中的KanMX盒,优选地这样毕赤酵母CYM1的1000bp存在于KanMX盒的一侧而产生毕赤酵母CYM1破坏盒。然后此构建体使用毕赤酵母CYM1基因5’端和3’端特异性引物通过PCR扩增。将PCR产物转化毕赤酵母菌株然后在含100μg/ml遗传霉素(G-418)的YPD平板上选择转化体。使用与KanMX盒5’端和3’端结合的毕赤酵母序列特异性CYM1引物通过菌落PCR确认在毕赤酵母基因组中正确的整合。从PCR产物的大小能分辩整合事件是否正确。
在巴斯德毕赤酵母中表达处源蛋白质和肽
为表达肽可使用Invitrogen的表达构建体pPICα(诱导型表达)或者pGAPZα(组成型表达)。这两个载体都使用酿酒酵母α-交配因子的前原序列通过分泌途径指导融合肽。α-交配因子的前原序列在高尔基体中去掉然后目的肽释放于培养基中。如果表达蛋白质,当异源表达的蛋白质为胞质定位并可从完整细胞中分离时,可使用没有α-交配因子前原序列的两个上面所提及载体(pPICZ和pGAPZ)。
在甲醇毕赤酵母中表达外源蛋白质和肽
在甲醇毕赤酵母中表达蛋白质和肽以如巴斯德毕赤酵母中类似的方式进行,其中质粒可使用用于蛋白质胞内表达和分泌到培养基的质粒。胞内表达的蛋白质可克隆到pMET(Invitrogen)中而分泌蛋白质克隆到pMETα(Invitrogen)中。pMETα含有如用于在巴斯德毕赤酵母表达的酿酒酵母α-交配因子的前原序列。此系统中通过甲醇诱导表达。
结果
生长条件对CCK-22加工的影响
从表达proCCK的BJ2168中测量CCK-22的胞内和胞外级分。无论细胞处于指数生长期还是到达稳定期,胞内级分都保持不变(图2)。但分泌的CCK-22的相对量在细胞到达稳定期时明显改变。在指数生长期CCK-22级分为23%,但在稳定期(270分钟后)此级分增加到37%(图2)。所以在此所述的实验中仅使用指数生长的细胞。
赖氨酸残基在CCK-22释放中的意义
为评价赖氨酸残基在蛋白水解中的作用,将用两个表达构建体proCCK和proCCK(K→A)转化的BJ2168转化体生长到晚指数期并收集培养基。对每一菌株的培养基进行凝胶层析并用Ab7270测量收集的级分中Gly-延伸CCK含量。野生型培养基中的CCK在Kd=0.8和1.1的两个主峰中洗脱下来(图3A),这与以前建立的CCK-22-Gly和CCK-8-Gly(Cantor等,1987;Rourke等,1997)的洗脱位置一致,而proCCK(K→A)产生CCK-8-Gly和在Kd=0.6洗脱下来的较大形式(图3C)。野生型构建体中在Kd=0.7和0.8洗脱下来的两个峰(图3B)分别与C端延伸的CCK-22和CCK-22-Gly对应(Rourke等,1997),而在这些位置处未观察到proCCK(K→A)构建体的CCK-22免疫反应性(图3D)。然而在Kd=0.55观察到免疫反应性小峰,其可能由于Ab89009与较大未加工片段的轻微交叉反应性(Paloheimo等,1994)。为研究精氨酸取代赖氨酸的影响,用proCCK(K→R)转化BJ2168。在胰蛋白酶切割之前和之后分析转化体的培养基。加工成CCK-22的proCCK级分与在野生型CCK中观察到的类似。
通过质谱分析分泌的CCK肽
收集自proCCK转化的BJ2168培养基通过质谱分析(图12)。获得的片段与加工的CCK-39、CCK-22和CCK-8相对应。Lys61的N-端鉴定出了两个肽(Tyr45-Val60,1805.0 Da和Tyr45-Lys61,1932.2 Da)。表明前者可能为后者的羧肽酶降解产物。为说明这个问题并尝试鉴定C-端延伸的CCKs,本发明者产生了这样的破坏菌株,其中编码负责加工成CCK-8的丝氨酸蛋白酶的KEX2和KEX1编码的羧肽酶都发生了突变。将proCCK转化入此kex2 kex1菌株(LJY22)并随后分析分泌的肽之后,本发明者仅发现了与Tyr45-Lys61对应的峰。使用KEX1和KEX2单基因破坏表达proCCK过程中看到了同样的模式,即仅有与Tyr45-Lys61对应的峰(数据未显示)。这样Tyr45-Val60肯定为与来源于Lys61后切割的CCK-22一致的降解产物。其他的片段通过在与CCK-61(未在哺乳动物中鉴定出)、CCK-58、C-端延伸的CCK-39和C-端延伸的CCK-22(图12)加工相应的kex2 kex1菌株中表达发现,而与我们前面工作一致的是未鉴定出与CCK-8相应的肽,这表明Kex2p参与了此加工过程(Rourke等,1997)。
Kex2p参与了CCK-22的生物合成
以前对kex2菌株分泌的CCK肽的分析和质谱获得的结果表明在Lys61处切割释放CCK-22可在没有Kex2p的参与下发生。然而kex2菌株显示出CCK-22浓度降低。ProCCK在液泡蛋白酶缺陷菌株和同基因kex2菌株(BJ2168和LJY23)中表达并且测量指数生长细胞中加工的胞内和胞外CCK-22级分。BJ2168中约28%的胞内CCK内容物在Lys61之后得到加工,而kex2菌株中仅6%得到加工。对分泌的CCK肽分析表明从表达proCCK的BJ2168中收集的培养基含有约20%的CCK-22,而kex2突变体中,数量减少到5%。这些结果表明Kex2p参与了生成CCK-22的加工过程。然而还有其他蛋白酶能进行Lys61切割。
Lys61切割的体外鉴定法
为研究除Kex2p外能在proCCK单一Lys61之后进行内肽酶切割的其它蛋白酶本质,使用酿酒酵母粗制品且以合成CCK-33作为底物建立了体外鉴定法。
使用液泡蛋白酶缺陷菌株BJ2168的提取物,存在普遍的N-端降解并且可测量的CCK回收少于无酵母提取物对照的10%。因为鉴定法依赖于抗体结合的CCK-22完整N端,本发明者建立了其中一些已知酿酒酵母氨肽酶缺失的菌株。Y14953菌株(ape1)用作亲代菌株,其也缺失了APE2和APE3基因。使用此LJY123菌株制备细胞提取物,与用BJ2168观察到的回收相比有2-3倍增加的免疫反应性。
加工成CCK-22依赖于金属离子
蛋白酶切割合成的人CCK-33产生CCK-22的本质通过包括多种不同抑制因子用LJY123提取物来分析。结果表明仅金属螯合剂的加入抑制CCK-33蛋白水解成CCK-22(图4A)。
活性最初被1mM EDTA的加入抑制之后,体外检测蛋白酶的金属依赖性。通过加入0.2mM过量的不同二价阳离子检测活性重建导致的CCK-22成熟。与已知金属蛋白酶只能由Zn2+、Co2+合Mn2+活化的性质一致,Zn2+、Co2+合Mn2+的加入能重建蛋白酶活性而Ca2+、Cu2+或Mg2+的加入没有影响(图4B)。使用渐增的Zn2+浓度再活化表明为一个双相模式,其中Zn2+在5mM浓度以上执行抑制作用(数据未显示)。
1mM EDTA最初抑制之后使用LJY123细胞提取物分析Zn2+和Mn2+再活化的金属蛋白酶的CCK-切割时间进程。通过加入1.2mM Zn2+或Mn2+然后孵育30、60和120分钟进行再活化。在此鉴定法和下面体外蛋白酶鉴定法中发明者使用N-端乙酰化的CCK-33-Gly(Ac-CCK-33-Gly)作为底物,其引起非常缓慢的非特异性降解。使用Ab89009测量胰蛋白酶切割前后的CCK-22免疫反应性表明30和60分钟时Zn2+和Mn2+没有活化能力的区别,然而120分钟后测量到使用Mn2+作为活化剂与Zn2+相比CCK-22免疫反应性增加了10%以上(图5)。免疫反应性的增加可能由于在此加入Mn2+之后抑制了降解,也可能由于表4中使用的酵母细胞提取物。
表4.酿酒酵母金属蛋白酶。搜索在Swiss-Prot序列检索系统(SRS)http://www.expasy.ch/中进行。蛋白酶分析使用金属蛋白酶缺陷菌株提取物的两个独立分析(A和B)中进行。用Ab89009测量CCK-22量并在胰蛋白酶切割之后用Ab89009测量CCK总量。假定的金属蛋白酶用*标记。
名称   Swiss-Protacc# ORF          CCK-22[nM] 总CCK[nM]          级分CCK-22
    A1     B1     A2     B2     A1/A2   B1/B2
 AAP1      P37898  YHR047     3.2     3.2     36     32     0.09   0.10
 AFG3      P39925  YER017     2.8     2.4     23     24     0.12   0.10
 APE1      P14904  YKL103     4.4     3.7     34     28     0.13   0.13
 APE2      P32454  YKL157
 APE3      P37302  YBR286
 DPP3      Q08225  YOL057     4.3     4.6     31     35     0.14   0.13
 LTA4      Q10740  YNL045     3.9     4.0     32     29     0.12   0.13
 MIP1      P35999  YKL134     3.4     3.3     34     33     0.10   0.10
 PRD1      P25375  YCL057     2.4     2.8     28     26     0.09   0.11
 QRI7      P43122  YDL104     2.8     2.9     23     24     0.12   0.12
 RCA1      P40341  YMR089     4.2     3.5     31     27     0.14   0.13
 STE2      Q06010  YLR389     2.6     2.3     25     20     0.10   0.12
 STE2      P47154  YJR117     3.4     2.8     19     17     0.18   0.16
 YBS4      P38244  YBR074     2.6     2.7     27     29     0.10   0.09
 YHR3      P38821  YHR113     2.5     2.4     26     26     0.10   0.09
 YHT2      P38836  YHR132     3.8     3.3     34     32     0.11   0.10
 YIK8      P40483  YIL108     5.7     5.2     43     39     0.13   0.13
 YIN7      P40462  YIL137c     3.5     2.8     23     20     0.15   0.14
 YK18      P36132  YKR038     2.9     2.1     23     20     0.13   0.11
 YME      P32795  YPR024     2.3     2.7     25     25     0.09   0.11
 MAS2    P11914  YHR024                             ND,致死基因
 MAS    P10507  YLR163c
 AXL1    P40851  YPR122     3.5     3.4     31     30   0.11   0.11
 CYM    P32898  YDR430     0.6     0.4     42     39   0.01   0.01
 YOJ8    Q12496  YOL098     3.6     3.8     35     34   0.10   0.12
胞外yapsin活性
为研究蛋白酶活性为分泌的还是与质膜胞外联系,在培养基中用完整酵母细胞分析了蛋白酶活性。使用指数生长的LJY123细胞30℃孵育1小时后未发生CCK-33的降解,这与以前的观察一致(Rourke等,1997)。在与完整酵母细胞孵育过程中,可测量暴露CCK-22 N-端的切割(图6),然而这种蛋白酶活性不能被所研究的抑制剂消除(数据未显示)。通过使用包含YPS1、YPS2和YPS3基因破坏(表I)的完整细胞,加工的CCK-22级分通过缺失三个天冬氨酰蛋白酶的任一个从而与野生型细胞相比减少(图6)。这些数据表明三个蛋白酶都具有胞外蛋白酶活性,其能在proCCK中Lys61处切割。初步结果表明YPS7基因破坏与YPS1缺失相比,前者降低胞外Lys61加工的量(未发表结果)。
在金属蛋白酶缺陷菌株中表达proCCK
基于前面所述酿酒酵母中金属蛋白酶的内肽酶活性(Adames等,1995;Schmidt等,2000),AXL1(LJY201)和STE24(LJY202)基因缺失菌株最初在BJ2168中制备。ProCCK在这些菌株中的表达表明与野生型相比Lys61之后的蛋白水解未改变并决定检测余下的金属蛋白酶缺陷菌株LJY123、LJY203、LJY204和通过Euroscarf获得的金属蛋白酶缺陷菌株(表I)分泌CCK-22的能力(不包括线粒体肽酶)。产生CCK的金属蛋白酶缺陷菌株中CCK-22免疫反应性未显著改变(数据未显示),并且通过此方法未鉴定出将异源表达的proCCK加工成CCK-22的蛋白酶。
CYM1编码能释放CCK-22游离N-端的蛋白酶
制备每一可育金属蛋白酶缺陷菌株的细胞提取物并在体外蛋白酶鉴定法中检测以研究是否有可测量的蛋白水解的减少。在此鉴定法中,加入Ac-CCK-33-Gly之前使用1mM Mn2+和1mM苯丁抑制素,因为发现加入这些氨肽酶抑制剂时回收为80-90%而不加入这些氨肽酶抑制剂时回收为30%(数据未显示)。CYM1的缺失几乎消除了蛋白酶活性,而其他金属蛋白酶缺陷菌株均未表明CCK-22生物合成的显著变化(表4)。
多拷贝质粒上表达CYM1在体外增加成熟CCK-22级分
为确定在体外合成的CCK-22的数量是否与Cym1p的数量相关,将Cym1p在多拷贝质粒上表达并随着时间分析合成的CCK-22级分。pRS425CYM1转化的BJ2168细胞提取物和pRS425空载体转化的对照用于含1mM Mn2+的体外蛋白酶鉴定法中,其中反应在15、30、45和60分钟后终止。CCK-22免疫反应性用Ab89009测量,余下的CCK-33在胰蛋白酶切割之后用相同的抗体测量(图7)。多拷贝质粒上CYM1的表达提高CCK-22产生速度数倍。然而,发明者还观察到CCK-33和CCK-22降解的增加(图7B)。当在pH6.0和pH7.5下进行相同实验时,降解有非常明显的增加并且30分钟孵育之后在pH6.0中检测不到CCK免疫反应性(数据未显示)。这些结果表明CCK-22体外成熟过程中的赖氨酸特异性切割依赖于Cym1p的量。
cym1突变体菌株中proCCK的表达提高CCK的分泌
为说明CYM1在CCK-22体内合成中的作用,在液泡蛋白酶缺陷菌株BJ2168和同基因kex2菌株中制备CYM1基因缺失。CYM1的缺失造成细胞中proCCK总量增加约40%(图8A)同时CCK-22不依赖于KEX2破坏有类似的减少(图8C)。同样cym1菌株中总CCK分泌量增加60%以上(图8B),但与胞内CCK-22级分减少不同,CCK-22胞外级分与液泡蛋白酶缺陷菌株和同基因kex2菌株相比有所增加(图8D)。
与cym1菌株中野生型CCK累积相比,CCKK→A突变体的表达引起胞内CCK的累积
CYM1的基因破坏造成CCK胞内浓度增加(图8A)的观察提出这样一个问题,Cym1p的蛋白水解活性是否在移位到内质网之前引起CCK-22的降解。因此本发明者在表达CCK的菌株中检测了胞内CCK含量,其中通过使用Lys61→Ala61突变体消除了CCK-22的成熟。胰蛋白酶和羧肽酶B处理之后使用Ab7270分析此CCK突变体在液泡蛋白酶缺陷菌株BJ2168和同基因cym1菌株中的转化体并且与野生型CCK表达相比此构建体的胞内CCK免疫反应性有所增加(图9)。分别在BJ2168和CYM1破坏菌株中表达时,突变体CCK(K→A)和野生型CCK转化体造成胞内proCCK浓度的增加。胞内proCCK的增加并非附加表明Cym1p的蛋白水解活性在移位到内质网之前引起CCK-22的降解。
在天冬氨酰蛋白酶缺陷菌株中表达proCCK
在无效突变体YPS1、-2和-3中分析proCCK的Lys61-特异性切割,其中测量指数生长的野生型酵母细胞BY4705和用proCCK转化LJY13、-14和-15的同基因天冬氨酰蛋白酶缺陷菌株中CCK-22的胞内和胞外数量。BY4705的胞内和胞外CCK免疫反应性比液泡蛋白酶缺陷菌株BJ2168相比低10倍多(数据未显示)。CCK-22胞内级分从野生型细胞中约28%显著减少到yps1菌株中的17%,而通过YPS2和YPS3基因破坏未测量到额外的减少(图10A)。然而CCK-22胞外级分确实表明Yps1p、Yps2p和Yps3p都参与了CCK-22的生物合成并且三联突变体降低CCK-22到野生型酵母的2/3(图10B)。
CYM1破坏引起分泌的野生型CCK和CCKK→R突变体总量增加两倍
为说明Cym1p是否切割单一精氨酸残基的C-端,在液泡蛋白酶缺陷菌株BJ2168和同基因cym1菌株中表达CCK(K→R)突变体。比较胞内和胞外CCK浓度与这些菌株中表达的野生型CCK浓度。突变CCK(K→R)总量与野生型CCK相比在胞内和胞外都有增加(图11)。在cym1菌株中表达时,野生型CCK和Lys61→Arg61突变体都表明胞外CCK可测量数量增加两倍(图11B)。
在肽合成中利用Cym1p活性
本发明的另一方面为使用Cym1p活性产生数量增加的胞质Cym1p活性,其中Cym1p从其自身启动子表达或从强组成型启动子例如PGK1、ADH1或TPI1或诱导型GAL1启动子表达。如前面提到的,当在2μ质粒上CYM1从其自身启动子转录时CCK-22的合成显著增加(图7)。转录可从含有启动子、CYM1和终止子的质粒进行或者通过异源重组取代CYM1为内源启动子在基因组中引入目的启动子进行。
活性可用于细胞内以产生不需经分泌途径的翻译后修饰的肽,例如二硫键形成、N-和O-糖基化或外切蛋白酶活性。
野生型细胞中CCK-22的生物合成与CYM1破坏同基因菌株的比较表明了Cym1p胞质活性在胞内肽合成中的作用,其表明CCK-22数量的显著增加(图8C)。目的肽的合成以避免移位到内质网(ER)的方式进行。这可通过从蛋白质中去掉导致翻译后进入内质网的疏水氨基端信号序列进行或在温度敏感分泌突变体如sec61中的表达来进行,当温度提高到37℃时其能消除分泌肽移位到内质网中。
然后目的前肽或原前肽(prepropeptide)可为胞质定位并为Cym1p的潜在底物。肽从其前体的释放通过引入proCCK中观察到的切割位点通过Cym1p活性进行,其造成内肽酶解加工C-端Lys61(Ser-Ile-Val-Lys61↓)后Gly-延伸CCK-22的释放(图13A)。如果目的肽为GLP1,合成可以与Cym1p切割位点融合的形式进行,其为部分proCCK(图13B)。然后目的肽将在胞质中累积并可从裂解之后的沉淀细胞中纯化。
ProBNP在cym1突变体菌株中的表达提高proBNP的分泌
为说明CYM1在proBNP体外生物合成中的作用,在液泡缺陷菌株BJ2168和三个蛋白酶缺陷同基因菌株Δcym1∷LEU2(LJY430)、Δyps1∷TRP1(LJY440)和Δcym1∷LEU2 Δyps1∷TRP1(LJY431)中表达proBNP。CYM1的缺失造成分泌的proBNP总量增加约100%,而proBNP的分泌不依赖于编码天冬氨酰蛋白酶Yps1p的基因破坏并因此与野生型菌株相似(图15A)。预期Cym1和Yps1的破坏都与cym1突变体中的分泌量相似(图15A)。
proBNP从cym1突变体中分泌的分析
为分析酿酒酵母中表达的proBNP,cym1突变体的培养基用于FPLC层析并使用抗体98192通过RIA分析。从34-39级分洗脱的峰与完整proBNP对应,而53-62级分中洗脱的峰很可能是proBNP 1-76片段的proBNP加工形式(图15B)。1-76片段和BNP-32从proBNP的释放是由于单一精氨酸残基之后的切割并可能由于Kex2或Yps1的活性。
讨论
分泌的多肽随生长条件而改变,当培养到达稳定期时CCK-22级分增加,而胞内加工级分在胁迫条件下保持不变。胞外切割成CCK-22随着细胞进入稳定期而增加表明能将proCCK加工成CCK-22的胞外内切蛋白酶为分泌的或在细胞膜上表达。已知天冬氨酰蛋白酶Yps1p和Yps2p表现细胞表面活性(Komano等,1998)。此外,以前表明异源肽在yps1菌株中的表达通过抑制单碱性残基C-端的蛋白水解提高对像白蛋白、胰高血糖素、GLP1、GLP2和CART的蛋白质和肽的回收(Egel-Mitani等,2000;Kerry-Williams等,1998)。这样最近的研究((Egel-Mitani等,2000;Kerry-Williams等,1998)和本发明者的研究)表明了在指数生长期收集分泌肽以避免额外胞外加工的重要性。
液泡蛋白酶缺陷菌株中表达的ProCCK在proCCK的Lys61处表现30%的胞内加工。而胞外Lys61-加工级分减少到完整酵母细胞中观察到级分的2/3,其显示了分泌前CCK-22的胞内降解。有限营养来源下胞外蛋白水解的增加可能由于如观察到的稳定期YPS1转录上调的有限营养来源下胞外蛋白酶转录的激活或上调(Gasch等,2000)。Yapsins中Yps1p、Yps2p和Yps3p具有部分细胞表面活性,但是甚至在三联突变体中仍保留了一些胞外活性仍。
本研究中发明者显示了KEX2的缺失引起胞内和胞外Lys61切割都降低5倍。表达proCCK的kex2菌株不仅改变了proCCK中的Lys61切割还改变了CCK的胞内存留时间,因为与野生型酵母相比CCK肽的胞内浓度降低了60%以上而胞外CCK浓度增加了几乎60%。此外kex1 kex2双突变体和kex2突变体中分泌的CCK肽分析表明Tyr45-Val60降解产物消失。这样表明通过高尔基体外侧网络提高的分泌速度在kex2菌株中消除了通过Kex1p去掉Lys61。这些结果和proCCK快速分泌的观察暗示了Kex2p造成的胞内存留引起了野生型酵母中通过yas1p和可能某种程度上通过Kex2p的CCK-22合成的增加。
在体外蛋白酶鉴定法中使用酿酒酵母粗提取物研究了引起CCK-22胞内成熟的蛋白酶类型,以分析合成的人CCK-33在不同抑制剂存在条件下加工成CCK-22的过程。通过在蛋白酶活性的提取过程中不包括去垢剂避免了Kex2p和GPI-锚定的yapsins活性(Azaryan等,1993;Fuller等,1989;Komano等,1999)。在受检测的抑制剂中,只有EDTA和1,10邻二氮杂菲抑制蛋白水解并且活性可通过加入二价阳离子Zn2+、Co2+和Mn2+恢复。这表明金属蛋白酶参与了CCK-22的成熟过程。
候选金属蛋白酶都不含有指导蛋白质到内质网的明显信号肽。因此本发明者研究了线粒体蛋白酶之外的每一种金属蛋白酶缺陷菌株。proCCK在每一菌株中的表达造成与野生型酵母中看到的相似不变的CCK-22成熟过程。然而,通过使用体外蛋白酶鉴定法,本发明者鉴定出Cym1p为进行CCK-33赖氨酸后切割的内肽酶。Cym1p可切割proCCK中的Lys61通过过量表达研究验证,其表明酶活性增加数倍。
cym1菌株中CCK-22胞内合成减少同时总proCCK浓度增加。相反地,胞外CCK-22级分与总的CCK平行增加的野生型酵母相比增加。这些发现与像大多数胰岛素降解酶一样的Cym1p活性的胞质定位一致(Bai等,1996)并表明其在移位到内质网之前作用于preproMfα1p-proCCK构建体。这样proCCK的移位前降解通过CYM1破坏减少并且总产量增加。
在cym1Δ突变体中proBNP以与preproMfα1p序列的融合肽形式表达显示出胞外proBNP含量与野生型菌株相比增加了两倍。层析分析分泌的proBNP揭示了存在两种主要形式。一种为完整proBNP,而另一种为proBNP1-76片段,这样也合成了生物活性的BNP-32,但是在本鉴定法中未检测到。proBNP1-76片段的释放很可能依赖于Kex2p活性,然而这在本鉴定法中未检测,因为proBNP的释放依赖于Kex2p和Kex1p两者。
所有以上讨论的出版物在此全部引用。
本领域技术人员理解如详细实施方案中显示的,对本发明所做的大量改变和/或变化并不偏离广泛描述的本发明的核心或范围。因此本实施方案在所有方面应理解为的说明性的而并非限制性的。
参考文献
Adames,N.,Blunde11,K.,Ashby,M.N.和Boone,C.(1995).Science270:464-67.
Azaryan,A.V.,Wong,M.,Friedman,T.C.,Cawley,N.X.,stivariz,F.E.,Chen,H.C.和Loh,Y.P.(1993).J.Biol.Chem.68:11968-75.
Bai,J.P.,Hong,H.J.,Rothenberger,D.A.,Wong,W.D.和Buls,J.G.(1996).J.Pharm.Pharmacol.48:1180-84.
Becker,A.B和Roth,R.A.(1992)PNAS 89:3835-3839.
Brachmann,C.B.,Davies,A.,Cost,G.J.,Caputo,E.,Li,J.,Hieter,P.和B0eke,J.D.(1998).Yeast 14:115-132.
Cantor,P.和Rehfeld,J.F.(1987).Clin.Chim.Acta 168:153-58.
Egel-Mitani,M.,Andersen,A.S.,Diers,I.,Hach,M.,Thim,L.,Hastrup,S.和Vad,K.(2000).Enzyme Microb.Technol.26:671-77.
Egel-Mitani,M.,Flygenring,H.P.和Hansen,M.T.(1990).Yeast6:127-137.
Elbashir,S.M.,Harborth,J.,Lendeckel,W.,Yalcin,A.,Weber,K.和Tuschl,T.(2001).Nature 411,494-98.
Fuller,R.S.,Brake,A.和Thorner,J.(1989).Proc.Natl.Acad.Sci.USA.86:1434-38.
Gasch,A.P.,Spellman,P.T.,Kao,C.M.,Carmel-Harel,O.,Eisen,M.B.,Storz,G.,Botstein,D.和Brown,P.O.(2000).Mol. Biol. Cell11:4241-57.
Gietz,R.D.,Schiestl,R.H.,Willems,A.R.和Woods,R.A.(1995).Yeast 11:355-60.
Figure A0382528400541
JP,Kastrup J,Pedersen F和Rehfeld JF.(2002)使用不依赖于前体加工的分析法定量pro-B-型尿钠肽及其在人血浆中的产物,ClinChem.Jul;48(7):1035-42)。
Haseloff,J.和Gerlach,W.L.(1988).Nature,334:585-91.
Hilsted,L.和Rehfeld,J.F.(1986).Anal.Biochem.152:119-26.
Hooper N.M.(1994)FEBS Letters 354:1-6.
Horton,R.M.,Ho,S.N.,Pullen,J.K.,Hunt,H.D.,Cai,Z.和Pease,L.R.(1993).Methods Enzymol.217:270-79.
Jones,E.W.(1991).Methods Enzymol.194:428-53.
Julius,D.,Schekman,R.和Thorner,J.(1984).Cell 36:309-18.
Kerry-Williams,S.M.,Gilbert,S.C.,Evans,L.R.和Balance,D.J.(1998).Yeast 14:161-69.
Komano,H.,Rockwell,N.,Wang,G.T.,Krafft,G.A.和Fuller,R.S.(1999).J.Biol.Chem.274:24431-37.
Komano,H.,Seeger,M.,Gandy,S.,Wang,G.T.,Krafft,G.A.和Fuller,R.S.(1998).J.Biol.Chem.273:31648-51.
Needleman,S.B.和Wunsch,C.D.(1970).J.Mol.Biol.48:443-53.
Paloheimo,L.I.和Rehfeld,J.F.(1994).Clin.Chim.Acta 229:49-65.
Philippsen,P.,Stotz,A.和Scherf,C.(1991).Methods Enzymol.194:169-82.
Rawlings,N.D.和Barrett,A.J.(1995).Meth.Enzymol.248:183-228.
Rothstein,R.(1991).Methods Enzymol.194:281-301.
Rourke,I.J.,Johnsen,A.H.,Din,N.,Petersen,J.G.L.和Rehfeld,J.F.(1997).J.Bio1.Chem.272:9720-27.
Sambrook,J.,Fritsch,E.F.和Maniatis,T.(1989).Molecular Cloning:A Laboratory Manual,第二版,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY.
Schmidt,W.K.,Tam,A.和Michaelis,S.(2000).J.Biol.Chem.275:6227-33.
Shippy,R.,Lockner,R.,Farnsworth,M.和Hampel,A.(1999).Mol.Biotech.12:117-29.
Waterhouse,P.M.,Graham,M.W.和Wang,M.-B.(1998).Proc NatlAcad Sci USA,95:13959-64.
序列表
<110>CYM1P有限公司
<120>增加宿主细胞重组多肽产量的方法
<130>P32077PC01
<150>DK/PA 2002 01391
<151>2002-09-20
<160>68
<170>用于Windows版本4.0的FastSEQ
<210>1
<211>5
<212>PRT
<213>人工序列
<220>
<223>Pitrilysin共有序列
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>X=任一氨基酸
<400>1
His Xaa Xaa Glu His
1               5
<210>2
<211>46
<212>PRT
<213>人工序列
<220>
<223>Pitrilysin共有序列
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(12)..(12)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(16)..(16)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(17)..(17)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(18)..(18)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(19)..(19)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(20)..(20)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(21)..(21)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(23)..(23)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(24)..(24)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(25)..(25)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(26)..(26)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(27)..(27)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(28)..(28)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(29)..(29)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(30)..(30)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(31)..(31)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(32)..(32)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(33)..(33)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(34)..(34)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(35)..(35)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(36)..(36)
<223>X=任一氨基酸或不存在
<220>
<221>MISC_FEATURE
<222>(37)..(37)
<223>X=任一氨基酸或不存在
<220>
<221>MISC_FEATURE
<222>(40)..(40)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(42)..(42)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(43)..(43)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(44)..(44)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(45)..(45)
<223>X=任一氨基酸
<400>2
Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa
1               5                   10                  15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
            20                  25                  30
Xaa Xaa Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr
        35                  40                  45
<210>3
<211>46
<212>PRT
<213>人工序列
<220>
<223>Pitrilysin共有序列
<220>
<221>MISC_FEATURE
<222>(2)..(2)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(3)..(3)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(6)..(6)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(9)..(9)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(11)..(11)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(12)..(12)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>X=S or T
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(19)..(19)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(20)..(20)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(21)..(21)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(22)..(22)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(23)..(23)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(24)..(24)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(25)..(25)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(26)..(26)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(27)..(27)
<223>X=任一氨基酸或不存在
<220>
<221>MISC_FEATURE
<222>(28)..(28)
<223>X=任一氨基酸或不存在
<220>
<221>MISC_FEATURE
<222>(30)..(30)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(31)..(31)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(32)..(32)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(33)..(33)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(34)..(34)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(35)..(35)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(36)..(36)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(37)..(37)
<223>X=任一氨基酸或不存在
<220>
<221>MISC_FEATURE
<222>(40)..(40)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(42)..(42)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(43)..(43)
<223>X=任一氨基酸
<220>
<221>MISC_FEATURE
<222>(44)..(44)
<223>X=D or E
<220>
<221>MISC_FEATURE
<222>(45)..(45)
<223>X=任一氨基酸
<400>3
Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Lys
1               5                   10                  15
Tyr Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa
            20                  25                  30
 Xaa Xaa Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr
         35                  40                  45
<210>4
<211>989
<212>PRT
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>4
Met Leu Arg Phe Gln Arg Phe Ala Ser Ser Tyr Ala Gln Ala Gln Ala
1               5                   10                  15
Val Arg Lys Tyr Pro Val Gly Gly Ile Phe His Gly Tyr Glu Val Arg
            20                  25                  30
Arg Ile Leu Pro Val Pro Glu Leu Arg Leu Thr Ala Val Asp Leu Val
        35                  40                  45
His Ser Gln Thr Gly Ala Glu His Leu His Ile Asp Arg Asp Asp Lys
    50                  55                  60
Asn Asn Val Phe Ser Ile Ala Phe Lys Thr Asn Pro Pro Asp Ser Thr
65                  70                  75                  80
Gly Val Pro His Ile Leu Glu His Thr Thr Leu Cys Gly Ser Val Lys
                85                  90                  95
Tyr Pro Val Arg Asp Pro Phe Phe Lys Met Leu Asn Lys Ser Leu Ala
            100                 105                 110
Asn Phe Met Asn Ala Met Thr Gly Pro Asp Tyr Thr Phe Phe Pro Phe
        115                 120                 125
Ser Thr Thr Asn Pro Gln Asp Phe Ala Asn Leu Arg Gly Val Tyr Leu
    130                 135                 140
Asp Ser Thr Leu Asn Pro Leu Leu Lys Gln Glu Asp Phe Asp Gln Glu
145                 150                 155                 160
Gly Trp Arg Leu Glu His Lys Asn Ile Thr Asp pro Glu Ser Asn Ile
                165                 170                 175
Val Phe Lys Gly Val Val Tyr Asn Glu Met Lys Gly Gln Ile Ser Asn
            180                 185                 190
Ala Asn Tyr Tyr Phe Trp Ser Lys Phe Gln Gln Ser Ile Tyr Pro Ser
        195                 200                 205
Leu Asn Asn Ser Gly G1y Asp Pro Met Lys Ile Thr Asp Leu Arg Tyr
    210                 215                 220
Gly Asp Leu Leu Asp Phe His His Lys Asn Tyr His Pro Ser Asn Ala
225                 230                 235                 240
Lys Thr Phe Thr Tyr Gly Asn Leu Pro Leu Val Asp Thr Leu Lys Gln
                245                 250                 255
Leu Asn Glu Gln Phe Ser Gly Tyr Gly Lys Arg Ala Arg Lys Asp Lys
            260                 265                 270
Leu Leu Met Pro Ile Asp Leu Lys Lys Asp Ile Asp Val Lys Leu Leu
        275                 280                 285
Gly Gln Ile Asp Thr Met Leu Pro Pro Glu Lys Gln Thr Lys Ala Ser
    290                 295                 300
Met Thr Trp Ile Cys Gly Ala Pro Gln Asp Thr Tyr Asp Thr Phe Leu
305                 310                 315                 320
Leu Lys Val Leu Gly Asn Leu Leu Met Asp Gly His Ser Ser Val Met
                325                 330                 335
Tyr Gln Lys Leu Ile Glu Ser Gly Ile Gly Leu Glu Phe Ser Val Asn
            340                 345                 350
Ser Gly Val Glu Pro Thr Thr Ala Val Asn Leu Leu Thr Val Gly Ile
        355                 360                 365
Gln Gly Val Ser Asp Ile Glu Ile Phe Lys Asp Thr Val Asn Asn Ile
    370                 375                 380
Phe Gln Asn Leu Leu Glu Thr Glu His Pro Phe Asp Arg Lys Arg Ile
385                 390                 395                 400
Asp Ala Ile Ile Glu Gln Leu Glu Leu Ser Lys Lys Asp Gln Lys Ala
                405                 410                 415
Asp Phe Gly Leu Gln Leu Leu Tyr Ser Ile Leu Pro Gly Trp Thr Asn
            420                 425                 430
Lys Ile Asp Pro Phe Glu Ser Leu Leu Phe Glu Asp Val Leu Gln Arg
        435                 440                 445
Phe Arg Gly Asp Leu Glu Thr Lys Gly Asp Thr Leu Phe Gln Asp Leu
    450                 455                 460
Ile Arg Lys Tyr Ile Val His Lys Pro Cys Phe Thr Phe Ser Ile Gln
465                 470                 475                 480
Gly Ser Glu Glu Phe Ser Lys Ser Leu Asp Asp Glu Glu Gln Thr Arg
                485                 490                 495
Leu Arg Glu Lys Ile Thr Ala Leu Asp Glu Gln Asp Lys Lys Asn Ile
            500                 505                 510
Phe Lys Arg Gly Ile Leu Leu Gln Glu Lys Gln Asn Glu Lys Glu Asp
        515                 520                 525
Leu Ser Cys Leu Pro Thr Leu Gln Ile Lys Asp Ile Pro Arg Ala Gly
    530                 535                 540
Asp Lys Tyr Ser Ile Glu Gln Lys Asn Asn Thr Met Ser Arg Ile Thr
545                 550                 555                 560
Asp Thr Asn Gly Ile Thr Tyr Val Arg Gly Lys Arg Leu Leu Asn Asp
                565                 570                 575
Ile Ile Pro Phe Glu Leu Phe Pro Tyr Leu Pro Leu Phe Ala Glu Ser
            580                 585                 590
Leu Thr Asn Leu Gly Thr Thr Thr Glu Ser Phe Ser Glu Ile Glu Asp
        595                 600                 605
Gln Ile Lys Leu His Thr Gly Gly Ile Ser Thr His Val Glu Val Thr
    610                 615                 620
Ser Asp Pro Asn Thr Thr Glu Pro Arg Leu Ile Phe Gly Phe Asp Gly
625                 630                 635                 640
Trp Ser Leu Asn Ser Lys Thr Asp His Ile Phe Glu Phe Trp Ser Lys
                645                 650                 655
Ile Leu Leu Glu Thr Asp Phe His Lys Asn Ser Asp Lys Leu Lys Val
            660                 665                 670
Leu Ile Arg Leu Leu Ala Ser Ser Asn Thr Ser Ser Val Ala Asp Ala
        675                 680                 685
Gly His Ala Phe Ala Arg Gly Tyr Ser Ala Ala His Tyr Arg Ser Ser
    690                 695                 700
Gly Ala Ile Asn Glu Thr Leu Asn Gly Ile Glu Gln Leu Gln Phe Ile
705                 710                 715                 720
Asn Arg Leu His Ser Leu Leu Asp Asn Glu Glu Thr Phe Gln Arg Glu
                725                 730                 735
Val Val Asp Lys Leu Thr Glu Leu Gln Lys Tyr Ile Val Asp Thr Asn
            740                 745                 750
Asr Met Asn Phe Phe Ile Thr Ser Asp Ser Asp Val Gln Ala Lys Thr
        755                 760                 765
Val Glu Ser Gln Ile Ser Lys Phe Met Glu Arg Leu Pro His Gly Ser
    770                 775                 780
Cys Leu Pro Asn Gly Pro Lys Thr Ser Asp Tyr Pro Leu Ile Gly Ser
785                 790                 795                 800
Lys Cys Lys His Thr Leu Ile Lys Phe Pro Phe Gln Val His Tyr Thr
                805                 810                 815
Ser Gln Ala Leu Leu Gly Val Pro Tyr Thr His Lys Asp Gly Ser Ala
            820                 825                 830
Leu Gln Val Met Ser Asn Met Leu Thr Phe Lys His Leu His Arg Glu
        835                 840                 845
Val Arg Glu Lys Gly Gly Ala Tyr Gly Gly Gly Ala Ser Tyr Ser Ala
    850                 855                 860
Leu Ala Gly Ile Phe Ser Phe Tyr Ser Tyr Arg Asp Pro Gln Pro Leu
865                 870                 875                 880
Lys Ser Leu Glu Thr Phe Lys Asn Ser Gly Arg Tyr Ile Leu Asn Asp
                885                 890                 895
Ala Lys Trp Gly Val Thr Asp Leu Asp Glu Ala Lys Leu Thr Ile Phe
            900                 905                 910
Gln Gln Val Asp Ala Pro Lys Ser Pro Lys Gly Glu Gly Val Thr Tyr
        915                 920                 925
Phe Met Ser Gly Val Thr Asp Asp Met Lys Gln Ala Arg Arg Glu Gln
    930                 935                 940
Leu Leu Asp Val Ser Leu Leu Asp Val His Arg Val Ala Glu Lys Tyr
945                 950                 955                 960
Leu Leu Asn Lys Glu Gly Val Ser Thr Val Ile Gly Pro Gly Ile Glu
                965                 970                 975
Gly Lys Thr Val Ser Pro Asn Trp Glu Val Lys Glu Leu
            980                 985
<210>5
<211>882
<212>PRT
<213>粟酒裂殖酵母(Schizosaccharomyces pombe)
<400>5
Met Asn Tyr Ala Lys Leu Ser Ile Ala Phe Ser Lys Lys Thr Ile Lys
1               5                   10                  15
Thr His Asn Cys Arg Leu Phe Gln Arg Trp Leu His Val Gly Asp Lys
            20                  25                  30
Val His Asp Phe Arg Val Val Asp Thr Lys Lys Val Pro Glu Leu Gln
        35                  40                  45
Leu Asn Tyr Thr Arg Leu Lys His Glu Pro Thr Asn Ala Asp Met Ile
    50                  55                  60
His Leu Asp Arg Glu Asp Pro Asn Ser Val Phe Ser Ile Gly Phe Gln
65                  70                  75                  80
Thr Pro Ala Glu Asn Asp Glu Gly Ile Pro His Ile Leu Glu His Thr
                85                  90                  95
Thr Leu Cys Gly Ser Asn Lys Tyr Pro Val Arg Asp Pro Phe Phe Lys
            100                 105                 110
Met Leu Asn Arg Ser Leu Ala Thr Phe Met Asn Ala Phe Thr Ala Ser
        115                 120                 125
Asp Phe Thr Phe Tyr Pro Phe Ala Thr Val Asn Thr Thr Asp Tyr Lys
    130                 135                 140
Asn Leu Arg Asp Val Tyr Leu Asp Ala Thr Leu Phe Pro Lys Leu Arg
145                 150                 155                 160
Lys Leu Asp Phe Leu Gln Glu Gly Trp Arg Phe Glu His Ala Asp Val
                165                 170                 175
Asn Asp Lys Lys Ser Pro Ile Ile Phe Asn Gly Val Val Tyr Asn Glu
            180                 185                 l90
Met Lys Gly Gln Val Ser Asp Ser Ser Tyr Ile Phe Tyr Met Leu Phe
        195                 200                 205
Gln Gln His Leu Phe Gln Gly Thr Ala Tyr Gly Phe Asn Ser Gly Gly
    2l0                 215                 220
Asp Pro Leu Ala Ile Pro Asp Leu Lys Tyr Glu Glu Leu Val Lys Phe
225                 230                 235                 240
His Arg Ser His Tyr His pro Ser Asn Ala Lys Ile Leu Ser Tyr Gly
                245                 250                 255
Ser Phe Pro Leu Glu Asp Asn Leu Ser Ala Leu Ser Glu Thr Phe Arg
            260                 265                 270
Pro Phe Ser Lys Arg Glu Leu Asn Leu Pro Asn Thr Phe Leu Lys Glu
        275                 280                 285
Phe Asp Gln Glu Lys Arg Val Val Glu Tyr Gly Pro Leu Asp Pro Val
    290                 295                 300
Met Ala Pro Gly Arg Gln Val Lys Thr Ser Ile Ser Phe Leu Ala Asn
305                 310                 315                 320
Asp Thr Ser Asn Val Tyr Glu Thr Phe Ala Leu Lys Val Leu Ser Lys
                325                 330                 335
Leu Cys Phe Asp Gly Phe Ser Ser Pro Phe Tyr Lys Ala Leu Ile Glu
            340                 345                 350
Ser Gly Leu Gly Thr Asp Phe Ala Pro Asn Ser Gly Tyr Asp Ser Thr
        355                 360                 365
Thr Lys Arg Gly Ile Phe Ser Val Gly Leu Glu Gly Ala Ser Glu Glu
    370                 375                 380
Ser Leu Ala Lys Ile Glu Asn Leu Val Tyr Ser Ile Phe Asn Asp Leu
385                 390                 395                 400
Ala Leu Lys Gly Phe Glu Asn Glu Lys Leu Glu Ala Ile Leu His Gln
                405                 410                 415
Met Glu Ile Ser Leu Lys His Lys Ser Ala His Phe Gly Ile Gly Leu
            420                 425                 430
Ala Gln Ser Leu Pro Phe Asn Trp Phe Asn Gly Ala Asp Pro Ala Asp
        435                 440                 445
Trp Leu Ser Phe Asn Lys Gln Ile Glu Trp Leu Lys Gln Lys Asn Ser
    450                 455                 460
Asp Gly Lys Leu Phe Gln Lys Leu Ile Lys Lys Tyr Ile Leu Glu Asn
465                 470                 475                 480
Lys Ser Arg Phe Val Phe Thr Met Leu Pro Ser Ser Thr Phe Pro Gln
                485                 490                 495
Arg Leu Gln Glu Ala Glu Ala Lys Lys Leu Gln Glu Arg Thr Ser Lys
            500                 505                 510
Leu Thr Asp Glu Asp Ile Ala Glu Ile Glu Lys Thr Ser Val Lys Leu
        515                 520                 525
Leu Glu Ala Gln Ser Thr Pro Ala Asp Thr Ser Cys Leu Pro Thr Leu
    530                 535                 540
Ser Val Ser Asp Ile Pro Glu Thr Ile Asp Glu Thr Lys Leu Lys Phe
545                 550                 555                 560
Leu Asp Ile Ala Gly Met Lys Ala Gln Trp Tyr Asp Leu Ala Ala Gly
                565                 570                 575
Leu Thr Tyr Ile Arg Leu Leu Leu Pro Leu Lys Asn Phe Pro Glu Ser
            580                 585                 590
Leu Ile Pro Tyr Leu Pro Val Tyr Cys Asp Ala Cys Leu Asn Leu Gly
        595                 600                 605
Thr His Ser Glu Ser Ile Gly Asp Leu Glu His Gln Ile Arg Arg Tyr
    610                 615                 620
Thr Gly Gly Ile Ser Ile Ser Pro Ser Ala Val Thr Asn Asn Ser Asp
625                 630                 635                 640
Val Ser Lys Tyr Glu Leu Gly Ile Ala Ile Ser Gly Tyr Ala Leu Asp
                645                 650                 655
Lys Asn Val Gly Lys Leu Val Glu Leu Ile Asn Lys Ala Phe Trp Asn
            660                 665                 670
Thr Asn Leu Ser Asn Thr Asp Lys Leu Ala Ile Met Leu Lys Thr Ser
        675                 680                 685
Val Ser Gly Ile Thr Asp Gly Ile Ala Glu Lys Gly His Ser Phe Ala
    690                 695                 700
Lys Val Ser Ser Ala Ser Gly Leu Thr Glu Lys Thr Ser Ile Thr Glu
705                 710                 715                 720
Gln Leu Gly Gly Leu Thr Gln Val Lys Leu Leu Ser Gln Leu Ser Arg
                725                 730                 735
Glu Glu Ser Phe Gly Pro Leu Val Glu Lys Leu Thr Ala Ile Arg Glu
            740                 745                 750
Ile Leu Arg Gly Thr Ser Gly Phe Lys Ala Ala Ile Asn Ala Ser Pro
        755                 760                 765
Thr Gln His Glu Val Val Glu Lys Ala Leu Gln Lys Phe Met Lys Ser
    770                 775                 780
Arg Gly Val Asn Gln Gln Thr Gln Thr Lys Ser Thr Ser Lys Glu Arg
785                 790                 795                 800
Asn Gly Ile Asn Ser Ile Lys Thr Tyr His Glu Leu Pro Phe Gln Thr
                805                 810                 815
Tyr Phe Ala Ala Lys Ser Cys Leu Gly Val Pro Tyr Thr His Pro Asp
            820                 825                 830
Gly Ala Pro Leu Gln Ile Leu Ser Ser Leu Leu Thr His Lys Tyr Leu
        835                 840                 845
His Gly Glu Ile Arg Glu Lys Gly Gly Ala Tyr Gly Ala Gly Leu Ser
    850                 855                 860
Tyr Ser Gly Ile Asp Gly Val Leu Ser Phe Phe Thr Tyr Arg Asp Ser
865                 870                 875                 880
Asp Pro
<210>6
<211>973
<212>PRT
<213>产气荚膜梭菌(Clostridium perfringens)
<400>6
Met Asn Phe Lys Glu Asn Asn Ile Tyr Ser Gly Phe Lys Leu Leu Asn
1               5                   10                  15
Ile Glu Asn Leu Asn Glu Ile Gly Gly Val Gly Leu Arg Phe Glu His
            20                  25                  30
Glu Lys Thr Lys Ala Lys Leu Ile Lys Ile Leu Ser Glu Asp Asp Asn
        35                  40                  45
Lys Cys Phe Ala Ile Gly Phe Arg Thr Pro Pro Glu Asn Ser Thr Gly
    50                  55                  60
Val Pro His Ile Leu Glu His Ser Val Leu Cys Gly Ser Arg Lys Phe
65                  70                  75                  80
Asn Thr Lys Glu Pro Phe Val Glu Leu Leu Lys Gly Ser Leu Asn Thr
                85                  90                  95
Phe Leu Asn Ala Met Thr Tyr Pro Asp Lys Thr Ile Tyr Pro Val Ala
            100                 105                 110
Ser Arg Asn Glu Lys Asp Phe Met Asn Leu Met Asp Val Tyr Leu Asp
        115                 120                 125
Ala Val Leu Tyr Pro Asn Ile Tyr Lys His Lys Glu Ile Phe Met Gln
    130                 135                 140
Glu Gly Trp His Tyr Tyr Ile Glu Asn Lys Glu Asp Glu Leu Lys Tyr
145                 150                 155                 160
Asn Gly Val Val Tyr Asn Glu Met Lys Gly Ala Tyr Ser Ser Pro Asp
                165                 170                 175
Ser Ile Leu Tyr Arg Lys Ile Pro Gln Thr Ile Tyr Pro Asp Thr Cys
            180                 185                 190
Tyr Ala Leu Ser Ser Gly Gly Asp Pro Asp Glu Ile Pro Asn Leu Thr
        195                 200                 205
Tyr Glu Glu Phe Val Glu Phe His Lys Lys Tyr Tyr His Pro Ser Asn
    210                 215                 220
Ser Tyr Ile Phe Leu Tyr Gly Asn Gly Asp Thr Glu Lys Glu Leu Glu
225                 230                 235                 240
Phe Ile Asn Glu Glu Tyr Leu Lys Asn Phe Glu Tyr Lys Glu Ile Asp
                245                 250                 255
Ser Glu Ile Lys Glu Gln Lys Ser Phe Glu Ser Met Lys Glu Glu Ser
            260                 265                 270
Phe Thr Tyr Gly Ile Ala Glu Ser Glu Asp Leu Asn His Lys Ser Tyr
        275                 280                 285
Tyr Ser Leu Asn Phe Val Ile Gly Asp Ala Thr Asp Gly Glu Lys Gly
    290                 295                 300
Leu Ala Phe Asp Val Leu Ala Tyr Leu Leu Thr Arg Ser Thr Ala Ala
305                 310                 315                 320
Pro Leu Lys Lys Ala Leu Ile Asp Ala Gly Ile Gly Lys Ala Val Ser
                325                 330                 335
Gly Asp Phe Asp Asn Ser Thr Lys Gln Ser Ala Phe Thr Val Leu Val
            340                 345                 350
Lys Asn Ala Glu Leu Asn Lys Glu Glu Glu Phe Lys Lys Val Val Met
        355                 360                 365
Asp Thr Leu Lys Asp Leu Val Glu Asn Gly Ile Asp Lys Glu Leu Ile
    370                 375                 380
Glu Ala Ser Ile Asn Arg Val Glu Phe Glu Leu Arg Glu Gly Asp Tyr
385                 390                 395                 400
Gly Ser Tyr Pro Asn Gly Leu Ile Tyr Tyr Leu Lys Val Met Asp Ser
                405                 410                 415
Trp Leu Tyr Asp Gly Asp Pro Tyr Val His Leu Glu Tyr Glu Lys Asn
            420                 425                 430
Leu Glu Lys Ile Lys Ser Ala Leu Thr Ser Asn Tyr Phe Glu Asp Leu
        435                 440                 445
Ile Glu Arg Tyr Met Ile Asn Asn Thr His Ser Ser Leu Val Ser Leu
    450                 455                 460
His Pro Glu Lys Gly Ile Asn Glu Lys Lys Ser Ala Glu Leu Lys Lys
465                 470                 475                 480
Lys Leu Glu Glu Ile Lys Asn Ser Phe Asp Glu Lys Thr Leu Asn Glu
                485                 490                 495
Ile Ile Asp Asn Cys Lys Lys Leu Lys Glu Arg Gln Ser Thr Pro Asp
            500                 505                 510
Lys Lys Glu Asp Leu Glu Ser Ile Pro Met Leu Ser Leu Glu Asp Ile
        515                 520                 525
Asp Lys Glu Ala Thr Lys Ile Pro Thr Glu Glu Lys Glu Ile Asp Gly
    530                 535                 540
Ile Thr Thr Leu His His Asp Phe His Thr Asn Lys Ile Asp Tyr Val
545                 550                 555                 560
Asn Phe Phe Phe Asn Thr Asn Ser Val Pro Glu Asp Leu Ile Pro Tyr
                565                 570                 575
Val Gly Leu Leu Cys Asp Ile Leu Gly Lys Cys Gly Thr Glu Asn Tyr
            580                 585                 590
Asp Tyr Ser Lys Leu Ser Asn Ala Ile Asn Ile Ser Thr Gly Gly Ile
        595                 600                 605
Ser Phe Gly Ala Ile Thr Phe Ala Asn Leu Lys Lys Asn Asn Glu Phe
    610                 615                 620
Arg Pro Tyr Leu Glu Ile Ser Tyr Lys Ala Leu Ser Ser Lys Thr Asn
625                 630                 635                 640
Lys Ala Ile Glu Leu Val Asp Glu Ile Val Asn His Thr Asp Leu Asp
                645                 650                 655
Asp Met Asp Arg Ile Met Gln Ile Ile Arg Glu Lys Arg Ala Arg Leu
            660                 665                 670
Glu Gly Ala Ile Phe Asp Ser Gly His Arg Ile Ala Met Lys Lys Val
        675                 680                 685
Leu Ser Tyr Ser Thr Asn Arg Gly Ala Tyr Asp Glu Lys Ile Ser Gly
    690                 695                 700
Leu Asp Tyr Tyr Asp Phe Leu Val Asn Ile Glu Lys Glu Asp Lys Lys
705                 710                 715                 720
Ser Thr Ile Ser Asp Ser Leu Lys Lys Val Arg Asp Leu Ile Phe Asn
                725                 730                 735
Lys Gly Asn Met Leu Ile Ser Tyr Ser Gly Lys Glu Glu Glu Tyr Glu
            740                 745                 750
Asn Phe Lys Glu Lys Val Lys Tyr Leu Ile Ser Lys Thr Asn Asn Asn
        755                 760                 765
Asp Phe Glu Lys Glu Glu Tyr Asn Phe Glu Leu Gly Lys Lys Asn Glu
    770                 775                 780
Gly Leu Leu Thr Gln Gly Asn Val Gln Tyr Val Ala Lys Gly Gly Asn
785                 790                 795                 800
Tyr Lys Thr His Gly Tyr Lys Tyr Ser Gly Ala Leu Ser Leu Leu Glu
                805                 810                 815
Ser Ile Leu Gly Phe Asp Tyr Leu Trp Asn Ala Val Arg Val Lys Gly
            820                 825                 830
Gly Ala Tyr Gly Val Phe Ser Asn Phe Arg Arg Asp Gly Gly Ala Tyr
        835                 840                 845
Ile Val Ser Tyr Arg Asp Pro Asn Ile Lys Ser Thr Leu Glu Ala Tyr
    850                 855                 860
Asp Asn Ile Pro Lys Tyr Leu Asn Asp Phe Glu Ala Asp Glu Arg Glu
865                 870                 875                 880
Met Thr Lys Tyr Ile Ile Gly Thr Ile Arg Lys Tyr Asp Gln Pro Ile
                885                 890                 895
Ser Asn Gly Ile Lys Gly Asp Ile Ala Val Ser Tyr Tyr Leu Ser Asn
            900                 905                 910
Phe Thr Tyr Glu Asp Leu Gln Lys Glu Arg Glu Glu Ile Ile Asn Ala
        915                 920                 925
Asp Val Glu Lys Ile Lys Ser Phe Ala Pro Met Ile Lys Asp Leu Met
    930                 935                 940
Lys Glu Asp Tyr Ile Cys Val Leu Gly Asn Glu Glu Lys Ile Lys Glu
945                 950                 955                 960
Asn Lys Asp Leu Phe Asn Asn Ile Lys Ser Val Ile Lys
                965                 970
<210>7
<211>971
<212>PRT
<213>布氏疏螺旋体(Borrelia burgdorferi)
<400>7
Met Lys Lys Lys Lys Ile Phe Lys Leu Ile Ser Lys Thr Tyr Leu Glu
1               5                   10                  15
Glu His Asp Ala Glu Gly Tyr Tyr Phe Lys His Glu Ser Gly Leu Glu
            20                  25                  30
Val Phe His Leu Lys Ser Asp Ser Phe Lys Glu Asn Ala Phe Cys Ile
        35                  40                  45
Ala Phe Lys Thr Ile Pro Ser Asn Asn Thr Gly Val Ala His Val Leu
    50                  55                  60
Glu His Thr Ile Phe Cys Gly Ser Ser Lys Tyr Lys Ile Lys Asp Pro
65                  70                  75                  80
Phe Leu Tyr Leu Leu Lys Gly Ser Leu Asn Thr Phe Leu Asn Ala Met
                85                  90                  95
Thr Phe Pro Asp Lys Thr Ile Tyr Pro Ala Ala Ser Thr Ile Glu Lys
            100                 105                 110
Asp Tyr Phe Asn Leu Phe Asn Ile Tyr Ala Asp Ser Ile Phe Asn Pro
        115                 120                 125
Leu Leu Lys Lys Glu Ser Phe Met Gln Glu Gly Tyr Asn Ile Asn Pro
    130                 135                 140
Lys Asp Phe Lys Val Ser Gly Ile Val Phe Asn Glu Met Lys Gly Ser
145                 150                 155                 160
Tyr Ser Asn Lys Asn Ser Leu Ile Asn Glu Ile Val Ser Ser Ser Leu
                165                 170                 175
Phe Glu Glu Gly Ala Tyr Lys Tyr Asp Ser Gly Gly Ile Pro Thr Asn
            180                 185                 190
Ile Ile Asp Leu Thr Tyr Glu Ser Phe Leu Asp Phe Tyr Lys Lys Tyr
        195                 200                 205
Tyr Thr Leu Glu Asn Cys Lys Ile Phe Leu Cys Gly Asn Thr Gln Thr
    210                 215                 220
Glu Lys Asn Leu Asn Phe Ile Glu Lys Tyr Ile Ile Arg Pro Tyr Lys
225                 230                 235                 240
Lys Glu Lys Ser Asn Val Asn Ile Asn Ile Glu Asn Val Lys Arg Trp
                245                 250                 255
Glu Lys Gly Lys Lys Leu Thr Tyr Lys Ile Pro Lys Glu Asn Asp Asn
            260                 265                 270
Ser Leu Gly Val Tyr Thr Ile Asn Trp Leu Cys Thr Glu Ile Asn Asn
       275                  280                 285
Ile Glu Asp Ser Ile Gly Leu Glu Ile Leu Ser Glu Ile Leu Leu Asp
    290                 295                 300
Asp Ser Cys Ser Phe Thr Ile Asn Ile Leu Lys Ser Gly Ile Gly Glu
305                 310                 315                 320
Asp Ile Ala His Ile Ser Gly Ile Asn Thr Asp Leu Lys Glu Ser Ile
                325                 330                 335
Phe Ser Phe Gly Leu Gln Asn Val Val Glu Asn Lys Glu Lys Glu Phe
            340                 345                 350
Lys Asn Leu Val Phe Ser Glu Leu Lys Asn Leu Val Lys Asn Lys Ile
        355                 360                 365
Pro Lys Glu Leu Ile Lys Gly Ile Leu Phe Gly Tyr Glu Phe Ala Leu
    370                 375                 380
Lys Glu Glu Lys Gly Gln Asn Phe Pro Ile Ala Leu Met Ile Lys Ser
385                 390                 395                 400
Phe Lys Gly Trp Leu Asn Gly Leu His Pro Ile Lys Thr Leu Gln Thr
                405                 410                 415
Ser Tyr Tyr Ile Asn Glu Ile Thr Asn Lys Leu Glu Lys Gly Ile Tyr
            420                 425                 430
Tyr Phe Glu Asn Leu Ile Glu Lys Tyr Leu Ile Phe Asn Asn His Tyr
        435                 440                 445
Thr Leu Ile Ser Phe Ile Pro Ser His Asp Thr Glu Lys Glu Met Glu
    450                 455                 460
Glu Glu Ile Glu Lys Lys Leu Met Ala Arg Glu Ile Glu Ile Lys Gln
465                 470                 475                 480
Asn Pro Glu Glu Phe Leu Gln Phe Lys Lys Asp Tyr Asn Gln Phe Lys
                485                 490                 495
Lys Tyr Gln Asn Lys Lys Asp Ser Lys Ala Asp Ile Ala Lys Leu Pro
            500                 505                 510
Leu Leu Lys Ile Glu Asp Leu Pro Lys Gln Ile Glu Lys Ser Leu Asp
        515                 520                 525
Leu Asn Glu Ile Lys Glu Leu Asn Leu His Ser Phe Lys Phe Lys Ser
    530                 535                 540
Asn Asn Ile Phe Asn Val Asn Leu Phe Phe Lys Leu Asp Phe Leu Glu
545                 550                 555                 560
Lys Glu Asp Tyr Ile Tyr Leu Ser Leu Phe Lys Arg Ala Leu Gln Asp
                565                 570                 575
Leu Ser Thr Lys Asn Tyr Ser Tyr Ile Asn Ile Asn Asn Lys Ile Gln
            580                 585                 590
Asn Thr Leu Gly Gln Ile Asn Ile Ser Glu Ser Tyr Asp Glu Asp Ile
        595                 600                 605
Asp Gly Asn Ile Leu Asn Ser Phe Asn Ile Ser Phe Lys Ser Phe Asn
    610                 615                 620
Asn Lys Val Lys Glu Ser Phe Glu Leu Ile Lys Glu Ile Leu Ile Asn
625                 630                 635                 640
Ile Asn Phe His Asp Tyr Glu Arg Leu Lys Glu Ile Thr Leu Ser Leu
                645                 650                 655
Lys Asn Asp Phe Lys Ser Leu Leu Ile Pro Lys Gly His Leu Leu Ala
            660                 665                 670
Met Leu Arg Ser Lys Ser Lys Leu Lys Leu Asn Glu Tyr Leu Lys Glu
        675                 680                 685
Leu Gln Asn Gly Ile Thr Gly Arg Glu phe Trp Gln Lys Ala Lys Thr
    690                 695                 700
Asp Thr Glu Ser Leu Lys Glu Ile Ala Asn Lys Leu Asp Asn Leu Lys
705                 710                 715                 720
Asn Lys Ile Ile Leu Lys Asn Asn Leu Ser Ala Leu Ile Met Gly Asn
                725                 730                 735
Thr Asp Asp Ile Leu Lys Asn Leu Glu Asn Glu Phe Phe Asn Leu Lys
            740                 745                 750
Glu Ser Leu Glu Glu Ser Asn His Tyr Asn Gly Leu Leu Asn Leu Asp
        755                 760                 765
Ala Asn Ser Lys Ala Leu Arg Glu Ile Ile Ile Ile Gln Ser Lys Val
    770                 775                 780
Ala Phe Asn Ala Ile Cys Phe Pro Ser Tyr Lys Ile Asn Asp Glu Asn
785                 790                 795                 800
Tyr Pro Lys Ala Asn Phe Leu Glu His Val Leu Arg Ser Gly Ile Phe
                805                 810                 815
Trp Glu Lys Ile Arg Val Met Gly Gly Ala Tyr Gly Ala Ser Ala Ser
            820                 825                 830
Ile Ala Asn Gly Ile Phe Ser Phe Ala Ser Tyr Arg Asp Pro Asn Phe
        835                 840                 845
Thr Lys Thr Tyr Gln Ala Phe Glu Lys Ser Leu Glu Glu Leu Ala Asn
    850                 855                 860
Asn Lys Met Thr Asp Asp Glu Ile Tyr Thr Tyr Leu Ile Gly Leu Ile
865                 870                 875                 880
Gly Thr Asn Ile Tyr Val Lys Thr Lys Ala Thr Glu Ala Leu Gln Ser
                 885                890                 895
Tyr Arg Arg Lys Met Leu Asn Ile Ser Asp Ser Leu Arg Gln Asp Ile
            900                 905                 910
Arg Asn Ala Tyr Phe Thr Ile Thr Pro Gln Asp Ile Lys Glu Ile Ser
        915                 920                 925
Thr Lys Ile Leu Thr Gln Ile Arg Gln His Asn Ser Ile Ala Ser Leu
    930                 935                 940
Val Asn Asn Gln Ile Tyr Glu Glu Glu Lys Asn Asn Leu Glu Lys Leu
945                 950                 955                 960
Ile Gly Lys Glu Tyr Ser Leu Lys Lys Ile Tyr
                965                 970
<210>8
<211>995
<212>PRT
<213>秀丽隐杆线虫(caenorhabditis elegans)
<400>8
Met Ser Ala Ser Lys Leu Trp Ser Cys Thr Glu Thr Val Leu Asn Gly
1               5                   10                  15
Gly Ile Lys Leu Phe Leu Tyr Ser Ser Lys Asn Thr Lys Leu Arg Val
            20                  25                  30
Ala Ile Gly Glu Val Pro Gly Pro Met Val His Gly Ala Val Ser Phe
        35                  40                  45
Val Thr Glu Ala Asp Ser Asp Asp Gly Leu Pro His Thr Leu Glu His
    50                  55                  60
Leu Val Phe Met Gly Ser Lys Lys Tyr Pro Phe Lys Gly Val Leu Asp
65                  70                  75                  80
Val Ile Ala Asn Arg Cys Leu Ala Asp Gly Thr Asn Ala Trp Thr Asp
                85                  90                  95
Thr Asp His Thr Ala Tyr Thr Leu Ser Thr Val Gly Ser Asp Gly Phe
            100                 105                 110
Leu Lys Val LeuPro Val Tyr Ile Asn His Leu Leu Thr Pro Met Leu
        115                120                 125
Thr Ala Ser Gln Phe Ala Thr Glu Val His His Ile Thr Gly Glu Gly
    130                 135                 140
Asn Asp Ala Gly Val Val Tyr Ser Glu Met Gln Asp His Glu Ser Glu
145                 150                 155                 160
Met Glu Ser Ile Met Asp Arg Lys Thr Lys Glu Val Ile Tyr Pro Pro
                165                 170                 175
Phe Asn Pro Tyr Ala Val Asp Thr Gly Gly Arg Leu Lys Asn Leu Arg
            180                 185                 190
Glu Ser Cys Thr Leu Glu Lys Val Arg Asp Tyr His Lys Lys Phe Tyr
        195                 200                 205
His Leu Ser Asn Met Val Val Thr Val Cys Gly Met Val Asp His Asp
    210                 215                 220
Gln Val Leu Glu Ile Met Asn Asn Val Glu Asn Glu His Met Ser Thr
225                 230                 235                 240
Val Pro Asp His Phe Pro Lys pro Phe Ser Phe Ala Leu Ser Asp Ile
                245                 250                 255
Lys Glu Ser Thr Val His Arg Val Glu Cys Pro Thr Asp Asp Ala Ser
            260                 265                 270
Arg Gly Ala Val Glu Val Ala Trp Phe Ala His Ser Pro Ser Asp Leu
        275                 280                 285
Glu Thr His Ser Ser Leu His Val Leu Phe Asp Tyr Leu Ser Asn Thr
    290                 295                 300
Ser Val Ala Pro Leu Gln Lys Asp Phe Ile Leu Leu Glu Asp Pro Leu
305                 310                 315                 320
Ala Ser Ser Val Ser Phe His Ile Ala Glu Gly Val Arg Cys Asp Leu
                325                 330                 335
Arg Leu Asn Phe Ala Gly Val Pro Val Glu Lys Leu Asp Glu Cys Ala
            340                 345                 350
Pro Lys Phe Phe Asp Lys Thr Val Arg Glu His Leu Glu Glu Ala Asn
        355                 360                 365
Phe Asp Met Glu Arg Met Gly Tyr Leu Ile Asp Gln Thr Ile Leu Asn
    370                 375                 380
Glu Leu Val Lys Leu Glu Thr Asn Ala Pro Lys Asp Ile Met Ser His
385                 390                 395                 400
Ile Ile Gly His Gln Leu Phe Asp Asn Glu Asp Glu Glu Leu Phe Lys
                405                 410                 415
Lys Arg Thr Asn Glu Ile Asp Phe Leu Lys Lys Leu Lys Ser Glu Pro
            420                 425                 430
Ala Ser Tyr Trp Val Gln Leu Val Asn Lys Tyr Phe Thr Ala Pro Ser
        435                 440                 445
Ala Thr Val Ile Gly Val Pro Asn Glu Glu Leu Val Asp Lys Ile Ala
    450                 455                 460
Glu Glu Glu Glu Lys Arg Ile Ala Ala Gln Cys Glu Lys Leu Gly Lys
465                 470                 475                 480
Lys Gly Leu Glu Glu Ala Gly Lys Ser Leu Glu Ala Ala Ile Leu Glu
                485                 490                 495
Asn Thr Ala Asn His Pro Ser Ala Glu Leu Leu Asp Gln Leu Ile Val
            500                 505                 510
Lys Asp Leu Glu Ala Phe Asp Arg Phe Pro Val Gln Ser Leu Thr Ser
        515                 520                 525
Asn Ser Pro Ser Leu Thr Pro Gln Gln Ser Thr Phe Leu Ala Gln Phe
    530                 535                 540
Pro Phe His Ala Asn Leu His Asn Cys Pro Thr Lys Phe Val Glu Ile
545                 550                 555                 560
Phe Phe Leu Leu Asp Ser Ser Asn Leu Ser Ile Glu Asp Arg Ser Tyr
                565                 570                 575
Leu Phe Leu Tyr Thr Asp Leu Leu Phe Glu Ser Pro Ala Met Ile Asp
            580                 585                 590
Gly Val Leu Thr Ser Ala Asp Asp Val Ala Lys His Phe Thr Lys Asp
        595                 600                 605
Leu Ile Asp His Ser Ile Gln Val Gly Val Ser Gly Leu Tyr Asp Arg
    610                 615                 620
Phe Val Asn Leu Arg Ile Lys Val Gly Ala Asp Lys Tyr Pro Leu Leu
625                 630                 635                 640
Ala Lys Trp Ala Gln Ile Phe Thr Gln Gly Val Val Phe Asp Pro Ser
                645                 650                 655
Arg Ile His Gln Cys Ala Gln Lys Leu Ala Gly Glu Ala Arg Asp Arg
            660                 665                 670
Lys Arg Asp Gly Cys Thr Val Ala Ser Thr Ala Val Ala Ser Met Val
        675                 680                 685
Tyr Gly Lys Asn Thr Asn Cys Ile Leu Phe Asp Glu Leu Val Leu Glu
    690                 695                 700
Lys Leu His Glu Lys Ile Ser Lys Asp Val Met Lys Asn Pro Glu Ala
705                 710                 715                 720
Val Leu Glu Lys Leu Glu Gln Val Arg Ser Ala Leu Phe Ser Asn Gly
                725                 730                 735
Val Asn Ala His Phe Val Ala Asp Val Asp Ser Ile Asp Pro Lys Met
            740                 745                 750
Leu Ser Ser Asp Leu Trp Thr Trp Val Gln Ala Asp Pro Arg Phe Gly
        755                 760                 765
Pro Gly His Gln Phe Ser Ala Glu Ala Gly Glu Asn Val Ser Leu Glu
    770                 775                 780
Leu Gly Lys Glu Leu Leu Ile Gly Val Gly Gly Ser Glu Ser Ser Phe
785                 790                 795                 800
Ile Tyr Gln Thr Ser Phe Leu Asp Ala Asn Trp Asn Ser Glu Glu Leu
                805                 810                 815
Ile Pro Ala Met Ile Phe Gly Gln Tyr Leu Ser Gln Cys Glu Gly Pro
            820                 825                 830
Leu Trp Arg Ala Ile Arg Gly Asp Gly Leu Ala Tyr Gly Ala Asn Val
        835                 840                 845
Phe Val Lys Pro Asp Arg Lys Gln Ile Thr Leu Ser Leu Tyr Arg Cys
    850                 855                 860
Ala Gln Pro Ala Val Ala Tyr Glu Arg Thr Arg Asp Ile Ile Arg Lys
865                 870                 875                 880
Ile Val Glu Ser Gly Glu Ile Ser Lys Ala Glu Phe Glu Gly Ala Lys
                885                 890                 895
Arg Ser Thr Val Phe Glu Met Met Lys Arg Glu Gly Thr Val Ser Gly
            900                 905                 910
Ala Ala Lys Ile Ser Ile Leu Asn Asn Phe Arg Gln Thr Pro His Pro
        915                 920                 925
Phe Asn Ile Asp Leu Cys Arg Arg Ile Trp Asn Leu Thr Ser Glu Glu
    930                 935                 940
Met Val Lys Ile Gly Gly Pro Pro Leu Ala Arg Leu Phe Asp Glu Lys
945                 950                 955                 960
Cys Phe Val Arg Ser Ile Ala Val His Pro Ser Lys Leu Asn Glu Met
                965                 970                 975
Lys Lys Ala Phe Pro Gly Ser Ser Lys Ile Lys Ile Ser Asp Leu Gln
            980                 985                 990
Phe Ala Cys
        995
<210>9
<211>962
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>9
Met Pro Arg Ser Thr Trp Phe Lys Ala Leu Leu Leu Leu Val Ala Leu
1               5                   10                  15
Trp Ala Pro Leu Ser Gln Ala Glu Thr Gly Trp Gln Pro Ile Gln Glu
            20                  25                  30
Thr Ile Arg Lys Ser Asp Lys Asp Asn Arg Gln Tyr Gln Ala Ile Arg
        35                  40                  45
Leu Asp Asn Gly Met Val Val Leu Leu Val Ser Asp Pro Gln Ala Val
    50                  55                  60
Lys Ser Leu Ser Ala Leu Val Val Pro Val Gly Ser Leu Glu Asp Pro
65                  70                  75                  80
Glu Ala Tyr Gln Gly Leu Ala His Tyr Leu Glu His Met Ser Leu Met
                85                  90                  95
Gly Ser Lys Lys Tyr Pro Gln Ala Asp Ser Leu Ala Glu Tyr Leu Lys
            100                 105                 110
Met His Gly Gly Ser His Asn Ala Ser Thr Ala Pro Tyr Arg Thr Ala
        115                 120                 125
Phe Tyr Leu Glu Val Glu Asn Asp Ala Leu Pro Gly Ala Val Asp Arg
    130                 135                 140
Leu Ala Asp Ala Ile Ala Glu Pro Leu Leu Asp Lys Lys Tyr Ala Glu
145                 150                 155                 160
Arg Glu Arg Asn Ala Val Asn Ala Glu Leu Thr Met Ala Arg Thr Arg
                165                 170                 175
Asp Gly Met Arg Met Ala Gln Val Ser Ala Glu Thr Ile Asn Pro Ala
            180                 185                 190
His Pro Gly Ser Lys Phe Ser Gly Gly Asn Leu Glu Thr Leu Ser Asp
        l95                 200                 205
Lys Pro Gly Asn Pro Val Gln Gln Ala Leu Lys Asp Phe His Glu Lys
    210                 215                 220
Tyr Tyr Ser Ala Asn Leu Met Lys Ala Val Ile Tyr Ser Asn Lys Pro
225                 230                 235                 240
Leu Pro Glu Leu Ala Lys Met Ala Ala Asp Thr Phe Gly Arg Val Pro
                245                 250                 255
Asn Lys Glu Ser Lys Lys Pro Glu Ile Thr Val Pro Val Val Thr Asp
            260                 265                 270
Ala Gln Lys Gly Ile Ile Ile His Tyr Val Pro Ala Leu Pro Arg Lys
        275                 280                 285
VaL Leu Arg Val Glu Phe Arg Ile Asp Asn Asn Ser Ala Lys Phe Arg
    290                 295                 300
Ser Lys Thr Asp Glu Leu Ile Thr Tyr Leu Ile Gly Asn Arg Ser Pro
305                 310                 315                 320
G1y Thr Leu Ser Asp Trp Leu Gln Lys Gln Gly Leu VaL Glu Gly Ile
                325                 330                 335
Ser Ala Asn Ser Asp Pro Ile Val Asn Gly Asn Ser Gly Val Leu Ala
            340                 345                 350
Ile Ser Ala Ser Leu Thr Asp Lys GLy Leu Ala Asn Arg Asp GLn Val
        355                 360                 365
Val Ala Ala Ile Phe Ser Tyr Leu Asn Leu Leu Arg Glu Lys Gly Ile
    370                 375                 380
Asp Lys Gln Tyr Phe Asp Glu Leu Ala Asn Val Leu Asp Ile Asp Phe
385                 390                 395                 400
Arg Tyr Pro Ser Ile Thr Arg Asp Met Asp Tyr Val Glu Trp Leu Ala
                405                 410                 415
Asp Thr Met Ile Arg Val Pro Val Glu His Thr Leu Asp Ala Val Asn
            420                 425                 430
Ile Ala Asp Arg Tyr Asp Ala Lys Ala Val Lys Glu Arg Leu Ala Met
        435                 440                 445
Met Thr Pro Gln Asn Ala Arg Ile Trp Tyr Ile Ser Pro Lys Glu Pro
    450                 455                 460
His Asn Lys Thr Ala Tyr Phe Val Asp Ala Pro Tyr Gln Val Asp Lys
465                 470                 475                 480
Ile Ser Ala Gln Thr Phe Ala Asp Trp Gln Lys Lys Ala Ala Asp Ile
                485                 490                 495
Ala Leu Ser Leu Pro Glu Leu Asn Pro Tyr Ile Pro Asp Asp Phe Ser
            500                 505                 510
Leu Ile Lys Ser Glu Lys Lys Tyr Asp His Pro Glu Leu Ile Val Asp
        515                 520                 525
Glu Ser Asn Leu Arg Val Val Tyr Ala Pro Ser Arg Tyr Phe Ala Ser
    530                 535                 540
Glu Pro Lys Ala Asp Val Ser Leu Ile Leu Arg Asn Pro Lys Ala Met
545                 550                 555                 560
Asp Ser Ala Arg Asn Gln Val Met Phe Ala Leu Asn Asp Tyr Leu Ala
                565                 570                 575
Gly Leu Ala Leu Asp Gln Leu Ser Asn Gln Ala Ser Val Gly Gly Ile
            580                 585                 590
Ser Phe Ser Thr Asn Ala Asn Asn Gly Leu Met Val Asn Ala Asn Gly
        595                 600                 605
Tyr Thr Gln Arg Leu Pro Gln Leu Phe Gln Ala Leu Leu Glu Gly Tyr
    610                 615                 620
Phe Ser Tyr Thr Ala Thr Glu Asp Gln Leu Glu Gln Ala Lys Ser Trp
625                 630                 635                 640
Tyr Asn Gln Met Met Asp Ser Ala Glu Lys Gly Lys Ala Phe Glu Gln
                645                 650                 655
Ala Ile Met Pro Ala Gln Met Leu Ser Gln Val Pro Tyr Phe Ser Arg
            660                 665                 670
Asp Glu Arg Arg Lys Ile Leu Pro Ser Ile Thr Leu Lys Glu Val Leu
        675                 680                 685
Ala Tyr Arg Asp Ala Leu Lys Ser Gly Ala Arg Pro Glu Phe Met Val
    690                 695                 700
Ile Gly Asn Met Thr Glu Ala Gln Ala Thr Thr Leu Ala Arg Asp Val
705                 710                 715                 720
Gln Lys Gln Leu Gly Ala Asp Gly Ser Glu Trp Cys Arg Asn Lys Asp
                725                 730                 735
Val Val Val Asp Lys Lys Gln Ser Val Ile Phe Glu Lys Ala Gly Asn
            740                 745                 750
Ser Thr Asp Ser Ala Leu Ala Ala Val Phe Val Pro Thr Gly Tyr Asp
        755                 760                 765
Glu Tyr Thr Ser Ser Ala Tyr Ser Ser Leu Leu Gly Gln Ile Val Gln
    770                 775                 780
Pro Trp Phe Tyr Asn Gln Leu Arg Thr Glu Glu Gln Leu Gly Tyr Ala
785                 790                 795                 800
Val Phe Ala Phe Pro Met Ser Val Gly Arg Gln Trp Gly Met Gly Phe
                805                 810                 815
Leu Leu Gln Ser Asn Asp Lys Gln Pro Ser Phe Leu Trp Glu Arg Tyr
            820                 825                 830
Lys Ala Phe Phe Pro Thr Ala Glu Ala Lys Leu Arg Ala Met Lys Pro
        835                 840                 845
Asp Glu Phe Ala Gln Ile Gln Gln Ala Val Ile Thr Gln Met Leu Gln
    850                 855                 860
Ala Pro Gln Thr Leu Gly Glu Glu Ala Ser Lys Leu Ser Lys Asp Phe
865                 870                 875                 880
Asp Arg Gly Asn Met Arg Phe Asp Ser Arg Asp Lys Ile Val Ala Gln
                885                 890                 895
Ile Lys Leu Leu Thr Pro Gln Lys Leu Ala Asp Phe Phe His Gln Ala
            900                 905                 910
Val Val Glu Pro Gln Gly Met Ala Ile Leu Ser Gln Ile Ser Gly Ser
        915                 920                 925
Gln Asn Gly Lys Ala Glu Tyr Val His Pro Glu Gly Trp Lys Val Trp
    930                 935                 940
Glu Asn Val Ser Ala Leu Gln Gln Thr Met Pro Leu Met Ser Glu Lys
945                 950                 955                 960
Asn Glu
<210>10
<211>1161
<212>PRT
<213>人(Homo sapiens)
<400>10
Met Leu Arg Arg Val Ala Val Ala Ala Val Phe Ala Thr Gly Arg Lys
1               5                   10                  15
Leu Arg Cys Glu Ala Gly Arg Asp Val Thr Ala Val Gly Arg Ile Glu
            20                  25                  30
Ala Arg Gly Leu Cys Glu Glu Ser Ala Lys Pro Phe Pro Thr Leu Thr
        35                  40                  45
Met Pro Gly Arg Asn Lys Ala Lys Ser Thr Cys Ser Cys Pro Asp Leu
    50                  55                  60
Gln Pro Asn Gly Gln Asp Leu Gly Glu Ser Gly Arg Val Ala Arg Leu
65                  70                  75                  80
Gly Ala Asp Glu Ser Glu Glu Glu Gly Arg Ser Leu Ser Asn Val Gly
                85                  90                  95
Asp Pro Glu Ile Ile Lys Ser Pro Ser Asp Pro Lys Gln Tyr Arg Tyr
            100                 105                 110
Ile Lys Leu Gln Asn Gly Leu Gln Ala Leu Leu Ile Ser Asp Leu Ser
        115                 120                 125
Asn Val Glu Gly Lys Thr Gly Asn Ala Thr Asp Glu Glu Glu Glu Glu
    130                 135                 140
Glu Glu Glu Glu Glu Glu Gly Glu Glu Glu Glu Glu Glu Glu Glu Asp
145                 150                 155                 160
Asp Asp Asp Asp Asp Asp Glu Asp Ser Gly Ala Glu Ile Gln Asp Asp
                165                 170                 175
Asp Glu Glu Gly Phe Asp Asp Glu Glu Glu Phe Asp Asp Asp Glu His
            180                 185                 190
Asp Asp Asp Asp Leu Asp Asn Glu Glu Asn Glu Leu Glu Glu Leu Glu
        195                 200                 205
Glu Arg Val Glu Ala Arg Lys Lys Thr Thr Glu Lys Gln Ser Ala Ala
    210                 215                 220
Ala Leu Cys Val Gly Val Gly Ser Phe Ala Asp Pro Asp Asp Leu Pro
225                 230                 235                 240
Gly Leu Ala His Phe Leu Glu His Met Val Phe Met Gly Ser Leu Lys
                245                 250                 255
Tyr Pro Asp Glu Asn Gly Phe Asp Ala Phe Leu Lys Lys His Gly Gly
            260                265                  270
Ser Asp Asn Ala Ser Thr Asp Cys Glu Arg Thr Val Phe Gln Phe Asp
        275                 280                 285
Val Gln Arg Lys Tyr Phe Lys Glu Ala Leu Asp Arg Trp Ala Gln Phe
    290                 295                 300
Phe Ile His Pro Leu Met Ile Arg Asp Ala Ile Asp Arg Glu Val Glu
305                 310                 315                 320
 Ala Val Asp Ser Glu Tyr Gln Leu Ala Arg Pro Ser Asp Ala Asn Arg
                 325                 330                 335
 Lys Glu Met Leu Phe Gly Ser Leu Ala Arg Pro Gly His Pro Met Gly
             340                 345                 350
Lys Phe Phe Trp Gly Asn Ala Glu Thr Leu Lys His Glu Pro Lys Lys
        355                 360                 365
Asn Asn Ile Asp Thr His Ala Arg Leu Arg Glu Phe Trp Met Arg Tyr
    370                 375                 380
Tyr Ser Ala His Tyr Met Thr Leu Val Val Gln Ser Lys Glu Thr Leu
385                 390                 395                 400
Asp Thr Leu Glu Lys Trp Val Thr Glu Ile Phe Ser Gln Ile Pro Asn
                405                 410                 415
Asn Gly Leu Pro Lys Pro Asn Phe Ser His Leu Thr Asp Pro Phe Asp
            420                 425                 430
Thr Pro Ala Phe Asn Lys Leu Tyr Arg Val Val Pro Ile Arg Lys Ile
        435                 440                 445
His Ala Leu Thr Ile Thr Trp Ala Leu Pro Pro Gln Gln Gln His Tyr
   450                  455                 460
Arg Val Lys Pro Leu His Tyr Ile Ser Trp Leu Val Gly His Glu Gly
465                 470                 475                 480
Lys Gly Ser Ile Leu Ser Tyr Leu Arg Lys Lys Cys Trp Ala Leu Ala
               485                  490                 495
Leu Phe Gly Gly Ash Gly Glu Thr Gly Phe Glu Gln Asn Ser Thr Tyr
            500                 505                 510
Ser Val Phe Ser Ile Ser Ile Thr Leu Thr Asp Glu Gly Tyr Glu His
        515                 520                 525
Phe Tyr Glu Val Ala His Thr Val Phe Gln Tyr Leu Lys Met Leu Gln
    530                 535                 540
Lys Leu Gly Pro Glu Lys Arg Val Phe Glu Glu Ile Gln Lys Ile Glu
545                 550                 555                 560
Asp Asn Glu Phe His Tyr Gln Glu Gln Thr Asp Pro Val Glu Tyr Val
                565                 570                 575
Glu Asn Met Cys Glu Asn Met Gln Leu Tyr Pro Arg Gln Asp Phe Leu
            580                 585                 590
Thr Gly Asp Gln Leu Leu Phe Glu Tyr Lys Pro Glu Val Ile Ala Glu
        595                 600                 605
Ala Leu Asn Gln Leu Val Pro Gln Lys Ala Asn Leu Val Leu Leu Ser
    610                 615                 620
Gly Ala Asn Glu Gly Arg Cys Asp Leu Lys Glu Lys Trp Phe Gly Thr
625                 630                 635                 640
Gln Tyr Ser Ile Glu Asp Ile Glu Asn Ser Trp Thr Glu Leu Trp Lys
                645                 650                 655
Ser Asn Phe Asp Leu Asn Ser Asp Leu His Leu Pro Ala Glu Asn Lys
            660                 665                 670
Tyr Ile Ala Thr Asp Phe Thr Leu Lys Ala Phe Asp Cys Pro Glu Thr
        675                 680                 685
Glu Tyr Pro Ala Lys Ile Val Asn Thr Pro Gln Gly Cys Leu Trp Tyr
    690                 695                 700
Lys Lys Asp Asn Lys Phe Lys Ile Pro Lys Ala Tyr Ile Arg Phe His
705                 710                 715                 720
Leu Ile Ser Pro Leu Ile Gln Lys Ser Ala Ala Asn Val Val Leu Phe
                725                 730                 735
Asp Ile Phe Val Asn Ile Leu Thr His Asn Leu Ala Glu Pro Ala  Tyr
            740                 745                 750
Glu Ala Asp Val Ala Gln Leu Glu Tyr Lys Leu Val Ala Gly Glu His
        755                 760                 765
Gly Leu Ile Ile Arg Val Lys Gly Phe Asn His Lys Leu Pro Leu Leu
    770                 775                 780
Phe Gln Leu Ile Ile Asp Tyr Leu Thr Glu Phe Ser Ser Thr Pro Ala
785                 790                 795                 800
Val Phe Thr Met Ile Thr Glu Gln Leu Lys Lys Thr Tyr Phe Asn Ile
                805                 810                 815
Leu Ile Lys Pro Glu Thr Leu Ala Lys Asp Val Arg Leu Leu Ile Leu
            820                 825                 830
Glu Tyr Ser Arg Trp Ser Met Ile Asp Lys Tyr Arg Ala Leu Met Asp
        835                 840                 845
Gly Leu Ser Leu Glu Ser Leu Leu Asn Phe Val Lys Asp Phe Lys Ser
    850                 855                 860
Gln Leu Phe Val Glu Gly Leu Val Gln Gly Asn Val Thr Ser Thr Glu
865                 870                 875                 880
Ser Met Asp Phe Leu Arg Tyr Val Val Asp Lys Leu Asn Phe Val Pro
                885                 890                 895
Leu Glu Arg Glu Met Pro Val Gln Phe Gln Val Val Glu Leu Pro Ser
            900                 905                 910
Gly His His Leu Cys Lys Val Arg Ala Leu Asn Lys Gly Asp Ala Asn
        915                 920                 925
Ser Glu Val Thr Val Tyr Tyr Gln Ser Gly Thr Arg Ser Leu Arg Glu
    930                 935                 940
Tyr Thr Leu Met Glu Leu Leu Val Met His Met Glu Glu Pro Cys Phe
945                 950                 955                 960
Asp Phe Leu Arg Thr Lys Gln Thr Leu Gly Tyr His Val Tyr Pro Thr
                965                 970                 975
Cys Arg Asn Thr Ser Gly Ile Leu Gly Phe Ser Val Thr Val Gly Thr
            980                 985                 990
Gln Ala Thr Lys Tyr Asn Ser Glu  Thr Val Asp Lys Lys  Ile Glu Glu
        995                 1000                 1005
Phe Leu  Ser Ser Phe Glu Glu  Lys Ile Glu Asn Leu  Thr Glu Asp
    1010                 1015                 1020
Ala Phe  Asn Thr Gln Val Thr  Ala Leu Ile Lys Leu  Lys Glu Cys
    1025                 1030                 1035
Glu Asp  Thr His Leu Gly Glu  Glu Val Asp Arg Asn  Trp Asn Glu
    1040                 1045                 1050
Val Val  Thr Gln Gln Tyr Leu  Phe Asp Arg Leu Ala  His Glu Ile
    1055                 1060                 1065
Glu Ala  Leu Lys Ser Phe Ser  Lys Ser Asp Leu Val  Ser Trp Phe
    1070                 1075                 1080
Lys Ala  His Arg Gly Pro Gly  Ser Lys Met Leu Ser  Val His Val
    1085                 1090                 1095
Val Gly  Tyr Gly Lys Tyr Glu  Leu Glu Glu Asp Gly  Ala Pro Val
    1100                 1105                 1110
Cys Glu  Asp Pro Asn Ser Arg  Glu Gly Met Gln Leu  Ile Tyr Leu
    1115                 1120                 1125
Pro Pro  Ser Pro Leu Leu Ala  Glu Ser Thr Thr Pro  Ile Thr Asp
    1130                 1135                 1140
Ile Arg  Ala Phe Thr Ala Thr  Leu Ser Leu Phe Pro  Tyr His Lys
    1145                 1150                 1155
Ile Val  Lys
    1160
<210>11
<211>1019
<212>PRT
<213>人
<400>11
Met Arg Tyr Arg Leu Ala Trp Leu Leu His Pro Ala Leu Pro Ser Thr
1               5                   10                  15
Phe Arg Ser Val Leu Gly Ala Arg Leu Pro Pro Pro Glu Arg Leu Cys
            20                  25                  30
Gly Phe Gln Lys Lys Thr Tyr Ser Lys Met Asn Asn Pro Ala Ile Lys
        35                  40                  45
Arg Ile Gly Asn His Ile Thr Lys Ser Pro Glu Asp Lys Arg Glu Tyr
    50                  55                  60
Arg Gly Leu Glu Leu Ala Asn Gly Ile Lys Val Leu Leu Met Ser Asp
65                  70                  75                  80
Pro Thr Thr Asp Lys Ser Ser Ala Ala Leu Asp Val His Ile Gly Ser
                85                  90                  95
Leu Ser Asp Pro Pro Asn Ile Ala Gly Leu Ser His Phe Cys Glu His
            100                 105                 110
Met Leu Phe Leu Gly Thr Lys Lys Tyr Pro Lys Glu Asn Glu Tyr Ser
        115                 120                 125
Gln Phe Leu Ser Glu His Ala Gly Ser Ser Asn Ala Phe Thr Ser Gly
    130                 135                 140
Glu His Thr Asn Tyr Tyr Phe Asp Val Ser His Glu His Leu Glu Gly
145                 150                 155                 160
Ala Leu Asp Arg Phe Ala Gln Phe Phe Leu Cys Pro Leu Phe Asp Glu
                165                 170                 175
Ser Cys Lys Asp Arg Glu Val Asn Ala Val Asp Ser Glu His Glu Lys
            180                 185                 190
Asn Val Met Asn Asp Ala Trp Arg Leu phe Gln Leu Glu Lys Ala Thr
        195                 200                 205
Gly Asn Pro Lys His Pro Phe Ser Lys Phe Gly Thr Gly Asn Lys Tyr
    210                 215                 220
Thr Leu Glu Thr Arg Pro Asn Gln Glu Gly Ile Asp Val Arg Gln Glu
225                 230                 235                 240
Leu Leu Lys Phe His Ser Ala Tyr Tyr Ser Ser Asn Leu Met Ala Val
                245                 250                 255
Cys Val Leu Gly Arg Glu Ser Leu Asp Asp Leu Thr Asn Leu Val Val
            260                 265                 270
Lys Leu Phe Ser Glu Val Glu Asn Lys Asn Val Pro Leu Pro Glu Phe
        275                 280                 285
Pro Glu His Pro Phe Gln Glu Glu His Leu Lys Gln Leu Tyr Lys Ile
    290                 295                 300
Val Pro Ile Lys Asp Ile Arg Asn Leu Tyr Val Thr Phe Pro Ile Pro
305                 310                 315                 320
Asp Leu Gln Lys Tyr Tyr Lys Ser Asn Pro Gly His Tyr Leu Gly His
                325                 330                 335
Leu Ile Gly His Glu Gly Pro Gly Ser Leu Leu Ser Glu Leu Lys Ser
            340                 345                 350
Lys Gly Trp Val Asn Thr Leu Val Gly Gly Gln Lys Glu Gly Ala Arg
        355                 360                 365
Gly Phe Met Phe Phe Ile Ile Asn Val Asp Leu Thr Glu Glu Gly Leu
    370                 375                 380
Leu His Val Glu Asp Ile Ile Leu His Met Phe Gln Tyr Ile Gln Lys
385                 390                 395                 400
Leu Arg Ala Glu Gly Pro Gln Glu Trp Val Phe Gln Glu Cys Lys Asp
                405                 410                 415
Leu Asn Ala Val Ala Phe Arg Phe Lys Asp Lys Glu Arg Pro Arg Gly
            420                 425                 430
Tyr Thr Ser Lys Ile Ala Gly Ile Leu His Tyr Tyr Pro Leu Glu Glu
        435                 440                 445
Val Leu Thr Ala Glu Tyr Leu Leu Glu Glu Phe Arg Pro Asp Leu Ile
    450                 455                 460
Glu Met Val Leu Asp Lys Leu Arg Pro Glu Asn Val Arg Val Ala Ile
465                 470                 475                 480
Val Ser Lys Ser Phe Glu Gly Lys Thr Asp Arg Thr Glu Glu Trp Tyr
                485                 490                 495
Gly Thr Gln Tyr Lys Gln Glu Ala Ile Pro Asp Glu Val Ile Lys Lys
            500                 505                 510
Trp Gln Asn Ala Asp Leu Asn Gly Lys Phe Lys Leu Pro Thr Lys Asn
        515                 520                 525
Glu Phe Ile Pro Thr Asn Phe Glu Ile Leu Pro Leu Glu Lys Glu Ala
    530                 535                 540
Thr Pro Tyr Pro Ala Leu Ile Lys Asp Thr Val Met Ser Lys Leu Trp
545                 550                 555                 560
Phe Lys Gln Asp Asp Lys Lys Lys Lys Pro Lys Ala Cys Leu Asn Phe
                565                 570                 575
Glu Phe Phe Ser Pro Phe Ala Tyr Val Asp Pro Leu His Cys Asn Met
            580                 585                 590
Ala Tyr Leu Tyr Leu Glu Leu Leu Lys Asp Ser Leu Asn Glu Tyr Ala
        595                 600                 605
Tyr Ala Ala Glu Leu Ala Gly Leu Ser Tyr Asp Leu Gln Asn Thr Ile
    610                 615                 620
Tyr Gly Met Tyr Leu Ser Val Lys Gly Tyr Asn Asp Lys Gln Pro Ile
625                 630                 635                 640
Leu Leu Lys Lys Ile Ile Glu Lys Met Ala Thr phe Glu Ile Asp Glu
                645                 650                 655
Lys Arg Phe Glu Ile Ile Lys Glu Ala Tyr Met Arg Ser Leu Asn Asn
            660                 665                 670
Phe Arg Ala Glu Gln Pro His Gln His Ala Met Tyr Tyr Leu Arg Leu
        675                 680                 685
Leu Met Thr Glu Val Ala Trp Thr Lys Asp Glu Leu Lys Glu Ala Leu
    690                 695                 700
Asp Asp Val Thr Leu Pro Arg Leu Lys Ala Phe Ile Pro Gln Leu Leu
705                 710                 715                 720
Ser Arg Leu His Ile Glu Ala Leu Leu His Gly Asn Ile Thr Lys Gln
                725                 730                 735
Ala Ala Leu Gly Ile Met Gln Met Val Glu Asp Thr Leu Ile Glu His
            740                 745                 750
Ala His Thr Lys Pro Leu Leu Pro Ser Gln Leu Val Arg Tyr Arg Glu
        755                 760                 765
Val Gln Leu Pro Asp Arg Gly Trp Phe Val Tyr Gln Gln Arg Asn Glu
    770                 775                 780
Val His Asn Asn Cys Gly Ile Glu Ile Tyr Tyr Gln Thr Asp Met Gln
785                 790                 795                 800
Ser Thr Ser Glu Asn Met Phe Leu Glu Leu Phe Cys Gln Ile Ile Ser
                805                 810                 815
Glu Pro Cys Phe Asn Thr Leu Arg Thr Lys Glu Gln Leu Gly Tyr Ile
            820                 825                 830
Val Phe Ser Gly Pro Arg Arg Ala Asn Gly Ile Gln Ser Leu Arg Phe
        835                 840                 845
Ile Ile Gln Ser Glu Lys Pro Pro His Tyr Leu Glu Ser Arg Val Glu
    850                 855                 860
Ala Phe Leu Ile Thr Met Glu Lys Ser Ile Glu Asp Met Thr Glu Glu
865                 870                 875                 880
Ala Phe Gln Lys His Ile Gln Ala Leu Ala Ile Arg Arg Leu Asp Lys
                885                 890                 895
Pro Lys Lys Leu Ser Ala Glu Cys Ala Lys Tyr Trp Gly Glu Ile Ile
            900                 905                 910
Ser Gln Gln Tyr Asn Phe Asp Arg Asp Asn Thr Glu Val Ala Tyr Leu
        915                 920                 925
Lys Thr Leu Thr Lys Glu Asp Ile Ile Lys Phe Tyr Lys Glu Met Leu
    930                 935                 940
Ala Val Asp Ala Pro Arg Arg His Lys Val Ser Val His Val Leu Ala
945                 950                 955                 960
Arg Glu Met Asp Ser Cys Pro Val Val Gly Glu Phe Pro Cys Gln Asn
                965                 970                 975
Asp Ile Asn Leu Ser Gln Ala Pro Ala Leu Pro Gln Pro Glu Val Ile
            980                 985                 990
Gln Asn Met Thr Glu Phe Lys Arg  Gly Leu Pro Leu Phe  Pro Leu Val
        995                 1000                 1005
Lys Pro  His Ile Asn Phe Met  Ala Ala Lys Leu
    1010                 1015
<210>12
<211>1265
<212>PRT
<213>拟南芥(Arabidopsis thaliana)
<400>12
Met Ala Ser Ser Ser Ser Ser Ile Phe Thr Gly Val Lys Phe Ser Pro
1               5                   10                  15
Ile Leu Ala Pro Phe Asn Ser Gly Asp Ser Arg Arg Ser Arg Tyr Leu
            20                  25                  30
Lys Asp Ser Arg Asn Lys Val Arg Phe Asn Pro Ser Ser Pro Arg Leu
        35                  40                  45
Thr Pro His Arg Val Arg Val Glu Ala Pro Ser Leu Ile Pro Tyr Asn
    50                  55                  60
Gly Leu Trp Ala Ala Gln Pro Asn Ser His Lys Gly Arg Leu Lys Arg
65                  70                  75                  80
Asn Ile Val Ser Gly Lys Glu Ala Thr Gly Ile Ser Leu Ser Gln Gly
                85                  90                  95
Arg Asn Phe Cys Leu Thr Cys Lys Arg Asn Gln Ala Gly Ile Arg Arg
            100                 105                 110
Ala Leu Pro Ser Ala Phe Val Asp Arg Thr Ala Phe Ser Leu Ser Arg
        115                 120                 125
Ser Ser Leu Thr Ser Ser Leu Arg Lys His Ser Gln Ile Val Asn Ala
    130                 135                 140
Thr Leu Gly Pr0 Asp Glu Pro His Ala Ala Gly Thr Ala Trp Pro Asp
145                 150                 155                 160
Gly Ile Val Ala Glu Arg Gln Asp Leu Asp Leu Leu Pro Pro Glu Ile
                165                 170                 175
Asp Ser A1a Glu Leu Glu Ala Phe Leu Gly Cys Glu Leu Pro Ser His
            180                 185                 190
Pro Lys Leu His Arg Gly Gln Leu Lys Asn Gly Leu Arg Tyr Leu Ile
        195                 200                 205
Leu Pro Asn Lys Val Pro Pro Asn Arg Phe Glu Ala His Met Glu Val
    210                 215                 220
His Val Gly Ser Ile Asp Glu Glu Glu Asp Glu Gln Gly Ile A1a His
225                 230                 235                 240
Met Ile Glu His Val Ala Phe Leu Gly Ser Lys Lys Arg Glu Lys Leu
                245                 250                 255
Leu Gly Thr Gly Ala Arg Ser Asn Ala Tyr Thr Asp Phe His His Thr
            260                 265                 270
Val Phe His Ile His Ser Pro Thr His Thr Lys Asp Ser Glu Asp Asp
        275                 280                 285
Leu Phe Pro Ser Val Leu Asp Ala Leu Asn Glu Ile Ala Phe His Pro
    290                 295                 300
Lys Phe Leu Ser Ser Arg Val Glu Lys Glu Arg Arg Ala Ile Leu Ser
305                 310                 315                 320
Glu Leu Gln Met Met Asn Thr Ile Glu Tyr Arg Val Asp Cys Gln Leu
                325                 330                 335
Leu Gln His Leu His Ser Glu Asn Lys Leu Gly Arg Arg Phe Pro Ile
            340                 345                 350
Gly Leu Glu Glu Gln Ile Lys Lys Trp Asp Val Asp Lys Ile Arg Lys
        355                 360                 365
Phe His Glu Arg Trp Tyr Phe Pro Ala Asn Ala Thr Leu Tyr Ile Val
    370                 375                 380
Gly Asp Ile Asp Asn Ile Pro Arg Ile Val His Asn Ile Glu Ala Val
385                 390                 395                 400
Phe Gly Lys Asn Gly Leu Asp Asn Glu Ser Thr Pro Ser Ser Pro Ser
                405                 410                 415
Pro Gly Ala Phe Gly Ala Met Ala Asn Phe Leu Val Pro Lys Leu Pro
            420                 425                 430
Ala Gly Leu Gly Gly Thr Phe Ser Asn Glu Lys Thr Asn Thr Ala Asp
        435                 440                 445
Gln Ser Lys Met Ile Lys Arg Glu Arg His Ala Ile Arg Pro Pro Val
    450                 455                 460
Glu His Asn Trp Ser Leu Pro Gly Thr Ser Val Asp Leu Lys Pro Pro
465                 470                 475                 480
Gln Ile Phe Lys His Glu Leu Leu Gln Asn Phe Ala Ile Asn Met Phe
                485                 490                 495
Cys Lys Ile Pro Val Ser Lys Val Gln Thr Phe Gly Asp Leu Arg Asn
            500                 505                 510
Val Leu Met Lys Arg Ile Phe Leu Ser Ala Leu His Phe Arg Ile Asn
        515                 520                 525
Thr Arg Tyr Lys Ser Ser Asn Pro Pro Phe Thr Ser Val Glu Leu Asp
    530                 535                 540
His Ser Asp Ser Gly Arg Glu Gly Cys Thr Val Thr Thr Leu Thr Val
545                 550                 555                 560
Thr Ala Glu Pro Gln Asn Trp Gln Asn Ala Val Lys Val Ala Val Gln
                565                 570                 575
Glu Val Arg Arg Leu Lys Glu Phe Gly Val Thr Arg Gly Glu Leu Thr
            580                 585                 590
Arg Tyr Met Asp Ala Leu Leu Lys Asp Ser Glu His Leu Ala Ala Met
        595                 600                 605
Ile Asp Asn Val Ser Ser Val Asp Asn Leu Asp Phe Ile Met Glu Ser
    610                 615                 620
Asp Ala Leu Ser His Thr Val Met Asp Gln Thr Gln Gly His Glu Thr
625                 630                 635                 640
Leu Val Ala Val Ala Gly Thr Val Thr Leu Glu Glu Val Asn Thr Val
                645                 650                 655
Gly Ala Lys Val Leu Glu Phe Ile Ser Asp Phe Gly Arg Pro Thr Ala
            660                 665                 670
Leu Leu Pro Ala Ala Ile Val Ala Cys Val Pro Thr Lys Val His Val
        675                 680                 685
Asp Gly Val Gly Glu Ser Asp Phe Asn Ile Ser Pro Asp Glu Ile Ile
    690                 695                 700
Glu Ser Val Lys Ser Gly Leu Leu Ala Pro Ile Glu Ala Glu Pro Glu
705                 710                 715                 720
Leu Glu Val Pro Lys Glu Leu Ile Ser Gln Ser Gln Leu Lys Glu Leu
                725                 730                 735
Thr Leu Gln Arg Asn Pro Cys Phe Val Pro Ile Pro Gly Ser Gly Leu
            740                 745                 750
Thr Lys Leu His Asp Lys Glu Thr Gly Ile Thr Gln Leu Arg Leu Ser
        755                 760                 765
Asn Gly Ile Ala Val Asn Tyr Lys Lys Ser Thr Thr Glu Ser Arg Ala
    770                 775                 780
Gly Val Met Arg Leu Ile Val Gly Gly Gly Arg Ala Ala Glu Thr Ser
785                 790                 795                 800
Asp Ser Lys Gly Ala Val Val Val Gly Val Arg Thr Leu Ser Glu Gly
                805                 810                 815
Gly Arg Val Gly Asp Phe Ser Arg Glu Gln Val Glu Leu Phe Cys Val
            820                 825                 830
Asn His Leu Ile Asn Cys Ser Leu Glu Ser Thr Glu Glu Phe Ile Ala
        835                 840                 845
Met Glu Pphe Arg Phe Thr Leu Arg Asp Asn Gly Met Gln Ala Ala Phe
    850                  855                 860
Gln Leu Leu His Met Val Leu Glu Arg Ser Val Trp Leu Glu Asp Ala
865                 870                 875                 880
Phe Asp Arg Ala Arg Gln Leu Tyr Leu Ser Tyr Phe Arg Ser Ile Pro
                885                 890                 895
Lys Ser Leu Glu Arg Ala Thr Ala His Lys Leu Met Ile Ala Met Leu
            900                 905                 910
Asn Gly Asp Glu Arg Phe Val Glu Pro Thr Pro Lys Ser Leu Gln Ser
        915                 920                 925
Leu Asn Leu Glu Ser Val Lys Asp Ala Val Met Ser His Phe Val Gly
    930                 935                 940
Asp Asn Met Glu Val Ser Ile Val Gly Asp Phe Ser Glu Glu Glu Ile
945                 950                 955                 960
Glu Arg Cys Ile Leu Asp Tyr Leu Gly Thr Val Lys Ala Ser His Asp
                965                 970                 975
Ser Ala Lys Pro Pro Gly Ser Glu Pro Ile Leu Phe Arg Gln Pro Thr
            980                 985                 990
Ala Gly Leu Gln Phe Gln Gln Val  Phe Leu Lys Asp Thr  Asp Glu Arg
        995                 1000                 1005
Ala Cys  Ala Tyr Ile Ala Gly  Pro Ala Pro Asn Arg  Trp Gly Phe
    1010                 1015                 1020
Thr Val  Asp Gly Asp Asp Leu  Phe Gln Ser Val Ser  Lys Leu Pro
    1025                 1030                 1035
Val Ala  His Asp Gly Leu Leu  Lys Ser Glu Glu Gln  Leu Leu Glu
    1040                 1045                 1050
Gly Gly  Asp Arg Glu Leu Gln  Lys Lys Leu Arg Ala  His Pro Leu
    1055                 1060                 1065
Phe Phe  Gly Val Thr Met Gly  Leu Leu Ala Glu Ile  Ile Asn Ser
    1070                 1075                 1080
Arg Leu  Phe Thr Thr Val Arg  Asp Ser Leu Gly Leu  Thr Tyr Asp
    1085                 1090                 1095
Val Ser  Phe Glu Leu Asn Leu  Phe Asp Arg Leu Lys  Leu Gly Trp
    1100                 1105                 1110
Tyr Val  Ile Ser Val Thr Ser  Thr Pro Gly Lys Val  Tyr Lys Ala
    1115                 1120                 1125
Val Asp  Ala Cys Lys Asn Val  Leu Arg Gly Leu His  Ser Asn Gln
    1130                 1135                 1140
Ile Ala  Pro Arg Glu Leu Asp  Arg Ala Lys Arg Thr  Leu Leu Met
    1145                 1150                 1155
Arg His  Glu Ala Glu Leu Lys  Ser Asn Ala Tyr Trp  Leu Asn Leu
    1160                 1165                 1170
Leu Ala  His Leu Gln Ala Ser  Ser Val Gln Arg Lys  Glu Leu Ser
    1175                 1180                 1185
Cys Ile  Lys Glu Leu Val Ser  Leu Tyr Glu Ala Ala  Ser Ile Glu
    1190                 1195                 1200
Asp Ile  Tyr Leu Ala Tyr Asn  Gln Leu Arg Val Asp  Glu Asp Ser
    1205                 1210                 1215
Leu Tyr  Ser Cys Ile Gly Ile  Ala Gly Ala Gln Ala  Gly Glu Glu
    1220                 1225                 1230
Ile Thr  Val Leu Ser Glu Glu  Glu Glu Pro Glu Asp  Val Phe Ser
    1235                 1240                 1245
Gly Val  Val Pro Val Gly Arg  Gly Ser Ser Met Thr  Thr Arg Pro
    1250                 1255                 1260
Thr Thr
    1265
<210>13
<211>534
<212>PRT
<213>人
<400>13
Met Arg Pro Asp Asp Lys Tyr His Glu Lys Gln Ala Gln Val Glu Ala
1               5                   10                  15
Thr Lys Leu Lys Gln Lys Val Glu Ala Leu Ser pro Gly Asp Arg Gln
            20                  25                  30
Gln Ile Tyr Glu Lys Gly Leu Glu Leu Arg Ser Gln Gln Ser Lys Pro
       35                   40                  45
Gln Asp Ala Ser Cys Leu Pro Ala Leu Lys Val Ser Asp Ile Glu Pro
    50                  55                  60
Thr Ile Pro Val Thr Glu Leu Asp Val Val Leu Thr Ala Gly Asp Ile
65                  70                  75                  80
Pro Val Gln Tyr Cys Ala Gln Pro Thr Asn Gly Met Val Tyr Phe Arg
                85                  90                  95
Ala Phe Ser Ser Leu Asn Thr Leu Pro Glu Glu Leu Arg Pro Tyr Val
            100                 105                 110
Pro Leu Phe Cys Ser Val Leu Thr Lys Leu Gly Cys Gly Leu Leu Asp
        115                 120                 125
Tyr Arg Glu Gln Ala Gln Gln Ile Glu Leu Lys Thr Gly Gly Met Ser
    130                 135                 140
Ala Ser Pro His Val Leu Pro Asp Asp Ser His Met Asp Thr Tyr Glu
145                 150                 155                 160
Gln Gly Val Leu Phe Ser Ser Leu Cys Leu Asp Arg Asn Leu Pro Asp
                165                 170                 175
Met Met Gln Leu Trp Ser Glu Ile Phe Asn Asn Pro Cys Phe Glu Glu
            180                 185                 190
Glu Glu His Phe Lys Val Leu Val Lys Met Thr Ala Gln Glu Leu Ala
        195                 200                 205
Asn Gly Ile Pro Asp Ser Gly His Leu Tyr Ala Ser Ile Arg Ala Gly
    210                 215                 220
Arg Thr Leu Thr Pro Ala Gly Asp Leu Gln Glu Thr Phe Ser Gly Met
225                 230                 235                 240
Asp Gln Val Arg Leu Met Lys Arg Ile Ala Glu Met Thr Asp Ile Lys
                245                 250                 255
Pro Ile Leu Arg Lys Leu Pro Arg Ile Lys Lys His Leu Leu Asn Gly
            260                 265                 270
Asp Asn Met Arg Cys Ser Val Asn Ala Thr Pro Gln Gln Met Pro Gln
        275                 280                 285
Thr Glu Lys Ala Val Glu Asp Phe Leu Arg Ser Ile Gly Arg Ser Lys
    290                 295                 300
Lys Glu Arg Arg Pro Val Arg Pro His Thr Val Glu Lys Pro Val Pro
305                 310                 315                 320
Ser Ser Ser Gly Gly Asp Ala His Val Pro His Gly Ser Gln Val Ile
                325                 330                 335
Arg Lys Leu Val Met Glu Pro Thr Phe Lys Pro Trp Gln Met Lys Thr
            340                 345                 350
His Phe Leu Met Pro Phe Pro Val Asn Tyr Val Gly Glu Cys Ile Arg
        355                 360                 365
Thr Val Pro Tyr Thr Asp Pro Asp His Ala Ser Leu Lys Ile Leu Ala
    370                 375                 380
Arg Leu Met Thr Ala Lys Phe Leu His Thr Glu Ile Arg Glu Lys Gly
385                 390                 395                 400
Gly Ala Tyr Gly Gly Gly Ala Lys Leu Ser His Asn Gly Ile Phe Thr
                405                 410                 415
Leu Tyr Ser Tyr Arg Asp Pro Asn Thr Ile Glu Thr Leu Gln Ser Phe
            420                 425                 430
Gly Lys Ala Val Asp Trp Ala Lys Ser Gly Lys Phe Thr Gln Gln Asp
        435                 440                 445
Ile Asp Glu Ala Lys Leu Ser Val Phe Ser Thr Val Asp Ala Pro Val
    450                 455                 460
Ala Pro Ser Asp Lys Gly Met Asp His Phe Leu Tyr Gly Leu Ser Asp
465                 470                 475                 480
Glu Met Lys Gln Ala His Arg Glu Gln Leu Phe Ala Val Ser His Asp
                485                 490                 495
Lys Leu Leu Ala Val Ser Asp Arg Tyr Leu Gly Thr Gly Lys Ser Thr
            500                 505                 510
His Gly Leu Ala Ile Leu Gly Pro Glu Asn Pro Lys Ile Ala Lys Asp
        515                 520                 525
Pro Ser Trp Ile Ile Arg
    530
<210>14
<211>409
<212>PRT
<213>枯草芽孢杆菌(Bacillus subtilis)
<400>14
Met Ile Lys Arg Tyr Thr Cys Pro Asn Gly Val Arg Ile Val Leu Glu
l               5                   10                  15
Asn Asn Pro Thr Val Arg Ser Val Ala Ile Gly Val Trp Ile Gly Thr
            20                  25                  30
Gly Ser Arg His Glu Thr Pro Glu Ile Asn Gly Ile Ser His Phe Leu
        35                  40                  45
Glu His Met Phe Phe Lys Gly Thr Ser Thr Lys Ser Ala Arg Glu Ile
    50                  55                  60
Ala Glu Ser Phe Asp Arg Ile Gly Gly Gln Val Asn Ala Phe Thr Ser
65                  70                  75                  80
Lys Glu Tyr Thr Cys Tyr Tyr Ala Lys Val Leu Asp Glu His Ala Asn
                85                  90                  95
Tyr Ala Leu Asp Val Leu Ala Asp Met Phe Phe His Ser Thr Phe Asp
            100                 105                 110
Glu Asn Glu Leu Lys Lys Glu Lys Asn Val Val Tyr Glu Glu Ile Lys
        115                 120                 125
Met Tyr Glu Asp Ala Pro Asp Asp Ile Val His Asp Leu Leu Ser Lys
    130                 135                 140
Ala Thr Tyr Gly Asn His Ser Leu Gly Tyr Pro Ile Leu Gly Thr Glu
145                 150                 155                 160
Glu Thr Leu Ala Ser Phe Asn Gly Asp Ser Leu Arg Gln Tyr Met His
                165                 170                 175
Asp Tyr Tyr Thr Pro Asp Arg Val Val Ile Ser Val Ala Gly Asn Ile
            180                 185                 190
Ser Asp Ser Phe Ile Lys Asp Val Glu Lys Trp Phe Gly Ser Tyr Glu
        195                 200                 205
Ala Lys Gly Lys Ala Thr Gly Leu Glu Lys Pro Glu Phe His Thr Glu
    210                 215                 220
Lys Leu Thr Arg Lys Lys Glu Thr Glu Gln Ala His Leu Cys Leu Gly
225                 230                 235                 240
Phe Lys G1y Leu Glu Val Gly His Glu Arg Ile Tyr Asp Leu Ile Val
                245                 250                 255
Leu Asn Asn Val Leu Gly Gly Ser Met Ser Ser Arg Leu Phe Gln Asp
            260                 265                 270
Val Arg Glu Asp Lys Gly Leu Ala Tyr Ser Val Tyr Ser Tyr His Ser
        275                 280                 285
Ser Tyr Glu Asp Ser Gly Met Leu Thr Ile Tyr Gly Gly Thr Gly Ala
    290                 295                 300
Asn Gln Leu Gln Gln Leu Ser Glu Thr Ile Gln Glu Thr Leu Ala Thr
305                 310                 315                 320
Leu Lys Arg Asp Gly Ile Thr Ser Lys Glu Leu Glu Asn Ser Lys Glu
                325                 330                 335
Gln Met Lys Gly Ser Leu Met Leu Ser Leu Glu Ser Thr Asn Ser Lys
            340                 345                 350
Met Ser Arg Asn Gly Lys Asn Glu Leu Leu Leu Gly Lys His Lys Thr
        355                 360                 365
Leu Asp Glu Ile Ile Asn Glu Leu Asn Ala Val Asn Leu Glu Arg Val
    370                 375                 380
Asn Gly Leu Ala Arg Gln Leu Phe Thr Glu Asp Tyr Ala Leu Ala Leu
385                 390                 395                 400
Ile Ser Pro Ser Gly Asn Met Pro Ser
                405
<210>15
<211>438
<212>PRT
<213>结核分枝杆菌(Mycobacterium tuberculosis)
<400>15
Met Pro Arg Arg Ser Pro Ala Asp Pro Ala Ala Ala Leu Ala Pro Arg
1               5                   10                  15
Arg Thr Thr Leu Pro Gly Gly Leu Arg Val Val Thr Glu Phe Leu Pro
            20                  25                  30
Ala Val His Ser Ala Ser Val Gly Val Trp Val Gly Val Gly Ser Arg
        35                  40                  45
Asp Glu Gly Ala Thr Val Ala Gly Ala Ala His Phe Leu Glu His Leu
    50                  55                  60
Leu Phe Lys Ser Thr Pro Thr Arg Ser Ala Val Asp Ile Ala Gln Ala
65                  70                   75                  80
Met Asp Ala Val Gly Gly Glu Leu Asn Ala Phe Thr Ala Lys Glu His
                85                  90                  95
Thr Cys Tyr Tyr Ala His Val Leu Gly Ser Asp Leu Pro Leu Ala Val
            100                 105                 110
Asp Leu Val Ala Asp Val Val Leu Asn Gly Arg Cys Ala Ala Asp Asp
        115                 120                 125
Val Glu Val Glu Arg Asp Val Val Leu Glu Glu Ile Ala Met Arg Asp
    130                 135                 140
Asp Asp Pro Glu Asp Ala Leu Ala Asp Met Phe Leu Ala Ala Leu Phe
145                 150                 155                 160
Gly Asp His Pro Val Gly Arg Pro Val Ile Gly Ser Ala Gln Ser Val
                165                 170                 175
Ser Val Met Thr Arg Ala Gln Leu Gln Ser Phe His Leu Arg Arg Tyr
            180                 185                 190
Thr Pro Glu Arg Met Val Val Ala Ala Ala Gly Asn Val Asp His Asp
        195                 200                 205
Gly Leu Val Ala Leu Val Arg Glu His Phe Gly Ser Arg Leu Val Arg
    210                 215                 220
Gly Arg Arg Pro Val Ala Pro Arg Lys Gly Thr Gly Arg Val Asn Gly
225                 230                 235                 240
Ser Pro Arg Leu Thr Leu Val Ser Arg Asp Ala Glu Gln Thr His Val
                245                 250                 255
Ser Leu Gly Ile Arg Thr Pro Gly Arg Gly Trp Glu His Arg Trp Ala
            260                 265                 270
Leu Ser Val Leu His Thr Ala Leu Gly Gly Gly Leu Ser Ser Arg Leu
        275                 280                 285
Phe Gln Glu Val Arg Glu Thr Arg Gly Leu Ala Tyr Ser Val Tyr Ser
    290                 295                 300
Ala Leu Asp Leu Phe Ala Asp Ser Gly Ala Leu Ser Val Tyr Ala Ala
305                 310                 315                 320
Cys Leu Pro Glu Arg Phe Ala Asp Val Met Arg Val Thr Ala Asp Val
                325                 330                 335
Leu Glu Ser Val Ala Arg Asp Gly Ile Thr Glu Ala Glu Cys Gly Ile
            340                 345                 350
Ala Lys Gly Ser Leu Arg Gly Gly Leu Val Leu Gly Leu Glu Asp Ser
        355                 360                 365
Ser Ser Arg Met Ser Arg Leu Gly Arg Ser Glu Leu Asn Tyr Gly Lys
    370                 375                 380
His Arg Ser Ile Glu His Thr Leu Arg Gln Ile Glu Gln Val Thr Val
385                 390                 395                 400
Glu Glu Val Asr Ala Val Ala Arg His Leu Leu Ser Arg Arg Tyr Gly
                405                 410                 415
Ala Ala Val Leu Gly Pro His Gly Ser Lys Arg Ser Leu Pro Gln Gln
            420                 425                 430
Leu Arg Ala Met Val Gly
        435
<210>16
<211>34
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>16
aatagaagct tgtcgactga tctatccaaa actg                                  34
<210>17
<211>66
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>17
aaaagagctc ggccagatct tctagaggat ccaagaattc tgttttatat ttgttgtaaa      60
aagtag                                                                 66
<210>18
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>18
ttttgaattc caagatctcc catgtctcta ctggtgg                               37
<210>19
<211>41
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>19
ccccgagctc gtcgaccctt ctcgaaagct ttaacgaacg c                          41
<210>20
<211>43
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>20
ttttgaattc aaagaatgag atttccttca atttttactg cag                        43
<210>21
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>2l
tttttctaga ctaggagggg tactcatact cctcggc                               37
<210>22
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>22
cgaatgtcca tcgttgcgaa cctgcagaac ctg                                   33
<210>23
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>23
caggttctgc aggttcctaa cgatggacat tcg                                   33
<210>24
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>24
cgaatgtcca tcgttaggaa cctgcagaac ctg                                   33
<210>25
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>25
caggttctgc aggttcctaa cgatggacat tcg                                   33
<210>26
<211>18
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>26
tcgcagagaa cggatggc                                                    18
<210>27
<211>36
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>27
ttttgggccc ttcatggtga tacggtatct cttggc                                36
<210>28
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>28
ttttctcgag aaggtggaac atactgccct gggatgg                               37
<210>29
<211>38
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>29
ttttgagctc gtttaggaaa cgtccttggc ggagatgc                              38
<210>30
<211>40
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>30
tttttctaga cactgcgaat ccatggtata aaccaaaacc                            40
<210>31
<211>24
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>31
gtcgttgttc atggacatac ctcc                                             24
<210>32
<211>26
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>32
tacaaatgtt cttctgccat ttctgg                                           26
<210>33
<211>32
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>33
ggttcatatg cgccggagct cctcgacagc ag                                    32
<210>34
<211>37
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>34
ggttcctagg atccgcaagt ttgattccat tgcggtg                               37
<210>35
<211>70
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>35
ttaaagagta ccttggctat agaataccgt agagataaag acctgaatag agattgtact      60
gagagtgcac                                                             70
<210>36
<211>70
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>36
aggtattata actatttttc tgtatttttt atatattttt atttgccaag ctgtgcggta      60
tttcacaccg                                                             70
<210>37
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>37
ctttggttaa agagtacctt ggc                                              23
<210>38
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>38
tactacgaaa agcgtgtgcg agg                                              23
<210>39
<211>71
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>39
tagaaggcta ctcaaaagaa taaagttact ataaaatata ctgcggtata tagattgtac      60
tgagagtgca c                                                           71
<210>40
<211>70
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>40
gatcggcaag aaactttgaa gcagtatatt tacaggatta aattatatat ctgtgcggta      60
tttcacaccg                                                             70
<210>41
<211>22
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>41
cggaggggct ctatgataaa gg                                               22
<210>42
<211>23
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸
<400>42
gagtaactag ggcttctctt ccc                                              23
<210>43
<211>85
<212>PRT
<213>人
<400>43
Ser Gly Leu Gln Arg Ala Glu Glu Ala Pro Arg Arg Gln Leu Arg Val
1               5                   10                  15
Ser Gln Arg Thr Asp Gly Glu Ser Arg Ala His Leu Gly Ala Leu Leu
            20                  25                  30
Ala Arg Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser
        35                  40                  45
Ile Val Lys Asr Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp
    50                  55                  60
Arg Asp Tyr Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu
65                  70                  75                  80
Tyr Glu Tyr Pro Ser
                85
<210>44
<211>22
<212>PRT
<2l3>人
<400>44
Gln Leu Arg Val Ser Gln Arg Thr Asp Gly Glu Ser Arg Ala His Leu
1               5                   10                  15
Gly Ala Leu Leu Ala Arg
            20
<210>45
<211>19
<212>PRT
<213>人
<400>45
Val Ser Gln Arg Thr Asp Gly Glu Ser Arg Ala His Leu Gly Ala Leu
1               5                   10                  15
Leu Ala Arg
<210>46
<211>51
<212>PRT
<213>人
<400>46
Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser Ile Val
1               5                   10                  15
Lys Asn Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp Arg Asp
            20                  25                  30
Tyr Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu Tyr Glu
        35                  40                  45
Tyr Pro Ser
    50
<210>47
<211>17
<212>PRT
<213>人
<400>47
Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser Ile Val
1               5                   10                  15
Lys
<210>48
<211>16
<212>PRT
<213>人
<400>48
Tyr Ile Gln Gln Ala Arg Lys Ala Pro Ser Gly Arg Met Ser Ile Val
1               5                   10                  15
<210>49
<211>13
<212>PRT
<213>人
<400>49
Asn Leu Gln Asr Leu Asp Pro Ser His Arg Ile Ser Asp
1               5                   10
<210>50
<211>23
<212>PRT
<213>人
<400>50
Asn Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp Arg Asp Tyr
1               5                   10                  15
Met Gly Trp Met Asp Phe Gly
            20
<210>51
<211>34
<212>PRT
<213>人
<400>51
Asn Leu Gln Asn Leu Asp Pro Ser His Arg Ile Ser Asp Arg Asp Tyr
1               5                   10                  15
Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu Tyr Glu Tyr
            20                  25                  30
Pro Ser
<210>52
<211>20
<212>PRT
<213>人
<400>52
Asp Tyr Met Gly Trp Met Asp Phe Gly Arg Arg Ser Ala Glu Glu Tyr
1               5                   10                  15
Glu Tyr Pro Ser
            20
<210>53
<211>12
<212>PRT
<213>人工序列
<220>
<223>Portion of fusion protein
<400>53
Lys Arg Glu Ala Glu Ala Ser Gly Leu Gln Arg Ala
1               5                   10
<210>54
<211>9
<212>PRT
<213>人
<400>54
Arg Met Ser Ile Val Lys Asn Leu Gln
1               5
<210>55
<211>13
<212>PRT
<213>人
<400>55
Asp Arg Asp Tyr Met Gly Trp Met Asp Phe Gly Arg Arg
1               5                   10
<210>56
<211>48
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸MFa1BNP(S)
<400>56
ggataaaaga gaggctgaag ctcacccgct gggcagcccc ggttcagc                   48
<210>57
<211>48
<212>DNA
<213>人工序列
<220>
<223>MF1aBNP(AS)
<400>57
gctgaaccgg ggctgcccag cgggtgagct tcagcctctc ttttatcc                   48
<210>58
<211>34
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸BNP5′EcoRI
<400>58
ttttgaattc atggatcccc agacagcacc ttcc                                  34
<210>59
<211>33
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸BNP3′Xbal
<400>59
tttttctaga ttaatgccgc ctcagcactt tgc                                   33
<210>60
<211>48
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸MF1BNP(S)
<400>60
ggataaaaga gaggctgaag ctcacccgct gggcagcccc ggttcagc                   48
<210>61
<211>48
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸MF1BNP(AS)
<400>61
gctgaaccgg ggctgcccag cgggtgagct tcagcctctc ttttatcc                   48
<210>62
<211>69
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸YPS15′GD400
<400>62
aaaaagataa ggtgaacacc aagcatatag tataatatta cctaccacat gattgtactg      60
agagtgcac                                                              69
<210>63
<211>70
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸YPS13′GD400
<400>63
aactccaact ggcttggaga tgtgaatgtc taaactttgt gcaacggttt ctgtgcggta      60
tttcacaccg                                                             70
<210>64
<211>20
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸YPS15′DC
<400>64
tcgtttcact gatgtgtccg                                                  20
<210>65
<211>21
<212>DNA
<213>人工序列
<220>
<223>寡核苷酸YPS15′DC
<400>65
gattataggc catatcccag g                                                21
<210>66
<211>13
<212>PRT
<213>人工序列
<220>
<223>Pitrilysin共有序列
<221>变体
<222>(1)...(13)
<223>Xaa=任一氨基酸
<221>变体
<222>(1)...(13)
<223>Xaa=任一氨基酸
<221>变体
<222>(1)...(13)
<223>Xaa=任一氨基酸
<221>未确定
<222>(0)...(0)
<400>66
Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly
 1               5                  10
<210>67
<211>44
<212>PRT
<213>人工序列
<220>
<223>Pitrilysin共有序列
<221>变体
<222>(1)...(44)
<223>Xaa=任一氨基酸
<221>变体
<222>(1)...(44)
<223>Xaa=任一氨基酸
<221>变体
<222>(1)...(44)
<223>Xaa=任一氨基酸
<221>变体
<222>(34)...(34)
<223>Xaa=任一氨基酸或不存在
<221>变体
<222>(35)...(35)
<223>Xaa=任一氨基酸或不存在
<400>67
Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Xaa
 1               5                  10                  15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
            20                  25                  30
Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr
        35                  40
<210>68
<211>44
<212>PRT
<213>人工序列
<220>
<223>Pitrilysin共有序列
<221>变体
<222>(1)...(44)
<223>Xaa=任一氨基酸
<221>变体
<222>(1)...(44)
<223>Xaa=任一氨基酸
<221>变体
<222>(1)...(44)
<223>Xaa=任一氨基酸
<221>变体
<222>(34)...(34)
<223>Xaa=任一氨基酸或不存在
<221>变体
<222>(35)...(35)
<223>Xaa=任一氨基酸或不存在
<400>68
Gly Xaa Xaa His Xaa Xaa Glu His Xaa Xaa Xaa Xaa Gly Xaa Xaa Lys
 1               5                  10                  15
Tyr Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa Xaa Xaa
            20                  25                  30
Xaa Xaa Xaa Asn Ala Xaa Thr Xaa Xaa Xaa Xaa Thr
        35                  40

Claims (22)

1.用于在宿主细胞中产生目的蛋白质的方法,其中所述宿主细胞已经遗传修饰,从而与相应的未经修饰细胞相比,在相同条件下培养时表达显著降低水平的包含HXXEH基元(SEQ ID NO 1)的金属蛋白酶,所述方法包括:
a)向宿主细胞中导入编码目的蛋白质的核酸序列;
b)在适当的生长培养基中培养步骤(a)的宿主细胞,以产生目的蛋白质;以及
c)分离目的蛋白质。
2.根据权利要求1的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端70和80个氨基酸之间的谷氨酸残基。
3.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第一个组氨酸残基N-端3个氨基酸的甘氨酸残基。
4.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端5个氨基酸的甘氨酸残基。
5.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端8个氨基酸的赖氨酸残基。
6.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端9个氨基酸的酪氨酸残基。
7.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含位于HXXEH基元第二个组氨酸残基C-端10个氨基酸的脯氨酸残基。
8.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含共有序列SEQ ID NO 2。
9.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还包含共有序列SEQ ID NO 3。
10.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶还在HXXEH基元第二个组氨酸残基C-端20和30个氨基酸之间包含NAXTXXXXT基元。
11.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶选自:
i)由SEQ ID NO 4到15组成的组中的任何一个序列;以及
ii)与SEQ ID NO 4到15中任一序列至少80%相同的序列。
12.根据前述权利要求中任意一项所述的方法,其中金属蛋白酶与SEQ ID NO:4至少80%相同。
13.根据前述权利要求中任意一项所述的方法,其中目的蛋白质的总量与相应的未经修饰细胞相比在相同条件下培养时至少增加5%。
14.根据前述权利要求中任意一项所述的方法,其中目的蛋白质的总量与相应的未经修饰细胞相比在相同条件下培养时至少增加50%。
15.根据前述权利要求中任意一项所述的方法,其中宿主细胞为原核细胞。
16.根据权利要求1-14中任意一项所述的方法,其中宿主细胞为真核细胞。
17.根据权利要求16的方法,其中宿主细胞为非丝状真菌细胞。
18.根据权利要求16的方法,其中宿主细胞为丝状真菌细胞。
19.根据权利要求17的方法,其中宿主细胞为酵母属菌株。
20.根据权利要求19的方法,其中宿主细胞为酿酒酵母。
21.用于表达目的蛋白质的宿主细胞,其中所述细胞已经遗传修饰,从而与相应的未经修饰细胞相比,当在相同条件下培养时表达显著降低水平的包含HXXEH基元(SEQ ID NO 1)的金属蛋白酶。
22.根据权利要求21的宿主细胞,其中金属蛋白酶还包含共有序列SEQ ID NO 3。
CNA038252848A 2002-09-20 2003-09-19 增加宿主细胞重组多肽产量的方法 Pending CN1701119A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DKPA200201391 2002-09-20
DKPA200201391 2002-09-20

Publications (1)

Publication Number Publication Date
CN1701119A true CN1701119A (zh) 2005-11-23

Family

ID=32010903

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038252848A Pending CN1701119A (zh) 2002-09-20 2003-09-19 增加宿主细胞重组多肽产量的方法

Country Status (7)

Country Link
US (1) US20060121565A1 (zh)
EP (1) EP1546342A2 (zh)
JP (1) JP2005538731A (zh)
CN (1) CN1701119A (zh)
AU (1) AU2003263163A1 (zh)
CA (1) CA2499467A1 (zh)
WO (1) WO2004027067A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102639559A (zh) * 2009-11-25 2012-08-15 诺沃—诺迪斯克有限公司 用于制备多肽的方法
CN109071611A (zh) * 2016-05-06 2018-12-21 葛兰素史克知识产权开发有限公司 产生重组蛋白的方法
CN110177879A (zh) * 2016-12-22 2019-08-27 拉勒曼德匈牙利流动性管理有限责任公司 重组酵母宿主细胞的亚硫酸盐耐受性
CN111315763A (zh) * 2017-10-03 2020-06-19 保尔特纺织品公司 用于生产重组丝的经修饰菌株

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2630224T3 (es) 2003-10-22 2017-08-18 Keck Graduate Institute Métodos para sintetizar polipéptidos heteromultiméricos en levadura con el uso de una estrategia de apareamiento haploide
EP2037596B1 (en) 2006-06-19 2013-11-20 NTT DoCoMo, Inc. Transmission of broadcast information on traffic and control channels
US20090253173A1 (en) * 2008-04-08 2009-10-08 Danisco Us Inc., Genencor Division Filamentous fungi with inactivated protease genes for altered protein production
JP2013509181A (ja) * 2009-10-30 2013-03-14 メルク・シャープ・エンド・ドーム・コーポレイション ジペプチジルアミノペプチダーゼ活性を欠くピチア・パストリスにおける治療用タンパク質の製造方法
CN112041486A (zh) * 2017-12-11 2020-12-04 鲍鱼生物股份有限公司 周质空间中蛋白质的酵母展示
CN111727244B (zh) * 2018-02-14 2023-09-15 休斯敦系统大学 循环肿瘤细胞的通用检测探针

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5508192A (en) * 1990-11-09 1996-04-16 Board Of Regents, The University Of Texas System Bacterial host strains for producing proteolytically sensitive polypeptides
US5508182A (en) * 1991-02-13 1996-04-16 Schneider; Manfred P. Esterification of hydrophilic polyols by adsorption onto a solid support and employing a substrate-immiscible solvent
WO1996029391A1 (en) * 1995-03-20 1996-09-26 Novo Nordisk A/S Host cell expressing reduced levels of a metalloprotease and methods using the host cell in protein production
AU3256397A (en) * 1996-06-05 1998-01-05 Gist-Brocades B.V. Fungal metallo protease genes
GB9727471D0 (en) * 1997-12-30 1998-02-25 Genencor Int Bv Proteases from gram positive organisms

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102639559A (zh) * 2009-11-25 2012-08-15 诺沃—诺迪斯克有限公司 用于制备多肽的方法
CN102639559B (zh) * 2009-11-25 2015-04-29 诺沃—诺迪斯克有限公司 用于制备多肽的方法
CN109071611A (zh) * 2016-05-06 2018-12-21 葛兰素史克知识产权开发有限公司 产生重组蛋白的方法
CN110177879A (zh) * 2016-12-22 2019-08-27 拉勒曼德匈牙利流动性管理有限责任公司 重组酵母宿主细胞的亚硫酸盐耐受性
CN111315763A (zh) * 2017-10-03 2020-06-19 保尔特纺织品公司 用于生产重组丝的经修饰菌株

Also Published As

Publication number Publication date
WO2004027067A3 (en) 2004-08-19
AU2003263163A1 (en) 2004-04-08
EP1546342A2 (en) 2005-06-29
JP2005538731A (ja) 2005-12-22
US20060121565A1 (en) 2006-06-08
CA2499467A1 (en) 2004-04-01
WO2004027067A2 (en) 2004-04-01

Similar Documents

Publication Publication Date Title
CN1174100C (zh) 用重组生物体生产甘油的方法
CN1249239C (zh) 合成有机产物的方法和材料
CN1202253C (zh) 用重组生物体生产甘油的方法
CN1253574C (zh) 来自米曲霉的areA基因和其中areA基因已被修饰的真菌
CN1262639C (zh) 新的宿主细胞和生产蛋白质的方法
CN1852983A (zh) 蛋白质从酵母的分泌
US11795487B2 (en) Fungal cell with improved protein production capacity
CN1161461C (zh) 碱性磷酸酶在酵母中的表达
CN1225550C (zh) 表达降低水平的金属蛋白酶的宿主细胞和在蛋白质产生中使用该宿主细胞的方法
CN1836038A (zh) 制备分泌型多肽的方法
CN1622998A (zh) 丝状真菌来源的赖氨酰氧化酶
CN1267556C (zh) 提高丝状真菌中血红素蛋白产量的方法
CN1701119A (zh) 增加宿主细胞重组多肽产量的方法
CN1253575C (zh) 用共有翻译起始区序列制备多肽的方法
CN1216988C (zh) 分泌型Kex衍生物的制造方法
CN1592785A (zh) 酵母中来自Tritirachium album的重组蛋白酶K的表达
CN1545553A (zh) 生产重组胰蛋白酶的方法
CN1969041A (zh) 用于生产多肽的信号肽
CN1268746C (zh) 用于在真菌细胞中生产多肽的方法
CN1301307A (zh) 在丝状真菌突变细胞中生产多肽的方法
CN1216901C (zh) 使用加工酶的嵌合蛋白质的切断方法
Krasovska et al. Glucose‐induced production of recombinant proteins in Hansenulapolymorpha mutants deficient in catabolite repression
CN1930292A (zh) 硼酸抗性给予蛋白质及其基因
CN1934250A (zh) 新的醇脱氢酶
CN1517436A (zh) 氧化还原酶

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication