CN101107361B - 二硫桥连双链形式的蛋白质的重组表达 - Google Patents

二硫桥连双链形式的蛋白质的重组表达 Download PDF

Info

Publication number
CN101107361B
CN101107361B CN2006800029573A CN200680002957A CN101107361B CN 101107361 B CN101107361 B CN 101107361B CN 2006800029573 A CN2006800029573 A CN 2006800029573A CN 200680002957 A CN200680002957 A CN 200680002957A CN 101107361 B CN101107361 B CN 101107361B
Authority
CN
China
Prior art keywords
ile
asn
leu
lys
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800029573A
Other languages
English (en)
Other versions
CN101107361A (zh
Inventor
沃尔克·施佩希特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merz Pharma GmbH and Co KGaA
Original Assignee
Merz Pharma GmbH and Co KGaA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Merz Pharma GmbH and Co KGaA filed Critical Merz Pharma GmbH and Co KGaA
Publication of CN101107361A publication Critical patent/CN101107361A/zh
Application granted granted Critical
Publication of CN101107361B publication Critical patent/CN101107361B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/21Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/33Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Clostridium (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Epidemiology (AREA)
  • Oncology (AREA)
  • Communicable Diseases (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明涉及以双链形式产生多肽或蛋白质的方法,该方法通过在大肠杆菌中的重组表达,由此i)所述多肽或蛋白质作为双链多肽或蛋白质发挥其功能,ii)第一链的C末端氨基酸基团是Arg或Lys基团,iii)所述蛋白质/多肽的第二链在其N末端具有1-20个氨基酸基团和称为PRS的五肽序列VPXGS,其中X可以是任何天然存在的氨基酸,其中V代表Val、Leu、Ile、Ala、Phe、Pro或Gly,P代表Pro、Leu、Ile、Ala、Phe、Val或Gly,G代表Gly、Leu、Ile、Ala、Pro、Phe或Val,而S代表Ser、Tyr、Trp或Thr;以及iv)所述方法包含以下步骤:a)在核酸水平修饰所述多肽或蛋白质,使经修饰形式的该多肽或蛋白质在其环区域包含序列VPXGS,其中X、V、P、G和S如上所定义;b)引入所述在核酸水平修饰的构建体到大肠杆菌细胞中;c)培养并且随后裂解所述宿主细胞;以及d)分离双链多肽或蛋白质。根据本发明的优选实施方案,所述多肽或蛋白质是肉毒杆菌神经毒素,特别是肉毒杆菌神经毒素(BoNT(A))A型。

Description

二硫桥连双链形式的蛋白质的重组表达
本发明的一个方面涉及通过在大肠杆菌宿主细胞中的重组表达产生双链形式的蛋白质的方法。本发明的另一个方面涉及双链生物学活性形式的蛋白质或多肽,其可通过前述的方法产生。
它们与相应的不呈现本发明特征的重组蛋白质/多肽相比,重要的优势在于不必为了定向切割多肽链而用特异性蛋白酶处理,因而产生方法得以显著简化。本发明的其它方面为:编码根据本发明的多肽/蛋白质的核酸;含有这样的核酸或核酸序列的载体;含有前述载体的宿主细胞;和最后含有双链和生物学活性蛋白质/多肽的药物制剂。
梭菌神经毒素是神经细胞中钙依赖性神经递质的分泌的强抑制剂。在通过口腔摄入肉毒杆菌毒素(BoNT)(例如通过腐败的食物)之后,将出现被称作肉毒中毒的临床现象,其特征在于多种肌肉的麻痹。呼吸肌的麻痹最终可导致患者的死亡。在这种情况中,从神经到肌肉的信号转移在肌感受器(myoceptor)处被中断,因为运动神经元不再能够分泌乙酰胆碱。肉毒杆菌神经毒素通过蛋白水解切割参与该分泌过程的蛋白质,即所谓SNARE蛋白,来产生它们的抑制作用。在这里,不同血清型的神经毒素在SNARE蛋白和各自氨基酸序列的切割位点方面具有不同的特异性。BoNT(A)和BoNT(E)切割SNARE蛋白SNAP-25,而BoNT(C)将SNAP-25以及突触融合蛋白-1识别为底物。同样,血清型B、D、F和G的毒素以及破伤风毒素(TeNT)切割VAMP-2(synaprobrevin-2)(Schiavo et al.,1997)。
梭菌神经毒素是已知的最强的毒药。例如,导致剂量组所有小鼠的一半死于肉毒中毒的静脉给药致死剂量仅为5pg。大多数血清型的毒素当口服时也是有毒的,这是由于它们被包埋在复合蛋白质中,因此在通过胃肠道时免遭消化酶分解。人们还认为它们在通过小肠上皮细胞再吸收毒素中起作用(Fujinaga,1997)。
在过去的几十年中,血清型A和B的肉毒杆菌毒素已经在治疗中得到了应用。例如,通过定位注射仅最小剂量即可能松弛个体慢性痉挛的肌肉。一个特别的优点是长效,例如,BoNT(A)和BoNT(B)的效力多于三到六个月。最先的适应证包括张力失常,例如斜颈(torticollia)、睑痉挛和斜视;又增加了更多的适应证,例如多汗或用于平滑皱纹的美容治疗。肉毒杆菌作为治疗剂的市场增长迅速,相当重要的原因是发展了更多的适应证,而且在已有的用途中有了更加广泛的使用。在这样的背景下,人们尝试了对神经毒素在活性持续时间、效力和抗原潜力方面的性质加以改进。测试显示商业上可获得的制剂(可获自Allergen的BOTOX和可获自Ipsen-Beaufort的Dysport,均为BoNT(A)制剂;以及可获自Elan的Myobloc/Neurobloc,为BoNT(B)制剂)中含有的复合蛋白质对活性持续时间和效力不具积极影响,但是由于蛋白质量比具有相同活性的纯神经毒素制剂更高,可导致患者免疫反应的触发,使进一步的注射变得无效。
由于复合蛋白质在活性成分制剂中不是必需的,甚至是不利的,并且某些用于改进特性的修饰只能通过基因技术完成,因此人们对通过重组表达产生神经毒素存在强烈的需求,例如,通过在大肠杆菌中的表达(以这种方式产生的神经毒素不含前述的复合蛋白质)。此外由于肉毒杆菌毒素将被赋予不同的细胞特异性,将发展新的适应证。这里,通过重组毒素或毒素衍生物的途径同样是优选的。
肉毒杆菌毒素以及破伤风毒素在它们的氨基酸序列上具有高同源性,并且特别是在其域结构方面是相似的。它们由受体结合域(HC)、易位域(HN)和催化亚基(L)组成,其导致神经细胞中相应SNARE蛋白的切割。HC负责神经毒素特异性结合到肌感受器,而易位域保证L能够通过核内体进入神经元的细胞质。HN(N末端)和HC(C末端)形成100kDa的重链,而L是轻链,形成50kDa的催化亚基。两种多肽链彼此通过二硫键相连。在参与的半胱氨酸残基之间有接头区或环区(还同义地称为接头序列或环序列,或更简单的,称为接头或环),其长度在各种血清型的肉毒杆菌毒素之间变化很大。最迟在细胞溶胞过程中从梭菌释放毒素时,该环被至今还未定性的梭菌内肽酶切割,其中切割和未切割的种类的比率在血清型之间有所不同。对于神经毒素的活性而言,将环切割成双链毒素是关键的(Schiavo et al.,1997)。例如,在肉毒杆菌神经毒素A的情况下,从环中,即环序列VRGIITSKTKSLDKGYNKALNDL中,切出一个十肽,其在N末端以及C末端有半胱氨酸残基直接相邻,不仅一个肽键被切割,而且发生两个蛋白酶切割作用。在这种情况下,生物活性的肉毒杆菌神经毒素A的分子量天然地低于原本在梭菌中翻译的毒素的分子量。
因为其他宿主生物体例如大肠杆菌中不存在梭菌蛋白酶,重组肉毒杆菌毒素和它们的片段或衍生物在其中作为单链肽表达。对于任何其它作为双链蛋白发挥其正常生物/生化活性的蛋白质而言也是如此:一般而言,这种蛋白质通过重组DNA技术作为单链蛋白获得,它们天然作为双链蛋白发挥的生物/生化活性因此几乎不存在或完全不存在。
在过去,为了产生活性的蛋白质,尤其是活性的肉毒杆菌毒素,必须插入序列特异性蛋白酶(例如凝血酶、因子Xa AA或genenase)的识别序列,使得在纯化之后,能够通过添加内切蛋白酶进行切割并由此进行活化。这种内切蛋白酶的使用主要有两种的缺点:一方面,不能在任何情况下排除这样的可能,即除了通过基因技术方法添加的切割位点之外,氨基酸序列中还存在其它添加的切割位点。即使当这些次要切割位点的切割效率显著较低时,在蛋白酶处理之后,毒素的不同切割变体的混合物可导致分离上的困难。另一方面,在药物制剂的情况下,由于制药法律(受规章限制的考虑因素)的原因,后续添加蛋白质或让制剂接触其它蛋白质是非常不利的,因为必须证明该蛋白质和其可能存在的污染物在进一步的处理中得以完全去除;这通常需要相当的花费。
对于其它细菌毒素(例如假单胞菌外毒素或白喉毒素),也需要通过蛋白水解切割成双链二硫桥连多肽的活化来使酶域发挥毒性作用(例如,通过ADP核糖基化延伸因子并且由此抑制蛋白质合成)。这些毒素用于产生所谓的免疫毒素,特别是用于肿瘤治疗。为了这种目的,将毒素的细胞结合域换成对肿瘤特异表面蛋白(分化抗原或肿瘤相关抗原)具有高结合亲和力的蛋白质域。在经典的免疫毒素中这些蛋白质域由单克隆抗体或其片段组成,但也可以利用下述蛋白质来赋予针对某些肿瘤细胞的特异性,仅举数例:细胞因子、生长因子以及affilin、锚蛋白重复蛋白或经过突变和选择的anticalin家族蛋白质等。在这种融合蛋白的重组表达中,获得单链多肽。然而,例如,除了蓖麻(Ricinus communis)的蛋白酶以外,蓖麻毒蛋白没有蛋白酶加工位点,而必须插入这种位点,白喉毒素片段和假单胞菌外毒素片段作为免疫毒素的组成部分能够在内在化于内体区室中之后被目标细胞的蛋白酶所切割。这在形成二硫键的半胱氨酸残基之间的环区域中发生。然而,仅仅最小部分而非全部内在化的免疫毒素分子以这种方式被加工(Ogata et al.,1990)。
为了以足够的数量和可溶的形式获得重组蛋白,尤其是较小的多肽,在许多情况下必须将它们作为融合蛋白或杂合蛋白,例如与谷胱甘肽-S-转移酶或麦芽糖结合蛋白融合或杂合的蛋白在大肠杆菌中表达。此外,市场上有许多借助用于亲和纯化的N-末端或C-末端标签(例如His标签、Strep标签或FLAG标签)来表达所需多肽的表达系统。许多情况下,表达质粒中在插入所需蛋白的编码DNA序列的多克隆位点和融合配偶体(fusion partner)或亲和标记物的编码序列之间存在蛋白酶识别序列。该序列被这样设计,使得在表达和纯化融合蛋白之后,通过添加合适的序列特异内切蛋白酶(例如,凝血酶、因子Xa或genenase),能够将所需蛋白从额外的肽区域分离出来。如果两种融合配偶体通过二硫键而非肽键彼此共价结合,则在纯化之后借助含巯基物质例如β-巯基乙醇、DTT或还原谷胱甘肽的简单还原作用将其彼此分离是可能的。例如,可使用前述还原剂将所需的蛋白质从亲和基质(例如Ni-NTA琼脂糖或StrepTactin琼脂糖)洗脱,而亲和标签保持与基质结合。这样就可以免去分离亲和标签的进一步纯化步骤或添加内切蛋白酶。
因此,最好提供一种方法,用来重组表达各种蛋白质/多肽,尤其是神经毒素和所述神经毒素的片段和衍生物以及融合蛋白或杂合蛋白,特别是用来重组表达这样的免疫毒素:其在宿主细胞裂解之后已经以其生物活性的双链结构存在,其中所述两条链是二硫桥连的。本文所述的发明提供了这种用于产生这些蛋白质和多肽的方法。
令人惊讶的是,发明者们发现,当BoNT(A)的LHN片段或完整的神经毒素A——二者通过重组表达作为单链获得,但均以双链二硫桥连形式发挥它们正常的生物/生化活性——被施以至少一个特定的修饰,优选核酸水平的修饰时,可通过重组表达以双链形式获得LHN片段和完整的毒素。发明者进行的后续测试已证明,对于任何其他蛋白质/多肽也是如此,如果它们依照常规重组方法作为单链获得但以双链二硫键形式发挥其生物活性的话。
前述“至少一个修饰”在BoNT(A)的情况下或在BoNT(A)的LHN片段的情况下,涉及一种五肽序列的插入,该五肽序列在本文中称为PRS(蛋白酶识别位点)。对于蛋白质/多肽的一般情况,可以对存在于待修饰(优选在核酸水平)的蛋白质/多肽中的五肽序列进行这样的修饰(例如,通过替换至少一个氨基酸残基或通过插入PRS的少数氨基酸残基或通过缺失氨基酸残基),使得其与插入到已经存在的序列中的五肽序列PRS一致。以相同的方式可插入六/七/八(等)肽序列插入,需要或不需要缺失一个或两个或三个或数个氨基酸残基。依照本发明,有利无害的是最终表达的多肽在其环区域具有PRS(五肽)序列,其中所述“环区域”根据本发明定义为位于两个参与二硫键的半胱氨酸残基之间的氨基酸序列。当该PRS序列存在于环区域时将产生这样的结果,即在切断多肽序列PRS相邻的单链多肽后(在氨基酸水平),天然存在于两条不同链中的序列也被分到两条不同的链上。在肉毒杆菌神经毒素A(BoNT(A))的情况下,该PRS序列优选地通过缺失BoNT(A)的五肽Asp443-Asp447而插入到环中(参见图3-1)。在其它蛋白质/多肽中(例如,在BoNT(B)、BoNT(Cl)、BoNT(D)、BoNT(E)的情况下,在蓖麻毒蛋白的情况下,在假单胞菌外毒素PE40的情况下或在白喉毒素(DT)的情况下),则优选将经修饰的BoNT(A)的环插入到环序列中(参见图3-2至3-5),其中可缺失掉或不缺失掉天然环序列的氨基酸残基。图3-2至3-5中修饰的环序列是不具有两个末端Cys残基的那些序列,其中PRS序列的中央氨基酸不但可以是R、Y、H或Q,还可以是任何其它天然存在的氨基酸。在前述其他蛋白质/多肽的情况下,特别优选插入仅仅一部分经修饰的BoNT(A)的环,尤其是序列GIITSKTKSLVPXGSKALNDL(X=天然存在的氨基酸),其中可以缺失掉或不缺失掉天然环序列的氨基酸残基。图3-2至3-5中的修饰的环序列是那些不具有两个末端Cys残基的序列。
因此,对于BoNT(A)的LHN片段或对于完整的重组毒素,这意味着序列修饰是L和HN之间的环区域中的改变,并且这种改变为PRS序列的存在作了准备。根据本发明,PRS序列,不只对于BoNT(A),是五肽序列Val-Pro-Xaa-Gly-Ser。Xaa代表任何天然存在的氨基酸。与Xaa是Arg还是任何其它天然存在的氨基酸无关,在任何情况下均将五肽序列Val-Pro-Xaa-Gly-Ser称作五肽序列。然而当PRS序列的另外四个氨基酸残基之一被替换时——这在本发明的背景下确实是可能的——特别是替换为相应的亲水/疏水或极性单极残基时,将此情况下和下文中,将把该序列称为PRS五肽序列的变体。例如,当Val被Leu、Ile、Ala、Phe、Pro或Gly取代时即出现变体。此外,(还或仅)当PRS从N末端数起第二位的脯氨酸由Leu、Ile、Ala、Phe、Val或Gly取代时出现变体。同样,PRS的第四位的甘氨酸可以,例如,被Leu、Ile、Ala、Pro、Phe或Val取代;这导致其它的变体。并且当PRS的第五位的丝氨酸被例如,Tyr、Trp、Thr,及任选地Cys或Met取代时,将出现另外类型的变体。根据本发明,将至少在PRS序列的位置1、2、4和5之一含有不同于Val-1、Pro-2、Gly-4和/或Ser-5氨基酸残基的那些序列称为五肽序列的变体。
当BoNT(A)的LHN片段(或完整的毒素)或任何其它蛋白质/多肽——其通常由重组表达作为单链蛋白质/多肽获得但(仅)在双链形式是生物/生化活性的——含有五肽序列Val-Pro-Xaa-Gly-Ser(其中Xaa是20种天然存在的氨基酸中的任一种,且其中四个其它氨基酸可根据上段的含义加以取代)时,其将以双链形式存在于大肠杆菌宿主细胞(例如,大肠杆菌K12,尤其是菌株M15[pREP4]、XL1-BLUE或UT5600的大肠杆菌K12宿主细胞)的裂解物中,其中在BoNT(A)的情况下,轻链通过二硫键共价结合至HN或完整的重链(图7)。多肽链的切割在细胞裂解之后立即实现,或在温育细胞裂解物几小时后基本上完成。通过毒素或毒素片段的蛋白酶域活性的自我蛋白酶解是可以排除的,因为相应修饰了环区域的蛋白酶失活突变体在表达和大肠杆菌宿主细胞解体之后仍以双链结构存在。显而易见,负责切割PRS五肽序列的是大肠杆菌宿主菌株的蛋白酶。
根据四段之前以“令人惊讶的是,发明者们......”开始的那一段(在第4页),另一个优选的修饰位于PRS序列N末端间隔1-20个氨基酸残基处(N末端方向上紧邻五肽PRS序列的缬氨酸残基的氨基酸——在图3-2至3-5的情况下是亮氨酸残基——与PRS序列的间隔是1个氨基酸残基),尤其是间隔3-15个氨基酸残基处,特别是间隔3-10个氨基酸残基处,更加优选间隔3-8个氨基酸残基处,更加优选在间隔3个氨基酸残基处存在碱性氨基酸残基,优选赖氨酸残基或精氨酸残基,其中大肠杆菌宿主细胞蛋白酶在它的C末端切割环序列。切断之后即获得多肽,该多肽,例如,从PRS序列的缬氨酸残基的N末端起具有两个氨基酸残基(当以上定义的间隔是3氨基酸残基时)。在目前的情况下,“修饰”不一定意味着发生真正意义上的修饰,即氨基酸残基的插入或取代,而使得PRS序列的N末端在前面定义的间隔1-20个氨基酸残基处存在碱性氨基酸残基(例如,赖氨酸残基)。唯一重要的是与PRS序列N末端具有上述间隔的地方存在碱性氨基酸残基(例如赖氨酸残基或精氨酸残基)。
依照五段之前“令人惊讶的是,发明者们......”的那一段,另一种同样非必需但优选的修饰在于,被大肠杆菌宿主细胞蛋白酶切割的环序列长度为至少9个氨基酸残基。环序列优选的长度是至少12、至少15、至少18、至少20和至少23个氨基酸残基。环序列特别优选的长度是15-22,尤其是18-22个氨基酸残基。
根据本发明的方法在非常一般的意义上,是一种以大肠杆菌宿主细胞中的重组表达为手段来产生双链形式的蛋白质/多肽的方法,其中所述两条链是二硫桥连的,其中(i)所述蛋白质/多肽作为双链二硫桥连的蛋白质/多肽发挥其生物活性;(ii)第一链的C末端氨基酸残基是Arg残基或Lys残基;(iii)蛋白质/多肽的第二链在一个半胱氨酸残基的N端方向具有1-20氨基酸残基作为N末端,并且具有命名为PRS五肽序列VPXGS,其中X是任何天然存在的氨基酸,其中V是Val、Leu、Ile、Ala、Phe、Pro或Gly,其中P是Pro、Leu、Ile、Ala、Phe、Val或Gly,其中G是Gly、Leu、Ile、Ala、Pro、Phe或Val,并且其中S是Ser、Tyr、Trp或Thr;以及(iv)所述方法包括以下步骤:(a)在核酸水平上修饰蛋白质/多肽,使得修饰形式的该蛋白质/多肽在其环区域之内具有前述五肽序列(VPXGS);(b)在核酸水平上插入修饰的构建体到大肠杆菌细胞中;(c)培养并且随后裂解宿主细胞;和(d)分离双链蛋白质/多肽。
根据本发明,蛋白质/多肽的第一链优选是由相应DNA的N末端编码的链,而蛋白质/多肽的第二链因而是由相应的DNA的C末端编码的链。因为5’-DNA-3‘的表达的结果产生N-多肽-C,在前述的本发明优选的情况下,这意味着所述表达可如下表示:5’DNA-3′表达成为N-第一多肽链-C-环-N-第二多肽链-C。根据本发明,所述环已被原位切割,因而最终本发明的多肽/蛋白质N-第一多肽链-C-N-第二多肽链-C以双链结构被获得。
短语“蛋白质/多肽的第二链在一个半胱氨酸残基的N端方向具有1-20氨基酸残基作为N末端,并且具有命名为PRS五肽序列VPXGS”的意思是N末端不是由例如五肽序列VPXGS的缬氨酸残基形成,而是由其它(任何)氨基酸残基形成的。在后者和PRS的缬氨酸残基之间,还可存在1-19个氨基酸残基,但N末端氨基酸残基可通过肽键与例如所述缬氨酸残基直接结合,即,可以紧邻PRS的缬氨酸残基。
可以以它们的(生物)活性双链结构被分离的本发明的蛋白质/多肽是这样的蛋白质,其第一链的C末端具有碱性氨基酸残基,尤其是Arg残基或Lys残基,并且其第二链N末端具有1-20个氨基酸残基以及称为PRS的五肽序列VPXGS,其中X、V、P、G和S是如上所定义。
根据本发明,例如,在基于重组蓖麻毒蛋白的免疫毒素的情况下,序列特异蛋白酶(例如凝血酶或因子Xa)的处理对于活化而言是不必要的。例如,在基于白喉毒素或假单胞菌毒素的免疫毒素的情况下,预期可以获得,事实上也获得了显著增加的效率,因为不再需要靶细胞蛋白酶的加工——毒素的酶域易位至细胞质中的限速步骤了。已经作为双链二硫桥连的多肽存在的免疫毒素,可以小剂量施用并且仍然提供相同的细胞毒作用。这一方面降低了治疗成本,另一方面减少了形成可能使进一步施用该免疫毒素无效的抗体的危险。本发明提供了用于产生双链二硫桥连并由此活化免疫毒素的方法。
用本发明提供的方法还可能制备融合蛋白或杂合蛋白,即,带有用于亲和纯化的肽标签的双链形式的蛋白质,这些蛋白质的两条多肽链通过二硫键共价结合,并且在亲和层析或其它纯化方法之后,可以用含巯基物质(例如β-巯基乙醇、DTT或还原谷胱甘肽)通过简单还原作用来分离。
在大肠杆菌表达菌株例如M15[pREP4]或BL21(DE3)中重组表达梭菌神经毒素和其片段(例如,梭菌神经毒素的LHN片段或衍生物,例如具有修饰的细胞特异性),产生单链多肽。通过用胰岛素处理这些多肽,在蛋白酶域到易位域的过渡区域的环序列区域中发生切割。因为胰岛素不是序列特异蛋白酶,在多肽的其它区域可能发生切割(通常是不希望的)。例如,BoNT(A)被胰岛素额外地在HN和HC之间切割,因而产生双链LHN片段和HC片段。为了保证大多数情况下理想的、发生在环区域中的选择性切割,特异性内切蛋白酶的识别序列的存在(可选地,在发生插入之后)是必需的。
利用序列特异内切蛋白酶例如凝血酶、因子Xa、genenase等切割重组融合蛋白/杂合蛋白,属于公知的各种方法的范围。纯化之后,可分离融合配偶体,其赋予重组蛋白/多肽更好的可溶性和/或更好的表达,或充当用于亲和纯化的肽标签。为了这种目的,将蛋白质溶液与合适的可溶形式或在基质上固定形式的内切蛋白酶一起温育。
这种技术也可以用于表达前述重组蛋白/多肽,它们作为双链蛋白质/多肽发挥它们的正常生物/生化活性,但利用重组DNA技术获得它们时是无活性的单链蛋白质/多肽(例如,表达梭菌神经毒素、梭菌神经毒素的片段例如LHN片段、或梭菌神经毒素的衍生物,例如细胞特异性被修饰的衍生物):将内切蛋白酶的识别序列克隆到多肽中,优选在核酸水平克隆,例如克隆到L和HN之间的环区域中;此外,将另一个相同或另外的内切蛋白酶的识别序列克隆至N末端或C末端,使其两侧与用于亲和纯化的肽标签邻接。随后用相应的内切蛋白酶处理或多种内切蛋白酶同时或连续地处理被表达的单链蛋白质/多肽,在环区域的L和HN之间切割来加以活化,并去除肽标签。
这样的内切蛋白酶除了使用的成本和由此所需的额外工作步骤的成本之外,由于制药法律(受规章限制的)方面的原因,它们在药物制剂(例如,使用重组肉毒杆菌毒素或其衍生物)中的使用问题重重。一方面,所使用的内切蛋白酶的纯度必需是经实验证实的,而另一方面,完全的去除以及制剂的无病毒性在进一步纯化流程期间必需得到证明;这通常需要巨大的分析费用。由于将来肉毒杆菌毒素(例如具有性质改良的或细胞特异性被修饰的肉毒杆菌毒素)同样将由重组表达产生,因此人们非常需要这样的表达方法,可以提供前文所述的、作为双链蛋白质/多肽发挥正常生物/生化活性,但通过重组DNA技术获取时以无活性的单链蛋白质/多肽形式存在的重组蛋白质/多肽,特别地,该方法可提供这样的肉毒杆菌毒素或其衍生物,它们是双链二硫桥连的、因此具有生物活性的多肽/蛋白质,而不必要使用内切蛋白酶。
在下文中将更具体地解释本发明,因而最广义地提供一种方法,使用该方法能够通过在大肠杆菌宿主细胞中的重组表达产生蛋白质例如梭菌神经毒素以及其片段和衍生物,并且能够以它们的双链二硫桥连的并且因此是生物活性的形式分离,它们的活化不需要添加内切蛋白酶。
在本发明的第一个优选实施方案中,BoNT(A)半胱氨酸残基430和454之间的环区域的氨基酸序列(参见图3-1至3-5)已被修饰,因而在大肠杆菌宿主细胞的裂解物中表达的毒素或其片段/衍生物已作为双链多肽存在。所述两条链由半胱氨酸残基430和454参与形成二硫键而彼此共价结合。在本发明特别优选的实施方案中,如图3所说明的,五肽Asp443-Asn447(DKGYN)可以用Val-Pro-Arg-Gly-Ser(VPRGS)来取代。在本发明的另一个优选实施方案中,该五肽Asp443-Asn447(DKGYN)还可以用Val-Pro-Tyr-Gly-Ser(VPYGS)、Val-Pro-His-Gly-Ser(VPHGS)或Val-Pro-Gln-Gly-Ser(VPQGS)来取代。在这里,同样地,不仅中央氨基酸残基可以是任何天然存在的氨基酸,另外四个氨基酸残基也可以被替换,如在前文中详细说明的(当替换这些残基的至少一个时,即出现本发明意义上的PRS序列变体)。此外,对该实施方案以及所有其它在下文中将解释的优选实施方案而言仍然优选的是,环序列在PRS的N端方向间隔1-28个氨基酸处具有碱性氨基酸残基,特别是赖氨酸或精氨酸残基。
对于本领域技术人员显而易见的是,替换其它的单个或几个氨基酸残基,或在上面描述的BoNT(A)环区域中插入或缺失另外的氨基酸残基,同样会导致被表达的本发明的毒素或源自它们的片段/衍生物在裂解物中作为双链多肽存在。这些可能的变体同样被本发明所涵盖。
对于本领域技术人员同样显而易见的是,存在于野生型BoNT(A)中的五肽Asp443-Asn447(DKGYN)可以用六肽,七肽、八肽等取代,只要在被表达和单链翻译的多肽/蛋白质中,该PRS五肽序列或其可能的变体之一存在于环区域之内。如上文中已说明的,优选该五肽的N末端存在碱性氨基酸残基(优选赖氨酸)。
此外对于本领域技术人员显而易见的是,PRS五肽(Val-Pro-Arg-Gly-Ser)的优选实施方案是蛋白酶凝血酶可能的识别序列的一部分,凝血酶在凝血级联中扮演重要角色并且具有高度的序列特异性。需要明确地指出,首先,不管是在肉毒杆菌神经毒素A型中还是在其它多肽中,凝血酶切割均不是为了获得所需双链二硫桥连形式必需的,其次,凝血酶识别序列本身,即其未修饰形式,对于借助大肠杆菌裂解物蛋白酶活性的切割是有益的,但完全不是必需的。这样的PRS五肽序列的实施方案——PRS五肽序列插入到或产生在相应的多肽中(更佳:在它们的环中),而该多肽不含C末端能被凝血酶切割的精氨酸残基(而是存在另一种天然存在的氨基酸)——也导致在环中发生切割,如上文说明的。如上所述,优选在五肽的N端方向、环中的赖氨酸残基处实现切割(同样参见实施例2;图3)。
由于肉毒杆菌毒素的其它血清型,例如作为长效神经毒素的BoNT(B)和BoNT(C1)和作为短效神经毒素的BoNT(E)可用于治疗,而且完全不同的、可作为单链重组表达但仅作为双链发挥其生物活性的多肽/蛋白质也可在治疗上使用,因此,理想地,这些神经毒素以及它们的片段或衍生物(以及其它多肽/蛋白质)也能够作为双链二硫键多肽/蛋白质从大肠杆菌裂解物获得。特别地,在BoNT(B)的情况下,在大肠杆菌裂解物中完全切割重组毒素成为双链多肽/蛋白质,与肉毒梭菌(Clostridium botulinum)分泌的天然神经毒素相比有显著的优势;该天然神经毒素通常有至少40%作为单链存在且因此是失活的多肽,并且不能与活性的双链形式分离。同样显而易见的是,血清型B、C1和E神经毒素中参与二硫键的半胱氨酸残基之间的环区域,相对于BoNT(A)的环而言显著较短(图3和4)。在BoNT(A)中存在23个氨基酸残基(Val431-Leu453),而在BoNT(B)中仅8个(Lys438-Ile445),在BoNT(C1)中15个(His438-Asp452),在BoNT(E)中有13个氨基酸残基(Lys413-Ile425)存在于该区域中。尽管如此,发现除BoNT(B)之外,当这些相对缩短的区域具有根据本发明的PRS序列时,它们的长度足以使链的切割和二硫键形成成为可能。尽管BoNT(B)环中的五肽被替换为PRS五肽序列时(这样环序列的全长仅8个氨基酸残基),BoNT(B)被切割成符合本发明含义的两条链(轻的和重的),但是,当环是至少9个、至少15个、至少20个或甚至至少22个氨基酸残基时,获得了更好的结果,也就是说依照本发明这是优选的。最后提到的实施方案之一中,所述环具有22个氨基酸残基,图4-1和4-2的序列或二者之间的比较,对该实施方案作了示例性的说明。
还通过实验证实,对于将神经毒素切割成二硫桥连的双链多肽/蛋白质而言,优选将亚型B、C1等等中的环区域或它们的有效部分替换为BoNT(A)的环区域或它们的有效部分,尤其是当以这种方式环被延伸到至少9个、优选15个残基时,和/或当PRS的N末端插入了碱性氨基酸残基时(例如且优选Lys残基)(如果先前无N末端碱性或Lys残基存在的话)。特别优选的是图4所示的变化(其中图4中的PRS序列是VPRGS,但同时并且优选也是序列VPYGS、VPHGS、VPQGS、VPKGS、VPIGS和VPAGS)。
在本发明的其它实施方案中,将血清型B、C1、D、E、F和G肉毒杆菌毒素以及破伤风毒素中环区域的氨基酸序列和编码基因部分在参与L和HN之间二硫键的半胱氨酸残基之间修饰,使得大肠杆菌宿主细胞裂解物中表达的毒素或源自它们的片段/衍生物已经作为双链多肽存在,该双链多肽中两条链通过二硫键共价结合(对任何通过重组表达作为单链产生但仅以双链形式展现生物活性的其它多肽/蛋白质也是如此)。在本发明的优选实施方案中,神经毒素的完整环区域(或其部分),或源自它们的毒素片段/衍生物,可以替换为BoNT(A)的完整环区域,如图3所示,或替换为BoNT(A)环区域的部分,其中优选将五肽Asp443-Asn447替换为Val-Pro-Arg-Gly-Ser(VPRGS)。在本发明另外的优选实施方案中,还可以将五肽Asp443-Asn447替换为Val-ProTyr-Gly-Ser、Val-Pro-His-Gly-Ser或Val-Pro-Gln-Gly-Ser。在本发明的特别优选实施方案中,前述神经毒素的环区域或环区域的部分,以及源自它们的片段/衍生物,可以被替换为寡肽Arg/Ser-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(18聚体:R/SGIITSKTKSLVPRGSKA)。如果在上述环序列的区域中进一步替换、插入或缺失单个或几个氨基酸残基,如图4所示,也导致在大肠杆菌(例如,在大肠杆菌K12宿主细胞或其衍生物)中表达之后,被表达的神经毒素或其片段/衍生物成为二硫桥连的双链多肽/蛋白质,这样的替换、插入或缺失明确地包含于本发明中(对任何能够通过重组表达作为单链产生但仅以双链形式具有生物活性的其它多肽/蛋白质也是如此)。
如上文中反复重申的,用根据本发明的方法或根据本发明另外的实施方案的方法,还可以产生融合蛋白或杂合蛋白,其具有,例如,以下成分A、B和C:
-效应物域,通过其酶活性,能够例如抑制靶细胞中的分泌或杀死它们(A);
-环序列,其被根据本发明如上的说明修饰,且具有如上定义的PRS五肽序列VPXGS(例如,如图3所示的BoNT(A)的修饰环序列或其变体),并且可具有N末端和/或C末端附着的半胱氨酸残基(B);以及
-细胞结合域,其赋予融合蛋白或杂合蛋白以细胞特异性(C)。
成分B(环序列)在前两个实施方案中也同样可优选为:(i)如图4所示的修饰的环序列,(ii)在PRS的中央残基可以是任何天然存在氨基酸的残基的范围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义见上)。在图4中,BoNT(B)、BoNT(C1)或BoNT(E)的环序列分别缺失了除N末端和C末端一或两个氨基酸残基以外的部分,并且缺失的氨基酸残基被BoNT(A)的修饰环序列的17聚体GIITSKTKSLVPRGSKA(图4-2和4-6)或18聚体RGIITSKTKSLVPRGSKA(图4-4)所取代。
除了前述的成分A、B和C,融合/杂合蛋白可具有翻译域(在肉毒杆菌神经毒素中位于环序列和细胞结合域之间)。这种额外的域协助效应物域插入靶细胞的细胞质。这种融合蛋白在大肠杆菌(例如,大肠杆菌K12或其衍生菌株)中的表达产生这样的双链多肽/蛋白质,其中一个域在一条链上,而其它两个域在第二条链上(在肉毒杆菌毒素中,效应物域在轻链上,其通过二硫键与在重链上的其它两个域共价结合)。
这些本发明的融合或杂合蛋白可以是所谓的免疫毒素,它们尤其在肿瘤治疗中有用处。在这种背景下,通过使细胞结合域附着于毒素,而赋予毒素对于某种细胞类型(通常为肿瘤细胞)的特异性。作为毒素结合域,主要使用白喉毒素、假单胞菌毒素和蓖麻毒蛋白的酶域。这些毒素属于双链AB毒素,其中提供酶活性的A链通过二硫键共价结合于兼有易位活性和细胞结合活性的B链。然而,在靶细胞中产生期望的作用(例如,肿瘤细胞的杀灭)的范围内,免疫毒素中其它的毒素或毒素片段是可以想到的。第一代免疫毒素是将毒素域(例如蓖麻毒蛋白的A链)与单克隆抗体化学偶联而产生的,第二代免疫毒素是通过重组表达(主要是在大肠杆菌中)作为Fab毒素、单链Fv毒素(scFv毒素)或二硫键稳定化Fv(dsFv毒素),以及作为与生长因子或细胞因子的融合蛋白产生的(Reiter,2001)。在将来各代免疫毒素中,还可以由经过选择的修饰多肽来赋予细胞特异性,该多肽是根据,例如,与肿瘤特异表面蛋白(如affilins、锚蛋白重复蛋白或anticalins蛋白家族的蛋白)的高亲和力结合而选择的。
在免疫毒素所有可以想到的变体中,必须保证酶性毒素域能够进入靶细胞的细胞质以在其中发生毒性作用。因为在大肠杆菌中免疫毒素作为单链多肽表达,蛋白水解切割以及二硫键的还原对于将酶性毒素域与易位单位和细胞结合域分离(对于链而言)是必需的。在重组白喉毒素片段和重组假单胞菌外毒素片段的情况下,切割于内在化之后在靶细胞的内体区室中通过细胞蛋白酶例如弗林蛋白酶发生(Williams et al.,1990)。另一方面,蓖麻毒蛋白不具有这样的加工位点,因此,为了作为已经双链二硫桥连的免疫毒素施用,其需要人工插入的蛋白酶识别序列。然而,在基于白喉毒素和假单胞菌外毒素的免疫毒素的情况下,内在化融合蛋白只有最小一部分被切割,因而同样只有最小一部分酶域能够到达细胞质(Ogata et al.,1990)。下述本发明的优选实施方案描述了多种方法和构建体,依靠这些方法,通过在大肠杆菌宿主细胞中重组表达产生如前面段落中所述的免疫毒素的变体,并且这些变体能够以它们的双链二硫桥连的从而具有生物(酶促)活性的形式被分离,它们的活化不需要细胞内切蛋白酶或体外添加内切蛋白酶。这些免疫毒素能够将酶性毒素域以具有易位能力(translocation competent)的形式转运至靶细胞中,因而不需要细胞蛋白酶的切割,并且为了达到期望的细胞毒性效应而使用的免疫毒素剂量可以显著降低。
相应地,本发明的另一个优选实施方案进一步包含融合蛋白和杂合蛋白,其具有以下成分A、B和C:
-毒素域或其片段/衍生物(A);
-环序列,其根据本发明如上所述被修饰,并具有如上定义的PRS五肽序列VPXGS(例如,示于图3的BoNT(A)的修饰的环序列或其变体之一),并且可能已于N末端和/或C末端附着有半胱氨酸残基(B);以及
-细胞结合域,其可以取自下列蛋白家族中的代表:单克隆抗体蛋白、它们的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4或IL6)(C)。
依照最后的这种优选实施方案,成分B(环序列)同样可以是(i)图4所示的修饰的环序列之一,(ii)在PRS的中央残基可以是任何天然存在氨基酸的残基的范围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义见上)。
毒素域可以是蓖麻毒蛋白的A链、假单胞菌外毒素的片段例如PE40或PE38(域II和III,具有或不具有域Ib;图2)或白喉毒素的片段。前述效应物域或毒素域和细胞结合域应仅仅理解为示例。本发明涵盖所有如下所述的蛋白质或蛋白片段:一方面,其赋予融合蛋白/杂合蛋白对靶细胞(例如肿瘤细胞)表面抗原的特异性结合活性,另一方面,其在靶细胞中内在化之后发挥某种作用,例如杀死该细胞,其中在大肠杆菌中表达这种根据本发明的融合/杂合蛋白产生双链多肽/蛋白质,在这些双链多肽/蛋白质中毒素域或它们的衍生物通过二硫键共价结合于细胞结合域。
为了改善基于假单胞菌外毒素的免疫毒素的效率和特异性,曾经选择过不同的方法。例如,曾将受体结合域(域Ia氨基酸残基1-152)替换为单克隆抗体的片段,并且同时将易位域(域II)中半胱氨酸残基13和35(相对于域II编号)之间的环区域(图2和5)修饰,使得后者对普遍存在的细胞蛋白酶——福林蛋白酶的切割不再敏感,但对仅被某种肿瘤细胞以较强的程度表达并部分分泌的特殊蛋白酶的切割敏感(美国专利6,426,075)。设计这种修饰的蛋白酶敏感性,是为了在替换的受体结合域之外进一步赋予免疫毒素增加的细胞特异性。然而,不应期望利用其它细胞蛋白酶可导致环切割的增加并因此提高酶域III的易位效率。
根据另一种用于免疫毒素的方法,将受体结合域和易位域的N末端区域去除,直到环区域中的精氨酸残基27为止。通过下述手段提供这种免疫毒素中所需的细胞特异性:例如,通过在域II和III之间的Ib域处,插入以二硫键相互结合的单克隆抗体VH域和VL域;或通过附加域III的C末端(美国专利5,980,895)。在这种构建体中,通过蛋白酶的活化不再是必需的;一方面,这将导致转运效率显著增加。然而,另一方面可以预期,依靠位于酶域III的N末端或C末端的受体结合域(如单克隆抗体或TGF-alpha的VH域)的易位将被阻碍。因为这些受体结合域未与酶域分离,可以预期会影响酶活性,从而影响靶细胞中的毒性。下面两种情况下,基于假单胞菌外毒素的免疫毒素产生相对最大程度的细胞毒素活性:一方面,半胱氨酸残基13和35之间的环已经以被切割的二硫桥连形式存在,从而不再需要细胞蛋白酶的活化;另一方面,受体结合域取代外毒素的域I而融合于易位域的N末端,使得在细胞质中还原之后其与毒素域分离,从而不阻碍域III的酶活性。
因此,本发明一个特别优选的实施方案包括一种融合/杂合蛋白,其包含细胞结合域,该细胞结合域可取自以下蛋白家族的代表:单克隆抗体、它们的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4和IL6),细胞结合域的C末端融合修饰的PE38片段或其变体,该片段能够在C终端携带内质网保留信号Lys-Asp-Gly-Leu。PE38片段的修饰包含将半胱氨酸残基13和35之间的完整环序列(或仅其部分)替换为PRS五肽序列VPXGS,优选替换为图3所示的BoNT(A)的修饰的环序列或其变体,特别是替换为肽序列Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(图5)(变体的定义见上)。优选的,在这个实施方案中,还保证有碱性氨基酸位于PRS的N端方向间隔1-20个氨基酸处,如图5的序列中所示。如此修饰的PE38片段以及含有这种修饰片段的融合/杂合蛋白以双链二硫桥连形式存在于大肠杆菌宿主细胞(例如,M15[pREP4])的裂解物中。
和假单胞菌外毒素相反,白喉毒素的酶域——A链存在于N末端。在C末端的B链上有易位域和受体结合域。两条链均通过环序列连接,当被白喉棒杆菌(Corynebacterium diphtheriae)的细胞分泌时,在所述环序列中精氨酸残基193处由蛋白酶进行蛋白水解切割(Collier,2001)。切割后,两条链通过半胱氨酸残基186和201之间的二硫键保持彼此共价结合。在这点上,白喉毒素在其域结构上与肉毒杆菌毒素和破伤风毒素相似。
为了产生重组免疫毒素,将受体结合域或其部分替换为例如VEGF或IL2(Arora e al.,1999;Williams et al.,1990)以赋予融合蛋白新的细胞特异性。为了使A链到达靶细胞的细胞质,一方面,在大肠杆菌中作为单链表达的免疫毒素的多肽链必须在A链和B链的环区域之间切割,而另一方面,必须将二硫键还原。虽然后者在易位过程中发生,但细胞蛋白酶的蛋白水解切割是不完全的,因而仅有最小部分的A链的能够释放至细胞质中(Williams et al.,1990)。如果免疫毒素在施用时已经以双链二硫桥连的形式存在,则可望显著地增加功效,因为所有A链都可成为具有易位能力的形式以供使用。
因此,本发明的另一个特别优选实施方案包含这样的融合或杂合蛋白,其包含细胞结合域,该细胞结合域可取自以下的蛋白家族的代表:单克隆抗体、它们的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4和IL6);所述细胞结合域的N末端融合了修饰的白喉毒素片段。此毒素片段可包含A链以及B链的至少一个易位域(Gly1-Phe389或Gly1-Asn486)。白喉毒素片段的修饰在于:半胱氨酸残基186和201之间的完整环序列(或仅其部分)被替换为图3所示的修饰的环序列或其变体,尤其是替换为肽序列Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala(图5)(变体的定义见上)。这样修饰的白喉毒素片段,以及含有这种修饰片段的融合蛋白,均以双链二硫桥连的形式存在于大肠杆菌宿主细胞(例如M15[pREP4])的裂解物中。
第一代基于蓖麻毒蛋白的免疫毒素是通过连接蓖麻毒蛋白的A链和单克隆抗体而产生。过去这是通过具有化学接头分子的抗体衍生化完成的,其中所述接头分子与位于A链C末端的半胱氨酸残基的巯基官能团形成二硫键。由于抗体的非定向衍生化,这种偶联物是不均一的。抗肿瘤效率不足,很重要的原因是偶联物的大小,以及缺乏位于B链的易位域。当还存在天然形式的B链作为免疫毒素的成分时,毒性将显著增加,但是由于B链的凝集素样细胞结合性,被靶细胞之外的细胞非特异性地摄入也是有可能发生的。人们使用了这样一种策略来应对这种靶标冲突(target conflict):根据该策略,对B链进行修饰,使得易位活性保持完整而对细胞表面糖结构的结合亲和性却显著降低(专利申请WO89/04839)。然而,含有这种修饰的B链的重组表达免疫毒素具有单链结构,因此,由于A链和B链之间的接头肽中缺乏细胞蛋白酶识别序列,在免疫毒素被摄入靶细胞后A链的释放和易位完全不可能发生,或仅可能以极低的效率发生。美国专利6,593,132中显示,这种天然接头肽是不同细胞特异蛋白酶的识别序列。如果能以蛋白水解方式切割修饰的接头肽的蛋白酶仅在期望的靶细胞中以显著高于其它细胞类型的量表达,具有这种修饰的蓖麻毒蛋白变体可具有相应的细胞特异性。然而,必需假设切割仅在一部分内在化的毒素分子中发生,并且因此仅相应的最小量的A链易位到细胞质中。理想的基于蓖麻毒蛋白的双链免疫毒素是这样的:其中,A链通过二硫键与修饰的B链连接,B链中易位活性保持完整,但非特异性凝集素样细胞结合性被抑制;并且在它们的C末端与特异细胞结合域融合。这种免疫毒素将兼具细胞特异性和高毒性。
因此,本发明的另一个优选实施方案包含这样的融合蛋白,其具有以下成分A、B和C:
-蓖麻毒蛋白的A链(A);
-环序列,其根据本发明如上所述被修饰,并且具有如上定义的PRS五肽序列VPXGS(例如,示于图3的BoNT(a)的环序列或其变体之一),并且在N末端和/或C末端可能附着有半胱氨酸残基(B);以及
-细胞结合域,其可取自以下蛋白家族的代表:单克隆抗体、它们的片段、affilins、锚蛋白重复蛋白、anticalins、生长因子(例如,TGF-alpha、FGF、VEGF或IGF-1)或细胞因子(例如,IL2、IL4和IL6)(C)。
根据最后的优选实施方案的成分B也可以是(i)图4所示修饰的环序列之一,(ii)在PRS的中央残基能够是任何天然存在氨基酸的残基的范围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义见上)。
具体而言,环序列可含有肽序列Ala-Pro-Pro-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Asp-Val(图5-6),即,修饰的蓖麻毒蛋白A链的环。优选在环序列的C末端具有半胱氨酸残基。但在其中所含的Val-Pro-Arg-Gly-Ser的PRS序列中,Arg可以是任何其它天然存在的氨基酸Xaa。环序列还可以被更多的氨基酸残基(例如,甘氨酸和丝氨酸残基)所扩展。此外,蓖麻毒蛋白的A链可以通过环序列与完整的B链或其部分或变体连接,该环序列取代蓖麻毒蛋白原野生型序列半胱氨酸残基259和283之间的全部或部分氨基酸残基,并且至少包含图3所述的修饰的BoNT(A)的环或其变体。在此情况下,半胱氨酸残基259和283(相对于蓖麻毒蛋白原(pro ricin))形成二硫键。B链的C末端融合了细胞结合域,该细胞结合域取自上述多肽家族。相应的融合/杂合蛋白以双链二硫桥连的形式存在于大肠杆菌宿主细胞(例如菌株M15[pREP4]的细胞)的裂解物中。
本发明的另一个实施方案涉及重组融合蛋白,其具有以下成分A、B和C:
-蛋白质或寡肽,其赋予融合蛋白更好的可溶性,实现较高的表达率和/或使亲和纯化成为可能,(例如,谷胱甘肽-S-转移酶(GST)、麦芽糖结合蛋白(MBP)、His标签、Strep标签、FLAG标签(A)。
-环序列,其根据本发明如上所述被修饰,该环序列包含如上定义的PRS五肽序列VPXGS(例如,如图3所示的BoNT(A)修饰的环序列或其变体),并且可能具有附着于N末端和/或C末端的半胱氨酸残基,以及
-任何类型的多肽(C)。
依照此最后优选序列的成分B(环序列)同样可以是(i)如图4所示修饰的环序列之一,(ii)在PRS的中央残基可以是任何天然存在的氨基酸残基的范围内,任何源自(i)的序列,或(iii)(i)或(ii)的变体(变体的定义如上所示)。
具体而言,环可以具有肽序列Val-Arg-Gly-Ile-Ile-Thr-Ser-Lys-Thr-Lys-Ser-Leu-Val-Pro-Arg-Gly-Ser-Lys-Ala-Leu-Asn-Asp-Leu,其中在PRS中央的Arg仍然可以是Xaa。其在两端均可被更多的氨基酸残基(例如,甘氨酸和丝氨酸残基)延伸。这种融合蛋白在大肠杆菌中的表达产生双链多肽/蛋白质,这些多肽/蛋白质的两条链通过二硫键共价结合,并且在完全纯化之后,可以在不添加蛋白酶的条件下,直接由含巯基物质(例如β-巯基乙醇、DTT或还原谷胱甘肽)还原后彼此分离。这种表达系统尤其适合于这样的蛋白:其要在两个末端之一提供半胱氨酸残基,以便在纯化和分离带有反应性巯基基团的融合配偶体之后,提供用来例如与巯基反应性接头分子偶联反应或供例如聚乙二醇修饰的位点。
此外本发明包含编码根据本发明前面部分所述多肽的所有核酸,并考虑到密码子使用的不同可能性。此外,本发明包含商业上可以获得的或单独构建的克隆和表达质粒,其含有根据本发明的各种多肽的编码DNA序列;以及合适的大肠杆菌克隆和表达菌株,其用相应的表达质粒转化并且能够以其双链二硫桥连形式表达各种根据本发明的多肽。这种表达系统的一个实例是pQE系列的表达质粒和大肠杆菌宿主菌株M15[pREP4]的组合。
对于本领域熟练技术人员,尤其是从事药用多肽/蛋白质开发的技术人员而言,这些多肽/蛋白质的活化不必添加内切蛋白酶的优势是显而易见的。前面部分描述的根据本发明多肽/蛋白质大多是特别以药用为目标的。因此本发明还包含药物制剂,其包含本发明的多肽/蛋白质之一或本发明的多肽/蛋白质的混合物作为有效成分,以及赋予该制剂足够稳定性的有用添加剂;并且其组成与其期望的施用形式相匹配。
所附的附图和序列表序列如下所述:
图1显示从肉毒杆菌或大肠杆菌K12释放具有野生型环或根据本发明的修饰环的肉毒杆菌神经毒素A型的示意图。A:在肉毒杆菌细胞的裂解中,神经毒素在轻链(L)和重链(H)之间的环区域中被梭菌内切蛋白酶切割。两条链均通过二硫键彼此相连。B:具有野生型环的重组神经毒素在大肠杆菌中表达并裂解细胞之后,其以单链形式存在。C:当具有根据本发明修饰的环的重组神经毒素从大肠杆菌细胞释放时,内切蛋白酶在环区域中切割。
图2是比较具有野生型环区域以及根据本发明的修饰环区域的不同重组毒素从大肠杆菌细胞释放之后的示意图。A:肉毒杆菌神经毒素;B:假单胞菌外毒素;C:白喉毒素。
图3显示野生型环和挑选的根据本发明修饰的BoNT(A)环序列的比较。图示为核苷酸序列和衍生的氨基酸序列,其包含轻链和重链的限定性半胱氨酸残基。箭头标注大肠杆菌裂解物中内切蛋白酶的切割位点。
图4分别显示肉毒杆菌神经毒素血清型B、C1和E的野生型环和根据本发明修饰的示例环序列的比较。图示为核苷酸序列和衍生的氨基酸序列,其包含轻链和重链的限定性半胱氨酸残基。箭头标注大肠杆菌裂解物中内切蛋白酶的切割位点。
图5分别显示假单胞菌外毒素片段PE40、白喉毒素(DT)和蓖麻毒蛋白的野生型环和根据本发明修饰的示例环序列的比较。图示为核苷酸序列和衍生的氨基酸序列,其包含限定性半胱氨酸残基。箭头标注大肠杆菌裂解物中内切蛋白酶的切割位置。
图6显示用于克隆重组毒素和毒素片段的寡核苷酸的组合。限制性内切酶的识别序列以下划线标记。
图7显示具有根据本发明修饰的环序列的BoNT(A)重组LHN片段在SDS聚丙烯酰胺凝胶上的分析。LHN片段的表达在M15[pREP4]细胞中进行,该细胞被质粒pQE-BoNT(A)-LmodlHN转化。泳道2和5:在Ni-NTA琼脂糖上纯化的LHN片段;泳道1和4:同凝血酶一起温育之后的LHN片段;泳道3:分子量标记。上样在还原条件(泳道1和2)和非还原条件下(泳道4和5)。
图8显示具有根据本发明修饰的环序列的BoNT(B)重组LHN片段在SDS聚丙烯酰胺凝胶上的分析。LHN片段的表达在M15[pREP4]细胞中进行,该细胞被质粒pQE-BoNT(B)-LmodlHN转化。泳道1和4:在Ni-NTA琼脂糖上纯化的片段LHN;泳道2:分子量标记;泳道3:无上样。上样在还原条件(泳道1)和非还原条件下(泳道4)。
图9显示具有根据本发明修饰的环序列的重组BoNT(C1)在SDS聚丙烯酰胺凝胶上的分析。该毒素的表达在M15[pREP4]细胞中完成,该细胞被质粒pQE-BoNT(C1)-LmodlHNHC转化。泳道1和4:在Ni-NTA琼脂糖上纯化的毒素;泳道2:分子量标记;泳道3:无上样。上样在还原条件(泳道1)或非还原条件下(泳道4)。
SEQ ID NO.1是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的重组肉毒杆菌神经毒素A型(rBoTN(A)-modl)的核酸(DNA)的实例。
SEQ ID NO.2是具有根据本发明修饰的环序列和C末端六组氨酸标签的重组肉毒杆菌神经毒素A型(rBoTN(A)-modl)的实例。
SEQ ID NO.3是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素A型重组LHN片段(rBoTN(A)-LmodlHN)的核酸(DNA)的实例。该序列相应于SEQ ID NO.1,其中缺失核苷酸2620-3888。
SEQ ID NO.4是具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素A型重组LHN片段(rBoTN(A)-LmodlHN)的实例。该序列相应于SEQ ID NO.2,其中缺失氨基酸残基874-1296。
SEQ ID NO.5是编码具有根据本发明修饰的环序列和C末端六组氨酸标记的肉毒杆菌神经毒素A型重组LHNHCN片段(rBoTN(A)-LmodlHNHCN)的核酸(DNA)的实例。该序列相应于SEQ ID NO.1,其中缺失核苷酸3286-3888。
SEQ ID NO.6是具有根据本发明修饰的环序列和C末端六组氨酸标记的肉毒杆菌神经毒素A型重组LHNHCN片段(rBoTN(A)-LmodlHNHCN)的实例。该序列相应于SEQ ID NO.2,其中缺失氨基酸残基1096-1296。
SEQ ID NO.7是编码具有根据本发明修饰的环序列和C末端六组氨酸标签重组肉毒杆菌神经毒素B型(rBoTN(B)-modl)的核酸(DNA)的实例。
SEQ ID NO.8是具有根据本发明修饰的环序列和C末端六组氨酸标签的重组肉毒杆菌神经毒素B型(rBoTN(B)-modl)的实例。
SEQ ID NO.9是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素B型重组LHN片段(rBoTN(B)-LmodlHN)的核酸(DNA)的实例。该序列对应于SEQ ID NO.7,其中缺失了核苷酸2623-3915。
SEQ ID NO.10是具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素B型重组LHN片段(rBoTN(B)-LmodlHN)的实例。该序列对应于SEQ ID NO.8的序列,其中缺失了氨基酸残基875-1305。
SEQ ID NO.11是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的重组肉毒杆菌神经毒素C1型(rBoTN(C1)-modl)的核酸(DNA)的实例。
SEQ ID NO.12是具有根据本发明修饰的环序列和C末端六组氨酸标签的重组肉毒杆菌神经毒素C1型(rBoTN(C1)-modl)的实例。
SEQ ID NO.13是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素C1型重组LHN片段(rBoTN(C1)-LmodlHN)的核酸(DNA)的实例。该序列对应于SEQ ID NO.11,其中缺失了核苷酸2599-3858。
SEQ ID NO.14是具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素C1型重组LHN片段(rBoTN(C1)-LmodlHN)的实例。该序列对应于SEQ ID NO.12,其中缺失了氨基酸残基867-1286。
SEQ ID NO.15是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的肉毒杆菌神经毒素E型(rBoTN(E)-modl)的核酸(DNA)的实例。
SEQ ID NO.16是具有根据本发明修饰的环序列和C末端六组氨酸标签的重组肉毒杆菌神经毒素E型(rBoTN(E)-modl)的实例。
SEQ ID NO.17是编码具有根据本发明修饰的环序列和C末端六组氨酸标签,并包含域II、Ib和III的假单胞菌外毒素重组40kDa片段(PE40-modl)的核酸(DNA)的实例。
SEQ ID NO.18是具有根据本发明修饰的环序列和C末端六组氨酸标签,并包含域II、Ib和III的假单胞菌外毒素重组40kDa片段(PE40-modl)的实例。
SEQ ID NO.19是编码具有根据本发明修饰的环序列和C末端六组氨酸标签、且包含A链和B链N末端片段的白喉毒素重组片段(DT389-modl)的核酸(DNA)的实例。
SEQ ID NO.20是具有根据本发明修饰的环序列和C末端六组氨酸标签、且包含A链和B链N末端片段的白喉毒素重组片段(DT389-modl)的实例。
SEQ ID NO.21是编码具有根据本发明修饰的环序列和C末端六组氨酸标签的重组蓖麻毒蛋白(rRicin-modl)的核酸(DNA)的实例。
SEQ ID NO.22是具有根据本发明修饰的环序列和C末端六组氨酸标签的重组蓖麻毒蛋白(rRicin-modl)的实例。
实施例
实施例1克隆和表达具有修饰的环的肉毒杆菌神经毒素A型LHN片段
为了克隆轻链以及易位域的DNA序列,将染色体DNA从肉毒梭菌A型(菌株ATCC3502)的培养物中分离。通过用引物#1和#2(图6)的PCR扩增,获得编码具有修饰的环序列和C末端His标签的BoNT(A)轻链的基因片段。借助Nco 1和Sal 1的限制位点将PCR扩增产物克隆到表达质粒pQE-60中,从而产生质粒pQE-BoNT(A)-Lmodl。通过用引物#3和#4(图6)的PCR扩增,产生编码BoNT(A)的易位域的基因片段。借助Stu I和Xho I的限制位点将该片段克隆到pQE-BoNT(A)-Lmodl中的环序列和His标签的序列之间(质粒pQE-BoNT(A)-LmodlHN;序列#2,图3,No.2)。将大肠杆菌表达菌株M15[pREP4](Qiagen)用质粒pQE-BoNT(A)-LmodlHN转化。修饰的LHN片段的表达通过用500μM终浓度的IPTG于25摄氏度过夜分步诱导进行。在具有300mM NaGl的50mM pH8.0磷酸缓冲液中通过溶菌酶处理和超声波处理将细胞裂解。将经过离心的裂解物在Ni-NTA琼脂糖柱上层析。在SDS聚丙烯酰胺凝胶上的分析显示,在还原条件下两条大约50kDA的带以及一条100kDA的带被考马斯染色,而在非还原条件下仅观察到所述100kDA的带(图7)。这样就清楚地证明,有多于75%的LHN片段是作为双链多肽从细菌中释放的,其中两条链通过二硫键彼此共价结合。后续的凝血酶处理一方面导致单链形式的切割,另一方面导致双链多肽中易位域的缩短(图7)。在纯化LHN片段之前将大肠杆菌裂解物温育两小时,导致双链多肽的完全切割。
相应被表达和纯化的具有天然环序列的LHN片段(图3,No.1)在SDS聚丙烯酰胺凝胶上于非还原以及还原条件下均呈现100kDa的带。仅在用胰蛋白酶切割时才能将该单链多肽转化成双链二硫桥连的LHN片段。
实施例2 克隆和表达具有修饰的环的肉毒杆菌神经毒素A型LHNHCN片段和切割位点的鉴定
用引物#3和#5(图6)通过PCR扩增产生HNHCN片段(具有BoNT(A)受体结合域的N端一半的易位域),并且借助Stu I和Xho I的限制性位点克隆到质粒pQE-BoNT(A)-Lmodl中(质粒pQE-BoNT(A)-LmodlHNHCN;序列#3)。表达和纯化根据实施例1所述进行。在SDS聚丙烯酰胺凝胶上的分析显示,除了对应于单链多肽的弱带和其它未定义的带之外,有对应于轻链和HNHCN片段的50kDa的带以及一条75kDa的带。对HNHCN片段最先四个氨基酸残基的N末端测序提供了序列Ser-Leu-Val-Pro。在大肠杆菌裂解物中通过蛋白酶活性的切割由此发生在Lys440之后,从而在插入到环中的五肽Val-Pro-Arg-Gly-Ser的N端方向上。
实施例3克隆和表达具有修饰的环的肉毒杆菌神经毒素B型LHN片段
为了克隆轻链以及易位域的DNA序列,从肉毒梭菌B型(菌株Okra)的培养物中分离染色体DNA。用引物#6和#7(图6)通过PCR扩增产生了编码具有BoNT(A)修饰的环序列的BoNT(B)轻链的基因片段。用引物#8和#9(图6)了产生编码BoNT(B)的易位域的基因片段。克隆到表达质粒pQE-60中是这样实现的:首先借助Nco I和Stu I限制性位点,用BoNT(B)-Lmodl扩增产物替换pQE-BoNT(A)-Lmodl中的BoNT(A)-L基因片段。接下来,借助Stu I和XhoI限制性位点将BoNT(B)-HN扩增产物克隆在其后面,由此产生质粒pQE-BoNT(B)-LmodlHN(序列#5)。以类似于实施例1的方式在宿主菌株M15[pREP4]中表达并纯化LHN片段。SDS聚丙烯酰胺凝胶上的分析显示在还原条件下有大约50kDa和55kDa的两条带被考马斯染色,而在非还原条件下观察到一条大约105kDa的带(图8)。这些清楚地说明LHN片段基本上作为双链多肽从细菌中释放,其中多于80%的两条链通过二硫键彼此共价连接。
实施例4克隆和表达具有修饰的环的肉毒杆菌神经毒素C1型LHN片段和切割位点的鉴定
为了克隆轻链以及易位域的DNA序列,从肉毒梭菌C1型(菌株C205)的培养物中制备染色体DNA。用引物#10和#11进行PCR扩增(图6)产生了编码具有BoNT(A)的修饰环序列的BoNT(C1)轻链的基因片段。用引物#12和#13(图6),产生编码BoNT(C1)的易位域的基因片段。克隆到表达质粒pQE-60中是这样实现的:首先借助Nco I和Stu I的限制性位点用pQE-BoNT(C1)-Lmodl扩增产物替换pQE-BoNT(A)-Lmodl中的BoNT(A)-L基因片段。接下来,借助Stu I和Xho I限制性位点将BoNT(C1)-HN扩增产物克隆在其后面,由此产生质粒pQE-BoNT(C1)-LmodlHN(序列#7)。以类似于实施例1的方式在宿主菌株M15[pREP4]中表达并纯化LHN片段。SDS聚丙烯酰胺凝胶上的分析显示在还原条件下有大约50kDa和55kDa的两条带被考马斯染色,而在非还原条件下观察到一条大约105kDa的带。这清楚地说明多于90%的LHN片段作为双链多肽从细菌中释放,在所述双链多肽中两条链通过二硫键彼此共价连接。对HN片段最先四个氨基酸残基的N末端测序结果为序列Ser-Leu-Val-Pro。大肠杆菌裂解物中蛋白酶活性所致的切割发生在Lys447之后,因而在插入BoNT(A)环中的五肽Val-Pro-Arg-Gly-Ser的N端方向上。通过直接诱变,将插入的五肽的精氨酸残基替换为组氨酸、酪氨酸和谷氨酰胺。温育大肠杆菌裂解物两小时之后,以相同方式表达的诱变的LHN片段中多于90%以双链二硫键化的形式存在,其中切割的效率稍低于含有用五肽Vl-Pro-Arg-Gly-Ser修饰的BoNT(A)环的LHN片段。
实施例5克隆和表达带有修饰环的重组肉毒杆菌神经毒素C1型
使用肉毒梭菌C205菌株的染色体DNA,用引物#12和#14(图6)扩增编码重链的基因片段。借助Stu I和Xho I的限制性位点将其克隆到质粒BoNT(C1)-LmodlHN中编码轻链的序列段和His标签的序列段之间(质粒pQE-BoNT(C1)-LmodlHNHC;序列#6)。用相应的表达质粒转化大肠杆菌表达菌株M15[pREP4](Qiagen)。以类似于实施例1的方式在宿主菌株M15[pREP4]中表达并纯化。SDS聚丙烯酰胺凝胶上的分析显示在还原条件下有大约50kDa和105kDa的两条带被考马斯染色,而在非还原条件下观察到一条大约155kDa的带(图9)。这样清楚地证明,多于90%的重组神经毒素作为双链多肽从细菌中释放,在所述双链多肽中两条链通过二硫键彼此共价连接。偏侧膈鉴定(hemidiaphragm assay)中活性检测的结果是其毒性可以与分离自肉毒梭菌的天然神经毒素C1型的毒性相比较。因此轻链和易位域之间环区域的修饰对毒性不产生影响。
实施例6克隆和表达具有修饰的环的假单胞菌外毒素(Pe40)的重组片段
使用菌株铜绿假单胞菌(Pseudomonas aeruginosa)103的染色体DNA,使用引物#17和#18(图6)通过PCR扩增了一个基因片段,其编码域II中位于半胱氨酸残基13和36之间的环的C端的区域以及域III。借助Nco I和Mlu I将扩增产物克隆到质粒pQE-BoNT(A)-Lmodl中,替换基因片段BoNT(A)-Lmodl(质粒pQE-PEII3III)。通过寡核苷酸#15和#16(图6)的杂交并借助Nco I和Kpn I限制性位点克隆,将环N端方向的域II区域的序列段插入质粒pQE-PEII3III中(质粒pQE-PEIImod III;序列#9)。用相应的表达质粒转化大肠杆菌表达菌株M15[pREP4](Qiagen)。以类似于实施例1的方式在宿主菌株M15[pREP4]中表达和纯化。SDS凝胶上还原条件下的分析产生一条较弱的40kDa的带和一条较强的37kDa的带。然而在非还原条件下,仅观察到一条40kDa的带。当亲和层析纯化之前室温温育细胞裂解物至少两小时时,在还原条件下不再能够检测到40kDa的带。用修饰的BoNT(A)环替换PE40片段的域II中半胱氨酸残基13和36之间的环区域,从而发生了多肽链的切割,其中前述半胱氨酸残基形成二硫键。在12%SDS凝胶中还原之后,不再能够检测到大约3kDa的N末端片段。
实施例7克隆和表达具有修饰的环的白喉毒素(Dt389)的重组片段
使用白喉棒杆菌(Corynebacterium diphtheria)NCTC13129菌株的染色体DNA,用引物#19和#20(图6)通过PCR扩增编码白喉毒素A链的基因片段。借助Nco I和Stu I的限制性位点将扩增产物克隆到质粒pQE-BoNT(A)-Lmodl中(参见实施例1)(质粒pQE-DT-Amodl)。以相同的方式,用引物#21和#22(图6)扩增编码B链N末端片段的基因片段,并且将该基因片段借助Stu I和XhoI的限制性位点克隆到pQE-DT-Amodl中(质粒pQE-DT389-modl;序列#10)。用相应的表达质粒转化大肠杆菌表达菌株M15[pREP4](Qiagen)。以类似于实施例1的方式在宿主菌株M15[pREP4]中表达和纯化。SDS聚丙烯酰胺凝胶上的分析显示,在还原条件下两条大约22kDa的带被考马斯染色,而在非还原条件下观察到一条大约43kDa的带。这清楚地说明,多于90%的重组白喉毒素片段作为双链多肽从细菌中释放,在所述双链多肽中两条链通过二硫键彼此共价连接。
实施例8克隆和表达具有修饰的环的重组蓖麻毒蛋白
使用蓖麻的种子mRNA,用引物#23和#24(图6)通过RT-PCR扩增编码蓖麻毒蛋白A链的基因片段。借助Nco I和Xho I的限制性位点将其克隆到质粒pQE-BoNT(A)-Lmodl中(参见实施例1)(质粒pQE-Ricin-A)。以相同的方式,用引物#25和#26(图6)扩增编码B链的基因片段,并借助Kpn I和Xho I的限制性位点克隆到pQE-Ricin-A中(质粒pQE-Ricin-modl;序列#11)。用相应的表达质粒转化大肠杆菌表达菌株M15[pREP4](Qiagen)。以类似于实施例1的方式在宿主菌株M15[pREP4]中表达并纯化所表达的蓖麻毒蛋白的可溶部分。SDS聚丙烯酰胺凝胶上的分析显示,在还原条件下有两条大约19kDa和42kDa的带被考马斯染色,而在非还原条件下观察到大约62kDa的带。这清楚的说明多于90%的重组蓖麻毒蛋白的可溶部分以双链多肽形式从细菌中释放,所述双链多肽中两条链通过二硫键彼此共价连接。
科学文献
Arora et al.(1999),Cancer Res.59:3-8
Collier(2001),Toxicon39(11):1793-803
Fujinaga(1997),Microbiology143:3841-47
Ogata et al.(1990),J.Biol.Chem265(33):20678-85
Reiter(2001),Adv.Cancer Res.81:93-124
Schiavo and Montecucco(1997),The Clostridia:Molecular Biology andPathogenesis,Academic Press,San Diego:295-322
Williams et al.(1990)J.Biol Chem,265(33):20673-77
专利文献
Borgford,美国专利6,593,132
Brown and Jones,WO89/04839
Fitzgerald et al.,美国专利6,426,075
Pastan et al.,美国专利5,980,895
序列表
<110>比奥泰康医疗有限责任公司(BioteCon Therapeutics GmbH)
<120>二硫桥连双链形式的蛋白质的重组表达
<130>BIO-008PCT/natPh
<140>PCT/DE 2006/000088
<141>2006-01-20
<150>102005002978.7
<151>2005-01-21
<160>22
<170>PatentIn version 3.3
<210>1
<211>3915
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>1
atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct    60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat    120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat    180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca    240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca    300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga    360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca    420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt    480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat    540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt    600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca    660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat    720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt    780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac    840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct    900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa    960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag    1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta    1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct    1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac    1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact    1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa    1320
tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg    1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa    1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa    1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt    1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga    1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa    1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt    1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca    1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa    1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct    1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga    1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca    2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt    2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag    2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca    2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat    2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct    2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg    2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta    2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa    2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa    2580
agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat    2640
ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt    2700
ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa    2760
agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat    2820
tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat    2880
gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat    2940
ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa    3000
tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact    3060
aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca    3120
atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt    3180
agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat    3240
gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtatttt aaaagacttt    3300
tggggtgatt atttacaata tgataaacca tactatatgt taaatttata tgatccaaat    3360
aaatatgtcg atgtaaataa tgtaggtatt agaggttata tgtatcttaa agggcctaga    3420
ggtagcgtaa tgactacaaa catttattta aattcaagtt tgtatagggg gacaaaattt    3480
attataaaaa aatatgcttc tggaaataaa gataatattg ttagaaataa tgatcgtgta    3540
tatattaatg tagtagttaa aaataaagaa tataggttag ctactaatgc atcacaggca    3600
ggcgtagaaa aaatactaag tgcattagaa atacctgatg taggaaatct aagtcaagta    3660
gtagtaatga agtcaaaaaa tgatcaagga ataacaaata aatgcaaaat gaatttacaa    3720
gataataatg ggaatgatat aggctttata ggatttcatc agtttaataa tatagctaaa    3780
ctagtagcaa gtaattggta taatagacaa atagaaagat ctagtaggac tttgggttgc    3840
tcatgggaat ttattcctgt agatgatgga tggggagaaa ggccactgct cgagcaccac    3900
caccaccacc actaa                                                     3915
<210>2
<211>1304
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>2
Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1               5                   10                  15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro
            20                  25                  30
Val Lys Ala Phe Lys Ile His Asn Lys  Ile Trp ValIle Pro Glu Arg
        35                  40                  45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
    50                  55                  60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65                  70                  75                  80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
                85                  90                  95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val
            100                 105                 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
        115                 120                 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
    130                 135                 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145                 150                 155                 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
                165                 170                 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
            180                 185                 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
        195                 200                 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
    210                 215                 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225                 230                 235                 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
                245                 250                 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
            260                 265                 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
        275                 280                 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
    290                 295                 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305                 310                 315                 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
                325                 330                 335
Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp
            340                 345                 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
        355                 360                 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
    370                 375                 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385                 390                 395                 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
                405                 410                 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
            420                 425                 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys
        435                 440                 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
    450                 455                 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465                 470                 475                 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
                485                 490                 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
            500                 505                 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu
        515                 520                 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
    530                 535                 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545                 550                 555                 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
                565                 570                 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
            580                 585                 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
        595                 600                 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
    610                 615                 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625                 630                 635                 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
                645                 650                 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
            660                 665                 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
        675                 680                 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
    690                 695                 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705                 710                 715                 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
                725                 730                 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
            740                 745                 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
        755                 760                 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
    770                 775                 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785                 790                 795                 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
                805                 810                 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
            820                 825                 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
        835                 840                 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
    850                 855                 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn
865                 870                 875                 880
Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser
                885                 890                 895
Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn
            900                 905                 910
Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu
        915                 920                 925
Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser
    930                 935                 940
Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn
945                 950                 955                 960
Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val
                965                 970                 975
Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu
            980                 985                 990
Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser
        995                 1000                1005
Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg
    1010                1015                1020
Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln
    1025                1030                1035
Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile
    1040                1045                1050
Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp
    1055                1060                1065
Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu
    1070                1075                1080
Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Ile Leu Lys
    1085                1090                1095
Asp Phe Trp Gly Asp Tyr Leu Gln Tyr Asp Lys Pro Tyr Tyr Met
    1100                1105                1110
Leu Asn Leu Tyr Asp Pro Asn Lys Tyr Val Asp Val Asn Asn Val
    1115                1120                1125
Gly Ile Arg Gly Tyr Met Tyr Leu Lys Gly Pro Arg Gly Ser Val
    1130                1135                1140
Met Thr Thr Asn Ile Tyr Leu Asn Ser Ser Leu Tyr Arg Gly Thr
    1145                1150                1155
Lys Phe Ile Ile Lys Lys Tyr Ala Ser Gly Asn Lys Asp Asn Ile
    1160                1165                1170
Val Arg Asn Asn Asp Arg Val Tyr Ile Asn Val Val Val Lys Asn
    1175                1180                1185
Lys Glu Tyr Arg Leu Ala Thr Asn Ala Ser Gln Ala Gly Val Glu
    1190                1195                1200
Lys Ile Leu Ser Ala Leu Glu Ile Pro Asp Val Gly Asn Leu Ser
    1205                1210                1215
Gln Val Val Val Met Lys Ser Lys Asn Asp Gln Gly Ile Thr Asn
    1220                1225                1230
Lys Cys Lys Met Asn Leu Gln Asp Asn Asn Gly Asn Asp Ile Gly
    1235                1240                1245
Phe Ile Gly Phe His Gln Phe Asn Asn Ile Ala Lys Leu Val Ala
    1250                1255                1260
Ser Asn Trp Tyr Asn Arg Gln Ile Glu Arg Ser Ser Arg Thr Leu
    1265                1270                1275
Gly Cys Ser Trp Glu Phe Ile Pro Val Asp Asp Gly Trp Gly Glu
    1280                1285                1290
Arg Pro Leu Leu Glu His His His His His His
    1295                1300
<210>3
<211>2646
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>3
atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct    60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat    120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat    180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca    240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca    300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga    360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca    420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt    480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat    540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt    600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca    660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat    720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt    780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac    840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct    900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa    960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag    1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta    1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct    1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac    1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact    1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa    1320
tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg    1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa    1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa    1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt    1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga    1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa    1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt    1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca    1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa    1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct    1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga    1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca    2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt    2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag    2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca    2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat    2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct    2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg    2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta    2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa    2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa    2580
agattattat ctacatttac tgaatatatt aagaatattc tcgagcacca ccaccaccac    2640
cactaa                                                               2646
<210>4
<211>881
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>4
Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1               5                   10                  15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro
            20                  25                  30
Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg
        35                  40                  45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
    50                  55                  60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65                  70                  75                  80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
                85                  90                  95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ssr Ile Val
            100                 105                 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
        115                 120                 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
    130                 135                 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145                 150                 155                 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
                165                 170                 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
            180                 185                 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
        195                 200                 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
    210                 215                 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225                 230                 235                 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
                245                 250                 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
            260                 265                 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
        275                 280                 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
    290                 295                 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305                 310                 315                 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
                325                 330                 335
Lys  Phe Asp Lys Leu Tyr Lys Met Leu Thr GluIle Tyr Thr Glu Asp
            340                 345                 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
        355                 360                 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
    370                 375                 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385                 390                 395                 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
                405                 410                 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
            420                 425                 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys
         435                 440                 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
    450                 455                 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465                 470                 475                 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
                485                 490                 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
            500                 505                 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser Asp Ile Ile Gly Gln Leu
        515                 520                 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
    530                 535                 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545                 550                 555                 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
                565                 570                 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
            580                 585                 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
        595                 600                 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
    610                 615                 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625                 630                 635                 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
                645                 650                 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
            660                 665                 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
        675                 680                 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
    690                 695                 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705                 710                 715                 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
                725                 730                 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
            740                 745                 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
        755                 760                 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
    770                 775                 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785                 790                 795                 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
                805                 810                 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
            820                 825                 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
        835                 840                 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
    850                 855                 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Leu Glu His His His His His
865                 870                 875                 880
His
<210>5
<211>3312
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>5
atggcatttg ttaataaaca atttaattat aaagatcctg taaatggtgt tgatattgct    60
tatataaaaa ttccaaatgc aggacaaatg caaccagtaa aagcttttaa aattcataat    120
aaaatatggg ttattccaga aagagataca tttacaaatc ctgaagaagg agatttaaat    180
ccaccaccag aagcaaaaca agttccagtt tcatattatg attcaacata tttaagtaca    240
gataatgaaa aagataatta tttaaaggga gttacaaaat tatttgagag aatttattca    300
actgatcttg gaagaatgtt gttaacatca atagtaaggg gaataccatt ttggggtgga    360
agtacaatag atacagaatt aaaagttatt gatactaatt gtattaatgt gatacaacca    420
gatggtagtt atagatcaga agaacttaat ctagtaataa taggaccctc agctgatatt    480
atacagtttg aatgtaaaag ctttggacat gaagttttga atcttacgcg aaatggttat    540
ggctctactc aatacattag atttagccca gattttacat ttggttttga ggagtcactt    600
gaagttgata caaatcctct tttaggtgca ggcaaatttg ctacagatcc agcagtaaca    660
ttagcacatg aacttataca tgctggacat agattatatg gaatagcaat taatccaaat    720
agggttttta aagtaaatac taatgcctat tatgaaatga gtgggttaga agtaagcttt    780
gaggaactta gaacatttgg gggacatgat gcaaagttta tagatagttt acaggaaaac    840
gaatttcgtc tatattatta taataagttt aaagatatag caagtacact taataaagct    900
aaatcaatag taggtactac tgcttcatta cagtatatga aaaatgtttt taaagagaaa    960
tatctcctat ctgaagatac atctggaaaa ttttcggtag ataaattaaa atttgataag    1020
ttatacaaaa tgttaacaga gatttacaca gaggataatt ttgttaagtt ttttaaagta    1080
cttaacagaa aaacatattt gaattttgat aaagccgtat ttaagataaa tatagtacct    1140
aaggtaaatt acacaatata tgatggattt aatttaagaa atacaaattt agcagcaaac    1200
tttaatggtc aaaatacaga aattaataat atgaatttta ctaaactaaa aaattttact    1260
ggattgtttg aattttataa gttgctatgt gtaagaggga taataacttc taaaactaaa    1320
tcattagttc cgcgtggatc caaggcctta aatgatttat gtatcaaagt taataattgg    1380
gacttgtttt ttagtccttc agaagataat tttactaatg atctaaataa aggagaagaa    1440
attacatctg atactaatat agaagcagca gaagaaaata ttagtttaga tttaatacaa    1500
caatattatt taacctttaa ttttgataat gaacctgaaa atatttcaat agaaaatctt    1560
tcaagtgaca ttataggcca attagaactt atgcctaata tagaaagatt tcctaatgga    1620
aaaaagtatg agttagataa atatactatg ttccattatc ttcgtgctca agaatttgaa    1680
catggtaaat ctaggattgc tttaacaaat tctgttaacg aagcattatt aaatcctagt    1740
cgtgtttata catttttttc ttcagactat gtaaagaaag ttaataaagc tacggaggca    1800
gctatgtttt taggctgggt agaacaatta gtatatgatt ttaccgatga aactagcgaa    1860
gtaagtacta cggataaaat tgcggatata actataatta ttccatatat aggacctgct    1920
ttaaatatag gtaatatgtt atataaagat gattttgtag gtgctttaat attttcagga    1980
gctgttattc tgttagaatt tataccagag attgcaatac ctgtattagg tacttttgca    2040
cttgtatcat atattgcgaa taaggttcta accgttcaaa caatagataa tgctttaagt    2100
aaaagaaatg aaaaatggga tgaggtctat aaatatatag taacaaattg gttagcaaag    2160
gttaatacac agattgatct aataagaaaa aaaatgaaag aagctttaga aaatcaagca    2220
gaagcaacaa aggctataat aaactatcag tataatcaat atactgagga agagaaaaat    2280
aatattaatt ttaatattga tgatttaagt tcgaaactta atgagtctat aaataaagct    2340
atgattaata taaataaatt tttgaatcaa tgctctgttt catatttaat gaattctatg    2400
atcccttatg gtgttaaacg gttagaagat tttgatgcta gtcttaaaga tgcattatta    2460
aagtatatat atgataatag aggaacttta attggtcaag tagatagatt aaaagataaa    2520
gttaataata cacttagtac agatatacct tttcagcttt ccaaatacgt agataatcaa    2580
agattattat ctacatttac tgaatatatt aagaatatta ttaatacttc tatattgaat    2640
ttaagatatg aaagtaatca tttaatagac ttatctaggt atgcatcaaa aataaatatt    2700
ggtagtaaag taaattttga tccaatagat aaaaatcaaa ttcaattatt taatttagaa    2760
agtagtaaaa ttgaggtaat tttaaaaaat gctattgtat ataatagtat gtatgaaaat    2820
tttagtacta gcttttggat aagaattcct aagtatttta acagtataag tctaaataat    2880
gaatatacaa taataaattg tatggaaaat aattcaggat ggaaagtatc acttaattat    2940
ggtgaaataa tctggacttt acaggatact caggaaataa aacaaagagt agtttttaaa    3000
tacagtcaaa tgattaatat atcagattat ataaacagat ggatttttgt aactatcact    3060
aataatagat taaataactc taaaatttat ataaatggaa gattaataga tcaaaaacca    3120
atttcaaatt taggtaatat tcatgctagt aataatataa tgtttaaatt agatggttgt    3180
agagatacac atagatatat ttggataaaa tattttaatc tttttgataa ggaattaaat    3240
gaaaaagaaa tcaaagattt atatgataat caatcaaatt caggtctcga gcaccaccac    3300
caccaccact aa                                                        3312
<210>6
<211>1103
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>6
Met Ala Phe Val Asn Lys Gln Phe Asn Tyr Lys Asp Pro Val Asn Gly
1               5                   10                  15
Val Asp Ile Ala Tyr Ile Lys Ile Pro Asn Val Gly Gln Met Gln Pro
             20                  25                  30
Val Lys Ala Phe Lys Ile His Asn Lys Ile Trp Val Ile Pro Glu Arg
        35                  40                  45
Asp Thr Phe Thr Asn Pro Glu Glu Gly Asp Leu Asn Pro Pro Pro Glu
    50                  55                  60
Ala Lys Gln Val Pro Val Ser Tyr Tyr Asp Ser Thr Tyr Leu Ser Thr
65                  70                  75                  80
Asp Asn Glu Lys Asp Asn Tyr Leu Lys Gly Val Thr Lys Leu Phe Glu
                85                  90                  95
Arg Ile Tyr Ser Thr Asp Leu Gly Arg Met Leu Leu Thr Ser Ile Val
            100                 105                 110
Arg Gly Ile Pro Phe Trp Gly Gly Ser Thr Ile Asp Thr Glu Leu Lys
        115                 120                 125
Val Ile Asp Thr Asn Cys Ile Asn Val Ile Gln Pro Asp Gly Ser Tyr
    130                 135                 140
Arg Ser Glu Glu Leu Asn Leu Val Ile Ile Gly Pro Ser Ala Asp Ile
145                 150                 155                 160
Ile Gln Phe Glu Cys Lys Ser Phe Gly His Glu Val Leu Asn Leu Thr
                165                 170                 175
Arg Asn Gly Tyr Gly Ser Thr Gln Tyr Ile Arg Phe Ser Pro Asp Phe
            180                 185                 190
Thr Phe Gly Phe Glu Glu Ser Leu Glu Val Asp Thr Asn Pro Leu Leu
        195                 200                 205
Gly Ala Gly Lys Phe Ala Thr Asp Pro Ala Val Thr Leu Ala His Glu
    210                 215                 220
Leu Ile His Ala Gly His Arg Leu Tyr Gly Ile Ala Ile Asn Pro Asn
225                 230                 235                 240
Arg Val Phe Lys Val Asn Thr Asn Ala Tyr Tyr Glu Met Ser Gly Leu
                245                 250                 255
Glu Val Ser Phe Glu Glu Leu Arg Thr Phe Gly Gly His Asp Ala Lys
            260                 265                 270
Phe Ile Asp Ser Leu Gln Glu Asn Glu Phe Arg Leu Tyr Tyr Tyr Asn
        275                 280                 285
Lys Phe Lys Asp Ile Ala Ser Thr Leu Asn Lys Ala Lys Ser Ile Val
    290                 295                 300
Gly Thr Thr Ala Ser Leu Gln Tyr Met Lys Asn Val Phe Lys Glu Lys
305                 310                 315                 320
Tyr Leu Leu Ser Glu Asp Thr Ser Gly Lys Phe Ser Val Asp Lys Leu
                325                 330                 335
Lys Phe Asp Lys Leu Tyr Lys Met Leu Thr Glu Ile Tyr Thr Glu Asp
            340                 345                 350
Asn Phe Val Lys Phe Phe Lys Val Leu Asn Arg Lys Thr Tyr Leu Asn
        355                 360                 365
Phe Asp Lys Ala Val Phe Lys Ile Asn Ile Val Pro Lys Val Asn Tyr
    370                 375                 380
Thr Ile Tyr Asp Gly Phe Asn Leu Arg Asn Thr Asn Leu Ala Ala Asn
385                 390                 395                 400
Phe Asn Gly Gln Asn Thr Glu Ile Asn Asn Met Asn Phe Thr Lys Leu
                405                 410                 415
Lys Asn Phe Thr Gly Leu Phe Glu Phe Tyr Lys Leu Leu Cys Val Arg
            420                 425                 430
Gly Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys
        435                 440                 445
Ala Leu Asn Asp Leu Cys Ile Lys Val Asn Asn Trp Asp Leu Phe Phe
    450                 455                 460
Ser Pro Ser Glu Asp Asn Phe Thr Asn Asp Leu Asn Lys Gly Glu Glu
465                 470                 475                 480
Ile Thr Ser Asp Thr Asn Ile Glu Ala Ala Glu Glu Asn Ile Ser Leu
                485                 490                 495
Asp Leu Ile Gln Gln Tyr Tyr Leu Thr Phe Asn Phe Asp Asn Glu Pro
            500                 505                 510
Glu Asn Ile Ser Ile Glu Asn Leu Ser Ser AspIle  Ile Gly Gln Leu
        515                 520                 525
Glu Leu Met Pro Asn Ile Glu Arg Phe Pro Asn Gly Lys Lys Tyr Glu
    530                 535                 540
Leu Asp Lys Tyr Thr Met Phe His Tyr Leu Arg Ala Gln Glu Phe Glu
545                 550                 555                 560
His Gly Lys Ser Arg Ile Ala Leu Thr Asn Ser Val Asn Glu Ala Leu
                565                 570                 575
Leu Asn Pro Ser Arg Val Tyr Thr Phe Phe Ser Ser Asp Tyr Val Lys
            580                 585                 590
Lys Val Asn Lys Ala Thr Glu Ala Ala Met Phe Leu Gly Trp Val Glu
        595                 600                 605
Gln Leu Val Tyr Asp Phe Thr Asp Glu Thr Ser Glu Val Ser Thr Thr
    610                 615                 620
Asp Lys Ile Ala Asp Ile Thr Ile Ile Ile Pro Tyr Ile Gly Pro Ala
625                 630                 635                 640
Leu Asn Ile Gly Asn Met Leu Tyr Lys Asp Asp Phe Val Gly Ala Leu
                645                 650                 655
Ile Phe Ser Gly Ala Val Ile Leu Leu Glu Phe Ile Pro Glu Ile Ala
            660                 665                 670
Ile Pro Val Leu Gly Thr Phe Ala Leu Val Ser Tyr Ile Ala Asn Lys
        675                 680                 685
Val Leu Thr Val Gln Thr Ile Asp Asn Ala Leu Ser Lys Arg Asn Glu
    690                 695                 700
Lys Trp Asp Glu Val Tyr Lys Tyr Ile Val Thr Asn Trp Leu Ala Lys
705                 710                 715                 720
Val Asn Thr Gln Ile Asp Leu Ile Arg Lys Lys Met Lys Glu Ala Leu
                725                 730                 735
Glu Asn Gln Ala Glu Ala Thr Lys Ala Ile Ile Asn Tyr Gln Tyr Asn
            740                 745                 750
Gln Tyr Thr Glu Glu Glu Lys Asn Asn Ile Asn Phe Asn Ile Asp Asp
        755                 760                 765
Leu Ser Ser Lys Leu Asn Glu Ser Ile Asn Lys Ala Met Ile Asn Ile
    770                 775                 780
Asn Lys Phe Leu Asn Gln Cys Ser Val Ser Tyr Leu Met Asn Ser Met
785                 790                 795                 800
Ile Pro Tyr Gly Val Lys Arg Leu Glu Asp Phe Asp Ala Ser Leu Lys
                805                 810                 815
Asp Ala Leu Leu Lys Tyr Ile Tyr Asp Asn Arg Gly Thr Leu Ile Gly
            820                 825                 830
Gln Val Asp Arg Leu Lys Asp Lys Val Asn Asn Thr Leu Ser Thr Asp
        835                 840                 845
Ile Pro Phe Gln Leu Ser Lys Tyr Val Asp Asn Gln Arg Leu Leu Ser
    850                 855                 860
Thr Phe Thr Glu Tyr Ile Lys Asn Ile Ile Asn Thr Ser Ile Leu Asn
865                 870                 875                 880
Leu Arg Tyr Glu Ser Asn His Leu Ile Asp Leu Ser Arg Tyr Ala Ser
                885                 890                 895
Lys Ile Asn Ile Gly Ser Lys Val Asn Phe Asp Pro Ile Asp Lys Asn
            900                 905                 910
Gln Ile Gln Leu Phe Asn Leu Glu Ser Ser Lys Ile Glu Val Ile Leu
        915                 920                 925
Lys Asn Ala Ile Val Tyr Asn Ser Met Tyr Glu Asn Phe Ser Thr Ser
    930                 935                 940
Phe Trp Ile Arg Ile Pro Lys Tyr Phe Asn Ser Ile Ser Leu Asn Asn
945                 950                 955                 960
Glu Tyr Thr Ile Ile Asn Cys Met Glu Asn Asn Ser Gly Trp Lys Val
                965                 970                 975
Ser Leu Asn Tyr Gly Glu Ile Ile Trp Thr Leu Gln Asp Thr Gln Glu
            980                 985                 990
Ile Lys Gln Arg Val Val Phe Lys Tyr Ser Gln Met Ile Asn Ile Ser
        995                 1000                1005
Asp Tyr Ile Asn Arg Trp Ile Phe Val Thr Ile Thr Asn Asn Arg
    1010                1015                1020
Leu Asn Asn Ser Lys Ile Tyr Ile Asn Gly Arg Leu Ile Asp Gln
    1025                1030                1035
Lys Pro Ile Ser Asn Leu Gly Asn Ile His Ala Ser Asn Asn Ile
    1040                1045                1050
Met Phe Lys Leu Asp Gly Cys Arg Asp Thr His Arg Tyr Ile Trp
    1055                1060                1065
Ile Lys Tyr Phe Asn Leu Phe Asp Lys Glu Leu Asn Glu Lys Glu
    1070                1075                1080
Ile Lys Asp Leu Tyr Asp Asn Gln Ser Asn Ser Gly Leu Glu His
    1085                1090                1095
His His His His His
    1100
<210>7
<211>3942
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>7
atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt    60
atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca    120
gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat    180
aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat    240
actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa    300
tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga    360
gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa    420
ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata    480
tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat    540
tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta    600
agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat    660
ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat    720
ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct    780
acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata    840
actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt    900
gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat    960
aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata    1020
gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat    1080
atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca    1140
gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata    1200
tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct    1260
tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg    1320
ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt    1380
attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat    1440
ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc    1500
cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa    1560
aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct    1620
ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt    1680
cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct    1740
aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa    1800
gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat    1860
aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta    1920
gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca    1980
ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt    2040
ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta    2100
actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca    2160
acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa    2220
gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag    2280
tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa    2340
gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa    2400
atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg    2460
ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca    2520
aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat    2580
acaatactaa tagaaatgtt taataaatat aatagcgaaa ttttaaataa tattatctta    2640
aatttaagat ataaggataa taatttaata gatttatcag gatatggggc aaaggtagag    2700
gtatatgatg gagtcgagct taatgataaa aatcaattta aattaactag ttcagcaaat    2760
agtaagatta gagtgactca aaatcagaat atcatattta atagtgtgtt ccttgatttt    2820
agcgttagct tttggataag aatacctaaa tataagaatg atggtataca aaattatatt    2880
cataatgaat atacaataat taattgtatg aaaaataatt cgggctggaa aatatctatt    2940
aggggtaata ggataatatg gactttaatt gatataaatg gaaaaaccaa atcggtattt    3000
tttgaatata acataagaga agatatatca gagtatataa atagatggtt ttttgtaact    3060
attactaata atttgaataa cgctaaaatt tatattaatg gtaagctaga atcaaataca    3120
gatattaaag atataagaga agttattgct aatggtgaaa taatatttaa attagatggt    3180
gatatagata gaacacaatt tatttggatg aaatatttca gtatttttaa tacggaatta    3240
agtcaatcaa atattgaaga aagatataaa attcaatcat atagcgaata tttaaaagat    3300
ttttggggaa atcctttaat gtacaataaa gaatattata tgtttaatgc ggggaataaa    3360
aattcatata ttaaactaaa gaaagattca cctgtaggtg aaattttaac acgtagcaaa    3420
tataatcaaa attctaaata tataaattat agagatttat atattggaga aaaatttatt    3480
ataagaagaa agtcaaattc tcaatctata aatgatgata tagttagaaa agaagattat    3540
atatatctag atttttttaa tttaaatcaa gagtggagag tatataccta taaatatttt    3600
aagaaagagg aagaaaaatt gtttttagct cctataagtg attctgatga gttttacaat    3660
actatacaaa taaaagaata tgatgaacag ccaacatata gttgtcagtt gctttttaaa    3720
aaagatgaag aaagtactga tgagatagga ttgattggta ttcatcgttt ctacgaatct    3780
ggaattgtat ttgaagagta taaagattat ttttgtataa gtaaatggta cttaaaagag    3840
gtaaaaagga aaccatataa tttaaaattg ggatgtaatt ggcagtttat tcctaaagat    3900
gaagggtgga ctgaactcga gcaccaccac caccaccactaa                        3942
<210>8
<211>1313
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>8
Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn
1               5                   10                  15
Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg
            20                  25                  30
Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu
        35                  40                  45
Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly
    50                  55                  60
Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn
65                  70                  75                  80
Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe
                85                  90                  95
Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile
            100                 105                 110
Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu
        115                 120                 125
Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn
    130                 135                 140
Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile
145                 150                 155                 160
Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly
                165                 170                 175
Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln
            180                 185                 190
Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu
        195                 200                 205
Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro
    210                 215                 220
Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr
225                 230                 235                 240
Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe
                245                 250                 255
Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe
            260                 265                 270
Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile
        275                 280                 285
Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn
    290                 295                 300
Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr
305                 310                 315                 320
Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly
                325                 330                 335
Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu
            340                 345                 350
Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys
        355                 360                 365
Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys
    370                 375                 380
Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile
385                 390                 395                 400
Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile
                405                 410                 415
Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr
            420                 425                 430
Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser
        435                 440                 445
Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp
    450                 455                 460
Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp
465                 470                 475                 480
Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile
                485                 490                 495
Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile
            500                 505                 510
Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe
        515                 520                 525
Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile
    530                 535                 540
Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe
545                 550                 555                 560
Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala
                565                 570                 575
Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile
            580                 585                 590
Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val
        595                 600                 605
Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr
    610                 615                 620
Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu
625                 630                 635                 640
Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala
                645                 650                 655
Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu
            660                 665                 670
Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn
        675                 680                 685
Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn
    690                 695                 700
Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser
705                 710                 715                 720
Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala
                725                 730                 735
Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr
            740                 745                 750
Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn
        755                 760                 765
Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn
    770                 775                 780
Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys
785                 790                 795                 800
Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu
                805                 810                 815
Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile
            820                 825                 830
Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr
        835                 840                 845
Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile
    850                 855                 860
Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Asn Asn Ile Ile Leu
865                 870                 875                 880
Asn Leu Arg Tyr Lys Asp Asn Asn Leu Ile Asp Leu Ser Gly Tyr Gly
                885                 890                 895
Ala Lys Val Glu Val Tyr Asp Gly Val Glu Leu Asn Asp Lys Asn Gln
            900                 905                 910
Phe Lys Leu Thr Ser Ser Ala Asn Ser Lys Ile Arg Val Thr Gln Asn
        915                 920                 925
Gln Asn Ile Ile Phe Asn Ser Val Phe Leu Asp Phe Ser Val Ser Phe
    930                 935                 940
Trp Ile Arg Ile Pro Lys Tyr Lys Asn Asp Gly Ile Gln Asn Tyr Ile
945                 950                 955                 960
His Asn Glu Tyr Thr Ile Ile Asn Cys Met Lys Asn Asn Ser Gly Trp
                965                 970                 975
Lys Ile Ser Ile Arg Gly Asn Arg Ile Ile Trp Thr Leu Ile Asp Ile
            980                 985                 990
Asn Gly Lys Thr Lys Ser Val Phe Phe Glu Tyr Asn Ile Arg Glu Asp
        995                 1000                1005
Ile Ser Glu Tyr Ile Asn Arg Trp Phe Phe Val Thr Ile Thr Asn
    1010                1015                1020
Asn Leu Asn Asn Ala Lys Ile Tyr Ile Asn Gly Lys Leu Glu Ser
    1025                1030                1035
Asn Thr Asp Ile Lys Asp Ile Arg Glu Val Ile Ala Asn Gly Glu
    1040                1045                1050
Ile Ile Phe Lys Leu Asp Gly Asp Ile Asp Arg Thr Gln Phe Ile
    1055                1060                1065
Trp Met Lys Tyr Phe Ser Ile Phe Asn Thr Glu Leu Ser Gln Ser
    1070                1075                1080
Asn Ile Glu Glu Arg Tyr Lys Ile Gln Ser Tyr Ser Glu Tyr Leu
    1085                1090                1095
Lys Asp Phe Trp Gly Asn Pro Leu Met Tyr Asn Lys Glu Tyr Tyr
    1100                1105                1110
Met Phe Asn Ala Gly Asn Lys Asn Ser Tyr Ile Lys Leu Lys Lys
    1115                1120                1125
Asp Ser Pro Val Gly Glu Ile Leu Thr Arg Ser Lys Tyr Asn Gln
    1130                1135                1140
Asn Ser Lys Tyr Ile Asn Tyr Arg Asp Leu Tyr Ile Gly Glu Lys
    1145                1150                1155
Phe Ile Ile Arg Arg Lys Ser Asn Ser Gln Ser Ile Asn Asp Asp
    1160                1165                1170
Ile Val Arg Lys Glu Asp Tyr Ile Tyr Leu Asp Phe Phe Asn Leu
    1175                1180                1185
Asn Gln Glu Trp Arg Val Tyr Thr Tyr Lys Tyr Phe Lys Lys Glu
    1190                1195                1200
Glu Glu Lys Leu Phe Leu Ala Pro Ile Ser Asp Ser Asp Glu Phe
    1205                1210                1215
Tyr Asn Thr Ile Gln Ile Lys Glu Tyr Asp Glu Gln Pro Thr Tyr
    1220                1225                1230
Ser Cys Gln Leu Leu Phe Lys Lys Asp Glu Glu Ser Thr Asp Glu
    1235                1240                1245
Ile Gly Leu Ile Gly Ile His Arg Phe Tyr Glu Ser Gly Ile Val
    1250                1255                1260
Phe Glu Glu Tyr Lys Asp Tyr Phe Cys Ile Ser Lys Trp Tyr Leu
    1265                1270                1275
Lys Glu Val Lys Arg Lys Pro Tyr Asn Leu Lys Leu Gly Cys Asn
    1280                1285                1290
Trp Gln Phe Ile Pro Lys Asp Glu Gly Trp Thr Glu Leu Glu His
    1295                1300                1305
His His His His His
    1310
<210>9
<211>2649
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>9
atggcagtta caataaataa ttttaattat aatgatccta ttgataataa taatattatt    60
atgatggagc ctccatttgc gagaggtacg gggagatatt ataaagcttt taaaatcaca    120
gatcgtattt ggataatacc ggaaagatat acttttggat ataaacctga ggattttaat    180
aaaagttccg gtatttttaa tagagatgtt tgtgaatatt atgatccaga ttacttaaat    240
actaatgata aaaagaatat atttttacaa acaatgatca agttatttaa tagaatcaaa    300
tcaaaaccat tgggtgaaaa gttattagag atgattataa atggtatacc ttatcttgga    360
gatagacgtg ttccactcga agagtttaac acaaacattg ctagtgtaac tgttaataaa    420
ttaatcagta atccaggaga agtggagcga aaaaaaggta ttttcgcaaa tttaataata    480
tttggacctg ggccagtttt aaatgaaaat gagactatag atataggtat acaaaatcat    540
tttgcatcaa gggaaggctt cgggggtata atgcaaatga agttttgccc agaatatgta    600
agcgtattta ataatgttca agaaaacaaa ggcgcaagta tatttaatag acgtggatat    660
ttttcagatc cagccttgat attaatgcat gaacttatac atgttttaca tggattatat    720
ggcattaaag tagatgattt accaattgta ccaaatgaaa aaaaattttt tatgcaatct    780
acagatgcta tacaggcaga agaactatat acatttggag gacaagatcc cagcatcata    840
actccttcta cggataaaag tatctatgat aaagttttgc aaaattttag agggatagtt    900
gatagactta acaaggtttt agtttgcata tcagatccta acattaatat taatatatat    960
aaaaataaat ttaaagataa atataaattc gttgaagatt ctgagggaaa atatagtata    1020
gatgtagaaa gttttgataa attatataaa agcttaatgt ttggttttac agaaactaat    1080
atagcagaaa attataaaat aaaaactaga gcttcttatt ttagtgattc cttaccacca    1140
gtaaaaataa aaaatttatt agataatgaa atctatacta tagaggaagg gtttaatata    1200
tctgataaag atatggaaaa agaatataga ggtcagaata aagctataaa taaacaagct    1260
tatgaagaaa ttagcaagga gcatttggct gtatataaga tacaaatgtg taaaagtggg    1320
ataataactt ctaaaactaa atcattggtt ccacgtggat ccaaggcctc aggaatatgt    1380
attgatgttg ataatgaaga tttgttcttt atagctgata aaaatagttt ttcagatgat    1440
ttatctaaaa acgaaagaat agaatataat acacagagta attatataga aaatgacttc    1500
cctataaatg aattaatttt agatactgat ttaataagta aaatagaatt accaagtgaa    1560
aatacagaat cacttactga ttttaatgta gatgttccag tatatgaaaa acaacccgct    1620
ataaaaaaaa tttttacaga tgaaaatacc atctttcaat atttatactc tcagacattt    1680
cctctagata taagagatat aagtttaaca tcttcatttg atgatgcatt attattttct    1740
aacaaagttt attcattttt ttctatggat tatattaaaa ctgctaataa agtggtagaa    1800
gcaggattat ttgcaggttg ggtgaaacag atagtaaatg attttgtaat cgaagctaat    1860
aaaagcaata ctatggataa aattgcagat atatctctaa ttgttcctta tataggatta    1920
gctttaaatg taggaaatga aacagctaaa ggaaattttg aaaatgcttt tgagattgca    1980
ggagccagta ttctactaga atttatacca gaacttttaa tacctgtagt tggagccttt    2040
ttattagaat catatattga caataaaaat aaaattatta aaacaataga taatgcttta    2l00
actaaaagaa atgaaaaatg gagtgatatg tacggattaa tagtagcgca atggctctca    2160
acagttaata ctcaatttta tacaataaaa gagggaatgt ataaggcttt aaattatcaa    2220
gcacaagcat tggaagaaat aataaaatac agatataata tatattctga aaaagaaaag    2280
tcaaatatta acatcgattt taatgatata aattctaaac ttaatgaggg tattaaccaa    2340
gctatagata atataaataa ttttataaat ggatgttctg tatcatattt aatgaaaaaa    2400
atgattccat tagctgtaga aaaattacta gactttgata atactctcaa aaaaaatttg    2460
ttaaattata tagatgaaaa taaattatat ttgattggaa gtgcagaata tgaaaaatca    2520
aaagtaaata aatacttgaa aaccattatg ccgtttgatc tttcaatata taccaatgat    2580
acaatactaa tagaaatgtt taataaatat aatagcgaaa ttctcgagca ccaccaccac    2640
caccactaa                                                            2649
<210>10
<211>882
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>10
Met Ala Val Thr Ile Asn Asn Phe Asn Tyr Asn Asp Pro Ile Asp Asn
1               5                   10                  15
Asn Asn Ile Ile Met Met Glu Pro Pro Phe Ala Arg Gly Thr Gly Arg
            20                  25                  30
Tyr Tyr Lys Ala Phe Lys Ile Thr Asp Arg Ile Trp Ile Ile Pro Glu
        35                  40                  45
Arg Tyr Thr Phe Gly Tyr Lys Pro Glu Asp Phe Asn Lys Ser Ser Gly
    50                  55                  60
Ile Phe Asn Arg Asp Val Cys Glu Tyr Tyr Asp Pro Asp Tyr Leu Asn
65                  70                  75                  80
Thr Asn Asp Lys Lys Asn Ile Phe Leu Gln Thr Met Ile Lys Leu Phe
                85                  90                  95
Asn Arg Ile Lys Ser Lys Pro Leu Gly Glu Lys Leu Leu Glu Met Ile
            100                 105                 110
Ile Asn Gly Ile Pro Tyr Leu Gly Asp Arg Arg Val Pro Leu Glu Glu
        115                 120                 125
Phe Asn Thr Asn Ile Ala Ser Val Thr Val Asn Lys Leu Ile Ser Asn
    130                 135                 140
Pro Gly Glu Val Glu Arg Lys Lys Gly Ile Phe Ala Asn Leu Ile Ile
145                 150                 155                 160
Phe Gly Pro Gly Pro Val Leu Asn Glu Asn Glu Thr Ile Asp Ile Gly
                165                 170                 175
Ile Gln Asn His Phe Ala Ser Arg Glu Gly Phe Gly Gly Ile Met Gln
            180                 185                 190
Met Lys Phe Cys Pro Glu Tyr Val Ser Val Phe Asn Asn Val Gln Glu
        195                 200                 205
Asn Lys Gly Ala Ser Ile Phe Asn Arg Arg Gly Tyr Phe Ser Asp Pro
    210                 215                 220
Ala Leu Ile Leu Met His Glu Leu Ile His Val Leu His Gly Leu Tyr
225                 230                 235                 240
Gly Ile Lys Val Asp Asp Leu Pro Ile Val Pro Asn Glu Lys Lys Phe
                245                 250                 255
Phe Met Gln Ser Thr Asp Ala Ile Gln Ala Glu Glu Leu Tyr Thr Phe
            260                 265                 270
Gly Gly Gln Asp Pro Ser Ile Ile Thr Pro Ser Thr Asp Lys Ser Ile
        275                 280                 285
Tyr Asp Lys Val Leu Gln Asn Phe Arg Gly Ile Val Asp Arg Leu Asn
    290                 295                 300
Lys Val Leu Val Cys Ile Ser Asp Pro Asn Ile Asn Ile Asn Ile Tyr
305                 310                 315                 320
Lys Asn Lys Phe Lys Asp Lys Tyr Lys Phe Val Glu Asp Ser Glu Gly
                 325                 330                 335
Lys Tyr Ser Ile Asp Val Glu Ser Phe Asp Lys Leu Tyr Lys Ser Leu
            340                 345                 350
Met Phe Gly Phe Thr Glu Thr Asn Ile Ala Glu Asn Tyr Lys Ile Lys
        355                 360                 365
Thr Arg Ala Ser Tyr Phe Ser Asp Ser Leu Pro Pro Val Lys Ile Lys
    370                 375                 380
Asn Leu Leu Asp Asn Glu Ile Tyr Thr Ile Glu Glu Gly Phe Asn Ile
385                 390                 395                 400
Ser Asp Lys Asp Met Glu Lys Glu Tyr Arg Gly Gln Asn Lys Ala Ile
                405                 410                 415
Asn Lys Gln Ala Tyr Glu Glu Ile Ser Lys Glu His Leu Ala Val Tyr
            420                 425                 430
Lys Ile Gln Met Cys Lys Ser Gly Ile Ile Thr Ser Lys Thr Lys Ser
        435                 440                 445
Leu Val Pro Arg Gly Ser Lys Ala Ser Gly Ile Cys Ile Asp Val Asp
    450                 455                 460
Asn Glu Asp Leu Phe Phe Ile Ala Asp Lys Asn Ser Phe Ser Asp Asp
465                 470                 475                 480
Leu Ser Lys Asn Glu Arg Ile Glu Tyr Asn Thr Gln Ser Asn Tyr Ile
                485                 490                 495
Glu Asn Asp Phe Pro Ile Asn Glu Leu Ile Leu Asp Thr Asp Leu Ile
            500                 505                 510
Ser Lys Ile Glu Leu Pro Ser Glu Asn Thr Glu Ser Leu Thr Asp Phe
        515                 520                 525
Asn Val Asp Val Pro Val Tyr Glu Lys Gln Pro Ala Ile Lys Lys Ile
    530                 535                 540
Phe Thr Asp Glu Asn Thr Ile Phe Gln Tyr Leu Tyr Ser Gln Thr Phe
545                 550                 555                 560
Pro Leu Asp Ile Arg Asp Ile Ser Leu Thr Ser Ser Phe Asp Asp Ala
                565                 570                 575
Leu Leu Phe Ser Asn Lys Val Tyr Ser Phe Phe Ser Met Asp Tyr Ile
            580                 585                 590
Lys Thr Ala Asn Lys Val Val Glu Ala Gly Leu Phe Ala Gly Trp Val
        595                 600                 605
Lys Gln Ile Val Asn Asp Phe Val Ile Glu Ala Asn Lys Ser Asn Thr
    610                 615                 620
Met Asp Lys Ile Ala Asp Ile Ser Leu Ile Val Pro Tyr Ile Gly Leu
625                 630                 635                 640
Ala Leu Asn Val Gly Asn Glu Thr Ala Lys Gly Asn Phe Glu Asn Ala
                645                 650                 655
Phe Glu Ile Ala Gly Ala Ser Ile Leu Leu Glu Phe Ile Pro Glu Leu
            660                 665                 670
Leu Ile Pro Val Val Gly Ala Phe Leu Leu Glu Ser Tyr Ile Asp Asn
        675                 680                 685
Lys Asn Lys Ile Ile Lys Thr Ile Asp Asn Ala Leu Thr Lys Arg Asn
    690                 695                 700
Glu Lys Trp Ser Asp Met Tyr Gly Leu Ile Val Ala Gln Trp Leu Ser
705                 710                 715                 720
Thr Val Asn Thr Gln Phe Tyr Thr Ile Lys Glu Gly Met Tyr Lys Ala
                725                 730                 735
Leu Asn Tyr Gln Ala Gln Ala Leu Glu Glu Ile Ile Lys Tyr Arg Tyr
            740                 745                 750
Asn Ile Tyr Ser Glu Lys Glu Lys Ser Asn Ile Asn Ile Asp Phe Asn
        755                 760                 765
Asp Ile Asn Ser Lys Leu Asn Glu Gly Ile Asn Gln Ala Ile Asp Asn
    770                 775                 780
Ile Asn Asn Phe Ile Asn Gly Cys Ser Val Ser Tyr Leu Met Lys Lys
785                 790                 795                 800
Met Ile Pro Leu Ala Val Glu Lys Leu Leu Asp Phe Asp Asn Thr Leu
                805                 810                 815
Lys Lys Asn Leu Leu Asn Tyr Ile Asp Glu Asn Lys Leu Tyr Leu Ile
            820                 825                 830
Gly Ser Ala Glu Tyr Glu Lys Ser Lys Val Asn Lys Tyr Leu Lys Thr
        835                 840                 845
Ile Met Pro Phe Asp Leu Ser Ile Tyr Thr Asn Asp Thr Ile Leu Ile
    850                 855                 860
Glu Met Phe Asn Lys Tyr Asn Ser Glu Ile Leu Glu His His His His
865                 870                 875                 880
His His
<210>11
<211>3885
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>11
atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta    60
tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata    120
gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa    180
cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat    240
tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga    300
gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac    360
aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact    420
agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga    480
cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt    540
gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta    600
acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc    660
atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga    720
atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa    780
tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt    840
attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata    900
gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga    960
gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt    1020
gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa    1080
tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat    1140
actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac    1200
atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca    1260
ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg    1320
ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga    1380
gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact    1440
gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat    1500
gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta    1560
ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat    1620
gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa    1680
ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat    1740
agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa    1800
ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta    1860
agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct    1920
gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc    1980
ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt    2040
gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta    2100
gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc    2160
aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag    2220
gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa    2280
gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa    2340
gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat    2400
atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta    2460
attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca    2520
aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat    2580
tctttattaa aagatatact cgaggaatat ttcaatagta ttaatgattc aaaaattttg    2640
agcttacaaa acaaaaaaaa tgctttagtg gatacatcag gatataatgc agaagtgagg    2700
ctagaaggtg atgttcaagt taatacgata tatacaaatg attttaaatt aagtagttca    2760
ggagataaaa ttatagtaaa tttaaataat aatattttat atagcgctat ttatgagaac    2820
tctagtgtta gtttttggat taagatatct aaagatttaa ctaattctca taatgaatat    2880
actataatta atagtataaa acaaaattct gggtggaaat tatgtattag aaatggcaat    2940
atagaatgga ttttacaaga tattaataga aagtataaaa gtttaatttt tgattatagt    3000
gaatcattaa gtcatacagg atatacaaat aaatggtttt ttgttactat aactaataat    3060
ataatggggt atatgaaact ttatataaat ggagaattaa agcagagtga aagaattgaa    3120
gatttagatg aggttaagtt agataaaacc atagtatttg gaatagatga gaatatagat    3180
gagaatcaga tgctttggat tagagatttt aatatttttt ctaaagaatt aagcaatgaa    3240
gatattaata ttgtatatga gggacaaata ttaagaaatg ttattaaaga ttattgggga    3300
aatcctttga agtttgatac agaatattat atgattaatt ataattatat agataggtat    3360
atagcaccta aaaataatat acttgtactt gttcagtatt cagatatatc taaattatat    3420
actaaaaatc ctattactat taaatcagca gctaataaga atccttatag tagaatttta    3480
aatggagatg atataatgtt tcatatgtta tatgatagta gggaatatat gataataaga    3540
gatactgata caatatatgc aacacaagga ggacagtgtt caaaaaattg tgtatatgca    3600
ttaaaattac agagtaattt aggtaattat ggtataggta tatttagtat aaaaaatatt    3660
gtatctcaaa ataaatattg tagtcaaatt ttctctagtt ttatgaaaaa tacaatgctt    3720
ctagcagata tatataaacc ttggagattt tcttttgaaa atgcatacac gccagttgca    3780
gtaactaatt atgagacaaa actattatca acttcatctt tttggaaatt tatttctagg    3840
gatccaggat gggtagagct cgagcaccac caccaccacc actaa                    3885
<210>12
<211>1294
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>12
Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn
1               5                   10                  15
Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu
            20                  25                  30
Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp
        35                  40                  45
Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val
    50                  55                  60
Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp
65                  70                  75                  80
Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg
                85                  90                  95
Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr
            100                 105                 110
Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp
        115                 120                 125
Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn
    130                 135                 140
Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly
145                 150                 155                 160
Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr
                165                 170                 175
Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile
            180                 185                 190
Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn
        195                 200                 205
Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile
    210                 215                 220
Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly
225                 230                 235                 240
Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile
                245                 250                 255
Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala
            260                 265                 270
Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr
        275                 280                 285
Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu
    290                 295                 300
Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly
305                 310                 315                 320
Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser
                325                 330                 335
Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys
            340                 345                 350
Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn
        355                 360                 365
Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr
    370                 375                 380
Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn
385                 390                 395                 400
Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser
                405                 410                 415
Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu
            420                 425                 430
Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser
        435                 440                 445
Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val
    450                 455                 460
Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr
465                 470                 475                 480
Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp
                485                 490                 495
Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr
            500                 505                 510
Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu
        515                 520                 525
Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr
    530                 535                 540
Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys
545                 550                 555                 560
Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu
                565                 570                 575
Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala
            580                 585                 590
Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala
        595                 600                 605
Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr
    610                 615                 620
Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro
625                 630                 635                 640
Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala
                645                 650                 655
Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe
            660                 665                 670
Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu
        675                 680                 685
Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile
    690                 695                 700
Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser
705                 710                 715                 720
Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser
                725                 730                 735
Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr
            740                 745                 750
Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu
        755                 760                 765
Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn
    770                 775                 780
Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn
785                 790                 795                 800
Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr
                805                 810                 815
Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val
            820                 825                 830
Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn
        835                 840                 845
Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys
    850                 855                 860
Asp Ile Leu Glu Glu Tyr Phe Asn Ser Ile Asn Asp Ser Lys Ile Leu
865                 870                 875                 880
Ser Leu Gln Asn Lys Lys Asn Ala Leu Val Asp Thr Ser Gly Tyr Asn
                885                 890                 895
Ala Glu Val Arg Leu Glu Gly Asp Val Gln Val Asn Thr Ile Tyr Thr
            900                 905                 910
Asn Asp Phe Lys Leu Ser Ser Ser Gly Asp Lys Ile Ile Val Asn Leu
        915                 920                 925
Asn Asn Asn Ile Leu Tyr Ser Ala Ile Tyr Glu Asn Ser Ser Val Ser
    930                 935                 940
Phe Trp Ile Lys Ile Ser Lys Asp Leu Thr Asn Ser His Asn Glu Tyr
945                 950                 955                 960
Thr Ile Ile Asn Ser Ile Lys Gln Asn Ser Gly Trp Lys Leu Cys Ile
                965                 970                 975
Arg Asn Gly Asn Ile Glu Trp Ile Leu Gln Asp Ile Asn Arg Lys Tyr
            980                 985                 990
Lys Ser Leu Ile Phe Asp Tyr Ser Glu Ser Leu Ser His Thr Gly Tyr
        995                 1000                1005
Thr Asn Lys Trp Phe Phe Val Thr Ile Thr Asn Asn Ile Met Gly
    1010                1015                1020
Tyr Met Lys Leu Tyr Ile Asn Gly Glu Leu Lys Gln Ser Glu Arg
    1025                1030                1035
Ile Glu Asp Leu Asp Glu Val Lys Leu Asp Lys Thr Ile Val Phe
    1040                1045                1050
Gly Ile Asp Glu Asn Ile Asp Glu Asn Gln Met Leu Trp Ile Arg
    1055                1060                1065
Asp Phe Asn Ile Phe Ser Lys Glu Leu Ser Asn Glu Asp Ile Asn
    1070                1075                1080
Ile Val Tyr Glu Gly Gln Ile Leu Arg Asn Val Ile Lys Asp Tyr
    1085                1090                1095
Trp Gly Asn Pro Leu Lys Phe Asp Thr Glu Tyr Tyr Met Ile Asn
    1100                1105                1110
Tyr Asn Tyr Ile Asp Arg Tyr Ile Ala Pro Lys Asn Asn Ile Leu
    1115                1120                1125
Val Leu Val Gln Tyr Ser Asp Ile Ser Lys Leu Tyr Thr Lys Asn
    1130                1135                1140
Pro Ile Thr Ile Lys Ser Ala Ala Asn Lys Asn Pro Tyr Ser Arg
    1145                1150                1155
Ile Leu Asn Gly Asp Asp Ile Met Phe His Met Leu Tyr Asp Ser
    1160                1165                1170
Arg Glu Tyr Met Ile Ile Arg Asp Thr Asp Thr Ile Tyr Ala Thr
    1175                1180                1185
Gln Gly Gly Gln Cys Ser Lys Asn Cys Val Tyr Ala Leu Lys Leu
    1190                1195                1200
Gln Ser Asn Leu Gly Asn Tyr Gly Ile Gly Ile Phe Ser Ile Lys
    1205                1210                1215
Asn Ile Val Ser Gln Asn Lys Tyr Cys Ser Gln Ile Phe Ser Ser
    1220                1225                1230
Phe Met Lys Asn Thr Met Leu Leu Ala Asp Ile Tyr Lys Pro Trp
    1235                1240                1245
Arg Phe Ser Phe Glu Asn Ala Tyr Thr Pro Val Ala Val Thr Asn
    1250                1255                1260
Tyr Glu Thr Lys Leu Leu Ser Thr Ser Ser Phe Trp Lys Phe Ile
    1265                1270                1275
Ser Arg Asp Pro Gly Trp Val Glu Leu Glu His His His His His
    1280                1285                1290
His
<210>13
<211>2625
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>13
atggcaataa caattaacaa ctttaattat tcagatcctg ttgataataa aaatatttta    60
tatttagata ctcatttaaa tacattagct aatgagcctg aaaaagcctt tcgcattata    120
gggaatatat gggtaatacc cgatagattt tcaagagatt ctaatccaaa tttaaataaa    180
cctccacgag ttacaagccc taaaagtggt tattatgatc ctaattattt gagtactgat    240
tctgaaaaag atacattttt aaaagaaatt ataaagttat ttaaaagaat taactctaga    300
gaaataggag aagaattaat atatagactt gcaacagaca taccctttcc tgggaataac    360
aatactccaa ttaatacttt tgattttgat gtagatttta acagtgttga tgttaaaact    420
agacaaggta acaactgggt taaaactggt agtataaatc ctagtgttat aataactgga    480
cctagagaaa acattataga cccagaaact tctacgttta aattaactaa caatactttt    540
gcggcacaag aaggatttgg tgctttatca ataatttcaa tatcacctag atttatgcta    600
acatatagta atgcaactaa taatgtagga gagggtagat tttctaagtc tgaattttgc    660
atggatccaa tactaatttt aatgcatgaa cttaatcatg caatgcataa tttatatgga    720
atagctatac caaatgatca aagaatttca tctgtaacta gtaatatttt ttattctcaa    780
tataatgtga aattagagta tgcagaaata tatgcatttg gaggtccaac tatagacctt    840
attcctaaaa gtgcaaggaa atattttgag gaaaaggcat tggattatta tagatccata    900
gctaaaagac ttaatagtat aactactgca aatccttcaa gctttaataa atatatagga    960
gaatataaac agaaacttat tagaaagtat agattcgtag tagaatcttc aggtgaagtt    1020
gcagtagatc gtaataagtt tgctgagtta tataaagaac ttacacaaat atttacagaa    1080
tttaactacg ctaaaatata taatgtacaa aataggaaaa tatatctttc aaatgtatat    1140
actccggtta cggcaaatat attagacgat aatgtttatg atatacaaaa tggatttaac    1200
atacctaaaa gtaatttaaa tgtactattt atgggtcaaa atttatctcg aaatccagca    1260
ttaagaaaag tcaatcctga aaatatgctt tatttattta caaaattttg tcatagaggg    1320
ataataactt ctaaaactaa atcattagtt ccgcgtggat ccaaggcctt agattgtaga    1380
gagcttttag ttaaaaatac tgacttaccc tttataggtg atattagtga tatcaaaact    1440
gatatatttt taagcaaaga tattaatgaa gaaactgaag ttatagacta tccggacaat    1500
gtttcagtgg atcaagttat tctcagtaag aatacctcag aacatggaca actagattta    1560
ttatacccta ttattgaagg tgagagtcaa gtattaccgg gagagaatca agtcttttat    1620
gataatagaa ctcaaaatgt tgattatttg aattcttatt attacctaga atctcaaaaa    1680
ctaagtgata atgttgaaga ttttactttt acgacatcaa ttgaggaagc tttggataat    1740
agtggaaaag tatatactta ctttcctaaa ctagctgata aagtaaatac gggtgttcaa    1800
ggtggtttat ttttaatgtg ggcaaatgat gtagttgaag attttactac aaatattcta    1860
agaaaagata cattagataa aatatcagat gtatcagcta ttattcccta tataggacct    1920
gcattaaata taagtaattc tgtaagaagg ggaaatttta ctgaagcatt tgcagttacc    1980
ggtgtaacta ttttattaga agcgtttcaa gaatttacaa tacctgcact tggtgcattt    2040
gtgatttata gtaaggttca agaaagaaac gagattatta aaactataga taattgttta    2100
gaacaaagga ttaaaagatg gaaagattca tatgaatgga tgataggaac gtggttatcc    2160
aggattacta ctcaatttaa taatataagt tatcaaatgt atgattcttt aaattatcag    2220
gcagatgcaa tcaaagataa aatagattta gaatataaaa aatactcagg aagtgataaa    2280
gaaaatataa aaagtcaagt tgaaaattta aaaaatagtt tagatataaa aatctcggaa    2340
gcaatgaata atataaataa atttatacga gaatgttctg taacatactt atttaaaaat    2400
atgctcccta aagtaattga tgaattaaat aagtttgatt taaaaactaa aacagaatta    2460
attaatctta tagatagtca taatattatt ctagttggtg aagtagatag attaaaagca    2520
aaaataaatg agagttttga aaatacaata ccctttaata ttttttcata tactaataat    2580
tctttattaa aagatatact cgagcaccac caccaccacc actaa                    2625
<210>14
<211>874
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>14
Met Ala Ile Thr Ile Asn Asn Phe Asn Tyr Ser Asp Pro Val Asp Asn
1               5                   10                  15
Lys Asn Ile Leu Tyr Leu Asp Thr His Leu Asn Thr Leu Ala Asn Glu
            20                  25                  30
Pro Glu Lys Ala Phe Arg Ile Ile Gly Asn Ile Trp Val Ile Pro Asp
        35                  40                  45
Arg Phe Ser Arg Asp Ser Asn Pro Asn Leu Asn Lys Pro Pro Arg Val
    50                  55                  60
Thr Ser Pro Lys Ser Gly Tyr Tyr Asp Pro Asn Tyr Leu Ser Thr Asp
65                  70                  75                  80
Ser Glu Lys Asp Thr Phe Leu Lys Glu Ile Ile Lys Leu Phe Lys Arg
                85                  90                  95
Ile Asn Ser Arg Glu Ile Gly Glu Glu Leu Ile Tyr Arg Leu Ala Thr
            100                 105                 110
Asp Ile Pro Phe Pro Gly Asn Asn Asn Thr Pro Ile Asn Thr Phe Asp
        115                 120                 125
Phe Asp Val Asp Phe Asn Ser Val Asp Val Lys Thr Arg Gln Gly Asn
    130                 135                 140
Asn Trp Val Lys Thr Gly Ser Ile Asn Pro Ser Val Ile Ile Thr Gly
145                 150                 155                 160
Pro Arg Glu Asn Ile Ile Asp Pro Glu Thr Ser Thr Phe Lys Leu Thr
                165                 170                 175
Asn Asn Thr Phe Ala Ala Gln Glu Gly Phe Gly Ala Leu Ser Ile Ile
            180                 185                 190
Ser Ile Ser Pro Arg Phe Met Leu Thr Tyr Ser Asn Ala Thr Asn Asn
        195                 200                 205
Val Gly Glu Gly Arg Phe Ser Lys Ser Glu Phe Cys Met Asp Pro Ile
    210                 215                 220
Leu Ile Leu Met His Glu Leu Asn His Ala Met His Asn Leu Tyr Gly
225                 230                 235                 240
Ile Ala Ile Pro Asn Asp Gln Arg Ile Ser Ser Val Thr Ser Asn Ile
                245                 250                 255
Phe Tyr Ser Gln Tyr Asn Val Lys Leu Glu Tyr Ala Glu Ile Tyr Ala
            260                 265                 270
Phe Gly Gly Pro Thr Ile Asp Leu Ile Pro Lys Ser Ala Arg Lys Tyr
        275                 280                 285
Phe Glu Glu Lys Ala Leu Asp Tyr Tyr Arg Ser Ile Ala Lys Arg Leu
    290                 295                 300
Asn Ser Ile Thr Thr Ala Asn Pro Ser Ser Phe Asn Lys Tyr Ile Gly
305                 310                 315                 320
Glu Tyr Lys Gln Lys Leu Ile Arg Lys Tyr Arg Phe Val Val Glu Ser
                325                 330                 335
Ser Gly Glu Val Ala Val Asp Arg Asn Lys Phe Ala Glu Leu Tyr Lys
            340                 345                 350
Glu Leu Thr Gln Ile Phe Thr Glu Phe Asn Tyr Ala Lys Ile Tyr Asn
        355                 360                 365
Val Gln Asn Arg Lys Ile Tyr Leu Ser Asn Val Tyr Thr Pro Val Thr
    370                 375                 380
Ala Asn Ile Leu Asp Asp Asn Val Tyr Asp Ile Gln Asn Gly Phe Asn
385                 390                 395                 400
Ile Pro Lys Ser Asn Leu Asn Val Leu Phe Met Gly Gln Asn Leu Ser
                405                 410                 415
Arg Asn Pro Ala Leu Arg Lys Val Asn Pro Glu Asn Met Leu Tyr Leu
            420                 425                 430
Phe Thr Lys Phe Cys His Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser
        435                 440                 445
Leu Val Pro Arg Gly Ser Lys Ala Leu Asp Cys Arg Glu Leu Leu Val
    450                 455                 460
Lys Asn Thr Asp Leu Pro Phe Ile Gly Asp Ile Ser Asp Ile Lys Thr
465                 470                 475                 480
Asp Ile Phe Leu Ser Lys Asp Ile Asn Glu Glu Thr Glu Val Ile Asp
                485                 490                 495
Tyr Pro Asp Asn Val Ser Val Asp Gln Val Ile Leu Ser Lys Asn Thr
            500                 505                 510
Ser Glu His Gly Gln Leu Asp Leu Leu Tyr Pro Ile Ile Glu Gly Glu
        515                 520                 525
Ser Gln Val Leu Pro Gly Glu Asn Gln Val Phe Tyr Asp Asn Arg Thr
    530                 535                 540
Gln Asn Val Asp Tyr Leu Asn Ser Tyr Tyr Tyr Leu Glu Ser Gln Lys
545                 550                 555                 560
Leu Ser Asp Asn Val Glu Asp Phe Thr Phe Thr Thr Ser Ile Glu Glu
                565                 570                 575
Ala Leu Asp Asn Ser Gly Lys Val Tyr Thr Tyr Phe Pro Lys Leu Ala
            580                 585                 590
Asp Lys Val Asn Thr Gly Val Gln Gly Gly Leu Phe Leu Met Trp Ala
        595                 600                 605
Asn Asp Val Val Glu Asp Phe Thr Thr Asn Ile Leu Arg Lys Asp Thr
    610                 615                 620
Leu Asp Lys Ile Ser Asp Val Ser Ala Ile Ile Pro Tyr Ile Gly Pro
625                 630                 635                 640
Ala Leu Asn Ile Ser Asn Ser Val Arg Arg Gly Asn Phe Thr Glu Ala
                645                 650                 655
Phe Ala Val Thr Gly Val Thr Ile Leu Leu Glu Ala Phe Gln Glu Phe
            660                 665                 670
Thr Ile Pro Ala Leu Gly Ala Phe Val Ile Tyr Ser Lys Val Gln Glu
        675                 680                 685
Arg Asn Glu Ile Ile Lys Thr Ile Asp Asn Cys Leu Glu Gln Arg Ile
    690                 695                 700
Lys Arg Trp Lys Asp Ser Tyr Glu Trp Met Ile Gly Thr Trp Leu Ser
705                 710                 715                 720
Arg Ile Thr Thr Gln Phe Asn Asn Ile Ser Tyr Gln Met Tyr Asp Ser
                725                 730                 735
Leu Asn Tyr Gln Ala Asp Ala Ile Lys Asp Lys Ile Asp Leu Glu Tyr
            740                 745                 750
Lys Lys Tyr Ser Gly Ser Asp Lys Glu Asn Ile Lys Ser Gln Val Glu
        755                 760                 765
Asn Leu Lys Asn Ser Leu Asp Ile Lys Ile Ser Glu Ala Met Asn Asn
    770                 775                 780
Ile Asn Lys Phe Ile Arg Glu Cys Ser Val Thr Tyr Leu Phe Lys Asn
785                 790                 795                 800
Met Leu Pro Lys Val Ile Asp Glu Leu Asn Lys Phe Asp Leu Lys Thr
                805                 810                 815
Lys Thr Glu Leu Ile Asn Leu Ile Asp Ser His Asn Ile Ile Leu Val
            820                 825                 830
Gly Glu Val Asp Arg Leu Lys Ala Lys Ile Asn Glu Ser Phe Glu Asn
        835                 840                 845
Thr Ile Pro Phe Asn Ile Phe Ser Tyr Thr Asn Asn Ser Leu Leu Lys
    850                 855                 860
Asp Ile Leu Glu His His His His His His
865                 870
<210>15
<211>3810
<212>DNA
<213>肉毒梭菌(Clostridium botulinum)
<400>15
atggcaacaa ttaatagttt taattataat gatcctgtta ataatagaac aattttatat    60
attaaaccag gcggttgtca acaattttat aaatcattta atattatgaa aaatatttgg    120
ataattccag agagaaatgt aattggtaca attccccaag attttcttcc gcctacttca    180
ttgaaaaatg gagatagtag ttattatgac cctaattatt tacaaagtga tcaagaaaag    240
gataaatttt taaaaatagt cacaaaaata tttaatagaa taaatgataa tctttcagga    300
aggattttat tagaagaact gtcaaaagct aatccatatt taggaaatga taatactcca    360
gatggtgact tcattattaa tgatgcatca gcagttccaa ttcaattctc aaatggtagc    420
caaagcatac tattacctaa tgttattata atgggagcag agcctgattt atttgaaact    480
aacagttcca atatttctct aagaaataat tatatgccaa gcaatcacgg ttttggatca    540
atagctatag taacattctc acctgaatat tcttttagat ttaaagataa tagtatgaat    600
gaatttattc aagatcctgc tcttacatta atgcatgaat taatacattc attacatgga    660
ctatatgggg ctaaagggat tactacaaag tatactataa cacaaaaaca aaatccccta    720
ataacaaata taagaggtac aaatattgaa gaattcttaa cttttggagg tactgattta    780
aacattatta ctagtgctca gtccaatgat atctatacta atcttctagc tgattataaa    840
aaaatagcgt ctaaacttag caaagtacaa gtatctaatc cactacttaa tccttataaa    900
gatgtttttg aagcaaagta tggattagat aaagatgcta gcggaattta ttcggtaaat    960
ataaacaaat ttaatgatat ttttaaaaaa ttatacagct ttacggaatt tgatttagca    1020
actaaatttc aagttaaatg taggcaaact tatattggac agtataaata cttcaaactt    1080
tcaaacttgt taaatgattc tatttataat atatcagaag gctataatat aaataattta    1140
aaggtaaatt ttagaggaca gaatgcaaat ttaaatccta gaattattac accaattaca    1200
ggtagaggac tagtaaaaaa aatcattaga ttttgtaaaa gtgggataat aacttctaaa    1260
actaaatcat tggttccacg tggatccaag gcctcaatat gtatcgaaat aaataatggt    1320
gagttatttt ttgtggcttc cgagaatagt tataatgatg ataatataaa tactcctaaa    1380
gaaattgacg atacagtaac ttcaaataat aattatgaaa atgatttaga tcaggttatt    1440
ttaaatttta atagtgaatc agcacctgga ctttcagatg aaaaattaaa tttaactatc    1500
caaaatgatg cttatatacc aaaatatgat tctaatggaa caagtgatat agaacaacat    1560
gatgttaatg aacttaatgt atttttctat ttagatgcac agaaagtgcc cgaaggtgaa    1620
aataatgtca atctcacctc ttcaattgat acagcattat tagaacaacc taaaatatat    1680
acattttttt catcagaatt tattaataat gtcaataaac ctgtgcaagc agcattattt    1740
gtaggctgga tacaacaagt attagtagat tttactactg aagctaacca aaaaagtact    1800
gttgataaaa ttgcagatat ttctatagtt gttccatata taggtcttgc tttaaatata    1860
ggaaatgaag cacaaaaagg aaattttaaa gatgcacttg aattattagg agcaggtatt    1920
ttattagaat ttgaacccga gcttttaatt cctacaattt tagtattcac gataaaatct    1980
tttttaggtt catctgataa taaaaataaa gttattaaag caataaataa tgcattgaaa    2040
gaaagagatg aaaaatggaa agaagtatat agttttatag tatcgaattg gatgactaaa    2100
attaatacac aatttaataa aagaaaagaa caaatgtatc aagctttaca aaatcaagta    2160
aatgcactta aagcaataat agaatctaag tataatagtt atactttaga agaaaaaaat    2220
gagcttacaa ataaatatga tattgagcaa atagaaaatg aacttaatca aaaggtttct    2280
atagcaatga ataatataga caggttctta actgaaagtt ctatatctta tttaatgaaa    2340
ttaataaatg aagtaaaaat taataaatta agagaatatg atgaaaatgt taaaacgtat    2400
ttattagatt atattataaa acatggatca atcttgggag agagtcagca agaactaaat    2460
tctatggtaa ttgataccct aaataatagt attcctttta agctttcttc ttatacagat    2520
gataaaattt taatttcata ttttaataag ttctttaaga gaattaaaag tagttctgtt    2580
ttaaatatga gatataaaaa tgataaatac gtagatactt caggatatga ttcaaatata    2640
aatattaatg gagatgtata taaatatcca actaataaaa atcaatttgg aatatataat    2700
gataaactta gtgaagttaa tatatctcaa aatgattaca ttatatatga taataaatat    2760
aaaaatttta gtattagttt ttgggtaaga attcctaact atgataataa gatagtaaat    2820
gttaataatg aatacactat aataaattgt atgagggata ataattcagg atggaaagta    2880
tctcttaatc ataatgaaat aatttggaca ttgcaagata attcaggaat taatcaaaaa    2940
ttagcattta actatggtaa cgcaaatggt atttctgatt atataaataa gtggattttt    3000
gtaactataa ctaatgatag attaggagat tctaaacttt atattaatgg aaatttaata    3060
gataaaaaat caattttaaa tttaggtaat attcatgtta gtgacaatat attatttaaa    3120
atagttaatt gtagttatac aagatatatt ggtattagat attttaatat ttttgataaa    3180
gaattagatg aaacagaaat tcaaacttta tataacaatg agcctaatgc aaatatttta    3240
aaggattttt ggggaaatta tttgctttat gacaaagaat attatttatt aaatgtgtta    3300
aaaccaaata actttattaa taggagaaca gattctactt taagcattaataatataaga    3360
agcactattc ttttagctaa tagattatat agtggaataa aagttaaaat acaaagagtt    3420
aataatagta gtactaacga taatcttgtt agaaagaatg atcaggtata tattaatttt    3480
gtagccagca aaactcactt acttccatta tatgctgata cagctaccac aaataaagag    3540
aaaacaataa aaatatcatc atctggcaat agatttaatc aagtagtagt tatgaattca    3600
gtaggaaata attgtacaat gaattttaaa aataataatg gaaataatat tgggttgtta    3660
ggtttcaagg cagatactgt agttgctagt acttggtatt atacacatat gagagataat    3720
acaaacagca atggattttt ttggaacttt atttctgaag aacatggatg gcaagaaaaa    3780
acgcgttctc accaccacca ccaccactaa                                     3810
<210>16
<211>1269
<212>PRT
<213>肉毒梭菌(Clostridium botulinum)
<400>16
Met Ala Thr Ile Asn Ser Phe Asn Tyr Asn Asp Pro Val Asn Asn Arg
1               5                   10                  15
Thr Ile Leu Tyr Ile Lys Pro Gly Gly Cys Gln Gln Phe Tyr Lys Ser
            20                  25                  30
Phe Asn Ile Met Lys Asn Ile Trp Ile Ile Pro Glu Arg Asn Val Ile
        35                  40                  45
Gly Thr Ile Pro Gln Asp Phe Leu Pro Pro Thr Ser Leu Lys Asn Gly
    50                  55                  60
Asp Ser Ser Tyr Tyr Asp Pro Asn Tyr Leu Gln Ser Asp Gln Glu Lys
65                  70                  75                  80
Asp Lys Phe Leu Lys Ile Val Thr Lys Ile Phe Asn Arg Ile Asn Asp
                85                  90                  95
Asn Leu Ser Gly Arg Ile Leu Leu Glu Glu Leu Ser Lys Ala Asn Pro
            100                 105                 110
Tyr Leu Gly Asn Asp Asn Thr Pro Asp Gly Asp Phe Ile Ile Asn Asp
        115                 120                 125
Ala Ser Ala Val Pro Ile Gln Phe Ser Asn Gly Ser Gln Ser Ile Leu
    130                 135                 140
Leu Pro Asn Val Ile Ile Met Gly Ala Glu Pro Asp Leu Phe Glu Thr
145                 150                 155                 160
Asn Ser Ser Asn Ile Ser Leu Arg Asn Asn Tyr Met Pro Ser Asn His
                165                 170                 175
Gly Phe Gly Ser Ile Ala Ile Val Thr Phe Ser Pro Glu Tyr Ser Phe
            180                 185                 190
Arg Phe Lys Asp Asn Ser Met Asn Glu Phe Ile Gln Asp Pro Ala Leu
        195                 200                 205
Thr Leu Met His Glu Leu Ile His Ser Leu His Gly Leu Tyr Gly Ala
    210                 215                 220
Lys Gly Ile Thr Thr Lys Tyr Thr Ile Thr Gln Lys Gln Asn Pro Leu
225                 230                 235                 240
Ile Thr Asn Ile Arg Gly Thr Asn Ile Glu Glu Phe Leu Thr Phe Gly
                245                 250                 255
Gly Thr Asp Leu Asn Ile Ile Thr Ser Ala Gln Ser Asn Asp Ile Tyr
            260                 265                 270
Thr Asn Leu Leu Ala Asp Tyr Lys Lys Ile Ala Ser Lys Leu Ser Lys
        275                 280                 285
Val Gln Val Ser Asn Pro Leu Leu Asn Pro Tyr Lys Asp Val Phe Glu
    290                 295                 300
Ala Lys Tyr Gly Leu Asp Lys Asp Ala Ser Gly Ile Tyr Ser Val Asn
305                 310                 315                 320
Ile Asn Lys Phe Asn Asp Ile Phe Lys Lys Leu Tyr Ser Phe Thr Glu
                325                 330                 335
Phe Asp Leu Ala Thr Lys Phe Gln Val Lys Cys Arg Gln Thr Tyr Ile
            340                 345                 350
Gly Gln Tyr Lys Tyr Phe Lys Leu Ser Asn Leu Leu Asn Asp Ser Ile
        355                 360                 365
Tyr Asn Ile Ser Glu Gly Tyr Asn Ile Asn Asn Leu Lys Val Asn Phe
    370                 375                 380
Arg Gly Gln Asn Ala Asn Leu Asn Pro Arg Ile Ile Thr Pro Ile Thr
385                 390                 395                 400
Gly Arg Gly Leu Val Lys Lys Ile Ile Arg Phe Cys Lys Ser Gly Ile
                405                 410                 415
Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Ser
            420                 425                 430
Ile Cys Ile Glu Ile Asn Asn Gly Glu Leu Phe Phe Val Ala Ser Glu
        435                 440                 445
Asn Ser Tyr Asn Asp Asp Asn Ile Asn Thr Pro Lys Glu Ile Asp Asp
    450                 455                 460
Thr Val Thr Ser Asn Asn Asn Tyr Glu Asn Asp Leu Asp Gln Val Ile
465                 470                 475                 480
Leu Asn Phe Asn Ser Glu Ser Ala Pro Gly Leu Ser Asp Glu Lys Leu
                485                 490                 495
Asn Leu Thr Ile Gln Asn Asp Ala Tyr Ile Pro Lys Tyr Asp Ser Asn
            500                 505                 510
Gly Thr Ser Asp Ile Glu Gln His Asp Val Asn Glu Leu Asn Val Phe
        515                 520                 525
Phe Tyr Leu Asp Ala Gln Lys Val Pro Glu Gly Glu Asn Asn Val Asn
    530                 535                 540
Leu Thr Ser Ser Ile Asp Thr Ala Leu Leu Glu Gln Pro Lys Ile Tyr
545                 550                 555                 560
Thr Phe Phe Ser Ser Glu Phe Ile Asn Asn Val Asn Lys Pro Val Gln
                565                 570                 575
Ala Ala Leu Phe Val Gly Trp Ile Gln Gln Val Leu Val Asp Phe Thr
            580                 585                 590
Thr Glu Ala Asn Gln Lys Ser Thr Val Asp Lys Ile Ala Asp Ile Ser
        595                 600                 605
Ile Val Val Pro Tyr Ile Gly Leu Ala Leu Asn Ile Gly Asn Glu Ala
    610                 615                 620
Gln Lys Gly Asn Phe Lys Asp Ala Leu Glu Leu Leu Gly Ala Gly Ile
625                 630                 635                 640
Leu Leu Glu Phe Glu Pro Glu Leu Leu Ile Pro Thr Ile Leu Val Phe
                645                 650                 655
Thr Ile Lys Ser Phe Leu Gly Ser Ser Asp Asn Lys Asn Lys Val Ile
            660                 665                 670
Lys Ala Ile Asn Asn Ala Leu Lys Glu Arg Asp Glu Lys Trp Lys Glu
        675                 680                 685
Val Tyr Ser Phe Ile Val Ser Asn Trp Met Thr Lys Ile Asn Thr Gln
    690                 695                 700
Phe Asn Lys Arg Lys Glu Gln Met Tyr Gln Ala Leu Gln Asn Gln Val
705                 710                 715                 720
Asn Ala Leu Lys Ala Ile Ile Glu Ser Lys Tyr Asn Ser Tyr Thr Leu
                725                 730                 735
Glu Glu Lys Asn Glu Leu Thr Asn Lys Tyr Asp Ile Glu Gln Ile Glu
            740                 745                 750
Asn Glu Leu Asn Gln Lys Val Ser Ile Ala Met Asn Asn Ile Asp Arg
        755                 760                 765
Phe Leu Thr Glu Ser Ser Ile Ser Tyr Leu Met Lys Leu Ile Asn Glu
    770                 775                 780
Val Lys Ile Asn Lys Leu Arg Glu Tyr Asp Glu Asn Val Lys Thr Tyr
785                 790                 795                 800
Leu Leu Asp Tyr Ile Ile Lys His Gly Ser Ile Leu Gly Glu Ser Gln
                805                 810                 815
Gln Glu Leu Asn Ser Met Val Ile Asp Thr Leu Asn Asn Ser Ile Pro
            820                 825                 830
Phe Lys Leu Ser Ser Tyr Thr Asp Asp Lys Ile Leu Ile Ser Tyr Phe
        835                 840                 845
Asn Lys Phe Phe Lys Arg Ile Lys Ser Ser Ser Val Leu Asn Met Arg
    850                 855                 860
Tyr Lys Asn Asp Lys Tyr Val Asp Thr Ser Gly Tyr Asp Ser Asn Ile
865                 870                 875                 880
Asn Ile Asn Gly Asp Val Tyr Lys Tyr Pro Thr Asn Lys Asn Gln Phe
                885                 890                 895
Gly Ile Tyr Asn Asp Lys Leu Ser Glu Val Asn Ile Ser Gln Asn Asp
            900                 905                 910
Tyr Ile Ile Tyr Asp Asn Lys Tyr Lys Asn Phe Ser Ile Ser Phe Trp
        915                 920                 925
Val Arg Ile Pro Asn Tyr Asp Asn Lys Ile Val Asn Val Asn Asn Glu
    930                 935                 940
Tyr Thr Ile Ile Asn Cys Met Arg Asp Asn Asn Ser Gly Trp Lys Val
945                 950                 955                 960
Ser Leu Asn His Asn Glu Ile Ile Trp Thr Leu Gln Asp Asn Ser Gly
                965                 970                 975
Ile Asn Gln Lys Leu Ala Phe Asn Tyr Gly Asn Ala Asn Gly Ile Ser
            980                 985                 990
Asp Tyr Ile Asn Lys Trp Ile Phe Val Thr Ile Thr Asn Asp Arg Leu
        995                 1000                1005
Gly Asp Ser Lys Leu Tyr Ile Asn Gly Asn Leu Ile Asp Lys Lys
    1010                1015                1020
Ser Ile Leu Asn Leu Gly Asn Ile His Val Ser Asp Asn Ile Leu
    1025                1030                1035
Phe Lys Ile Val Asn Cys Ser Tyr Thr Arg Tyr Ile Gly Ile Arg
    1040                1045                1050
Tyr Phe Asn Ile Phe Asp Lys Glu Leu Asp Glu Thr Glu Ile Gln
    1055                1060                1065
Thr Leu Tyr Asn Asn Glu Pro Asn Ala Asn Ile Leu Lys Asp Phe
    1070                1075                1080
Trp Gly Asn Tyr Leu Leu Tyr Asp Lys Glu Tyr Tyr Leu Leu Asn
    1085                1090                1095
Val Leu Lys Pro Asn Asn Phe Ile Asn Arg Arg Thr Asp Ser Thr
    1100                1105                1110
Leu Ser Ile Asn Asn Ile Arg Ser Thr Ile Leu Leu Ala Asn Arg
    1115                1120                1125
Leu Tyr Ser Gly Ile Lys Val Lys Ile Gln Arg Val Asn Asn Ser
    1130                1135                1140
Ser Thr Asn Asp Asn Leu Val Arg Lys Asn Asp Gln Val Tyr Ile
    1145                1150                1155
Asn Phe Val Ala Ser Lys Thr His Leu Leu Pro Leu Tyr Ala Asp
    1160                1165                1170
Thr Ala Thr Thr Asn Lys Glu Lys Thr Ile Lys Ile Ser Ser Ser
    1175                1180                1185
Gly Asn Arg Phe Asn Gln Val Val Val Met Asn Ser Val Gly Asn
    1190                1195                1200
Asn Cys Thr Met Asn Phe Lys Asn Asn Asn Gly Asn Asn Ile Gly
    1205                1210                1215
Leu Leu Gly Phe Lys Ala Asp Thr Val Val Ala Ser Thr Trp Tyr
    1220                1225                1230
Tyr Thr His Met Arg Asp Asn Thr Asn Ser Asn Gly Phe Phe Trp
    1235                1240                1245
Asn Phe Ile Ser Glu Glu His Gly Trp Gln Glu Lys Thr Arg Ser
    1250                1255                1260
His His His His His His
    1265
<210>17
<211>1116
<212>DNA
<213>铜绿假单胞菌(Pseudomonas aeruginosa)
<400>17
atgggcagcc tggccgcgct gaccgcgcac caggcttgcc acagagggat aataacttct    60
aaaactaaat cattagttcc gcgtggatcc aaggccctgg agcagtgcgg gtacccggtg    120
cagcggctgg tcgccctcta cctggcggcg cggctgtcgt ggaaccaggt cgaccaggtg    180
atccgcaacg ccctggccag ccccggcagc ggcggcgacc tgggcgaagc gatccgcgag    240
cagccggagc aggcccgtct ggccctgacc ctggccgccg ccgagagcga gcgcttcgtc    300
cggcagggca ccggcaacga cgaggccggc gcggccaacg ccgacgtggt gagcctgacc    360
tgcccggtcg ccgccggtga atgcgcgggc ccggcggaca gcggcgacgc cctgctggag    420
cgcaactatc ccactggcgc ggagttcctc ggcgacggcg gcgacgtcag cttcagcacc    480
cgcggcacgc agaactggac ggtggagcgg ctgctccagg cgcaccgcca actggaggag    540
cgcggctatg tgttcgtcgg ctaccacggc accttcctcg aagcggcgca aagcatcgtc    600
ttcggcgggg tgcgcgcgcg cagccaggac ctcgacgcga tctggcgcgg tttctatatc    660
gccggcgatc cggcgctggc ctacggctac gcccaggacc aggaacccga cgcacgcggc    720
cggatccgca acggtgccct gctgcgggtc tatgtgccgc gctcgagcct gccgggcttc    780
taccgcacca gcctgaccct ggccgcgccg gaggcggcgg gcgaggtcga acggctgatc    840
ggccatccgc tgccgctgcg cctggacgcc atcaccggcc ccgaggagga aggcgggcgc    900
ctggagacca ttctcggctg gccgctggcc gagcgcaccg tggtgattcc ctcggcgatc    960
cccaccgacc cgcgcaacgt cggcggcgac ctcgacccgt ccagcatccc cgacaaggaa    1020
caggcgatca gcgccctgcc ggactacgcc agccagcccg gcaaaccgcc gcgcgaggac    1080
ctgacgcgtc tcgagcacca ccaccaccac cactaa                              1116
<210>18
<211>371
<212>PRT
<213>铜绿假单胞菌(Pseudomonas aeruginosa)
<400>18
Met Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys His Arg Gly
1               5                   10                  15
Ile Ile Thr Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala
            20                  25                  30
Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu Tyr Leu
        35                  40                  45
Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg Asn Ala
    50                  55                  60
Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile Arg Glu
65                  70                  75                  80
Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala Glu Ser
                85                  90                  95
Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly Ala Ala
            100                 105                 110
Asn Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Ala Gly Glu Cys
        115                 120                 125
Ala Gly Pro Ala Asp Ser Gly Asp Ala Leu Leu Glu Arg Asn Tyr Pro
    130                 135                 140
Thr Gly Ala Glu Phe Leu Gly Asp Gly Gly Asp Val Ser Phe Ser Thr
145                 150                 155                 160
Arg Gly Thr Gln Asn Trp Thr Val Glu Arg Leu Leu Gln Ala His Arg
                165                 170                 175
Gln Leu Glu Glu Arg Gly Tyr Val Phe Val Gly Tyr His Gly Thr Phe
            180                 185                 190
Leu Glu Ala Ala Gln Ser Ile Val Phe Gly Gly Val Arg Ala Arg Ser
        195                 200                 205
Gln Asp Leu Asp Ala Ile Trp Arg Gly Phe Tyr Ile Ala Gly Asp Pro
    210                 215                 220
Ala Leu Ala Tyr Gly Tyr Ala Gln Asp Gln Glu Pro Asp Ala Arg Gly
225                 230                 235                 240
Arg Ile Arg Asn Gly Ala Leu Leu Arg Val Tyr Val Pro Arg Ser Ser
                245                 250                 255
Leu Pro Gly Phe Tyr Arg Thr Ser Leu Thr Leu Ala Ala Pro Glu Ala
            260                 265                 270
Ala Gly Glu Val Glu Arg Leu Ile Gly His Pro Leu Pro Leu Arg Leu
        275                 280                 285
Asp Ala Ile Thr Gly Pro Glu Glu Glu Gly Gly Arg Leu Glu Thr Ile
    290                 295                 300
Leu Gly Trp Pro Leu Ala Glu Arg Thr Val Val Ile Pro Ser Ala Ile
305                 310                 315                 320
Pro Thr Asp Pro Arg Asn Val Gly Gly Asp Leu Asp Pro Ser Ser Ile
                325                 330                 335
Pro Asp Lys Glu Gln Ala Ile Ser Ala Leu Pro Asp Tyr Ala Ser Gln
            340                 345                 350
Pro Gly Lys Pro Pro Arg Glu Asp Leu Thr Arg Leu Glu His His His
        355                 360                 365
His His His
370
<210>19
<211>1215
<212>DNA
<213>白喉棒杆菌(Corynebacterium diphtheriae)
<400>19
atggctgatg atgttgttga ttcttctaaa tcttttgtga tggaaaactt ttcttcgtac    60
cacgggacta aacctggtta tgtagattcc attcaaaaag gtatacaaaa gccaaaatct    120
ggtacacaag gaaattatga cgatgattgg aaagggtttt atagtaccga caataaatac    180
gacgctgcgg gatactctgt agataacgaa aacccgctct ctggaaaagc tggaggcgtg    240
gtcaaagtga cgtatccagg actgacgaag gtcctcgcac taaaagtgga taatgccgaa    300
actattaaga aagagttagg tttaagtctc actgaaccgt tgatggagca agtcggaaca    360
gaagagttta tcaaaaggtt cggggatggt gcttcgcgtg tagtactcag ccttcccttt    420
gccgagggga gttctagcgt cgaatatatt aataactggg aacaggcgaa agcgttaagc    480
gtagaacttg agattaattt tgaaacccgt ggaaaacgtg gccaagatgc gatgtatgag    540
tatatggctc aagcctgtgc aagagggata ataacttcta aaactaaatc attggttcca    600
cgtggatcca aggccttgtc atgcataaat cttgattggg atgtcataag ggataaaact    660
aagacaaaga tagagtcttt gaaagagcat ggccctatca aaaataaaat gagcgaaagt    720
cccaataaaa cagtatctga ggaaaaagct aaacaatacc tagaagaatt tcatcaaacc    780
gcattagagc atcctgaatt gtcagaactt aaaaccgtta ctgggaccaa tcctcttttc    840
gctggggcta actatgcggc gtgggcagta aacgttgcgc aagttatcga tagcgaaaca    900
gctgataatt tggaaaagac aactgctgct ctttcgatac ttcctggtat cggtagcgta    960
atgggcattg cagacggtgc cgttcaccac aatacagaag agatagtggc acaatcaata    1020
gctttatcgt ctttaatggt tgctcaagct attccattgg taggagagct agttgatatt    1080
ggtttcgctg catataattt tgtagagagt attatcaatt tgtttcaagt agttcataat    1140
tcgtataatc gtcccgcgta ttctccgggg cataaaacgc aaccatttct cgagcaccac    1200
caccaccacc actaa                                                     1215
<210>20
<211>404
<212>PRT
<213>白喉棒杆菌(Corynebacterium diphtheriae)
<400>20
Met Ala Asp Asp Val Val Asp Ser Ser Lys Ser Phe Val Met Glu Asn
1               5                   10                  15
Phe Ser Ser Tyr His Gly Thr Lys Pro Gly Tyr Val Asp Ser Ile Gln
            20                  25                  30
Lys Gly Ile Gln Lys Pro Lys Ser Gly Thr Gln Gly Asn Tyr Asp Asp
        35                  40                  45
Asp Trp Lys Gly Phe Tyr Ser Thr Asp Asn Lys Tyr Asp Ala Ala Gly
    50                  55                  60
Tyr Ser Val Asp Asn Glu Asn Pro Leu Ser Gly Lys Ala Gly Gly Val
65                  70                  75                  80
Val Lys Val Thr Tyr Pro Gly Leu Thr Lys Val Leu Ala Leu Lys Val
                85                  90                  95
Asp Asn Ala Glu Thr Ile Lys Lys Glu Leu Gly Leu Ser Leu Thr Glu
            100                 105                 110
Pro Leu Met Glu Gln Val Gly Thr Glu Glu Phe Ile Lys Arg Phe Gly
        115                 120                 125
Asp Gly Ala Ser Arg Val Val Leu Ser Leu Pro Phe Ala Glu Gly Ser
    130                 135                 140
Ser Ser Val Glu Tyr Ile Asn Asn Trp Glu Gln Ala Lys Ala Leu Ser
145                 150                 155                 160
Val Glu Leu Glu Ile Asn Phe Glu Thr Arg Gly Lys Arg Gly Gln Asp
                165                 170                 175
Ala Met Tyr Glu Tyr Met Ala Gln Ala Cys Ala Arg Gly Ile Ile Thr
            180                 185                 190
Ser Lys Thr Lys Ser Leu Val Pro Arg Gly Ser Lys Ala Leu Ser Cys
        195                 200                 205
Ile Asn Leu Asp Trp Asp Val Ile Arg Asp Lys Thr Lys Thr Lys Ile
    210                 215                 220
Glu Ser Leu Lys Glu His Gly Pro Ile Lys Asn Lys Met Ser Glu Ser
225                 230                 235                 240
Pro Asn Lys Thr Val Ser Glu Glu Lys Ala Lys Gln Tyr Leu Glu Glu
                245                 250                 255
Phe His Gln Thr Ala Leu Glu His Pro Glu Leu Ser Glu Leu Lys Thr
            260                 265                 270
Val Thr Gly Thr Asn Pro Val Phe Ala Gly Ala Asn Tyr Ala Ala Trp
        275                 280                 285
Ala Val Asn Val Ala Gln Val Ile Asp Ser Glu Thr Ala Asp Asn Leu
    290                 295                 300
Glu Lys Thr Thr Ala Ala Leu Ser Ile Leu Pro Gly Ile Gly Ser Val
305                 310                 315                 320
Met Gly Ile Ala Asp Gly Ala Val His His Asn Thr Glu Glu Ile Val
                325                 330                 335
Ala Gln Ser Ile Ala Leu Ser Ser Leu Met Val Ala Gln Ala Ile Pro
            340                 345                 350
Leu Val Gly Glu Leu Val Asp Ile Gly Phe Ala Ala Tyr Asn Phe Val
        355                 360                 365
Glu Ser Ile Ile Asn Leu Phe Gln Val Val His Asn Ser Tyr Asn Arg
    370                 375                 380
Pro Ala Tyr Ser Pro Gly His Lys Thr Gln Pro Phe Leu Glu His His
385                 390                 395                 400
His His His His
<210>21
<211>1650
<212>DNA
<213>蓖麻(Ricinus communis)
<400>21
atggtcccca aacaataccc aattataaac tttaccacag cgggtgccac tgtgcasagc    60
tacacaaact ttatcagagc tgttcgcggt cgtttaacaa ctggagctga tgtgagacat    120
gatataccag tgttgccaaa cagagttggt ttgcctataa accaacggtt tattttagtt    180
gaactctcas atcatgcaga gctttctgtt scattagccc tggatgtcac caatgcatat    240
gtggtcggct accgtgctgg aaatagcgca tatttctttc atcctgacaa tcaggaagat    300
gcagaagcas tcactcatct tttcactgat gttcaaastc gatatacatt cgcctttggt    360
ggtaattatg atagacttga acaacttgct ggtaatctga gagaaastat cgagttggga    420
aatggtccsc tagaggaggc tatctcagcg ctttattatt scagtactgg tggcactcag    480
cttccaactc tggctcgttc ctttatsatt tgcatccsas tgatttcaga agcagcasga    540
ttccaatata ttgagggaga aatgcgcacg agaattaggt acaaccggag atctgcacca    600
gatcctagcg taattscact tgagaatagt tgggggagac tttccactgc asttcasgag    660
tctaaccsag gagcctttgc tagtccaatt caactgcasa gacgtaatgg ttccsaattc    720
agtgtgtacg atgtgagtat attsstccct atcatagctc tcatggtgta tagatgcgca    780
cctcctaggg ggatastsac ttctaasact aaatcattgg ttccacgtgg atccaaggct    840
gatgtttgta tggatcctga gcccstagtg cgtatcgtag gtcgssatgg tctatgtgtt    900
gatgttaggg atggaagatt ccscsacgga sacgcastsc agttgtggcc atgcasgtct    960
sstscsgatg casatcagct ctggactttg sassgagacs atsctattcg atctsatgga    1020
asgtgtttaa ctscttacgg gtscagtccg ggagtctatg tgatgatcta tgattgcaat    1080
actgctgcaa ctgatgccac ccgctggcas atatgggata atggaaccat catsaatccc    1140
agatctagtc tagttttagc agcgacstca gggaacagtg gtsccscact tacggtgcas    1200
accsscsttt atgccgttag tcasggttgg cttcctacta ataatscscs accttttgtt    1260
acaaccattg ttgggctata tggtctgtgc ttgcaagcaa atagtggaca agtatggata    1320
gaggactgta gcagtgaaaa ggctgaacaa cagtgggctc tttatgcaga tggttcaata    1380
cgtcctcagc aaaaccgaga taattgcctt acaagtgatt ctaatatacg ggaaacagtt    1440
gttaagatcc tctcttgtgg ccctgcatcc tctggccaac gatggatgtt caagaatgat    1500
ggaaccattt taaatttgta tagtggattg gtgttagatg tgaggcgatc ggatccgagc    1560
cttaaacaaa tcattcttta ccctctccat ggtgacccaa accaaatatg gttaccatta    1620
tttctcgagc accaccacca ccaccactaa                                     1650
<210>22
<211>549
<212>PRT
<213>蓖麻(Ricinus communis)
<400>22
Met Val Pro Lys Gln Tyr Pro Ile Ile Asn Phe Thr Thr Ala Gly Ala
1               5                   10                  15
Thr Val Gln Ser Tyr Thr Asn Phe Ile Arg Ala Val Arg Gly Arg Leu
            20                  25                  30
Thr Thr Gly Ala Asp Val Arg His Asp Ile Pro Val Leu Pro Asn Arg
        35                  40                  45
Val Gly Leu Pro Ile Asn Gln Arg Phe Ile Leu Val Glu Leu Ser Asn
    50                  55                  60
His Ala Glu Leu Ser Val Thr Leu Ala Leu Asp Val Thr Asn Ala Tyr
65                  70                  75                  80
Val Val Gly Tyr Arg Ala Gly Asn Ser Ala Tyr Phe Phe His Pro Asp
                85                  90                  95
Asn Gln Glu Asp Ala Glu Ala Ile Thr His Leu Phe Thr Asp Val Gln
            100                 105                 110
Asn Arg Tyr Thr Phe Ala Phe Gly Gly Asn Tyr Asp Arg Leu Glu Gln
        115                 120                 125
Leu Ala Gly Asn Leu Arg Glu Asn Ile Glu Leu Gly Asn Gly Pro Leu
    130                 135                 140
Glu Glu Ala Ile Ser Ala Leu Tyr Tyr Tyr Ser Thr Gly Gly Thr Gln
145                 150                 155                 160
Leu Pro Thr Leu Ala Arg Ser Phe Ile Ile Cys Ile Gln Met Ile Ser
                165                 170                 175
Glu Ala Ala Arg Phe Gln Tyr Ile Glu Gly Glu Met Arg Thr Arg Ile
            180                 185                 190
Arg Tyr Asn Arg Arg Ser Ala Pro Asp Pro Ser Val Ile Thr Leu Glu
        195                 200                 205
Asn Ser Trp Gly Arg Leu Ser Thr Ala Ile Gln Glu Ser Asn Gln Gly
    210                 215                 220
Ala Phe Ala Ser Pro Ile Gln Leu Gln Arg Arg Asn Gly Ser Lys Phe
225                 230                 235                 240
Ser Val Tyr Asp Val Ser Ile Leu Ile Pro Ile Ile Ala Leu Met Val
                245                 250                 255
Tyr Arg Cys Ala Pro Pro Arg Gly Ile Ile Thr Ser Lys Thr Lys Ser
            260                 265                 270
Leu Val Pro Arg Gly Ser Lys Ala Asp Val Cys Met Asp Pro Glu Pro
        275                 280                 285
Ile Val Arg Ile Val Gly Arg Asn Gly Leu Cys Val Asp Val Arg Asp
    290                 295                 300
Gly Arg Phe His Asn Gly Asn Ala Ile Gln Leu Trp Pro Cys Lys Ser
305                 310                 315                 320
Asn Thr Asp Ala Asn Gln Leu Trp Thr Leu Lys Arg Asp Asn Thr Ile
                325                 330                 335
Arg Ser Asn Gly Lys Cys Leu Thr Thr Tyr Gly Tyr Ser Pro Gly Val
            340                 345                 350
Tyr Val Met Ile Tyr Asp Cys Asn Thr Ala Ala Thr Asp Ala Thr Arg
        355                 360                 365
Trp Gln Ile Trp Asp Asn Gly Thr Ile Ile Asn Pro Arg Ser Ser Leu
    370                 375                 380
Val Leu Ala Ala Thr Ser Gly Asn Ser Gly Thr Thr Leu Thr Val Gln
385                 390                 395                 400
Thr Asn Ile Tyr Ala Val Ser Gln Gly Trp Leu Pro Thr Asn Asn Thr
                405                 410                 415
Gln Pro Phe Val Thr Thr Ile Val Gly Leu Tyr Gly Leu Cys Leu Gln
            420                 425                 430
Ala Asn Ser Gly Gln Val Trp Ile Glu Asp Cys Ser Ser Glu Lys Ala
        435                 440                 445
Glu Gln Gln Trp Ala Leu Tyr Ala Asp Gly Ser Ile Arg Pro Gln Gln
    450                 455                 460
Asn Arg Asp Asn Cys Leu Thr Ser Asp Ser Asn Ile Arg Glu Thr Val
465                 470                 475                 480
Val Lys Ile Leu Ser Cys Gly Pro Ala Ser Ser Gly Gln Arg Trp Met
                485                 490                 495
Phe Lys Asn Asp Gly Thr Ile Leu Asn Leu Tyr Ser Gly Leu Val Leu
            500                 505                 510
Asp Val Arg Arg Ser Asp Pro Ser Leu Lys Gln Ile Ile Leu Tyr Pro
        515                 520                 525
Leu His Gly Asp Pro Asn Gln Ile Trp Leu Pro Leu Phe Leu Glu His
    530                 535                 540
His His His His His
545

Claims (32)

1.通过在大肠杆菌宿主细胞中重组表达产生双链形式的蛋白质的方法,所述两条链是二硫桥连的,其中
(i)所述蛋白质作为双链二硫键桥连的蛋白质发挥其生物活性,并且选自肉毒杆菌神经毒素C及其LHN片段;
(ii)第一链的C末端氨基酸残基是碱性氨基酸残基,
(iii)所述蛋白质的第二链在N末端按照从N到C的方向具有1-20个氨基酸残基和称为PRS的五肽序列VPXGS,其中X是任何天然存在的氨基酸,其中V是Val、Leu、Ile、Ala、Phe、Pro或Gly,其中P是Pro、Leu、Ile、Ala、Phe、Val或Gly,其中G是Gly、Leu、Ile、Ala、Pro、Phe或Val,并且其中S是Ser、Tyr、Trp或Thr;并且
(iv)所述方法包含以下步骤:
(a)在核酸水平修饰多肽或蛋白质,使得经修饰形式的该多肽或蛋白质在其环区域具有序列VPXGS,其中X、V、P、G和S如上所定义,且其中所述环区域定义为位于形成二硫桥连的Cys残基之间的氨基酸序列;
(b)将核酸水平被修饰的构建体导入到大肠杆菌细胞中;
(c)培养并随后裂解宿主细胞;和
(d)分离所述双链二硫桥连的蛋白质,
其中所述方法不包括随后添加蛋白如内切蛋白酶的步骤,因为步骤(c)之后获得的蛋白是以其生物学上活性的双链结构存在的。
2.权利要求1的方法,其中所述碱性氨基酸残基是Arg或Lys残基。
3.根据权利要求1或2的方法,其中所述蛋白质的第一链是该蛋白质的较轻的链,而第二链是该蛋白质的较重的链。
4.根据权利要求1-3之一的方法,其中将PRS序列VPXGS插入缺失了至少一个氨基酸的下列序列中:BoNT(C1)的15聚体His438-Asp452
5.根据权利要求4的方法,其中将PRS序列VPXGS以17聚体GIITSKTKSLVPRGSKA的形式插入。
6.根据权利要求4的方法,其中将PRS序列VPXGS以18聚体RGIITSKTKSLVPRGSKA的形式插入。
7.根据权利要求1或3的方法,其中所述蛋白质是杂合神经毒素。
8.根据权利要求7的方法,其中所述杂合神经毒素具有以下成分A、B和C:
-作为成分A的效应物域,该域通过其酶促活性,能够抑制靶细胞中的分泌;
-作为成分B的环序列,其包含序列VPXGS;以及
-作为成分C的细胞结合域,其赋予所述杂合神经毒素以细胞特异性。
9.根据权利要求8的方法,其中所述杂合神经毒素还包含作为成分D的易位域。
10.根据权利要求1的方法,其中所述大肠杆菌细胞是大肠杆菌K12细胞。
11.权利要求10的方法,其中所述大肠杆菌K12细胞是菌株M15[pREP4]、XL1-BLUE或UT5600的大肠杆菌K12细胞。
12.根据权利要求1的方法,其中在核酸水平修饰多肽或蛋白质使得SEQID NO:12的多肽或蛋白质被编码。
13.根据权利要求1的方法,其中在核酸水平修饰多肽或蛋白质使得SEQID NO:14的多肽或蛋白质被编码。
14.蛋白质,其中该蛋白质作为双链二硫桥连的蛋白质存在,并且是生物活性的,其特征在于该蛋白质的第一链C末端是碱性氨基酸残基,而该蛋白质的第二链在N末端按照从N到C的方向包含1-20个氨基酸残基和称为PRS的五肽序列VPXGS,其中X是任何天然存在的氨基酸,其中V是Val、Leu、Ile、Ala、Phe、Pro或Gly,其中P是Pro、Leu、Ile、Ala、Phe、Val或Gly,其中G是Gly、Leu、Ile、Ala、Pro、Phe或Val,并且其中S是Ser、Tyr、Trp或Thr,其中所述蛋白质选自肉毒杆菌神经毒素C及其LHN片段。
15.根据权利要求14的蛋白质,其中所述碱性氨基酸残基是Arg或Lys残基。
16.根据权利要求14或15的蛋白质,其中所述蛋白质的第一链是该蛋白质的较轻的链,而第二链是该蛋白质的较重的链。
17.根据权利要求16的蛋白质,其中所述第一链的C末端是Lys残基。
18.根据权利要求14-17之一的蛋白质,其中所述第二链在N末端具有五肽序列VPXGS、六肽序列XVPXGS或七肽序列XXVPXGS。
19.根据权利要求14-18之一的蛋白质,其中所述第二链在N末端具有七肽序列SLVPXGS。
20.根据权利要求19的蛋白质,其中X是R、Y、H或Q。
21.根据权利要求19的蛋白质,其中X是R。
22.根据权利要求17的蛋白质,其中所述第一链具有SEQ ID NO:12的氨基酸残基1-447的氨基酸序列。
23.根据权利要求19的蛋白质,其中所述第二链包含SEQ ID NO:14的氨基酸残基448-868的序列。
24.根据权利要求19的蛋白质,其中所述第二链包含SEQ ID NO:12的氨基酸残基448-1288的序列。
25.根据权利要求14的蛋白质,其中所述第一链具有SEQ ID NO:12的氨基酸残基1-447的氨基酸序列,且其中所述第二链包含SEQ ID NO:14的氨基酸残基448-868的序列。
26.根据权利要求25的蛋白质,其中所述第二链具有SEQ ID NO:14的氨基酸残基448-874的氨基酸序列。
27.根据权利要求25的蛋白质,其中所述第二链包含SEQ ID NO:12的氨基酸残基448-1288的序列。
28.根据权利要求26的蛋白质,其中所述第二链具有SEQ ID NO:12的氨基酸残基448-1294的序列。
29.根据权利要求14-20之一的蛋白质,其中所述蛋白质是杂合肉毒杆菌神经毒素。
30.根据权利要求29的蛋白质,其中所述杂合肉毒杆菌神经毒素具有以下成分A、B和C:
-作为成分A的效应物域,该域通过其酶促活性能够抑制靶细胞中的分泌;
-作为成分B的环序列,其包含序列VPXGS;以及
-作为成分C的细胞结合域,其赋予杂合肉毒杆菌神经毒素以细胞特异性。
31.根据权利要求30的蛋白质,其中所述杂合肉毒杆菌神经毒素还具有易位域作为成分D。
32.药物制剂,其包含根据权利要求14-31之一的蛋白质。
CN2006800029573A 2005-01-21 2006-01-20 二硫桥连双链形式的蛋白质的重组表达 Expired - Fee Related CN101107361B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE102005002978A DE102005002978B4 (de) 2005-01-21 2005-01-21 Rekombinante Expression von Proteinen in einer disulfidverbrückten, zweikettigen Form
DE102005002978.7 2005-01-21
PCT/DE2006/000088 WO2006076902A2 (de) 2005-01-21 2006-01-20 Rekombinante expression von proteinen in einer disulfidverbrückten, zweikettigen form

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2013102392934A Division CN103320459A (zh) 2005-01-21 2006-01-20 二硫桥连双链形式的蛋白质的重组表达

Publications (2)

Publication Number Publication Date
CN101107361A CN101107361A (zh) 2008-01-16
CN101107361B true CN101107361B (zh) 2013-07-17

Family

ID=36603464

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2013102392934A Pending CN103320459A (zh) 2005-01-21 2006-01-20 二硫桥连双链形式的蛋白质的重组表达
CN2006800029573A Expired - Fee Related CN101107361B (zh) 2005-01-21 2006-01-20 二硫桥连双链形式的蛋白质的重组表达

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2013102392934A Pending CN103320459A (zh) 2005-01-21 2006-01-20 二硫桥连双链形式的蛋白质的重组表达

Country Status (15)

Country Link
US (1) US20080103098A1 (zh)
EP (1) EP1844150B1 (zh)
JP (2) JP5107055B2 (zh)
KR (1) KR20070104605A (zh)
CN (2) CN103320459A (zh)
AT (1) ATE546533T1 (zh)
AU (1) AU2006207726B2 (zh)
BR (1) BRPI0606612A2 (zh)
CA (1) CA2593520C (zh)
DE (2) DE102005002978B4 (zh)
DK (1) DK1844150T3 (zh)
ES (1) ES2380677T3 (zh)
IL (1) IL184112A0 (zh)
RU (1) RU2412253C2 (zh)
WO (1) WO2006076902A2 (zh)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2178905B1 (en) * 2007-07-26 2013-11-06 Allergan, Inc. Methods of activiting clostridial toxins
EP2337790B1 (en) * 2008-08-29 2016-07-13 Merz Pharma GmbH & Co. KGaA Clostridial neurotoxins with altered persistency
EP2202518A1 (en) 2008-12-19 2010-06-30 Merz Pharma GmbH & Co.KGaA In vivo assay for quantifying clostridial neurotoxin activity
EP2218783A1 (en) 2009-02-05 2010-08-18 Merz Pharma GmbH & Co. KGaA Novel method for the manufacturing of neurotoxins
MX340772B (es) 2009-02-19 2016-07-26 Merz Pharma Gmbh & Co Kgaa Medios y metodos para fabricar neurotoxina altamente pura.
TW201120210A (en) 2009-11-05 2011-06-16 Hoffmann La Roche Glycosylated repeat-motif-molecule conjugates
EP2526200B1 (en) 2010-01-22 2016-04-06 Merz Pharma GmbH & Co. KGaA In vitro assay for quantifying clostridial neurotoxin activity
KR101930962B1 (ko) * 2010-01-25 2018-12-19 알러간, 인코포레이티드 단일-사슬 단백질의 그의 이-사슬 형태로의 세포내 전환 방법
KR20130072201A (ko) * 2010-03-30 2013-07-01 피페넥스 인크. 재조합 독소 단백질의 고수준 발현
AR081361A1 (es) * 2010-04-30 2012-08-29 Molecular Partners Ag Proteinas de union modificadas que inhiben la interaccion de receptor del factor de crecimiento endotelial vascular de glicoproteina a vegf-a
ES2544060T3 (es) 2010-08-11 2015-08-27 Merz Pharma Gmbh & Co. Kgaa Fabricación selectiva de polipéptidos de neurotoxina recombinantes
US20140377248A1 (en) 2011-12-23 2014-12-25 Merz Pharma Gmbh & Co. Kgaa Method for the manufacturing of di-chain proteins for use in humans
CN103509807B (zh) * 2012-09-14 2015-04-15 山东大学 糖基化的麦芽糖结合蛋白及其制备方法与应用
GB201219602D0 (en) 2012-10-31 2012-12-12 Syntaxin Ltd Recombinant clostridium botulinum neurotoxins
JP6156954B2 (ja) * 2012-11-21 2017-07-05 イプセン バイオイノベーション リミテッド タンパク分解性にプロセシングされたポリペプチドの製造方法
US9975929B2 (en) 2014-03-05 2018-05-22 Merz Pharma Gmbh & Co. Kgaa Recombinant clostridial neurotoxins with increased duration of effect
CN107207586B (zh) 2014-12-19 2021-07-13 莫茨药物股份两合公司 用于测定BoNT/E在细胞中的生物活性的装置和方法
US10647750B2 (en) * 2015-01-09 2020-05-12 Ipsen Bioinnovation Limited Cationic neurotoxins
TW201718627A (zh) 2015-06-11 2017-06-01 梅茲製藥有限兩合公司 重組梭菌神經毒素及其使用與形成方法、包括其之醫藥組合物及對應其之前驅物、編碼前驅物之核酸序列及其獲得方法與前驅物之形成方法、載體與包括核酸序列之重組宿主細胞
TWI799366B (zh) 2015-09-15 2023-04-21 美商建南德克公司 胱胺酸結骨架平臺
ES2929347T3 (es) 2016-01-20 2022-11-28 Merz Pharma Gmbh & Co Kgaa Nuevas neurotoxinas clostridiales recombinantes con aumento de la duración del efecto
KR20180114891A (ko) 2016-03-02 2018-10-19 메르츠 파마 게엠베하 운트 코. 카가아 보툴리눔 독소를 포함하는 조성물
EP3263710A1 (en) 2016-07-01 2018-01-03 Ipsen Biopharm Limited Production of activated clostridial neurotoxins
EP3290437A1 (en) 2016-08-31 2018-03-07 Merz Pharma GmbH & Co. KGaA Novel recombinant clostridial neurotoxins with decreased duration of effect
EP3312193A1 (en) 2016-10-19 2018-04-25 Merz Pharma GmbH & Co. KGaA Novel recombinant botulinum neurotoxins with accelerated onset of effect
EP3333179A1 (en) 2016-12-07 2018-06-13 Merz Pharma GmbH & Co. KGaA Novel recombinant botulinum toxin with accelarated onset of effect
EP3335719A1 (en) 2016-12-14 2018-06-20 Merz Pharma GmbH & Co. KGaA Novel recombinant botulinum neurotoxins with a stabilized light chain
WO2018233813A1 (en) 2017-06-20 2018-12-27 Merz Pharma Gmbh & Co. Kgaa NOVEL RECOMBINANT BOTULINUM TOXINS WITH INCREASED DURATION
US11155802B2 (en) 2017-07-06 2021-10-26 Merz Pharma Gmbh & Co. Kgaa Recombinant botulinum neurotoxins with increased duration of effect
US20210008156A1 (en) 2017-10-26 2021-01-14 Merz Pharma Gmbh & Co. Kgaa Novel recombinant botulinum neurotoxins with increased duration of effect
EP3713595A1 (en) 2017-11-22 2020-09-30 Merz Pharma GmbH & Co. KGaA Novel recombinant botulinum toxin with increased duration of effect
EP3752128A1 (de) 2018-02-16 2020-12-23 Bontana Therapies Gmbh Nukleinsäure-basiertes botulinum neurotoxin zur therapeutischen anwendung
CA3101481A1 (en) * 2018-05-30 2019-12-05 The Governing Council Of The University Of Toronto Methods and kits for identifying a protein associated with receptor-ligand interactions
US20220214340A1 (en) * 2019-04-28 2022-07-07 Leide Biosciences Co., Ltd. Zipper structure that helps the formation of protein dimer and application thereof
EP4006158A4 (en) * 2019-12-18 2023-01-04 Mvrix Co., Ltd. METHOD FOR THE SAFE PRODUCTION OF BOTULINUM NEUROTOXIN
CN114957482A (zh) * 2021-02-26 2022-08-30 重庆誉颜制药有限公司 一种经修饰的神经毒素的单链多肽及其用途
CN113480667B (zh) * 2021-08-17 2023-03-28 长春萤火虫生物科技有限公司 一种人粒细胞集落刺激因子突变体重组融合蛋白及其制备方法和应用
WO2023226873A1 (en) * 2022-05-24 2023-11-30 Jhm Biopharmaceutical (Hangzhou) Co., Ltd. Recombinant botulinum neurotoxin of type a and preparation method thereof
CN115894641B (zh) * 2022-09-13 2023-09-29 君合盟生物制药(杭州)有限公司 A型肉毒素突变体及其基因工程菌的构建
CN115819526A (zh) * 2022-12-02 2023-03-21 海雅美生物技术(珠海)有限公司 一种重组肉毒杆菌神经毒素及其制备方法和应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1046189A (zh) * 1988-09-29 1990-10-17 邦奇(澳大利亚)有限公司 羊生长激素
CN1057294A (zh) * 1990-05-10 1991-12-25 法米塔利亚·卡洛·埃巴有限责任公司 水蛭素的重组体制备方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11513669A (ja) * 1995-10-13 1999-11-24 アメリカ合衆国 ジスルフィド安定化抗体フラグメントを含む免疫毒素
US7192596B2 (en) * 1996-08-23 2007-03-20 The Health Protection Agency Ipsen Limited Recombinant toxin fragments
JP2001504334A (ja) * 1996-11-06 2001-04-03 アメリカ合衆国 プロテアーゼ活性化可能なPseudomonas体外毒素A様プロタンパク質
EP0977862B8 (en) * 1997-04-30 2009-09-16 Twinstrand Therapeutics Inc. Ricin-like toxin variants for treatment of cancer, viral or parasitic infections
DE60032367T3 (de) * 1999-08-25 2011-03-10 Allergan, Inc., Irvine Aktivierbare rekombinante neurotoxine
US7273722B2 (en) * 2000-11-29 2007-09-25 Allergan, Inc. Neurotoxins with enhanced target specificity
US20040018589A1 (en) * 2002-07-25 2004-01-29 Jun Zhong Method for producing biologically active botulinum neurotoxins through recombinant DNA technique
US20080166375A1 (en) * 2003-05-06 2008-07-10 The Government Of The United States Of America, As Rep. By The Secretary Of Health And Human Service Activation of Recombinant Diphtheria Toxin Fusion Proteins by Specific Proteases Highly Expressed on the Surface of Tumor Cells

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1046189A (zh) * 1988-09-29 1990-10-17 邦奇(澳大利亚)有限公司 羊生长激素
CN1057294A (zh) * 1990-05-10 1991-12-25 法米塔利亚·卡洛·埃巴有限责任公司 水蛭素的重组体制备方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
全文.

Also Published As

Publication number Publication date
WO2006076902A3 (de) 2006-11-02
EP1844150A2 (de) 2007-10-17
US20080103098A1 (en) 2008-05-01
KR20070104605A (ko) 2007-10-26
ES2380677T3 (es) 2012-05-17
CA2593520C (en) 2013-11-19
RU2007127624A (ru) 2009-02-27
EP1844150B1 (de) 2012-02-22
JP5107055B2 (ja) 2012-12-26
JP2008527983A (ja) 2008-07-31
WO2006076902A2 (de) 2006-07-27
BRPI0606612A2 (pt) 2009-07-07
AU2006207726B2 (en) 2011-04-14
JP2012254088A (ja) 2012-12-27
DK1844150T3 (da) 2012-05-29
CN103320459A (zh) 2013-09-25
RU2412253C2 (ru) 2011-02-20
ATE546533T1 (de) 2012-03-15
CN101107361A (zh) 2008-01-16
CA2593520A1 (en) 2006-07-27
AU2006207726A1 (en) 2006-07-27
DE112006000677A5 (de) 2007-12-27
IL184112A0 (en) 2007-10-31
DE102005002978A1 (de) 2006-08-03
DE102005002978B4 (de) 2013-04-25

Similar Documents

Publication Publication Date Title
CN101107361B (zh) 二硫桥连双链形式的蛋白质的重组表达
CA2413045C (en) Expression system
Hovde et al. Evidence that glutamic acid 167 is an active-site residue of Shiga-like toxin I.
KR20190082318A (ko) Crispr/cpf1 시스템 및 방법
US20030017495A1 (en) Enterococcus faecalis polynucleotides and polypeptides
Weller et al. Expression of Active Streptolysin O in Escherichia coli as a Maltose‐Binding‐Protein‐Streptolysin‐O Fusion Protein: The N‐Terminal 70 Amino Acids are not Required for Hemolytic Activity
US20090035814A1 (en) Method for producing circular or multimeric protein species in vivo or in vitro and related methods
CN101432296A (zh) 聚乙二醇化的突变的肉毒梭菌毒素
Engel et al. Murein-metabolizing enzymes from Escherichia coli: existence of a second lytic transglycosylase
Jobling et al. Construction and Characterization of Versatile Cloning Vectors for Efficient Delivery of Native Foreign Proteins to the Periplasm ofEscherichia coli
Sichwart et al. Maximized autotransporter-mediated expression (MATE) for surface display and secretion of recombinant proteins in Escherichia coli
Gallagher et al. Identification and localization of the membrane‐associated, ATP‐binding subunit of the oligopeptide permease of Salmonella typhimurium
AU674741B2 (en) Methods and DNA expression systems for over-expression of proteins in host cells
Lacy et al. Recombinant expression and purification of the botulinum neurotoxin type A translocation domain
JP4546089B2 (ja) 融合タンパク質
Bunai et al. Bacillus subtilisFfh, a homologue of mammalian SRP54, can intrinsically bind to the precursors of secretory proteins
Kawazu et al. Comparative characterization of release factor RF-3 genes of Escherichia coli, Salmonella typhimurium, and Dichelobacter nodosus
Chiron et al. Pseudomonas exotoxin exhibits increased sensitivity to furin when sequences at the cleavage site are mutated to resemble the arginine‐rich loop of diphtheria toxin
KR20180072715A (ko) 조절가능한 리보솜 번역 속도를 위한 조성물 및 사용 방법
AU708689B2 (en) Polynucleotides and the proteins encoded thereby, suitable for controlling lamellicorn beetles
Engel et al. Enzymatic preparation of 1, 6-anhydro-muropeptides by immobilized murein hydrolases from Escherichia coli fused to staphylococcal protein A
CN111601894B (zh) M23a家族蛋白酶的制造方法
Fusi et al. An 8.5-kDa ribonuclease from the extreme thermophilic archaebacterium Sulfolobus solfataricus
Sakurai et al. New evidence that the Tyr-157 and Tyr-159 residues of staphylococcal exfoliative toxin B are essential for its toxicity
WO2003010287A1 (en) Immobilization of keratinase for proteolysis and keratinolysis

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: MERTZ DRUG LIMITED PARTNERSHIP

Free format text: FORMER OWNER: BIO TAIKANG MEDICAL TREATMENT CO., LTD.

Effective date: 20100319

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: POTSDAM, GERMANY TO: MAINZ, GERMANY

TA01 Transfer of patent application right

Effective date of registration: 20100319

Address after: German American

Applicant after: Merz Pharma GmbH & Co. Kgaa

Address before: postdam

Applicant before: Biotecon Therapeutics GmbH

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130717

Termination date: 20170120

CF01 Termination of patent right due to non-payment of annual fee