CN1353762A - 用于多肽的表达和分泌的果胶酸裂解酶融合体 - Google Patents

用于多肽的表达和分泌的果胶酸裂解酶融合体 Download PDF

Info

Publication number
CN1353762A
CN1353762A CN00808288A CN00808288A CN1353762A CN 1353762 A CN1353762 A CN 1353762A CN 00808288 A CN00808288 A CN 00808288A CN 00808288 A CN00808288 A CN 00808288A CN 1353762 A CN1353762 A CN 1353762A
Authority
CN
China
Prior art keywords
asn
gly
ser
ile
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN00808288A
Other languages
English (en)
Inventor
迈克尔·D·拉斯马森
马兹·E·比约恩瓦德
伊凡·迪尔斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN1353762A publication Critical patent/CN1353762A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/62Insulins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Abstract

本发明提供了一种能改进融合蛋白的生产的细胞,所述融合蛋白包含一种与外源多肽融合的天然果胶酸裂解酶,本发明还提供了用于生产所述融合蛋白的方法。

Description

用于多肽的表达和分泌的果胶酸裂解酶融合体
本发明涉及利用微生物通过融合蛋白的表达而生产多肽。更具体地,本发明涉及一种能改进融合蛋白的生产的细胞,所述融合蛋白包含与外源多肽融合的天然果胶酸裂解酶,本发明还涉及产生所述融合蛋白和/或所述多肽的方法。
                         发明背景
蛋白质或多肽目前通过多种方式进行工业化生产,所有方式均涉及能产生该蛋白质的微生物的培养。多种使蛋白质的工业化产量最佳化的方法为本领域已知,并已常规应用,如对培养基进行操作,通过例如突变来改变微生物,使诸如启动子和信号序列等能影响编码所需蛋白的基因表达的遗传元件发生变异,以及对基因本身进行操作以便例如增强蛋白质的稳定性或提高活性。
融合蛋白已被描述为生产用其它方法难以获得的蛋白质的一种途径,这些蛋白质如活性人类抗体(Goshorn,S.C.等,癌症研究,(1993)第53卷(9),第2123-2127页)。
本发明的目的是提高一种利用微生物以高产量生产多肽的方法。
                         发明简述
本发明人鉴定了一种芽孢杆菌果胶酸裂解酶,该酶能以较高产量产生,其由分离的第一DNA片段编码,该DNA片段可与编码外源多肽的第二DNA片段融合在一个开放读码框中,该融合DNA序列编码能在适当条件下以较高产量产生的融合蛋白。
本发明人还发现,特定氨基酸序列可在导入果胶酸裂解酶与外源多肽之间后作为蛋白酶剪切的靶位点。
相应地,本发明第一方面涉及一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽。
本发明人还成功地在果胶酸裂解酶与外源多肽之间导入了一个氨基酸接头,其在特定环境中增强融合蛋白的稳定性。
相应地,本发明第二方面涉及一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,含至少2个氨基酸的接头,用于蛋白酶剪切的靶位点,和外源多肽。
本发明第三方面涉及产生蛋白质的方法,该方法包括以下步骤:
i)构建合适的细胞,其包含一种能编码融合在一个开放读码框(ORF)内的至少以下依次排列之元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽,
ii)在适于生长和分泌的条件下培养步骤i)所构建的细胞,
iii)回收所述蛋白,和
iv)任选在所述靶位点切割该蛋白。
通过利用本发明的细胞或方法,有可能以较高产量产生所需外源多肽如激素,功能型激素类似物,酶和人工多肽,从而使生产更经济,甚至对特定多肽而言使这类所需多肽的实际利用更经济可行。
                         附图简述
在所附图中
图1显示Western印迹,其放大了如实施例2所述融合多肽果胶酸裂解酶-ASKR-GLP1(7-37)的表达。图注:泳道1:果胶酸裂解酶-ASKR-GLP1(7-37)的芽孢杆菌培养物;泳道2:GLP1标准品100mg/l;
图2显示Western印迹,其放大了如实施例2所述融合多肽果胶酸裂解酶-ASKR-GLP1(7-37)的表达。图2的图注:泳道1:纯化的果胶酸裂解酶-ASKR-GLP1(7-37)的10倍稀释液;泳道2:MI3(12.5mg/l)与GLP1(25mg/l)的混合标准品;
图3显示Western印迹,其放大了如实施例3所述枯草芽孢杆菌培养物对融合多肽果胶酸裂解酶-AS-PEPTPEPTKR-GLP1(7-37)的表达。图3的图注:泳道1:培养物(对照);泳道2:GLP1标准品(100mg/l);泳道3:GLP1标准品(50mg/l);泳道4:GLP1标准品(25mg/l);和
图4显示Western印迹,其放大了如实施例4所述融合多肽果胶酸裂解酶-AS-PEPTPEPTKR-MI3的表达。图4的图注:泳道1:MB1009-1(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道2:MB1009-1(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道3:MB1009-4(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道4:MB1009-4(果胶酸裂解酶-AS-PEPTPEPTKR-MI3);泳道5:MB1009-7(阴性对照);泳道6:MB1009-7(阴性对照);泳道7:MB1009-7(阴性对照);泳道8:标准MI3,50mg/l;泳道9:标准MI3,25mg/l;泳道10:标准MI3,12.5mg/l。
图5显示Western印迹,其放大了如实施例5所述融合多肽果胶酸裂解酶-ASKR-GLP1(7-37)的表达以及Kex2p-裂解而对GLP1(7-37)的释放。图5的图注:泳道1:果胶酸裂解酶-ASKR-GLP1(7-37)的芽孢杆菌培养物用Kex蛋白酶处理;泳道2:果胶酸裂解酶-ASKR-GLP1(7-37)的芽孢杆菌培养物;泳道3:GLP1标准品(12.5mg/l);泳道4:GLP1标准品(25mg/l);泳道5:GLP1标准品(50mg/l)。
定义
讨论本发明的详细实施方案之前,先就与本发明主要方面相关的特殊术语进行限定。
本文中术语“细胞”或“菌株”指单个活细胞或由单个活细胞的营养生长所得的活细胞群体。
本文中术语“DNA序列”或“DNA片段”或“DNA元件”指4种碱基腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、和胞嘧啶(C)在由序列或片段或元件所定性的特异性脱氧核糖核酸(DNA)链中的依次排列。
本文中术语“基因”或“开放读码框”指可在细胞内表达为多肽或蛋白质的DNA链。相应地,所述基因或开放读码框被限定为始于起始密码子(通常为“ATG”、“GTG”、或“TTG”)而止于终止密码子(通常为“TAA”、“TAG”、或“TGA”)。
本文中术语“多肽”或“蛋白质”指由RNA聚合酶将开放读码框或基因转录为信使RNA,然后由核糖体通过依次添加氨基酸并将它们用肽键相连而进一步翻译,最终所得的表达产物;此过程即本领域的“中心法则”。
本领域已知为了表达基因,该基因必需与一些元件相连,这些元件为该基因在细胞内表达所必需。这类标准元件可包括启动子,核糖体结合位点,终止序列,以及本领域已知的其它元件。
本文中,当至少两个基因及可能还有其它DNA元件连接在一起形成一个开放读码框,且这些元件以与列举它们相同的顺序表达在一个多肽中时,称这些元件“依次融合”,而该多肽则称为“融合多肽”或“融合蛋白”。
术语“果胶”指果胶酸,聚半乳糖醛酸,以及可以酯化至更高级或更低级的果胶。
本文中术语“果胶酶”指能切割果胶(pectic)物质,主要是聚(1,4-α-D-半乳糖醛酸酐及其衍生物(参见Sakai等,果胶、果胶酶和原果胶酶:生产、特性及应用,在《应用微生物学进展(Advances in Applied Microbiology)》第39卷,第213-294页,1993)的糖苷键的果胶酶。
术语“果胶酸裂解酶”指能通过转移消除作用催化果胶酸(也称为聚半乳糖醛酸)中α-1,4-糖苷键随机裂解的果胶酶,如聚半乳糖醛酸裂解酶(EC4.2.2.2)(PGL)一类,也称为聚(1,4-α-D-半乳糖醛酸酐)裂解酶,还指已经通过本领域技术人员已知的任何方式改变了的果胶酸裂解酶,所述方式如氨基酸缺失、插入或取代、C末端和/或N末端截短但仍保留上述催化活性。
术语“α-淀粉酶”指能催化寡糖和多糖中1,4-α-葡糖苷键内切水解的酶,  即根据酶学命名法数据库归类为EC 3.2.1.1的酶(http://www.expasy.ch/enzyme/)。
本文中术语“功能型激素类似物”指天然肽激素的衍生物,其通过本领域任何标准方法改变后仍保留了天然激素的生物学活性,所述方法如氨基酸缺失、插入或取代、C末端和/或N末端截短。功能型激素类似物的一个具体实例是人类GLP-1(7-37),其包含SEQ ID 14中348-378位或SEQ ID16中356-386位所示氨基酸序列。
术语“单链人类胰岛素(MI3)”指由SEQ ID 18所示氨基酸序列限定的原胰岛素类似物。该蛋白序列公开在国际专利申请WO 95/34666中,其全文引入作为参考。
术语“核心酶”指一种单结构域酶,其可能已经或尚未被修饰或改变,但其保留了最初的活性;该催化结构域如本领域已知的那样保持完整无损并具有功能。
本文中术语“用于蛋白酶剪切的靶位点”指由蛋白酶识别并被该蛋白酶酶解或通过化学化合物处理而裂解(分子生物学最新方案(Currentprotocols in Molecular Biology)(John Wiley & Sons,1995;Harwood,C.R.,和Cutting,S.M.编))的氨基酸序列。
本文中术语“外源”当与细胞一词连用时指由于所述细胞中外来基因(即已插入所述细胞且在该细胞中并非天然存在的基因)的存在而由该细胞产生的多肽。
与此相反,本文中术语“天然”或“内源”当与特定微生物来源连用时,指由于特定来源中天然基因(即并未重组插入该来源的细胞而是其中天然存在的基因)的存在而由该来源产生的多肽。
术语“接头”或“间隔臂”指含有至少两个氨基酸的多肽,其可能出现在一种多结构域蛋白(如含有核心酶以及结合结构域如纤维素结合结构域(CBD)的酶或任何其它酶杂合体)的结构域之间,或出现在表达为融合多肽(如含有两种核心酶的融合蛋白或作为一个整体出现在本发明的细胞中的融合蛋白)的两种蛋白或多肽之间。例如,可通过将编码第一核心酶的DNA序列、编码接头的DNA序列和编码第二核心酶的DNA序列依次融合在一个开放读码框中并表达该构建体,从而提供两种核心酶的融合蛋白。接头还可包含用于蛋白酶剪切的靶位点。
                         发明详述
细胞
本发明的细胞优选革兰氏阳性细胞,更优选芽孢杆菌细胞,甚至更优选选自下组的细胞:地衣芽孢杆菌(Bacillus licheniformis)、Bacillus clausii、短芽孢杆菌(Bacillus brevis)、解淀粉芽孢杆菌(Bacillus amyloliguefacienss)、枯草芽孢杆菌(Bacillus subtilis)、迟缓芽孢杆菌(Bacillus lentus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、嗜碱芽孢杆菌(Bacillus alkalophilus)、凝固芽孢杆菌(Bacillus coagulans)、环状芽孢杆菌(Bacillus circulans)、灿烂芽孢杆菌(Bacillus lautus)、苏云金芽孢杆菌(Bacillus thuringiensis)、和Bacillusagaradhaerens。
果胶酸裂解酶
由本发明的方法产生的、作为融合蛋白一部分的果胶酸裂解酶优选选自以下果胶酸裂解酶,它们含有选自SEQ ID 2,SEQ ID 4,SEQ ID 6,SEQ ID8,SEQ ID 10的氨基酸序列,和具有与SEQ ID 2,SEQ ID 4,SEQ ID 6,SEQID 8和SEQ ID 10中任何一个至少70%的氨基酸序列相似性的氨基酸序列。
示于SEQ ID 2(其相应DNA序列示于SEQ ID 1)并已证实十分有利于天然酶所结合的多肽异源表达的果胶酸裂解酶与其它四种果胶酸裂解酶密切相关。
那四种果胶酸裂解酶的完整DNA序列示于SEQ ID 3,SEQ ID 5,SEQID 7,和SEQ ID 9。它们在此作为可用作融合配对物以便在芽孢杆菌细胞中表达外源多肽的其它果胶酸序列的实例。这些序列公开在WO 99/27084中。
可将果胶酸裂解酶蛋白序列最小化至某种程度而仍维持其在融合蛋白表达中使用时的有利特性。这种对DNA序列以及因此对所编码的蛋白质序列的最小化可通过分子生物学领域已知的任何方法实现。
其中一个方法是,设计特异性PCR引物,通过PCR构建与目标蛋白融合的果胶酸裂解酶的截短形式,并检验这种新构建体的表达水平。这类构建体可缺失果胶酸裂解酶C末端的一部分,果胶酸裂解酶N末端的一部分,或二种末端都缺失。另一种方法是,用内切核酸酶处理果胶酸裂解酶编码序列,使得编码果胶酸裂解酶C末端的部分被降解至各种程度。携与目标肽融合之果胶酸裂解酶的不同长度N末端部分的克隆组成一个文库,可在该文库中以鉴定最佳表达构建体的方式筛选这些克隆的表达能力。该方法也可应用于果胶酸裂解酶融合构建体,使得果胶酸裂解酶N末端的部分或N末端及C末端均缺失,从而使融合蛋白得到最佳表达。
酶解位点
在本发明的一个优选实施方案中,用于蛋白酶剪切的靶位点是由蛋白酶识别并裂解的氨基酸序列。
文献中已描述了数种经策略性定位而能促进融合产物有效裂解的氨基酸序列。这些策略大多数涉及在亲本酶与目标肽之间的接头区中定点进行蛋白酶剪切(Polyak等(1997)蛋白质工程,第10卷(6),第615-619页;Kjeldsen等(1996)基因,笫170卷,第107-112页;Sun等(1995)蛋白表达和纯化,卷6(5),第685-692页;Martinez等(1995)生物化学杂志,第306卷(第2部分)第589-597页)。
为了确保有效裂解,可在亲本酶(本例为果胶酸裂解酶)与外源多肽(编码位点特异性蛋白酶的识别位点)之间插入氨基酸序列。文献中已描述了识别位点和蛋白酶的多种组合。以下我们将显示来自酿酒酵母(Saccharomycescerevisiae)α细胞的Kex2基因编码的膜结合蛋白酶。Kex2蛋白酶能水解具有碱性氨基酸对的肽和蛋白质,在其肽键的C末端裂解(Bessmertnaya等(1997)生物化学,第62卷(8)第850-857页)。在第一和第二方面的一个优选实施方案中,Kex2裂解位点为Lys-Arg(K-/-R)序列,但可插入碱性氨基酸的其它组合从而使Kex2的裂解最优化(Ledgerwood等,(1995)生物化学杂志,卷308(1):321-325;或Ghosh,S.等(1996)基因(AmsterDNA),卷176(1-2):249-255)。
蛋白酶和裂解位点的其它有效组合是:优先裂解氨基酸序列X-D-D-D-K-/-X的肠激酶(La Vallie等(1993)生物学化学杂志,第268卷第2311-2317页),优先裂解氨基酸序列X-K-R-/-X的胰蛋白酶(Jonasson等(1996)欧洲生物化学杂志,卷236(2):656-661),优先裂解氨基酸序列X-I-E-G-R-/-X的Xa因子(Nagai等(1985)PNAS,第82卷第7252-7255页),优先裂解氨基酸序列P-X-/-G-P-X-X的胶原酶(Chinery等(1993)欧洲生物化学杂志,卷212(2):557-553),优先裂解氨基酸序列X-G-V-R-G-P-R-/-X的凝血酶(Rahman等(1992)细胞分子生物学,卷38(5):529-542),优先在赖氨酸处裂解的ALP(水解无色杆菌(Achromobacter lyticus)的Lys特异性蛋白酶)(Kjeldsen等(1996)基因,卷170(1):107-112),以及地衣芽孢杆菌的在Glu处裂解的C-组分蛋白酶(Kakudo等(1992)生物学化学杂志,卷267(33):23782-23788)。
另一种在特异性靶位点裂解肽的优选方法是利用化学化合物如能裂解X-M-/-X的溴化氰或能裂解S-N-/-G-X的羟胺(分子生物学最新方案,JohnWiley & Sons,1995;Harwood,C.R.,和Cutting,S.M.编)。
接头
在本发明一个优选实施方案中,由本发明方法产生的融合蛋白在果胶酸裂解酶与外源多肽之间插入了一个接头。优选地,该接头包含以下氨基酸序列,该序列中至少25%的氨基酸为脯氨酸。更优选地,该接头包含以下次序的氨基酸的至少一个循环重复:Pro-Glu-Pro-Thr(PEPT,EPTP,PTEP或TPEP),更优选该接头包含氨基酸序列:Ile-Glu-Gly-Arg(IEGR)的至少一个重复。
外源多肽
通常,外源多肽是本发明方法的目标产物。外源多肽可以是能作为由本发明方法产生的融合多肽的一部分而成功表达的任何多肽。
在本发明的一个优选实施方案中,外源多肽选自激素、功能型激素类似物、酶和人工多肽。
人工多肽的一个实例是单链人类胰岛素(MI3),优选包含SEQ ID 18所示氨基酸序列(其由SEQ ID 17所示密码子最优化型人工序列编码)的胰岛素。所述外源多肽甚至可能是包含携SEQ ID 20中356-408位所示氨基酸序列的单链人类胰岛素(MI3)的多肽;或单链人类胰岛素(MI3)的包含SEQ ID42中366-418位所示氨基酸序列的MW变体。
据认为激素可以是本领域已知的任何肽激素,如人类GLP1的全长氨基酸序列。
功能型激素类似物的一个实例是人类GLP-1(7-37)激素类似物,优选包含SEQ ID 14中348-378位或SEQ ID 16中356-386位所示氨基酸序列的类似物。
酶的一个实例是α-淀粉酶。优选的α-淀粉酶包括美国专利5003257;EP 252666;WO/9I/00353;FR 2676456;EP 285123;EP 525610;EP 368341;和英国专利说明书1296839(Novo)所公开的那些。
其它淀粉酶有WO94/18314和WO 96/05295所述的稳定性增强型淀粉酶和在WO 95/10603中所公开的直接亲本的具有额外修饰的第二代变体。EP 277216,WO 95/26397和WO 96/23873中所述的淀粉酶也合适。
在本发明的一个优选实施方案中,所述α-淀粉酶包含SEQ ID 12中350-834位所示的氨基酸序列。
市售α-淀粉酶产物有来自Genencor的Purafect Ox Am和来自丹麦的Novo Nordisk A/S的Termamyl,Ban,Fungamyl和Duramyl。WO95/26397描述了其它合适的淀粉酶:通过Phadebasα-淀粉酶活性试验测得在25-55℃,pH8-10的条件下,比活性比Termamyl高至少25%的α-淀粉酶。上述酶的变体也合适,它们述于WO 96/23873。其它在活性水平方面具有改良特性的淀粉分解酶,和即具有稳定性又具有较高活性的淀粉裂解酶述于WO 95/35382。
可由本发明方法产生的优选的淀粉酶有,以商标名Termamyl,Duramyl和Maxamyl出售的淀粉酶,包含SEQ ID 12中350-834位所示氨基酸序列的JP170淀粉酶,和或证实稳定性已增加的、如WO 96/23873中SEQ ID 2所公开的α-淀粉酶变体。
产生蛋白质的方法
该方法中一个基本要素是本文所述细胞的应用。能产生所述蛋白的细胞的特异性构建和培养可以是本领域的任何标准方案(Maniatis,T.Fritsch,E.F.,Sambrook,J.“分子克隆:实验室手册”,冷泉港实验室,1982;Ausubel,F.M.等(编),“分子生物学最新方案”,John Wiley & Sons,1995;Harwood,C.R.,和Cutting,S.M.(编)“芽孢杆菌分子生物学方法”,John Wiley & Sons,1990)。
相似地,第三方面第iii)项所述蛋白的特异性分离策略可以是本领域技术人员已知的任何分离方案;该分离方案可能包括在如本领域已知的那样进行分离之前或之后以任意多种方式对所述蛋白进行蛋白酶解。
本发明进一步通过以下非限制性实施例举例说明。
材料和方法
菌株和供体生物
地衣芽孢杆菌ATCC14580包含SEQ ID 1所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 11789包含一种质粒,该质粒携有本发明SEQ ID 1所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 12403包含一种质粒,该质粒携有本发明SEQ ID 3所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 12404包含一种质粒,该质粒携有本发明SEQ ID 5所示DNA序列编码的果胶酸裂解酶。
大肠杆菌DSM 11788包含一种质粒,该质粒携有本发明SEQ ID 7所示DNA序列编码的果胶酸裂解酶。
芽孢杆菌KJ59菌株(DSM 12419)包含SEQ ID 9所示DNA序列编码的果胶酸裂解酶。
枯草芽孢杆菌PL1801。该菌株是携有中断的apr和npr基因的枯草芽孢杆菌DN1885(Diderichsen,B.,Wedsted,U.Hedegaard,L.Jensen,B.R.,Sjholm,C.(1990),对编码短芽孢杆菌胞外酶α-乙酰乳酸脱羧酶的aldB的克隆,细菌学杂志,172,4315-4321)。
枯草芽孢杆菌WB600。该菌株是有6个主要蛋白酶缺失的枯草芽孢杆菌。Wu,X-C.,S-C.Ng,R.I.Near,和S-L.Wong,1993,通过工程化枯草芽孢杆菌表达分泌系统有效产生功能性单链抗地高辛抗体,生物/技术,11:71-76。
枯草芽孢杆菌WB600asn。该菌株是amyE基因已被四环素标记中断的WB600菌株。此外,WB600中的氯霉素标记基因已被新霉素标记取代。该菌株抗四环素、新霉素、链霉素和博莱霉素。
枯草芽孢杆菌PL2306。该菌株是具有已被破坏的apr和npr基因的枯草芽孢杆菌DN1885(Diderichsen,B.,Wedsted,U.Hedegaard,L.Jensen,B.R.,Sjholm,C.(1990),对编码短芽孢杆菌胞外酶α-乙酰乳酸脱羧酶的aldB的克隆,细菌学杂志,172,4315-4321),其中已知的枯草芽孢杆菌纤维素酶基因的转录单位中有破坏,导致产生纤维素阴性细胞。所述破坏基本如(A.L.Sonenshein,J.A.Hoch和Richard Losick编(1993),枯草芽孢杆菌和其它革兰氏阳性细菌,美国微生物学协会,第618页)所述进行。
感受态细胞如Yasbin,R.E.,Wilson,G.A.和Young,F.E.(1975)枯草芽孢杆菌溶原性菌株中的转化和转染:在感受态细胞中选择性诱导噬菌体的证据,细菌学杂志,121:296-304所述进行制备和转化。
质粒
pSJ1678(参见WO 94/19454,其已全文引入作为参考)。
pMOL944:
该质粒为pUB110的衍生物,其主要包含能使其在枯草芽孢杆菌中增殖的元件,卡那霉素抗性基因并具有克隆自地衣芽孢杆菌ATCC 14580的amyL基因的强启动子和信号肽。该信号肽包含一个SacII位点,使得可方便地对与该信号肽融合为一体的蛋白的成熟部分之编码DNA进行克隆。这导致可转移至细胞外的前蛋白的表达。
质粒用常规遗传工程技术构建,简述如下。
pMOL944的构建:
用唯一限制性酶NciI消化pUB110质粒(Mckenzie,T.等,1986,质粒15:93-103)。由质粒pDN1981(P.L.Jrgensen等,1990,基因,96,第37-41页)上的amyL启动子扩增的PCR片段用NciI消化并插入用NciI消化的pUB110以产生质粒pSJ2624。
所用的两种PCR引物具有以下序列:
#LWN5494(SEQ ID 21):
5’-GTCGCCGGGGCGGCCGCTATCAATTGGTAACTGTATCTCAGC
#LWN5495(SEQ ID 22):
5’-GTCGCCCGGGAGCTCTGATCAGGTACCAAGCTTGTCGACCTGCAGAATGAGGCAGCAAGAAGAT
引物#LWN5494(SEQ ID 21)在所述质粒中插入了一个NotI位点。
质粒pSJ2624然后用SacI和NotI消化,由pDN1981上amyL启动子扩增的新PCR片段用SacI和NotI消化,将该DNA片段插入用SacI-NotI消化的pSJ2624中,产生质粒pSJ2670。
该克隆取代了与相同启动子一起克隆但方向相反的第一amyL启动子。用于PCR扩增的两种引物具有以下序列:
#LWN5938(SEQ ID 23):
5’-GTCGGCGGCCGCTGATCACGTACCAAGCTTGTCGACCTGCAGAATGAGGCAGCAAGAAGAT
#LWN5939(SEQ ID 24):
5’-GTCGGAGCTCTATCAATTGGTAACTGTATCTCAGC
质粒pSJ2670用限制酶PstI和BclI消化,由编码碱性淀粉酶SP722(公开于国际专利申请WO 95/26397,其已全文引入作为参考)的克隆化DNA序列扩增的PCR片段用PstI和BclI消化并插入以产生质粒pMOL944。用于PCR扩增的两种引物具有以下序列:
#LWN7864(SEQ ID 25):5’-AACAGCTGATCACGACTGATCTTTTAGCTTGGCAC
#LWN7901(SEQ ID 26):5’-AACTGCAGCCGCGGCACATCATAATGGGACAAATGGG
引物#LWN7901(SEQ ID 26)在所述质粒中插入了一个SacII位点。
质粒pMB541(构建如下)
供体菌株的增殖
将地衣芽孢杆菌菌株ATCC 14580在ATCC(美国典型培养物保藏中心,USA)所特指的液体培养基3中培养。以37℃、300rpm培养18小时后,收获细胞,用下述方法分离基因组DNA。
基因组DNA制备
如上述在液体培养基中培养所述地衣芽孢杆菌菌株。收获细胞,用Pitcher等所述方法[Pitcher,D.G.,Saunders,N.A.,Owen,R.J;用异硫氰酸胍快速提取细菌基因组DNA;应用微生物学通信(Lett Appl Microbiol)1989 8151-156]分离。
pMB541的构建。
克隆地衣芽孢杆菌的果胶酸裂解酶
地衣芽孢杆菌菌株ATCC 14580的基因组DNA用限制酶Sau3A进行部分消化,通过在0.7%琼脂糖凝胶上电泳而进行分级分离。大小介于2-7kb之间的片段通过在DEAE-纤维素滤纸上的电泳而分离(Dretzen,G.,Bellard,M.,Sassone-Corsi,P.,Chambon,P(1981),一种从琼脂糖和聚丙烯酰胺凝胶中回收DNA片段的可靠方法,生物化学年鉴,112,295-298)。
将所分离的DNA片段连接至已用BamHI消化的pSJ1678质粒DNA中,用此连接混合物转化大肠杆菌SJ2。将来自地衣芽孢杆菌ATCC14580的基因组文库的已转化细胞铺板于包含10μg/ml氯霉素和0.7%聚半乳糖醛酸钠(SIGMA P-1879)的LB琼脂平板上,37℃培养16小时。
将菌落影印至含10μg/ml氯霉素和0.7%聚半乳糖醛酸钠(SIGMA P-1879)的新鲜LB琼脂平板上,37℃培养8小时。将起始主平板用5ml 1MCaCl2淹没,5-30分钟后在假定的聚半乳糖醛酸钠降解克隆周围出现明显的云雾状环。取主平板上的相应克隆进行进一步鉴定。即,从大肠杆菌在TY液体培养基上30℃过夜培养所得的克隆制备质粒DNA,并用Qiagen QiaspinPrep试剂盒按厂商建议(Qiagen,德国)制备质粒DNA,以便进一步鉴定所述克隆。
地衣芽孢杆菌ATCC 14580基因库中的果胶酸裂解酶阳性克隆以DSM11789的名义进行保藏。在对大肠杆菌DSM 11789的质粒进行了引物步行试验后,鉴定出地衣芽孢杆菌ATCC 14580中编码果胶酸裂解酶的DNA的序列SEQ ID 1。
利用活性鉴定阳性克隆
平板培养后,将菌落影印至一组LB+6 CAM琼脂平板上,然后再于37℃培养约20小时。将含有1%HSB琼脂糖、0.37%聚半乳糖醛酸钠的适当缓冲液上层倾注在这些影印平板上,40℃培养约20小时。用5ml 1M CaCl2沉淀,5-30分钟后,在存在果胶酸裂解酶阳性克隆之处出现透明环(clearhalo),由此可鉴定果胶酸裂解酶阳性菌落。
果胶酸裂解酶阳性菌落的细胞通过在琼脂上划线分离而分出单菌落,针对所鉴定的每一果胶酸裂解酶生产菌落筛选产果胶酸裂解酶的单菌落。
阳性克隆的鉴定
从再划线接种的平板上获得果胶酶阳性克隆的单菌落,用QiagenPlasmid Prep按厂商建议(Qiagen,德国)提取质粒。表型通过大肠杆菌SJ2的再次转化而证实,质粒通过限制性消化来鉴定。
地衣芽孢杆菌ATCC 14580基因库中的果胶酸裂解酶阳性克隆以DSM11789的名义进行保藏。在对大肠杆菌DSM 11789的质粒进行了引物步行试验后,鉴定出地衣芽孢杆菌ATCC 14580中编码果胶酸裂解酶的DNA的序列SEQ ID 1。
枯草芽孢杆菌的再克隆
编码本发明果胶酸裂解酶的成熟部分(由氨基酸序列SEQ ID 2表示,其编码DNA序列如SEQ ID 1中所示)的DNA用含有以下两种寡核苷酸的PCR引物对进行PCR扩增:
Pecl.B.lich.upper.SacII(SEQ ID 27):
5’-CTA ACT GCA G CC GCG GCA GCT TCT GCC TTA AAC TCGGGC
Pecl.B.lich.lower.NotI(SEQ ID 28):
5’-GCG TTG AGA CGC  GCG GCC GCT GAA TGC CCC GGA CGTTTC ACC
SacII和NotI的限制性位点均已下划线。
用上述地衣芽孢杆菌ATCC 14580的染色体DNA为模板,用AmplitaqDNA聚合酶(Perkin Elmer)根据厂商建议,在含dNTP各200μM、AmpliTaq聚合酶(Perkin Elmer,Cetus,美国)2.5个单位以及每种引物各100pmol的PCR缓冲液(10mM Tris-HCl,pH8.3,50mM KCl,1.5mM MgCl2,0.01%(w/v)明胶)中进行PCR反应。
PCR反应用DNA热循环仪(Landgraf,德国)进行。94℃保温1分钟,然后以94℃30秒的变性、60℃1分钟的退火、72℃2分钟的延伸进行30个循环。所扩增产物取5μl在0.7%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。1.0kb的DNA片段的出现表示对基因片段的扩增是正确的。
对PCR片段的再克隆
对PCR片段的再克隆如实施例1所述进行,不同的是所纯化的PCR片段用SacII和NotI消化。保留一个包含果胶酸裂解酶基因的克隆,将其命名为MB541,MB541中的质粒因此命名为pMB541。
对应于果胶酸裂解酶成熟部分的DNA通过引物步行法进行DNA测序来鉴定,其中使用Taq脱氧末端化循环测序试剂盒(Perkin-Elmer,美国),荧光标记的终止子,并使用相应寡核苷酸作为引物。
对序列数据的分析如Devereux等(1984),核酸研究12:387-395所述进行。克隆化DNA序列在枯草芽孢杆菌中表达,出现在上清中的蛋白对应于SEQ ID 1所示的成熟蛋白。
普通分子生物学方法
除非另外指明,DNA操作和转化用分子生物学的标准方法进行(Sambrook等(1989)分子克隆:实验室手册,冷泉港实验室,冷泉港,纽约;Ausubel,F.M.等(编)“分子生物学最新方案”,John Wiley & Sons,1995;Harwood,C.R.& Cutting,S.M.(编)“芽孢杆菌分子生物学方法”,John Wiley &Sons,1990)。
用于DNA操作的酶根据厂商说明使用(如,限制性内切核酸酶、连接酶等均得自New England Biolabs公司)。
培养基
TY(如Ausubel,F.M.等(编)“分子生物学最新方案”,John Wiley &Sons,1995所述)。LB琼脂(如Ausubel,F.M.等(编)“分子生物学最新方案”,John Wiley & Sons,1995所述)。LBPG是添加了0.5%葡萄糖和0.05M磷酸钾的LB琼脂(pH7.0)。BPX培养基如EP 0506780(WO 91/09129)所述。CAL18-2培养基(1L):酵母提取物(#0127-17-9 Difco实验室,MI,美国)40g;硫酸镁(#5886 Merck,Darmstadt,德国)1.3g;Glucidex 12(Roquette Feres,法国)50g;磷酸二氢钠(#6346 Merck,Darmstadt,德国)20g;EDF-痕量金属(配方如下)6.7ml;Na2MoO4-痕量金属(配方如下)6.7ml;Pluronic PE6100(BASF,德国)0.1ml;用离子交换水调整至1000ml。混合所有物质,调整体积,测量pH并用NaOH将pH调整至6.0。该培养基通过121℃20分钟高压灭菌。EDF-痕量金属(1L):硫酸锰(II)(#5963 Merck,Darmstadt,德国)4.48g;氯化铁(III)(#3943 Merck,Darmstadt,德国)3.33g;硫酸铜(II)(#2790Merck,Darmstadt,德国)0.625g;硫酸锌(#8883 Merck,Darmstadt,德国)7.12g;用离子交换水调整至1000ml。混合所有物质,调整体积。将溶液用滤膜过滤除菌,于4℃保存。Na2MoQ4-痕量金属(1L):钼酸钠(#6521 Merck,Darmstadt,德国)2.0g;用离子交换水调整至1000ml。混合所有物质,调整体积。将溶液过滤除菌,于4℃保存。
α-淀粉酶活性试验
α-淀粉酶活性通过用4,6-亚乙基(G7)-对硝基苯(G1)-α,D-麦芽糖庚苷(亚乙基-G7PNP)作为底物(Boehringer Mannheim,Germany art.1442309)经酶比色检验来测定。在特定条件(温度、pH、反应时间、缓冲条件)下,1mg指定的α-淀粉酶将水解特定量的底物并产生黄色。在405nm处测量颜色强度。所测吸光度与目标α-淀粉酶在所给条件下的活性直接成比例。
SDS-PAGE和免疫印迹
在Novex(Novex,San Diego)梯度Tricine 10-20%凝胶上进行变性和还原条件(在别处所述(SvH))下的SDS-PAGE。用Hoefer印迹仪将蛋白带印迹至硝酸纤维素膜上。为了对果胶酸裂解酶-胰岛素融合蛋白进行免疫印迹,使用产生于House of Ivan Svendsen,Cell Technology的单克隆抗体F19作为第一抗体,用偶联了过氧化物酶的兔抗鼠抗体作为第二抗体(来自DakoImmunoglobulins,Copenhagen,丹麦)。
对果胶酸裂解酶-GLP1的免疫印迹分别用第一抗体(产生于house of PiaKirschhoff Borre,Cell Technology的单克隆αGLP 26.1)进行。与过氧化物酶标记的第二抗体的结合通过与3-氨基-9-乙基咔唑的反应来显示。
实施例1
果胶酸裂解酶与JP170α-淀粉酶的融合蛋白的构建和表达
JP170α-淀粉酶的编码DNA序列(公开于国际专利申请WO95/26397,其已全文引入作为参考)用以下两种寡核苷酸组成的引物对进行PCR扩增:
145424.正向.NheI(SEQ ID 29):
5’-GAC AAT GTC GAC AAT GTA AAA TCA ATC GTC AAG CAAAAT GCC GGA GTC GGC AAA ATC AAT CCA GCT AGC ATT GAA GGCAGA CAT CAT AAT GGG ACA AAT GGG ACG
101450.反向(SEQ ID 30):
5’-CAT GGT GAA CCA AAG TGA AAC C
SalI和NheI的限制性位点均已下划线。在最终构建中,将NheI位点插入果胶酸裂解酶基因最后一个密码子的右侧。
用编码JP170α-淀粉酶的质粒DNA样品(pMOL944)作为模板,用Amplitaq DNA聚合酶(Perkin Elmer)根据厂商建议,在含dNTP各200μM、AmpliTaq聚合酶(Perkin Elmer,Cetus,美国)2.5个单位以及每种引物各100pmol的PCR缓冲液(10mM Tris-HCl,pH8.3,50mM KCl,1.5mM MgCl2,0.01%(w/v)明胶)中进行PCR反应。
PCR反应用DNA热循环仪(MJ Research,PCT-200)进行。94℃保温1分钟,然后以94℃30秒的变性、60℃1分钟的退火、72℃2分钟的延伸进行30个循环。所扩增产物取5μl在0.7%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。约1.6kb的DNA片段的出现表示对基因片段的扩增是正确的。
对PCR片段的再克隆
编码JP170的纯化PCR片段和上述pMB541质粒用SalI和NotI消化,1639 bp的JP170片段和5722bp的pMB541载体片段用QIAquick凝胶提取试剂盒(Qiagen,德国)从琼脂糖凝胶中纯化。然后将所述两种片段用T4 DNA连接酶和缓冲系统(Biolab,英国)于16℃连接16小时。将连接反应物用于转化感受态的PL1801,将这些细胞铺板至添加了10mg卡那霉素的LB琼脂平板上。从过夜培养的培养液中分离质粒DNA,对多个克隆进行分析。
将一个这样的阳性克隆于上述所用的添加了10mg/ml卡那霉素的琼脂平板上进行多次划线接种,将该克隆保藏为MOL1578。将MOL1578克隆在TY-10μg/ml卡那霉素中37℃过夜培养,次日取1ml细胞,用Qiaprep SpinPlasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。对纯化的质粒进行DNA测序,结果显示了对应于融合蛋白果胶酸裂解酶-JP170的DNA序列。将该质粒命名为pMOL1578。编码果胶酸裂解酶-JP170的ORF的总DNA序列示于SEQ ID 11,其衍生的蛋白序列见SEQ ID 12。在SEQ ID 12中的氨基酸具有以下起点和特征:
a.a.1-29:地衣芽孢杆菌的amyL的信号肽。
a.a.30-343:地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345:衍生自NheI克隆位点的两个氨基酸。
a.a.346-349:IEGR接头。
a.a.350-834:JP170淀粉酶。
果胶酸裂解酶-JP170融合蛋白的表达和检测
编码果胶酸裂解酶-JP170杂合体的MOL1578和两株参照菌株:编码JP170的MOL944和编码果胶酸裂解酶的MB541均在BPX培养基上以30℃和300rpm培养5天。将100ml无细胞上清与100ml SDS上样缓冲液混合,取25μl上样至4-20%Laemmli Tris-甘氨酸,SDS-PAGE NO:VEX凝胶(Novex,美国)。按厂商建议在XcellTM Mini-Cell(NO:VEX,美国)上电泳,后续凝胶操作包括用考马斯亮蓝染色,脱色和干燥均按厂商建议进行。
约90kDa的蛋白带的出现表示质粒pMOL1578上所编码的果胶酸裂解酶-JP170融合蛋白已在枯草芽孢杆菌中表达。但凝胶上的主要带分别对应于两种核心酶果胶酸裂解酶(35kDa)和JP170淀粉酶(55kDa),表明融合蛋白在转运期间或刚刚转运之后被加工。
按上述方法分析MOL1578、MOL944和MB541这三种菌株的样品的α-淀粉酶活性,以确定JP170的产量。表1显示,在含有果胶酸裂解酶-JP170融合蛋白的MOL1578菌株中淀粉酶的产量相对于仅编码JP170的MOL944菌株有2.2倍的显著增加。结论是,显然果胶酸裂解酶可作为诸如JP170淀粉酶这样的大分子酶的分泌增强子。
表1菌株            酶                              单位MOL944a       JP170                             0.93MOL944b       JP170                             1.26MOL1578a      果胶酸裂解酶-JP170                2.32MOL1578b      果胶酸裂解酶-JP170                2.52MB541a        果胶酸裂解酶                      0.1MB541b        果胶酸裂解酶                      0.1
实施例2
果胶酸裂解酶与GLP-1融合蛋白的构建和表达
人类GLP-1激素可使2型糖尿病患者体内血糖水平正常化(WO9517510-A1)。GLP-1(7-37)类似物有31个氨基酸长,很难用传统技术从酵母中产生(Egel-Mitani等(inpress),在YPS1已被破坏的酿酒酵母菌株中表达的各种异源多肽的产量增加)。
GLP-1基因用下述重叠引物扩增。将编码特异性Kex2识别位点Lys-Arg(KR)的DNA序列插入紧邻GLP-1(7-37)的第一密码子的上游,使得可在果胶酸裂解酶和GLP-1(7-37)之间进行特异性裂解。(参见关于Kex2的文献,如:Ledgerwood等(1995),生物化学杂志,卷308(1):321-325,或Ghosh,S.等(1996)基因(Amsterdam),卷176(1-2):249-255)。以下两种引物用于扩增GLP-1(7-37)-Kex2序列:
149217.正向.NheI(SEQ ID 31):
5’-TGT TTG CTA GCA AAA GAC ATG CCG AAG GAA CAT TTACGT CAG ACG TCT CAT CAT ATT TAG AAG GCC AGG CAG CCA AAG
149216.反向.EagI(SEQ ID 32):
5’-GCA AAC GGC CGA AAG CTT ATC CCC TGC CTT TGA CTAACC ATG CGA TGA ATT CTT TGG CTG CCT GGC CTT C
重叠延伸反应在含dNTP各200μM、AmpliTaq聚合酶(Perkin Elmer,Cetus,美国)2.5个单位以及每种引物各100pmol的PCR缓冲液(10mMTris-HCl,pH8.3,50mM KCl,1.5mM MgCl2,0.01%(w/v)明胶)中进行。
该重叠延伸反应用DNA热循环仪(MJ Research,PCT-200)进行。94℃保温1分钟,然后以55℃1分钟的退火、72℃0.5分钟的延伸进行15个循环。所扩增产物取5μl在2.0%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。129bp的DNA片段的出现指示扩增是正确的。
GLP1片段的再克隆
用pMOL1578质粒作为载体,将GLP-1(7-37)序列克隆在同一读码框内以便制备融合构建体。GLP-1(7-37)片段和pMOL1578载体用NheI和EagI消化。如针对pMOL1578的构建所述,纯化119bp的GLP-1(7-37)片段和5779bp的载体片段并克隆。
将一个阳性PL1801转化型克隆于上述所用的添加了10mg/ml卡那霉素的琼脂平板上进行多次划线接种,将该克隆保藏为MOL1635。将MOL1635克隆在TY-10μg/ml卡那霉素中37℃过夜培养,次日取1ml细胞,用Qiaprep Spin Plasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。对纯化的质粒进行DNA测序,结果显示了对应于果胶酸裂解酶-GLP-1(7-37)融合蛋白的DNA序列。将该质粒命名为pMOL1621。
编码果胶酸裂解酶-GLP-1(7-37)的ORF的总DNA序列示于SEQ ID13,其衍生的蛋白序列见SEQ ID 14。在SEQ ID 14中的氨基酸具有以下起点和特征:
a.a.1-29:地衣芽孢杆菌的amyL的信号肽。
a.a.30-343:地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345:衍生自NheI克隆位点的两个氨基酸。
a.a.346-347:Kex2内切蛋白酶加工位点。
a.a.348-378:人类GLP-1(7-37)序列。
果胶酸裂解酶-GLP-1(7-37)融合蛋白的表达和检测
用质粒pMOL1621转化蛋白酶较弱的枯草芽孢杆菌菌株WB600asn。其中一个携有pMOL1621的WB600asn命名为MOL1636。将该菌株在含有10μg/ml卡那霉素的Cal18-2培养基上培养,在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清,通过传统Western印迹进行分析(见图1和2)。
实施例3
带PEPT接头的果胶酸裂解酶与GLP1之融合蛋白的构建和表达
为了避免在果胶酸裂解酶与GLP-1(7-37)之间的区域中的蛋白酶剪切性攻击,插入了一个稳定的接头区。所选接头序列为WO 99/01543中报道的PEPT基元。所述接头基元出现在亲本酶与CBD(纤维素酶结合结构域)之间的要求专利权的纤维素酶中,在本发明中,该PEPT接头已证实在枯草芽孢杆菌中针对蛋白酶剪切作用是稳定的。
为确保在果胶酸裂解酶与GLP-1之间有一个正确间隔臂,将该基元重复两次,使之成为PEPTPEPT(2x(PEPT))。将编码特异性Kex2识别位点Lys-Arg(KR)的DNA序列插入紧邻GLP-1(7-37)的第一密码子的上游,使得可于纯化后,在果胶酸裂解酶和GLP-1(7-37)之间进行特异性裂解(参见关于Kex2的文献,如:Ledgerwood等(1995),生物化学杂志,卷308(1):321-325,或Ghosh,S.等(1996)基因(Amsterdam),卷176(1-2):249-255)。
用pMOL1621为模板进行两个独立的PCR反应。PCR条件如实施例1所述。两个引物对的序列如下:
1.引物对
159639.正向.NheI(SEQ ID 33):
5’-CCA GCT AGC CCA GAA CCA ACA CCT GAG CCC ACA AAAAGA CAT GCC GAA GGA ACA TTT ACG
101450.反向(SEQ ID 34):
5’-CAT GGT GAA CCA AAG TGA AAC C
2.引物对
B5456H02.反向(SEQ ID 35):
5’-GGT GTT GGT TCT GGG CTA GCT GGA TTG ATT TTG CCG
142670.正向(SEQ ID 36):
5’-CAG CGA TAA TTA CAA CAG GAC G
两种PCR反应物经Qiagen柱(QIAquick PCR纯化试剂盒#28106)纯化为220bp和400bp的片段。在上述PCR条件下用每种片段各10ng进行SOE(序列重叠延伸)。PCR循环为94℃保温1分钟,然后以94℃10秒的变性、55℃30秒的退火、72℃2分钟的延伸进行10个循环。将100pmol侧翼引物142670.正向(SEQ ID 36)和101450.反向(SEQ ID 34)加入该反应中,再进行20轮PCR。所扩增产物取5μl在2.0%琼脂糖凝胶(NuSieve,FMC)上进行电泳分析。600bp的DNA片段的出现表示扩增是正确的。
GLP1片段的再克隆
用pMOL1578质粒作为载体,将上述2x(PEPT)-GLP-1(7-37)基因克隆在同一读码框内以便制备融合构建体。将含有PEPT-GLP-1(7-37)序列和pMOL1578载体的600bp PCR片段用NheI和EagI消化。如针对pMOL1578的构建所述,纯化137bp的PEPT-GLP-1(7-37)片段和5779bp的载体片段并克隆。
将阳性WB600asn转化克隆于上述所用的添加了10mg/ml卡那霉素的琼脂平板上进行多次划线接种,将该克隆保藏为MOL1698。将MOL1698克隆在TY-10μg/ml卡那霉素中37℃过夜培养,次日取1ml细胞,用QiaprepSpin Plasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。对纯化的质粒进行DNA测序,结果显示了对应于果胶酸裂解酶-接头-GLP1融合蛋白的DNA序列。将该质粒命名为pMOL1698。
编码果胶酸裂解酶-接头-的ORF的总DNA序列示于SEQ ID 15,其衍生的蛋白序列见SEQ ID 16。在SEQ ID 16中的氨基酸具有以下起点和特征:
a.a.1-29:地衣芽孢杆菌的amyL的信号肽。
a.a.30-343:地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345:衍生自NheI克隆位点的两个氨基酸。
a.a.346-353:PEPTPEPT接头区。
a.a.354-355:Kex2内切蛋白酶加工位点。
a.a.356-386:人类GLP-1(7-37)序列。
果胶酸裂解酶-接头-GLP-1(7-37)融合蛋白的表达和检测
编码果胶酸裂解酶杂合体的MOL1698在含有10μg/ml卡那霉素的Cal18-2培养基上培养。在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清,通过传统Western印迹进行分析,取25μl上样至4-20%Laemmli Tris-甘氨酸,SDS-PAGE NO:VEx凝胶(Novex,美国)。按厂商建议在XcellTM Mini-Cell(NO:VEX,美国)上电泳,后续凝胶操作,包括用考马斯亮蓝染色,脱色和干燥均按厂商建议进行(见图3)。
实施例4
果胶酸裂解酶和单链人类胰岛素(MI3)的融合蛋白的构建和表达
编码人类胰岛素MI3的DNA序列通过将SEQ ID 18所限定的其蛋白序列逆转录而产生。涉及该蛋白序列的专利申请是WO 95/34666。使该DNA序列在密码子应用方面进一步优化,以便接近SEQ ID 1所述果胶酸裂解酶中的密码子应用性。这只需简单通过使用果胶酸裂解酶SEQ ID 1的最优选密码子作为编码SEQ ID 18所示MI3分子的密码子便可实现。本实验的优选DNA序列可在SEQ ID 17中找到。
为了在果胶酸裂解酶和MI3之间具有弹性区(接头),我们使用了由PEPT重复单元组成的接头。我们特别为本实验使用了该PEPT的两个重复单元。再次使密码子最优化至接近果胶酸裂解酶的密码子使用特点。
为了能在从培养细胞的上清中纯化出融合蛋白后,从果胶酸裂解酶上裂解出MI3,将一个Kex2内切蛋白酶加工位点导入紧邻该接头之后以及MI3蛋白之前。(参见关于Kex2的文献,如:Ledgerwood等(1995),生物化学杂志,卷308(1):321-325,或Ghosh,S.等(1996)基因(Amsterdam),卷176(1-2):249-255)。这里所用Kex2位点为Lys-Arg(KR)。果胶酸裂解酶-接头-Kex-MI3编码质粒的构建如下:
设计两个重叠寡核苷酸,使得当它们在PCR反应中使用时将导致形成主要由SEQ ID 17中所示序列、接头编码序列、蛋白酶酶解位点编码序列和再克隆DNA片段所必需的两个限制性内切核酸酶位点组成的DNA片段。
该DNA片段的构建如下:
两个重叠寡核苷酸:Pecl.ISFUS.NheI.upper(#149171)(SEQ ID 37):5′-CAT CAT  GCT AGC CCG GAA CCA ACA CCA GAG CCG ACC AAA AGG TTCGTC AAC CAG CAT TTA TGT GGC TCA CAT CTG GTA GAG GCC CTG TAT TTAGTC TGT GGA GAG AGG GGA TTC TTT TAT ACA CCGPecl.ISFUS.NotI.Lower(#149172)(SEQ ID 38):5′-GCG TTG AGA C GC GGC CGC TTA GTT GCA GTA ATT TTC CAG CTG ATATAA GCT ACA GAT TGA TGT GCA ACA CTG TTC AAC AAT GCC TTT CGC GGCTTT CGG TGT ATA AAA GAA TCC CCT CTC
NheI和NotI的限制性位点均已下划线。
所述寡核苷酸用于PCR反应,该反应在添加了每种dNTP各200μM、HiFidelityTM Expand酶混合物2.6个单位以及每种引物各200pmol的HiFidelityTM PCR缓冲液(Boehringer Mannheim,德国)中进行。
用DNA热循环仪(Landgraf,德国)进行。94℃保温1分钟,然后以94℃15秒的变性、60℃1分钟的退火、72℃2分钟的延伸进行10个循环,再以94℃15秒的变性、60℃1分钟的退火、72℃2分钟的延伸(在此延伸步骤中,每个循环加20秒)进行20个循环。所扩增产物取5μl在1.5%琼脂糖凝胶(NuSieve,FMC)上用ReadyLoad 100bp DNA序列梯(GibcoBRL,丹麦)作为分子量标志进行电泳分析。0.2kb的清晰DNA片段表示所述两个引物的正确装配。
如上述所得的PCR产物取45μl用QIAquick PCR纯化试剂盒(Qiagen,美国)按厂商建议进行纯化。纯化的DNA在50μl 10mM Tris-HCl,pH8.5中洗脱。
5μl pMOL1578和25μl纯化的PCR片段用NheI和NotI消化,消化后的pMOL1578在0.8%的低熔点琼脂糖(SeaPlaque GTG,FMC)凝胶中电泳,从凝胶中切出相关片段,用QIAquick凝胶提取试剂盒(Qiagen,美国)按厂商建议进行纯化。所分离的PCR DNA片段在消化后用QIAquick PCR纯化试剂盒(Qiagen,美国)按厂商建议进行简单纯化。纯化的DNA在50μl10mM Tris-HCl,pH8.5中洗脱。
然后将PCR片段和质粒连接至经过NheI-NotI消化并纯化的pMOL1578上。该连接在16℃,用每种DNA片段各0.5μg、T4 DNA连接酶1个单位、和T4连接酶缓冲液(Boehringer Mannheim,德国)实施过夜。
用该连接混合物转化感受态的枯草芽孢杆菌PL2306细胞。将转化的细胞铺板于LBPG-10μg/ml卡那霉素平板上。37℃培养18小时后,选数个克隆在新鲜琼脂平板上再划线接种,并于含有10μg/ml卡那霉素的TY液体培养基中37℃过夜培养。次日取1ml细胞,用Qiaprep Spin Plasmid Miniprep试剂盒#27106按厂商针对枯草芽孢杆菌质粒制备的建议从细胞中分离质粒。用该质粒DNA作为DNA测序的模板。
保留含有对应于果胶酸裂解酶DNA序列的两个克隆,其中所述DNA序列与接头以及MI3基因为一融合体,将这些克隆命名为MB929-1和MB929-3。编码信号肽-果胶酸裂解酶-接头-MI3的ORF的DNA序列如SEQID 19所示,所衍生的蛋白序列见SEQ ID 20。
在SEQ ID 20中的氨基酸具有以下特征:
a.a.1-29:地衣芽孢杆菌的amyL的信号肽。
a.a.30-343:地衣芽孢杆菌的果胶酸裂解酶。
a.a.344-345:衍生自NheI克隆位点的两个氨基酸。
a.a.346-353:PEPT接头。
a.a.354-355:Kex2内切蛋白酶加工位点
a.a.356-408:人类单链胰岛素MI3。
从如上所述的相同克隆过程中分离出一个克隆,其不产生全长果胶酸裂解酶-接头-MI3,将该克隆命名为pMB929-5。DNA测序显示,在紧邻PEPT-KRFVN序列之后导入了一个终止密码子。用该克隆作为表达和检测分析中的对照。
果胶酸裂解酶-接头-MI3融合蛋白的表达
用pMB929质粒转化蛋白酶较弱的枯草芽孢杆菌菌株WB600asn。将其中一个携有pMB929-1的WB600asn菌株命名为MB1009-1。将一个携有pMB929-3的WB600asn菌株命名为MB1009-4。将其中一个携有pMB929-5的WB600asn菌株命名为MB1009-7并作为阴性对照菌株使用(如上所述)。这些菌株在含有10μg/ml卡那霉素的Cal18-2培养基上培养,在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清,通过传统Western印迹进行分析(见图4)。
实施例5
果胶酸裂解酶与GLP-1的融合蛋白的表达以及kex2p裂解
蛋白酶较弱的WB600asn菌株用质粒pMOL1621转化,以备过表达和裂解果胶酸裂解酶-ASKR-GLP1(7-37)融合产物。将该菌株在含有10μg/ml卡那霉素的Cal18-2培养基上培养,在带有两个挡板的500ml烧瓶中的100ml培养基上接种约10E8个细胞,37℃以300rpm培养24小时。取样,离心培养液,回收无细胞上清并分析。Kex2p裂解如下进行:
a)0.8ml上清
b)0.1ml 1M Na2HPO4,pH7.5
c)加入0.1ml Kex2p(制剂号KMK0087,Steen B.Mortensen,NovoNordisk赠)
d)于37℃水浴中保温2小时
e)将样品快速冷冻并保存在-20℃。
将样品立即解冻,然后进行SDS-PAGE。30μl样品用20μl样品缓冲液和5μl PMSF(溶于异丙醇)以及5μl 25%w/v DTT处理,然后煮沸。每孔上样10μl。每份样品均描述在工作单(worksheet)上。所有其它条件如前文材料和方法部分所述。
图5证实,果胶酸裂解酶-ASKR-GLP1(7-37)融合蛋白被Kex2p有效裂解,使GLP1产物被GLP1抗体识别。GLP1的产量在50mg/l的水平上。
                 序列表<110>诺维信公司(Novozymes A/S)<120>用于多肽的表达和分泌的果胶酸裂解酶融合体<130><140><141><160>38<170>PatentIn Ver.2.1<210>1<211>1026<212>DNA<213>地衣芽孢杆菌(Bacillus licheniformis)ATCC 14580<220><221>CDS<222>(1)..(1026)<400>1atg aag aaa tta atc agc atc atc ttt atc ttt gta tta ggg gtt gtc   48Met Lys Lys Leu Ile Ser Ile Ile Phe Ile Phe Val Leu Gly Val Val1               5                  10                  15ggg tca ttg aca gcg gcg gtt tcg gca gaa gca gct tct gcc tta aac   96Gly Ser Leu Thr Ala Ala Val Ser Ala Glu Ala Ala Ser Ala Leu Asn
         20                  25                  30tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc ttt gcc   144Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly Phe Ala
     35                  40                  45gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg gta acc   192Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr Val Thr
 50                  55                  60gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag aat gca   240Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys Asn Ala65                  70                  75                  80aat acg cct tta aaa att tat gtc aac ggc acc att aca aca tca aat   288Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr Ser Asn
             85                  90                  95aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta tcg att   336Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val Ser Ile
        100                 105                 110gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc aaa ata   384Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile Lys Ile
    115                 120                 125tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac gag gtc   432Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His Glu Val
130                 135                 140gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct aaa aac   480Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser Lys Asn145                 150                 155                 160att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt gac aaa   528Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val Asp Lys
            165                 170                 175gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa tat att   576Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu Tyr Ile
        180                 185                 190aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg ctg atg   624Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met Leu Met
    195                 200                 205ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc cat cat   672Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe His His
210                 215                 220aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt ttc gga   720Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg Phe Gly225                 230                 235                 240gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac agc gga   768Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp Ser Gly
            245                 250                 255att aat tcg agg atg ggc gcg cgc ate aga att gag aac aac ctc ttt   816Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn Leu Phe
        260                 265                 270gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca ccg ggc   864Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser Pro Gly
    275                 280                 285tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc agt atg   912Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly Ser Met
290                 295                 300ccg act acc tct act aca acc tat aat ccg cca tac agc tac tca ctc   960Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr Ser Leu305                 310                 315                 320gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc gga gtc   1008Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala Gly Val
            325                 330                 335ggc aaa atc aat cca taa                                           1026Gly Lys Ile Asn Pro
        340<210>2<211>341<212>PRT<213>地衣芽孢杆菌(Bacillus licheniformis)ATCC 14580<400>2Met Lys Lys Leu Ile Ser Ile Ile Phe Ile Phe Val Leu Gly Val Val1               5                  10                  15Gly Ser Leu Thr Ala Ala Val Ser Ala Glu Ala Ala Ser Ala Leu Asn
         20                  25                  30Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly Phe Ala
     35                  40                  45Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr Val Thr
 50                  55                  60Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys Asn Ala65                  70                  75                  80Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr Ser Asn
             85                  90                  95Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val Ser Ile
        100                 105                 110Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile Lys Ile
    115                 120                 125Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His Glu Val
130                 135                 140Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser Lys Asn145                 150                 155                 160Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val Asp Lys
            165                 170                 175Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu Tyr Ile
        180                 185                 190Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met Leu Met
    195                 200                 205Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe His His
210                 215                 220Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg Phe Gly225                 230                 235                 240Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp Ser Gly
            245                 250                 255Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn Leu Phe
        260                 265                 270Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser Pro Gly
    275                 280                 285Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly Ser Met
290                 295                 300Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr Ser Leu305                 310                 315                 320Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala Gly Val
            325                 330                 335Gly Lys Ile Asn Pro
        340<210>3<211>1530<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1530)<400>3atg atg aag atg aga aaa gca tta agt gta tta gtg att ttc gga tta   48Met Met Lys Met Arg Lys Ala Leu Ser Val Leu Val Ile Phe Gly Leu1               5                  10                  15ttc gta tct ttt ttt agt ttt ggt cat caa gga gca gaa gcg gca tca   96Phe Val Ser Phe Phe Ser Phe Gly His Gln Gly Ala Glu Ala Ala Ser
         20                  25                  30ttt cag tct aat aaa aat tat cat cta gtg aat gtg aac agt ggc aag   144Phe Gln Ser Asn Lys Asn Tyr His Leu Val Asn Val Asn Ser Gly Lys
     35                  40                  45tac tta gaa gtg ggg gct gcc tca aca gag aac ggt gca aat gtc caa   192Tyr Leu Glu Val Gly Ala Ala Ser Thr Glu Asn Gly Ala Asn Val Gln
 50                  55                  60caa tgg gaa aat acg aat tgt cat tgt caa caa tgg cga ttg gtg caa   240Gln Trp Glu Asn Thr Asn Cys His Cys Gln Gln Trp Arg Leu Val Gln65                  70                  75                  80aat cag gat ggt tat tat gag att gta aac cga cat agt ggc aaa gca   288Asn Gln Asp Gly Tyr Tyr Glu Ile Val Asn Arg His Ser Gly Lys Ala
             85                  90                  95ttg gat gta ttt gaa cgt tct tca gct gat gga gcg aac att gta caa   336Leu Asp Val Phe Glu Arg Ser Ser Ala Asp Gly Ala Asn Ile Val Gln
        100                 105                 110tgg gat tcg aat gga cgt agc aat caa caa tgg acg att caa caa gtg   384Trp Asp Ser Asn Gly Arg Ser Asn Gln Gln Trp Thr Ile Gln Gln Val
    115                 120                 125ggt tcc tct tat aaa ata gtt agc aga cat agt ggg aag gca ctc gaa   432Gly Ser Ser Tyr Lys Ile Val Ser Arg His Ser Gly Lys Ala Leu Glu
130                 135                140gta ttt aac cat tct aat caa aat gga gca aat gtc gta cag tgg caa   480Val Phe Asn His Ser Asn Gln Asn Gly Ala Asn Val Val Gln Trp Gln145                 150                 155                 160gat ttt ggt aat ccg aat caa ctt tgg aat atc gtc gag gtt ggt tca   528Asp Phe Gly Asn Pro Asn Gln Leu Trp Asn Ile Val Glu Val Gly Ser
            165                 170                 175gga caa gct cac gat ttc agt aag ccg ttg ggg tat gcc tca atg aat   576Gly Gln Ala His Asp Phe Ser Lys Pro Leu Gly Tyr Ala Ser Met Asn
        180                 185                 190ggc ggg acc act ggc ggt caa ggt gga cga gtc gaa tac gcg agt act   624Gly Gly Thr Thr Gly Gly Gln Gly Gly Arg Val Glu Tyr Ala Ser Thr
    195                 200                 205ggc tct caa cta caa aaa tta atc gat gat cga agt cga agc aat aat   672Gly Ser Gln Leu Gln Lys Leu Ile Asp Asp Arg Ser Arg Ser Asn Asn
210                 215                 220ccc aat caa cca ctt acc att tat gta act ggg aaa atc acc ctg caa   720Pro Asn Gln Pro Leu Thr Ile Tyr Val Thr Gly Lys Ile Thr Leu Gln225                 230                 235                 240aac tcc tct gat gat aaa att gaa gtg aaa aat cat cgt gga caa gct   768Asn Ser Ser Asp Asp Lys Ile Glu Val Lys Asn His Arg Gly Gln Ala
             245                250                 255cat gaa ata cgt aat ctg tct atc ata ggt caa gga aca aga gga gag   816His Glu Ile Arg Asn Leu Ser Ile Ile Gly Gln Gly Thr Arg Gly Glu
        260                 265                 270ttt gat ggc att ggt tta cga tta att aat gcg cac aat gtc att gtg   864Phe Asp Gly Ile Gly Leu Arg Leu Ile Asn Ala His Asn Val Ile Val
    275                 280                 285cgt aat ctc tcc att cac cat gta cga gct ggt tca ggt gaa ggt aca   912Arg Asn Leu Ser Ile His His Val Arg Ala Gly Ser Gly Glu Gly Thr
290                 295                 300tca att gaa gtt act caa gga agt aag aat att tgg att gat cat aac   960Ser Ile Glu Val Thr Gln Gly Ser Lys Asn Ile Trp Ile Asp His Asn305                 310                 315                 320gaa ttt tat agt caa ctg gat ggg aat aac aac cct gat ctg tat gat   1008Glu Phe Tyr Ser Gln Leu Asp Gly Asn Asn Asn Pro Asp Leu Tyr Asp
            325                 330                 335ggt ctt gtc gat att aaa cgg aat tcg gag tac att acg gtc tct tgg   1056Gly Leu Val Asp Ile Lys Arg Asn Ser Glu Tyr Ile Thr Val Ser Trp
        340                 345                 350aac aag ttt gag aat cat tgg aaa acg atg ctc gtc ggc cat acc gat   1104Asn Lys Phe Glu Asn His Trp Lys Thr Met Leu Val Gly His Thr Asp
    355                 360                 365aac gca tca tta gca cct gat aaa gtt acg tac cac cac aac ttt ttc   1152Asn Ala Ser Leu Ala Pro Asp Lys Val Thr Tyr His His Asn Phe Phc
370                 375                 380cac aat ctt aat tcc aga gtt ccg tta att cga ttc gca gat gtt cat   1200His Asn Leu Asn Ser Arg Val Pro Leu Ile Arg Phe Ala Asp Val His385                 390                 395                 400atg gtt aac aac tat ttc aaa gat att aaa gat aca gca att aat agt   1248Met Val Asn Asn Tyr Phe Lys Asp Ile Lys Asp Thr Ala Ile Asn Ser
            405                 410                 415cgt atg gga gca aga gta ttt gta gaa aat aac tat ttt gag aat gta   1296Arg Met Gly Ala Arg Val Phe Val Glu Asn Asn Tyr Phe Glu Asn Val
        420                 425                 430gga tca ggt caa caa gat ccg acc aca cga caa att aaa act gct gtt   1344Gly Ser Gly Gln Gln Asp Pro Thr Thr Arg Gln Ile Lys Thr Ala Val
    435                 440                 445ggg tgg ttt tat ggt agt tct agc act gga tat tgg aat tta aga gga   1392Gly Trp Phe Tyr Gly Ser Ser Ser Thr Gly Tyr Trp Asn Leu Arg Gly
450                 455                 460aat caa ttt att aac aca cca tca agc cac ttg tct tcc aca acg aat   1440Asn Gln Phe Ile Asn Thr Pro Ser Ser His Leu Ser Ser Thr Thr Asn465                 470                 475                 480ttc aca cca cct tat cag ttc aac gcc caa tcc gct caa gat gca aag   1488Phe Thr Pro Pro Tyr Gln Phe Asn Ala Gln Ser Ala Gln Asp Ala Lys
            485                 490                 495caa gcc gtt gaa cag ttt tcg ggt gta ggg gtt gta cag tag           1530Gln Ala Val Glu Gln Phe Ser Gly Val Gly Val Val Gln
        500                 505                 510<210>4<211>509<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>4Met Met Lys Met Arg Lys Ala Leu Ser Val Leu Val Ile Phe Gly Leu1               5                  10                  15Phe Val Ser Phe Phe Ser Phe Gly His Gln Gly Ala Glu Ala Ala Ser
         20                  25                  30Phe Gln Ser Asn Lys Asn Tyr His Leu Val Asn Val Asn Ser Gly Lys
     35                  40                  45Tyr Leu Glu Val Gly Ala Ala Ser Thr Glu Asn Gly Ala Asn Val Gln
 50                  55                  60Gln Trp Glu Asn Thr Asn Cys His Cys Gln Gln Trp Arg Leu Val Gln65                  70                  75                  80Asn Gln Asp Gly Tyr Tyr Glu Ile Val Asn Arg His Ser Gly Lys Ala
             85                  90                  95Leu Asp Val Phe Glu Arg Ser Ser Ala Asp Gly Ala Asn Ile Val Gln
        100                 105                 110Trp Asp Ser Asn Gly Arg Ser Asn Gln Gln Trp Thr Ile Gln Gln Val
    115                 120                 125Gly Ser Ser Tyr Lys Ile Val Ser Arg His Ser Gly Lys Ala Leu Glu
130                 135                 140Val Phe Asn His Ser Asn Gln Asn Gly Ala Asn Val Val Gln Trp Gln145                 150                 155                 160Asp Phe Gly Asn Pro Asn Gln Leu Trp Asn Ile Val Glu Val Gly Ser
            165                 170                 175Gly Gln Ala His Asp Phe Ser Lys Pro Leu Gly Tyr Ala Ser Met Asn
        180                 185                 190Gly Gly Thr Thr Gly Gly Gln Gly Gly Arg Val Glu Tyr Ala Ser Thr
    195                 200                 205Gly Ser Gln Leu Gln Lys Leu Ile Asp Asp Arg Ser Arg Ser Asn Asn
210                 215                 220Pro Asn Gln Pro Leu Thr Ile Tyr Val Thr Gly Lys Ile Thr Leu Gln225                 230                 235                 240Asn Ser Ser Asp Asp Lys Ile Glu Val Lys Asn His Arg Gly Gln Ala
            245                 250                 255His Glu Ile Arg Asn Leu Ser Ile Ile Gly Gln Gly Thr Arg Gly Glu
        260                 265                 270Phe Asp Gly Ile Gly Leu Arg Leu Ile Asn Ala His Asn Val Ile Val
    275                 280                 285Arg Asn Leu Ser Ile His His Val Arg Ala Gly Ser Gly Glu Gly Thr
290                 295                 300Ser Ile Glu Val Thr Gln Gly Ser Lys Asn Ile Trp Ile Asp His Asn305                 310                 315                 320Glu Phe Tyr Ser Gln Leu Asp Gly Asn Asn Asn Pro Asp Leu Tyr Asp
            325                 330                 335Gly Leu Val Asp Ile Lys Arg Asn Ser Glu Tyr Ile Thr Val Ser Trp
        340                 345                 350Asn Lys Phe Glu Asn His Trp Lys Thr Met Leu Val Gly His Thr Asp
    355                 360                 365Asn Ala Ser Leu Ala Pro Asp Lys Val Thr Tyr His His Asn Phe Phe
370                 375                 380His Asn Leu Asn Ser Arg Val Pro Leu Ile Arg Phe Ala Asp Val His385                 390                 395                 400Met Val Asn Asn Tyr Phe Lys Asp Ile Lys Asp Thr Ala Ile Asn Ser
            405                 410                 415Arg Met Gly Ala Arg Val Phe Val Glu Asn Asn Tyr Phe Glu Asn Val
        420                 425                 430Gly Ser Gly Gln Gln Asp Pro Thr Thr Arg Gln Ile Lys Thr Ala Val
    435                 440                 445Gly Trp Phe Tyr Gly Ser Ser Ser Thr Gly Tyr Trp Asn Leu Arg Gly
450                 455                 460Asn Gln Phe Ile Asn Thr Pro Ser Ser His Leu Ser Ser Thr Thr Asn465                 470                 475                 480Phe Thr Pro Pro Tyr Gln Phe Asn Ala Gln Ser Ala Gln Asp Ala Lys
            485                 490                 495Gln Ala Val Glu Gln Phe Ser Gly Val Gly Val Val Gln
        500                 505<210>5<211>1008<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1008)<400>5atg aga aaa ctc tta tcg atg atg act gcg ctt gta ctc atg ttt gga   48Met Arg Lys Leu Leu Ser Met Met Thr Ala Leu Val Leu Met Phe Gly1               5                  10                  15atc atg gtt gta cct tct ata gcc aaa ggt gaa agc gat tcc act atg   96Ile Met Val Val Pro Ser Ile Ala Lys Gly Glu Ser Asp Ser Thr Met
         20                  25                  30aat gct gat ttt tcc atg caa ggt ttt gcg aca ctt aat ggc gga acc   144Asn Ala Asp Phe Ser Met Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr
     35                  40                  45aca gga gga gcc ggc ggg caa acc gta acc gtt tct acc gga gac gaa   192Thr Gly Gly Ala Gly Gly Gln Thr Val Thr Val Ser Thr Gly Asp Glu
 50                  55                  60ctg ctg gcg gcc ttg aag aac aaa aac agc aat aca ccc ctg acg att   240Leu Leu Ala Ala Leu Lys Asn Lys Asn Ser Asn Thr Pro Leu Thr Ile65                  70                  75                  80tat gta aac ggt acc ata acg cca tca aat acg tcc gca agc aaa att   288Tyr Val Asn Gly Thr Ile Thr Pro Ser Asn Thr Ser Ala Ser Lys Ile
             85                  90                  95gat att aaa gac gta aac gat gtt tcg atc tta ggt gtt ggc act caa   336Asp Ile Lys Asp Val Asn Asp Val Ser Ile Leu Gly Val Gly Thr Gln
        100                 105                 110ggc gaa ttt aac ggc att ggc att aaa gta tgg cga gcc aat aac att   384Gly Glu Phe Asn Gly Ile Gly Ile Lys Val Trp Arg Ala Asn Asn Ile
    115                 120                 125att ctc cgc aac ttg aaa ata cat cac gtc aat aca ggc gac aaa gat   432Ile Leu Arg Asn Leu Lys Ile His His Val Asn Thr Gly Asp Lys Asp
130                 135                 140gcc att agc att gaa gga cca tcc aaa aac ata tgg gtt gac cac aat   480Ala Ile Ser Ile Glu Gly Pro Ser Lys Asn Ile Trp Val Asp His Asn145                 150                 155                 160gag ctc tac aat agt ctt gat gtc cat aag gat tac tac gat ggt ctt   528Glu Leu Tyr Asn Ser Leu Asp Val His Lys Asp Tyr Tyr Asp Gly Leu
            165                 170                 175ttt gat gtc aaa cgg gac gcg gat tac att aca ttc tcg tgg aat tat   576Phe Asp Val Lys Arg Asp Ala Asp Tyr Ile Thr Phe Ser Trp Asn Tyr
        180                 185                 190gtt cat gat agc tgg aag agc atg ctg atg gga tct tct gat tcc gat   624Val His Asp Ser Trp Lys Ser Met Leu Met Gly Ser Ser Asp Ser Asp
    195                 200                 205tcg tac aac cga aaa atc aca ttc cac aat aac tac ttt gaa aac ctc   672Ser Tyr Asn Arg Lys Ile Thr Phe His Asn Asn Tyr Phe Glu Asn Leu
210                 215                 220aat tca cgt gta cct tcc ata cgc ttt ggc gaa gcc cac atc ttc agc   720Asn Ser Arg Val Pro Ser Ile Arg Phe Gly Glu Ala His Ile Phe Ser225                 230                 235                 240aac tac tac aat ggc att aat gaa acc ggc atc aac tcc cgc atg ggg   768Asn Tyr Tyr Asn Gly Ile Asn Glu Thr Gly Ile Asn Ser Arg Met Gly
            245                 250                 255gca aaa gtg cgc atc gag gaa aat cta ttt gaa cgc gca aac aac ccg   816Ala Lys Val Arg Ile Glu Glu Asn Leu Phe Glu Arg Ala Asn Asn Pro
        260                 265                 270atc gtc agt cgc gac agt cgc caa gtc ggg tat tgg cac ttg ata aac   864Ile Val Ser Arg Asp Ser Arg Gln Val Gly Tyr Trp His Leu Ile Asn
    275                 280                 285aat cac ttt act caa tca acg ggc gaa att cca acg act tca aca atc   912Asn His Phe Thr Gln Ser Thr Gly Glu Ile Pro Thr Thr Ser Thr Ile
290                 295                 300aca tat aac cca cct tat tcc tat caa gct act ccg gtt ggc caa gta   960Thr Tyr Asn Pro Pro Tyr Ser Tyr Gln Ala Thr Pro Val Gly Gln Val305                 310                 315                 320aaa gat gtg gtt cgt gcg aat gct ggt gtt ggc aaa gta aca cct taa   1008Lys Asp Val Val Arg Ala Asn Ala Gly Val Gly Lys Val Thr Pro
            325                 330                 335<210>6<211>335<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>6Met Arg Lys Leu Leu Ser Met Met Thr Ala Leu Val Leu Met Phe Gly1               5                  10                  15Ile Met Val Val Pro Ser Ile Ala Lys Gly Glu Ser Asp Ser Thr Met
         20                  25                  30Asn Ala Asp Phe Ser Met Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr
     35                  40                  45Thr Gly Gly Ala Gly Gly Gln Thr Val Thr Val Ser Thr Gly Asp Glu
 50                  55                  60Leu Leu Ala Ala Leu Lys Asn Lys Asn Ser Asn Thr Pro Leu Thr Ile65                  70                  75                  80Tyr Val Asn Gly Thr Ile Thr Pro Ser Asn Thr Ser Ala Ser Lys Ile
             85                  90                  95Asp Ile Lys Asp Val Asn Asp Val Ser Ile Leu Gly Val Gly Thr Gln
        100                 105                 110Gly Glu Phe Asn Gly Ile Gly Ile Lys Val Trp Arg Ala Asn Asn Ile
    115                 120                 125Ile Leu Arg Asn Leu Lys Ile His His Val Asn Thr Gly Asp Lys Asp
130                 135                 140Ala Ile Ser Ile Glu Gly Pro Ser Lys Asn Ile Trp Val Asp His Asn145                 150                 155                 160Glu Leu Tyr Asn Ser Leu Asp Val His Lys Asp Tyr Tyr Asp Gly Leu
            165                 170                 175Phe Asp Val Lys Arg Asp Ala Asp Tyr Ile Thr Phe Ser Trp Asn Tyr
        180                 185                 190Val His Asp Ser Trp Lys Ser Met Leu Met Gly Ser Ser Asp Ser Asp
    195                 200                 205Ser Tyr Asn Arg Lys Ile Thr Phe His Asn Asn Tyr Phe Glu Asn Leu
210                 215                 220Asn Ser Arg Val Pro Ser Ile Arg Phe Gly Glu Ala His Ile Phe Ser225                 230                 235                 240Asn Tyr Tyr Asn Gly Ile Asn Glu Thr Gly Ile Asn Ser Arg Met Gly
            245                 250                 255Ala Lys Val Arg Ile Glu Glu Asn Leu Phe Glu Arg Ala Asn Asn Pro
        260                 265                 270Ile Val Ser Arg Asp Ser Arg Gln Val Gly Tyr Trp His Leu Ile Asn
    275                 280                 285Asn His Phe Thr Gln Ser Thr Gly Glu Ile Pro Thr Thr Ser Thr Ile
290                  295                300Thr Tyr Asn Pro Pro Tyr Ser Tyr Gln Ala Thr Pro Val Gly Gln Val305                 310                 315                 320Lys Asp Val Val Arg Ala Asn Ala Gly Val Gly Lys Val Thr Pro
            325                 330                 335<210>7<211>1077<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1077)<400>7atg act aaa gtc ttt aaa ttg tta ctg gca tta gct ctc gtt tta cca   48Met Thr Lys Val Phe Lys Leu Leu Leu Ala Leu Ala Leu Val Leu Pro1               5                  10                  15gtt atc tca ttt agt tct cct gcc tcg caa gct gct tca aat cag cca   96Val Ile Ser Phe Ser Ser Pro Ala Ser Gln Ala Ala Ser Asn Gln Pro
         20                  25                  30act tct aac gga cca caa ggc tat gcg tca atg aat gga ggg aca acc   144Thr Ser Asn Gly Pro Gln Gly Tyr Ala Ser Met Asn Gly Gly Thr Thr
     35                  40                  45ggt ggt gca ggc ggc cgt gtc gaa tat gca agc acc gga gcg caa att   192Gly Gly Ala Gly Gly Arg Val Glu Tyr Ala Ser Thr Gly Ala Gln Ile
 50                  55                  60cag caa ttg ata gat aat cgc agc cga agt aat aac cct gat gaa cca   240Gln Gln Leu Ile Asp Asn Arg Ser Arg Ser Asn Asn Pro Asp Glu Pro65                  70                  75                  80tta acg att tat gta aac gga acg att aca caa gga aat tcc cca cag   288Leu Thr Ile Tyr Val Asn Gly Thr Ile Thr Gln Gly Asn Ser Pro Gln
             85                  90                  95tcc ctt ata gat gtt aaa aat cac cgt gga aaa gct cat gaa att aaa   336Ser Leu Ile Asp Val Lys Asn His Arg Gly Lys Ala His Glu Ile Lys
        100                 105                 110aac atc tct att atc ggt gta gga aca aat gga gag ttt gat ggc att   384Asn Ile Ser Ile Ile Gly Val Gly Thr Asn Gly Glu Phe Asp Gly Ile
    115                 120                 125ggg ata aga cta tca aac gcc cat aat atc att atc caa aat gta tca   432Gly Ile Arg Leu Ser Asn Ala His Asn Ile Ile Ile Gln Asn Val Ser
130                 135                 140att cat cat gtg cga gag gga gaa ggc acg gct att gaa gtg aca gat   480Ile His His Val Arg Glu Gly Glu Gly Thr Ala Ile Glu Val Thr Asp145                 150                 155                 160gag agt aaa aac gtg tgg atc gat cac aac gag ttt tat agt gaa ttt   528Glu Ser Lys Asn Val Trp Ile Asp His Asn Glu Phe Tyr Ser Glu Phe
            165                 170                 175cca ggt aat gga gac tca gat tat tac gat ggt ctc gta gac ata aaa   576Pro Gly Asn Gly Asp Ser Asp Tyr Tyr Asp Gly Leu Val Asp Ile Lys
        180                 185                 190aga aac gct gaa tat att acg gtt tca tgg aat aag ttt gag aat cat   624Arg Asn Ala Glu Tyr Ile Thr Val Ser Trp Asn Lys Phe Glu Asn His
    195                 200                 205tgg aaa acg atg ctc gtc ggt cat act gat aat gcc tca tta gcg cca   672Trp Lys Thr Met Leu Val Gly His Thr Asp Asn Ala Ser Leu Ala Pro
210                 215                 220gat aaa att acg tac cat cac aat tat ttt aat aat ctt aat tca cgt   720Asp Lys Ile Thr Tyr His His Asn Tyr Phe Asn Asn Leu Asn Ser Arg225                 230                 235                 240gtc ccg ctt att cga tac gct gat gtc cat atg ttc aat aac tat ttt   768Val Pro Leu Ile Arg Tyr Ala Asp Val His Met Phe Asn Asn Tyr Phe
            245                 250                 255aaa gac att aac gat aca gcg att aac agt cgt gta ggg gcc cgt gtc   816Lys Asp Ile Asn Asp Thr Ala Ile Asn Ser Arg Val Gly Ala Arg Val
        260                 265                 270ttt gta gaa aac aac tat ttt gac aac gta gga tca gga caa gct gac   864Phe Val Glu Asn Asn Tyr Phe Asp Asn Val Gly Ser Gly Gln Ala Asp
     275                280                 285cca acg act ggt ttt att aaa ggg cct gtt ggt tgg ttc tat gga agt   912Pro Thr Thr Gly Phe Ile Lys Gly Pro Val Gly Trp Phe Tyr Gly Ser
290                 295                 300ccg agt act gga tat tgg aat tta cgt gga aat gta ttt gtt aat aca   960Pro Ser Thr Gly Tyr Trp Asn Leu Arg Gly Asn Val Phe Val Asn Thr305                 310                 315                 320ccg aat agt cat tta agc tct aca aca aac ttt aca cca cca tat agt   1008Pro Asn Ser His Leu Ser Ser Thr Thr Asn Phe Thr Pro Pro Tyr Ser
            325                 330                 335tac aaa gtc caa tca gct acc caa gct aag tcg tcg gtt gaa caa cat   1056Tyr Lys Val Gln Ser Ala Thr Gln Ala Lys Ser Ser Val Glu Gln His
        340                 345                 350tcg gga gta ggt gtt atc aac                                       1077Ser Gly Val Gly Val Ile Asn
    355<210>8<211>359<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>8Met Thr Lys Val Phe Lys Leu Leu Leu Ala Leu Ala Leu Val Leu Pro1               5                  10                  15Val Ile Ser Phe Ser Ser Pro Ala Ser Gln Ala Ala Ser Asn Gln Pro
         20                  25                  30Thr Ser Asn Gly Pro Gln Gly Tyr Ala Ser Met Asn Gly Gly Thr Thr
     35                  40                  45Gly Gly Ala Gly Gly Arg Val Glu Tyr Ala Ser Thr Gly Ala Gln Ile
 50                  55                  60Gln Gln Leu Ile Asp Asn Arg Ser Arg Ser Asn Asn Pro Asp Glu Pro65                  70                  75                  80Leu Thr Ile Tyr Val Asn Gly Thr Ile Thr Gln Gly Asn Ser Pro Gln
             85                  90                  95Ser Leu Ile Asp Val Lys Asn His Arg Gly Lys Ala His Glu Ile Lys
        100                 105                 110Asn Ile Ser Ile Ile Gly Val Gly Thr Asn Gly Glu Phe Asp Gly Ile
    115                 120                 125Gly Ile Arg Leu Ser Asn Ala His Asn Ile Ile Ile Gln Asn Val Ser
130                 135                 140Ile His His Val Arg Glu Gly Glu Gly Thr Ala Ile Glu Val Thr Asp145                 150                 155                 160Glu Ser Lys Asn Val Trp Ile Asp His Asn Glu Phe Tyr Ser Glu Phe
            165                 170                 175Pro Gly Asn Gly Asp Ser Asp Tyr Tyr Asp Gly Leu Val Asp Ile Lys
        180                 185                 190Arg Asn Ala Glu Tyr Ile Thr Val Ser Trp Asn Lys Phe Glu Asn His
    195                 200                 205Trp Lys Thr Met Leu Val Gly His Thr Asp Asn Ala Ser Leu Ala Pro
210                 215                 220Asp Lys Ile Thr Tyr His His Asn Tyr Phe Asn Asn Leu Asn Ser Arg225                 230                 235                 240Val Pro Leu Ile Arg Tyr Ala Asp Val His Met Phe Asn Asn Tyr Phe
            245                 250                 255Lys Asp Ile Asn Asp Thr Ala Ile Asn Ser Arg Val Gly Ala Arg Val
        260                 265                 270Phe Val Glu Asn Asn Tyr Phe Asp Asn Val Gly Ser Gly Gln Ala Asp
    275                 280                 285Pro Thr Thr Gly Phe Ile Lys Gly Pro Val Gly Trp Phe Tyr Gly Ser
290                 295                 300Pro Ser Thr Gly Tyr Trp Asn Leu Arg Gly Asn Val Phe Val Asn Thr305                 310                 315                 320Pro Asn Ser His Leu Ser Ser Thr Thr Asn Phe Thr Pro Pro Tyr Ser
            325                 330                 335Tyr Lys Val Gln Ser Ala Thr Gln Ala Lys Ser Ser Val Glu Gln His
        340                 345                 350Ser Gly Val Gly Val Ile Asn
    355<210>9<211>1047<212>DNA<213>芽孢杆菌属(Bacillus)的种<220><221>CDS<222>(1)..(1047)<400>9atg gac aaa ctt tat att gaa aaa gga agt gag agt atg atg aga tca   48Met Asp Lys Leu Tyr Ile Glu Lys Gly Ser Glu Ser Met Met Arg Ser1               5                  10                  15agc atc gtc aaa cta gtt gct ttc agt att gtg ttt atg tta tgg ctc   96Ser Ile Val Lys Leu Val Ala Phe Ser Ile Val Phe Met Leu Trp Leu
         20                  25                  30ggt gta tcc ttt caa acg gca gaa gcg aat acg cca aat ttc aac tta   144Gly Val Ser Phe Gln Thr Ala Glu Ala Asn Thr Pro Asn Phe Asn Leu
     35                  40                  45caa ggc ttt gcc acg tta aat ggg gga aca act ggt ggc gct ggt gga   192Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr Thr Gly Gly Ala Gly Gly
 50                  55                  60gat gta gtg acg gtt cgt aca ggg aat gag tta ata aac gct ttg aag   240Asp Val Val Thr Val Arg Thr Gly Asn Glu Leu Ile Asn Ala Leu Lys65                  70                  75                  80tcc aaa aac cct aat cgg ccg tta aca att tat gtt aac ggt acg ata   288Ser Lys Asn Pro Asn Arg Pro Leu Thr Ile Tyr Val Asn Gly Thr Ile
             85                  90                  95acg cct aat aat acg tct gat agt aag atc gac att aag gat gtt tcc   336Thr Pro Asn Asn Thr Ser Asp Ser Lys Ile Asp Ile Lys Asp Val Ser
        100                 105                 110aat gta tcg att tta ggg gtt ggc aca aat ggc cga tta aac ggg atc   384Asn Val Ser Ile Leu Gly Val Gly Thr Asn Gly Arg Leu Asn Gly Ile
    115                 120                 125ggt att aaa gta tgg cga gcg aat aat atc att att cga aac ttg aca   432Gly Ile Lys Val Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Thr
130                 135                 140atc cat gaa gtc cat aca ggt gat aaa gat gcg att agc atg att agc   480Ile His Glu Val His Thr Gly Asp Lys Asp Ala Ile Ser Met Ile Ser145                 150                 155                 160att gaa gga cca tct cga aac att tgg gtt gac cat aac gag ctt tat   528Ile Glu Gly Pro Ser Arg Asn Ile Trp Val Asp His Asn Glu Leu Tyr
            165                 170                 175gcc agc ttg aat gtt cat aaa gat cac tat gac ggc ttg ttt gac gta   576Ala Ser Leu Asn Val His Lys Asp His Tyr Asp Gly Leu Phe Asp Val
        180                 185                 190aag cgc gat gct tac aat att acc ttc tct tgg aat tat gtc cat gat   624Lys Arg Asp Ala Tyr Asn Ile Thr Phe Ser Trp Asn Tyr Val His Asp
    195                 200                 205ggc tgg aaa gcg atg ctc atg ggg aat tcc gat agt gat aat tat gac   672Gly Trp Lys Ala Met Leu Met Gly Asn Ser Asp Ser Asp Asn Tyr Asp
210                 215                 220cga aac ata aca ttc cac cat aac tac ttc aaa aac tta aac tct cgt   720Arg Asn Ile Thr Phe His His Asn Tyr Phe Lys Asn Leu Asn Ser Arg225                 230                 235                 240gta cct gcg tac cgt ttt gga aag gcg cac ttg ttt agc aat tac ttt   768Val Pro Ala Tyr Arg Phe Gly Lys Ala His Leu Phe Ser Asn Tyr Phe
            245                 250                 255gag aac att tta gaa aca ggc atc aat tca cgg atg gga gcg gaa atg   816Glu Asn Ile Leu Glu Thr Gly Ile Asn Ser Arg Met Gly Ala Glu Met
        260                 265                 270ctc gtt gaa cat aac gtt ttt gag aat gcc acc aac ccg cta gga ttc   864Leu Val Glu His Asn Val Phe Glu Asn Ala Thr Asn Pro Leu Gly Phe
    275                 280                 285tgg cat agc agt cga aca ggt tat tgg aat gta gcc aat aac cgc tat   912Trp His Ser Ser Arg Thr Gly Tyr Trp Asn Val Ala Asn Asn Arg Tyr
290                 295                 300atc aat agc acg ggc agc atg ccg acc act tcc acg acc aat tat cga   960Ile Asn Ser Thr Gly Ser Met Pro Thr Thr Ser Thr Thr Asn Tyr Arg305                 310                 315                 320cct cct tac ccc tat acg gtc aca cct gtt ggt gat gtg aaa tca gtt   1008Pro Pro Tyr Pro Tyr Thr Val Thr Pro Val Gly Asp Val Lys Ser Val
            325                 330                 335gtc aca cgt tat gcg gga gtt ggt gtc atc caa ccg taa               1047Val Thr Arg Tyr Ala Gly Val Gly Val Ile Gln Pro
        340                 345<210>10<211>348<212>PRT<213>芽孢杆菌属(Bacillus)的种<400>10Met Asp Lys Leu Tyr Ile Glu Lys Gly Ser Glu Ser Met Met Arg Ser1               5                  10                  15Ser Ile Val Lys Leu Val Ala Phe Ser Ile Val Phe Met Leu Trp Leu
         20                  25                  30Gly Val Ser Phe Gln Thr Ala Glu Ala Asn Thr Pro Asn Phe Asn Leu
     35                  40                  45Gln Gly Phe Ala Thr Leu Asn Gly Gly Thr Thr Gly Gly Ala Gly Gly
 50                  55                  60Asp Val Val Thr Val Arg Thr Gly Asn Glu Leu Ile Asn Ala Leu Lys65                  70                  75                  80Ser Lys Asn Pro Asn Arg Pro Leu Thr Ile Tyr Val Asn Gly Thr Ile
             85                  90                  95Thr Pro Asn Asn Thr Ser Asp Ser Lys Ile Asp Ile Lys Asp Val Ser
        100                 105                 110Asn Val Ser Ile Leu Gly Val Gly Thr Asn Gly Arg Leu Asn Gly Ile
    115                 120                 125Gly Ile Lys Val Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Thr
130                 135                 140Ile His Glu Val His Thr Gly Asp Lys Asp Ala Ile Ser Met Ile Ser145                 150                 155                 160Ile Glu Gly Pro Ser Arg Asn Ile Trp Val Asp His Asn Glu Leu Tyr
            165                 170                 175Ala Ser Leu Asn Val His Lys Asp His Tyr Asp Gly Leu Phe Asp Val
        180                 185                 190Lys Arg Asp Ala Tyr Asn Ile Thr Phe Ser Trp Asn Tyr Val His Asp
    195                 200                 205Gly Trp Lys Ala Met Leu Met Gly Asn Ser Asp Ser Asp Asn Tyr Asp
210                 215                 220Arg Asn Ile Thr Phe His His Asn Tyr Phe Lys Asn Leu Asn Ser Arg225                 230                 235                 240Val Pro Ala Tyr Arg Phe Gly Lys Ala His Leu Phe Ser Asn Tyr Phe
            245                 250                 255Glu Asn Ile Leu Glu Thr Gly Ile Asn Ser Arg Met Gly Ala Glu Met
        260                 265                 270Leu Val Glu His Asn Val Phe Glu Asn Ala Thr Asn Pro Leu Gly Phe
    275                 280                 285Trp His Ser Ser Arg Thr Gly Tyr Trp Asn Val Ala Asn Asn Arg Tyr
290                 295                 300Ile Asn Ser Thr Gly Ser Met Pro Thr Thr Ser Thr Thr Ash Tyr Arg305                 310                 315                 320Pro Pro Tyr Pro Tyr Thr Val Thr Pro Val Gly Asp Val Lys Ser Val
            325                 330                 335Val Thr Arg Tyr Ala Gly Val Gly Val Ile Gln Pro
        340                 345<210>11<211>2502<212>DNA<213>人工序列<220><221>CDS<222>(1)..(2 502)<220><223>人工序列的描述:详见说明书正文<400>11atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt   48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc   96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc   144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg   192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag   240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca   288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                  95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta   336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc   384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac   432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct   480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt   528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa   576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tea atg   624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc   672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt   720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac   768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac   816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca   864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc   912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac   960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc   1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335gga gtc ggc aaa atc aat cca gct agc att gaa ggc aga cat cat aat   1056Gly Val Gly Lys Ile Asn Pro Ala Ser Ile Glu Gly Arg His His Asn
        340                 345                 350ggg aca aat ggg acg atg atg caa tac ttt gaa tgg cac ttg cct aat   1104Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His Leu Pro Asn
    355                 360                 365gat ggg aat cac tgg aat aga tta aga gat gat gct agt aat cta aga   1152Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser Asn Leu Arg
370                 375                 380aat aga ggt ata acc gct att tgg att ccg cct gcc tgg aaa ggg act   1200Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp Lys Gly Thr385                 390                 395                 400tcg caa aat gat gtg ggg tat gga gcc tat gat ctt tat gat tta ggg   1248Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly
            405                 410                 415gaa ttt aat caa aag ggg acg gtt cgt act aag tat ggg aca cgt agt   1296Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Arg Ser
        420                 425                 430caa ttg gag tct gcc atc cat get tta aag aat aat ggc gtt caa gtt   1344Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly Val Gln Val
    435                 440                 445tat ggg gat gta gtg atg aac cat aaa gga gga gct gat gct aca gaa   1392Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp Ala Thr Glu
450                 455                 460aac gtt ctt gct gtc gag gtg aat cca aat aac cgg aat caa gaa ata   1440Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn Gln Glu Ile465                 470                 475                 480tct ggg gac tac aca att gag gct tgg act aag ttt gat ttt cca ggg   1488Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp Phe Pro Gly
            485                 490                 495agg ggt aat aca tac tca gac ttt aaa tgg cgt tgg tat cat ttc gat   1536Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr His Phe Asp
        500                 505                 510ggt gta gat tgg gat caa tca cga caa ttc caa aat cgt atc tac aaa   1584Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg Ile Tyr Lys
    515                 520                 525ttc cga ggt gat ggt aag gca tgg gat tgg gaa gta gat tcg gaa aat   1632Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp Ser Glu Asn
530                 535                 540gga aat tat gat tat tta atg tat gca gat gta gat atg gat cat ccg   1680Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met Asp His Pro545                 550                 555                 560gag gta gta aat gag ctt aga aga tgg gga gaa tgg tat aca aat aca   1728Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr Thr Asn Thr
            565                 570                 575tta aat ctt gat gga ttt agg atc gat gcg gtg aag cat att aaa tat   1776Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His Ile Lys Tyr
        580                 585                 590agc ttt aca cgt gat tgg ttg acc cat gta aga aac gca acg gga aaa   1824Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala Thr Gly Lys
    595                 600                 605gaa atg ttt gct gtt gct gaa ttt tgg aaa aat gat tta ggt gcc ttg   1872Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu Gly Ala Leu
610                 615                 620gag aac tat tta aat aaa aca aac tgg aat cat tct gtc ttt gat gtc   1920Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val Phe Asp Val625                 630                 635                 640ccc ctt cat tat aat ctt tat aac gcg tea aat agt gga ggc aac tat   1968Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly Gly Asn Tyr
            645                 650                 655gac atg gca aaa ctt ctt aat gga acg gtt gtt caa aag cat cca atg   2016Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys His Pro Met
        660                 665                 670cat gcc gta act ttt gtg gat aat cac gat tct caa cct ggg gaa tca   2064His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro Gly Glu Ser
    675                 680                 685tta gaa tca ttt gta caa gaa tgg ttt aag cca ctt gct tat gcg ctt   2112Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala Tyr Ala Leu
690                 695                 700att tta aca aga gaa caa ggc tat ccc tct gtc ttc tat ggt gac tac   2160Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr Gly Asp Tyr705                 710                 715                 720tat gga att cca aca cat agt gtc cca gca atg aaa gcc aag att gat   2208Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala Lys Ile Asp
            725                 730                 735cca atc tta gag gcg cgt caa aat ttt gca tat gga aca caa cat gat   2256Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr Gln His Asp
        740                 745                 750tat ttt gac cat cat aat ata atc gga tgg aca cgt gaa gga aat acc   2304Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu Gly Asn Thr
    755                 760                 765acg cat ccc aat tca gga ctt gcg act atc atg tcg gat ggg cca ggg   2352Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp Gly Pro Gly
770                 775                 780gga gag aaa tgg atg tac gta ggg caa aat aaa gca ggt caa gtt tgg   2400Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly Gln Val Trp785                 790                 795                 800cat gac ata act gga aat aaa cca gga aca gtt acg atc aat gca gat   2448His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile Asn Ala Asp
            805                 810                 815gga tgg gct aat ttt tca gta aat gga gga tct gtt tcc att tgg gtg   2496Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser Ile Trp Val
        820                 825                 830aaa cga                                                              2502Lys Arg<210>l2<211>834<212>PRT<213>人工序列<223>人工序列的描述:详见说明书正文<400>12Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                  95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335Gly Val Gly Lys Ile Asn Pro Ala Ser Ile Glu Gly Arg His His Asn
        340                 345                 350Gly Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp His Leu Pro Asn
    355                 360                 365Asp Gly Asn His Trp Asn Arg Leu Arg Asp Asp Ala Ser Asn Leu Arg
370                 375                 380Asn Arg Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Trp Lys Gly Thr385                 390                 395                 400Ser Gln Asn Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly
            405                 410                 415Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Arg Ser
        420                 425                 430Gln Leu Glu Ser Ala Ile His Ala Leu Lys Asn Asn Gly Val Gln Val
    435                 440                 445Tyr Gly Asp Val Val Met Asn His Lys Gly Gly Ala Asp Ala Thr Glu
450                 455                 460Asn Val Leu Ala Val Glu Val Asn Pro Asn Asn Arg Asn Gln Glu Ile465                 470                 475                 480Ser Gly Asp Tyr Thr Ile Glu Ala Trp Thr Lys Phe Asp Phe Pro Gly
            485                 490                 495Arg Gly Asn Thr Tyr Ser Asp Phe Lys Trp Arg Trp Tyr His Phe Asp
        500                 505                 510Gly Val Asp Trp Asp Gln Ser Arg Gln Phe Gln Asn Arg Ile Tyr Lys
    515                 520                 525Phe Arg Gly Asp Gly Lys Ala Trp Asp Trp Glu Val Asp Ser Glu Asn
530                 535                 540Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Val Asp Met Asp His Pro545                 550                 555                 560Glu Val Val Asn Glu Leu Arg Arg Trp Gly Glu Trp Tyr Thr Asn Thr
            565                 570                 575Leu Asn Leu Asp Gly Phe Arg Ile Asp Ala Val Lys His Ile Lys Tyr
        580                 585                 590Ser Phe Thr Arg Asp Trp Leu Thr His Val Arg Asn Ala Thr Gly Lys
    595                 600                 605Glu Met Phe Ala Val Ala Glu Phe Trp Lys Asn Asp Leu Gly Ala Leu
610                 615                 620Glu Asn Tyr Leu Asn Lys Thr Asn Trp Asn His Ser Val Phe Asp Val625                 630                 635                 640Pro Leu His Tyr Asn Leu Tyr Asn Ala Ser Asn Ser Gly Gly Asn Tyr
            645                 650                 655Asp Met Ala Lys Leu Leu Asn Gly Thr Val Val Gln Lys His Pro Met
        660                 665                 670His Ala Val Thr Phe Val Asp Asn His Asp Ser Gln Pro Gly Glu Ser
    675                 680                 685Leu Glu Ser Phe Val Gln Glu Trp Phe Lys Pro Leu Ala Tyr Ala Leu
690                 695                 700Ile Leu Thr Arg Glu Gln Gly Tyr Pro Ser Val Phe Tyr Gly Asp Tyr705                 710                 715                 720Tyr Gly Ile Pro Thr His Ser Val Pro Ala Met Lys Ala Lys Ile Asp
            725                 730                 735Pro Ile Leu Glu Ala Arg Gln Asn Phe Ala Tyr Gly Thr Gln His Asp
        740                 745                 750Tyr Phe Asp His His Asn Ile Ile Gly Trp Thr Arg Glu Gly Asn Thr
    755                 760                 765Thr His Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asp Gly Pro Gly
770                 775                 780Gly Glu Lys Trp Met Tyr Val Gly Gln Asn Lys Ala Gly Gln Val Trp785                 790                 795                 800His Asp Ile Thr Gly Asn Lys Pro Gly Thr Val Thr Ile Asn Ala Asp
            805                 810                 815Gly Trp Ala Asn Phe Ser Val Asn Gly Gly Ser Val Ser Ile Trp Val
        820                 825                 830Lys Arg<210>13<211>1134<212>DNA<213>人工序列<220><223>人工序列的描述:详见说明书正文<220><221>CDS<222>(1)..(1134)<400>13atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt   48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc   96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc   144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg   192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag   240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca   288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
            85                   90                  95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta   336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc   384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac   432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct   480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                150                  155                 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt   528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa   576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg   624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc   672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt   720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac   768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac   816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca   864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc   912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac   960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc   1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335gga gtc ggc aaa atc aat cca gct agc aaa aga cat gcc gaa gga aca   1056Gly Val Gly Lys Ile Asn Pro Ala Ser Lys Arg His Ala Glu Gly Thr
        340                 345                 350ttt acg tca gac gtc tca tca tat tta gaa ggc cag gca gcc aaa gaa   1104Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu
    355                 360                 365ttc atc gca tgg tta gtc aaa ggc agg gga                           1134Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
370                 375<210>14<211>378<212>PRT<213>人工序列<223>人工序列的描述:详见说明书正文<400>14Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                  95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335Gly Val Gly Lys Ile Asn Pro Ala Ser Lys Arg His Ala Glu Gly Thr
        340                 345                 350Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu
    355                 360                 365Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
370                 375<210>15<211>1158<212>DNA<213>人工序列<220><223>人工序列的描述:详见说明书正文<220><221>CDS<222>(1)..(1158)<400>15atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt   48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc   96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc   144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg   192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag   240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca   288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                 95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta   336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc   384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac   432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct   480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt   528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa   576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg   624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc   672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt   720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac   768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac   816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca   864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc   912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac   960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc   1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335gga gtc ggc aaa atc aat cca gct agc cca gaa cca aca cct gag ccc   1056Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro
        340                 345                 350aca aaa aga cat gcc gaa gga aca ttt acg tca gac gtc tca tca tat   1104Thr Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr
    355                 360                 365tta gaa ggc cag gca gcc aaa gaa ttc atc gca tgg tta gtc aaa ggc   1152Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly
370                 375                  380agg gga                                                           1158Arg Gly385<210>16<211>386<212>PRT<213>人工序列<223>人工序列的描述:详见说明书正文<400>16Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                  95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro
        340                 345                 350Thr Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr
    355                 360                 365Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly
 370                375                 380Arg Gly385<210>17<211>160<212>DNA<213>人(Homo sapiens)<220><221>CDS<222>(1)..(159)<400>17ttc gtc aac cag cat tta tgt ggc tca cat ctg gta gag gcc ctg tat   48Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1               5                  10                  15tta gtc tgt gga gag agg gga ttc ttt tat aca ccg aaa gcc gcg aaa   96Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys
         20                  25                  30ggc att gtt gaa cag tgt tgc aca tca atc tgt agc tta tat cag ctg   144Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
     35                  40                  45gaa aat tac tgc aac t                                             160Glu Asn Tyr Cys Asn
 50<210>18<211>53<212>PRT<213>人(Homo sapiens)<400>18Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr1               5                  10                  15Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Ala Ala Lys
         20                  25                  30Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu
     35                  40                  45Glu Asn Tyr Cys Asn
 50<210>19<211>1227<212>DNA<213>人工序列<220><223>人工序列的描述:详见说明书正文<220><221>CDS<222>(1)..(1227)<400>19atg aaa caa caa aaa cgg ctt tac gcc cga ttg ctg acg ctg tta ttt   48Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15gcg ctc atc ttc ttg ctg cct cat tct gca gcc gcg gca gct tct gcc   96Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30tta aac tcg ggc aaa gta aat ccg ctt gcc gac ttc agc tta aaa ggc   144Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45ttt gcc gca cta aac ggc gga aca acg ggc gga gaa ggc ggt cag acg   192Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60gta acc gta aca acg gga gat cag ctg att gcg gca tta aaa aat aag   240Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80aat gca aat acg cct tta aaa att tat gtc aac ggc acc att aca aca   288Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                  95tca aat aca tcc gca tca aag att gac gtc aaa gac gtg tca aac gta   336Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110tcg att gtc gga tca ggg acc aaa ggg gaa ctc aaa ggg atc ggc atc   384Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125aaa ata tgg cgg gcc aac aac atc atc atc cgc aac ttg aaa att cac   432Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140gag gtc gcc tca ggc gat aaa gac gcg atc ggc att gaa ggc cct tct   480Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160aaa aac att tgg gtt gat cat aat gag ctt tac cac agc ctg aac gtt   528Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175gac aaa gat tac tat gac gga tta ttt gac gtc aaa aga gat gcg gaa   576Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190tat att aca ttc tct tgg aac tat gtg cac gat gga tgg aaa tca atg   624Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205ctg atg ggt tca tcg gac agc gat aat tac aac agg acg att aca ttc   672Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220cat cat aac tgg ttt gag aat ctg aat tcg cgt gtg ccg tca ttc cgt   720His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240ttc gga gaa ggc cat att tac aac aac tat ttc aat aaa atc atc gac   768Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255agc gga att aat tcg agg atg ggc gcg cgc atc aga att gag aac aac   816Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270ctc ttt gaa aac gcc aaa gat ccg att gtc tct tgg tac agc agt tca   864Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285ccg ggc tat tgg cat gta tcc aac aac aaa ttt gta aac tct agg ggc   912Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300agt atg ccg act acc tct act aca acc tat aat ccg cca tac agc tac   960Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320tca ctc gac aat gtc gac aat gta aaa tca atc gtc aag caa aat gcc   1008Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335gga gtc ggc aaa atc aat cca gct agc ccg gaa cca aca cca gag ccg   1056Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro
        340                 345                 350acc aaa agg ttc gtc aac cag cat tta tgt ggc tca cat ctg gta gag   1104Thr Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
    355                 360                 365gcc ctg tat tta gtc tgt gga gag agg gga ttc ttt tat aca ccg aaa   1152Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
370                 375                 380gcc gcg aaa ggc att gtt gaa cag tgt tgc aca tca atc tgt agc tta   1200Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu385                 390                 395                 400tat cag ctg gaa aat tac tgc aac taa                               1227Tyr Gln Leu Glu Asn Tyr Cys Asn
            405<210>20<211>408<212>PRT<213>人工序列<223>人工序列的描述:详见说明书正文<400>20Met Lys Gln Gln Lys Arg Leu Tyr Ala Arg Leu Leu Thr Leu Leu Phe1               5                  10                  15Ala Leu Ile Phe Leu Leu Pro His Ser Ala Ala Ala Ala Ala Ser Ala
         20                  25                  30Leu Asn Ser Gly Lys Val Asn Pro Leu Ala Asp Phe Ser Leu Lys Gly
     35                  40                  45Phe Ala Ala Leu Asn Gly Gly Thr Thr Gly Gly Glu Gly Gly Gln Thr
 50                  55                  60Val Thr Val Thr Thr Gly Asp Gln Leu Ile Ala Ala Leu Lys Asn Lys65                  70                  75                  80Asn Ala Asn Thr Pro Leu Lys Ile Tyr Val Asn Gly Thr Ile Thr Thr
             85                  90                  95Ser Asn Thr Ser Ala Ser Lys Ile Asp Val Lys Asp Val Ser Asn Val
        100                 105                 110Ser Ile Val Gly Ser Gly Thr Lys Gly Glu Leu Lys Gly Ile Gly Ile
    115                 120                 125Lys Ile Trp Arg Ala Asn Asn Ile Ile Ile Arg Asn Leu Lys Ile His
130                 135                 140Glu Val Ala Ser Gly Asp Lys Asp Ala Ile Gly Ile Glu Gly Pro Ser145                 150                 155                 160Lys Asn Ile Trp Val Asp His Asn Glu Leu Tyr His Ser Leu Asn Val
            165                 170                 175Asp Lys Asp Tyr Tyr Asp Gly Leu Phe Asp Val Lys Arg Asp Ala Glu
        180                 185                 190Tyr Ile Thr Phe Ser Trp Asn Tyr Val His Asp Gly Trp Lys Ser Met
    195                 200                 205Leu Met Gly Ser Ser Asp Ser Asp Asn Tyr Asn Arg Thr Ile Thr Phe
210                 215                 220His His Asn Trp Phe Glu Asn Leu Asn Ser Arg Val Pro Ser Phe Arg225                 230                 235                 240Phe Gly Glu Gly His Ile Tyr Asn Asn Tyr Phe Asn Lys Ile Ile Asp
            245                 250                 255Ser Gly Ile Asn Ser Arg Met Gly Ala Arg Ile Arg Ile Glu Asn Asn
        260                 265                 270Leu Phe Glu Asn Ala Lys Asp Pro Ile Val Ser Trp Tyr Ser Ser Ser
    275                 280                 285Pro Gly Tyr Trp His Val Ser Asn Asn Lys Phe Val Asn Ser Arg Gly
290                 295                 300Ser Met Pro Thr Thr Ser Thr Thr Thr Tyr Asn Pro Pro Tyr Ser Tyr305                 310                 315                 320Ser Leu Asp Asn Val Asp Asn Val Lys Ser Ile Val Lys Gln Asn Ala
            325                 330                 335Gly Val Gly Lys Ile Asn Pro Ala Ser Pro Glu Pro Thr Pro Glu Pro
        340                 345                 350Thr Lys Arg Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu
    355                 360                 365Ala Leu Tyr Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys
370                 375                 380Ala Ala Lys Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu385                 390                 395                 400Tyr Gln Leu Glu Asn Tyr Cys Asn
            405<210>21<211>42<212>DNA<213>人工序列<220><223>人工序列的描述:引物#LWN5494<400>21gtcgccgggg cggccgctat caattggtaa ctgtatctca gc                    42<210>22<211>64<212>DNA<213>人工序列<220><223>人工序列的描述:引物#LWN5495<400>22gtcgcccggg agctctgatc aggtaccaag cttgtcgacc tgcagaatga ggcagcaaga 60agat                                                              64<210>23<211>61<212>DNA<213>人工序列<220><223>人工序列的描述:引物#LWN5938<400>23gtcggcggcc gctgatcacg taccaagctt gtcgacctgc agaatgaggc agcaagaaga 60t                                                                 61<210>24<211>35<212>DNA<213>人工序列<220><223>人工序列的描述:引物#LWN5939<400>24gtcggagctc tatcaattgg taactgtatc tcagc                            35<210>25<211>35<212>DNA<213>人工序列<220><223>人工序列的描述:引物#LWN7864<400>25aacagctgat cacgactgat cttttagctt ggcac                            35<210>26<211>37<212>DNA<213>人工序列<220><223>人工序列的描述:引物#LWN7901<400>26aactgcagcc gcggcacatc ataatgggac aaatggg                          37<210>27<211>39<212>DNA<213>人工序列<220><223>人工序列的描述:引物Pecl.B.lich.upper.SacII<400>27ctaactgcag ccgcggcagc ttctgcctta aactcgggc                        39<210>28<211>42<212>DNA<213>人工序列<220><223>人工序列的描述:引物Pecl.B.lich.lower.NotI<400>28gcgttgagac gcgcggccgc tgaatgcccc ggacgtttca cc                    42<210>29<211>105<212>DNA<213>人工序列<220><223>人工序列的描述:引物145424.正向.NheI<400>29gacaatgtcg acaatgtaaa atcaatcgtc aagcaaaatg ccggagtcgg caaaatcaat 60ccagctagca ttgaaggcag acatcataat gggacaaatg ggacg                 105<210>30<211>22<212>DNA<213>人工序列<220><223>人工序列的描述:引物101450.反向<400>30catggtgaac caaagtgaaa cc                                          22<210>31<211>78<212>DNA<213>人工序列<220><223>人工序列的描述:引物149217.正向.NheI<400>31tgtttgctag caaaagacat gccgaaggaa catttacgtc agacgtctca tcatatttag 60aaggccaggc agccaaag                                               78<210>32<211>70<212>DNA<213>人工序列<220><223>人工序列的描述:引物149216.反向.EagI<400>32gcaaacggcc gaaagcttat cccctgcctt tgactaacca tgcgatgaat tctttggctg 60cctggccttc                                                        70<210>33<211>60<212>DNA<213>人工序列<220><223>人工序列的描述:引物159639.正向.NheI<400>33ccagctagcc cagaaccaac acctgagccc acaaaaagac atgccgaagg aacatttacg 60<210>34<211>22<212>DNA<213>人工序列<220><223>人工序列的描述:引物101450.反向<400>34catggtgaac caaagtgaaa cc                                          22<210>35<211>36<212>DNA<213>人工序列<220><223>人工序列的描述:引物B5456H02.反向<400>35ggtgttggtt ctgggctagc tggattgatt ttgccg                           36<210>36<211>22<212>DNA<213>人工序列<220><223>人工序列的描述:引物142670.正向<400>36cagcgataat tacaacagga cg                                          22<210>37<211>126<212>DNA<213>人工序列<220><223>人工序列的描述:引物Pecl.ISFUS.NheI.upper(#149171)<400>37catcatgcta gcccggaacc aacaccagag ccgaccaaaa ggttcgtcaa ccagcattta 60tgtggctcac atctggtaga ggccctgtat ttagtctgtg gagagagggg attcttttat 120acaccg                                                            126<210>38<211>120<212>DNA<213>人工序列<220><223>人工序列的描述:引物Pecl.ISFUS.NotI.Lower(#149172)<400>38gcgttgagac gcggccgctt agttgcagta attttccagc tgatataagc tacagattga 60tgtgcaacac tgttcaacaa tgcctttcgc ggctttcggt gtataaaaga atcccctctc 120

Claims (23)

1.一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽。
2.一种细胞,其包含一种能编码依次融合在一个开放读码框内的至少以下元件的DNA序列,所述元件有果胶酸裂解酶,含至少2个氨基酸的接头,用于蛋白酶剪切的靶位点,和外源多肽。
3.权利要求1或2的细胞,其中所述细胞为革兰氏阳性微生物细胞。
4.权利要求1-3中任一项的细胞,其中所述细胞为芽孢杆菌细胞。
5.权利要求1-4中任一项的细胞,其中所述细胞选自地衣芽孢杆菌、Bacillus clausii、短芽孢杆菌、解淀粉芽孢杆菌、枯草芽孢杆菌、迟缓芽孢杆菌、嗜热脂肪芽孢杆菌、嗜碱芽孢杆菌、凝固芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌、苏云金芽孢杆菌、和Bacillus agaradhaerens。
6.权利要求1-5中任一项的细胞,其中所述用于蛋白酶剪切的靶位点是由蛋白酶识别并切割的氨基酸序列。
7.权利要求6的细胞,其中所述用于蛋白酶剪切的靶位点是氨基酸序列Lys-Arg(KR)。
8.权利要求6的细胞,其中所述用于蛋白酶剪切的靶位点是氨基酸序列Ile-Glu-Gly-Arg(IEGR)。
9.权利要求1-5中任一项的细胞,其中所述用于蛋白酶剪切的靶位点是当所融合的多肽被所述细胞分泌时被切割的氨基酸序列。
10.权利要求1-5中任一项的细胞,其中所述用于蛋白酶剪切的靶位点是能被化学化合物切割的氨基酸序列。
11.权利要求10的细胞,其中所述化学化合物是溴化氰或羟胺。
12.权利要求1-11中任一项的细胞,其中所述果胶酸裂解酶选自以下果胶酸裂解酶,这些酶含有选自SEQ ID 2、SEQ ID 4、SEQ ID 6、SEQ ID 8、和SEQID 10的氨基酸序列。
13.权利要求1-12中任一项的细胞,其中所述果胶酸裂解酶是一种同系物,其与含有选自SEQ ID 2、SEQ ID 4、SEQ ID 6、SEQ ID 8、和SEQ ID10的氨基酸序列的果胶酸裂解酶具有70%的氨基酸序列相似性。
14.权利要求2-13中任一项的细胞,其中出现在接头中的氨基酸残基至少25%为脯氨酸。
15.权利要求2-14中任一项的细胞,其中所述接头依次包含氨基酸的至少一个循环重复:Pro-Glu-Pro-Thr,Glu-Pro-Thr-Pro,Pro-Thr-Pro-Glu,或Th-Pro-Glu-Pro(PEPT,EPTP,PTEP,或TPEP)。
16.权利要求2-13中任一项的细胞,其中所述接头包含氨基酸序列Ile-Glu-Gly-Arg(IEGR)的至少一个重复。
17.权利要求1-16中任一项的细胞,其中所述外源多肽选自激素,功能型激素类似物,酶和人工多肽。
18.权利要求1-16中任一项的细胞,其中所述外源多肽为包含SEQ ID12中350-834位所示氨基酸序列的α-淀粉酶。
19.权利要求1-16中任一项的细胞,其中所述外源多肽为包含SEQ ID14中348-378位或SEQ ID 16中356-386位所示氨基酸序列的人类GLP-1(7-37)激素类似物。
20.权利要求1-16中任一项的细胞,其中所述外源多肽为包含SEQ ID18中所示氨基酸序列的单链人类胰岛素(MI3)。
21.权利要求1-16中任一项的细胞,其中所述外源多肽包含含有SEQID 20中356-408位所示氨基酸序列的单链人类胰岛素(MI3)。
22.一种生产蛋白的方法,该方法包括以下步骤:
i)构建合适的细胞,其包含一种能编码融合在一个开放读码框(ORF)内的至少以下依次排列之元件的DNA序列,所述元件有果胶酸裂解酶,用于蛋白酶剪切的靶位点,和外源多肽,
ii)在适于生长和分泌的条件下培养步骤i)所构建的细胞,和
iii)回收含有外源多肽的蛋白。
23.权利要求22的方法,其进一步包括在回收所述外源多肽之前或之后对所述蛋白进行蛋白酶剪切的步骤。
CN00808288A 1999-06-02 2000-05-31 用于多肽的表达和分泌的果胶酸裂解酶融合体 Pending CN1353762A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DKPA199900780 1999-06-02
DKPA199900780 1999-06-02
US13869299P 1999-06-11 1999-06-11
US60/138,692 1999-06-11

Publications (1)

Publication Number Publication Date
CN1353762A true CN1353762A (zh) 2002-06-12

Family

ID=26064641

Family Applications (1)

Application Number Title Priority Date Filing Date
CN00808288A Pending CN1353762A (zh) 1999-06-02 2000-05-31 用于多肽的表达和分泌的果胶酸裂解酶融合体

Country Status (5)

Country Link
EP (1) EP1187925B1 (zh)
JP (1) JP2003520571A (zh)
CN (1) CN1353762A (zh)
AU (1) AU4911600A (zh)
WO (1) WO2000075344A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104892769B (zh) * 2015-05-22 2018-04-06 盐城师范学院 一种溶血素融合蛋白PeLa‑EK‑10His‑SLO及其表达质粒与应用
CN108546303A (zh) * 2018-05-08 2018-09-18 盐城师范学院 一种高表达高稳定性的多糖氢键破除酶融合蛋白及其应用
CN112980753A (zh) * 2019-12-13 2021-06-18 中国科学院天津工业生物技术研究所 用于外源蛋白分泌的糖苷水解酶融合表达系统

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020155574A1 (en) 2000-08-01 2002-10-24 Novozymes A/S Alpha-amylase mutants with altered properties
MXPA03011194A (es) 2001-06-06 2004-02-26 Novozymes As Endo-beta-1,4-glucanasa.
CN1738899A (zh) 2002-12-11 2006-02-22 诺和酶股份有限公司 洗涤剂组合物
US7935501B2 (en) 2003-09-11 2011-05-03 Novozymes Pharma Biotec A/S Recombinant production of antimicrobial peptides
JP4736085B2 (ja) * 2005-04-18 2011-07-27 独立行政法人海洋研究開発機構 宿主微生物
EP2794873A1 (en) 2011-11-08 2014-10-29 Novozymes A/S Methods for production of archeae protease in yeast
WO2016050680A1 (en) 2014-09-29 2016-04-07 Novozymes A/S Yoqm-inactivation in bacillus
US20200024321A1 (en) * 2017-03-20 2020-01-23 Lupin Limited Expression and large-scale production of peptides
CN117730090A (zh) 2021-07-13 2024-03-19 诺维信公司 重组角质酶表达
WO2023170177A1 (en) 2022-03-08 2023-09-14 Novozymes A/S Fusion polypeptides with deamidase inhibitor and deamidase domains
EP4242303A1 (en) 2022-03-08 2023-09-13 Novozymes A/S Fusion polypeptides with deamidase inhibitor and deamidase domains

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8412517D0 (en) * 1984-05-16 1984-06-20 Nagai K Recombinant fusion proteins
US5576195A (en) * 1985-11-01 1996-11-19 Xoma Corporation Vectors with pectate lyase signal sequence
GB8702475D0 (en) * 1987-02-04 1987-03-11 Ciba Geigy Ag Expression system

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104892769B (zh) * 2015-05-22 2018-04-06 盐城师范学院 一种溶血素融合蛋白PeLa‑EK‑10His‑SLO及其表达质粒与应用
CN108546303A (zh) * 2018-05-08 2018-09-18 盐城师范学院 一种高表达高稳定性的多糖氢键破除酶融合蛋白及其应用
CN112980753A (zh) * 2019-12-13 2021-06-18 中国科学院天津工业生物技术研究所 用于外源蛋白分泌的糖苷水解酶融合表达系统
CN112980753B (zh) * 2019-12-13 2023-12-19 中国科学院天津工业生物技术研究所 用于外源蛋白分泌的糖苷水解酶融合表达系统

Also Published As

Publication number Publication date
EP1187925B1 (en) 2005-03-30
WO2000075344A1 (en) 2000-12-14
AU4911600A (en) 2000-12-28
EP1187925A1 (en) 2002-03-20
JP2003520571A (ja) 2003-07-08

Similar Documents

Publication Publication Date Title
CN1115413C (zh) 合成前导肽序列
CN1311075C (zh) 表达超热稳定蛋白的系统
CN1353762A (zh) 用于多肽的表达和分泌的果胶酸裂解酶融合体
CN1195859C (zh) 修饰化人源粒细胞-集落刺激因子及其制备方法
CN1037174A (zh) 针对人腺癌抗原的新的重组和嵌合抗体
CN1283702A (zh) 通过分子伴侣的共分泌制备天然折叠的和分泌的蛋白质的方法
CN1818067A (zh) 抗虫融合基因、融合蛋白及其应用
CN1513057A (zh) 宿主微生物
CN1662657A (zh) 低成本生产肽
CN1269838C (zh) 用于由大肠杆菌向培养基中分泌来制备Leu-水蛭素的信号序列
CN1152955C (zh) 生产蛋白酶的方法
CN1541059A (zh) 具有动物型糖链加成功能的植物细胞
CN1875106A (zh) 重组微生物
CN1681930A (zh) 具有包含fivsi基序的信号序列的多肽以及编码该基序的寡核苷酸
CN1231594C (zh) 天然折叠和分泌型蛋白质的制备方法
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1958794A (zh) 人肿瘤坏死因子相关凋亡诱导配体突变体编码cDNA及制备方法和应用
CN1878859A (zh) 新型桥石短小芽孢杆菌和使用该微生物作为宿主生产蛋白的方法
CN1930289A (zh) 变异芽孢杆菌属细菌
CN1156575C (zh) 分泌人粒细胞集落刺激因子(g-csf)的大肠杆菌菌株
CN1213402A (zh) 表层蛋白的重组表达
CN1639320A (zh) 冷休克诱导的异源多肽的表达和生产
CN1756835A (zh) 用作选择标记的转位酶
CN1788092A (zh) 构建分泌细菌重组蛋白的前导肽
CN1875095A (zh) 重组微生物

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication