CehA突变体蛋白、基因、重组载体及其用途和制备方法
技术领域
本发明属于生物技术领域,具体涉及CehA突变体蛋白、基因、重组载体及其用途和制备方法。
背景技术
农药残留已成为突出的环境问题,越来越受到人们的关注,消除环境中残留农药的研究也越来越受到重视。残留农药的去除方法主要有生物降解、物理降解、化学降解等,其中生物降解是指通过生物(包括各种微生物、植物和动物)的作用将大分子分解成小分子化合物的过程。生物降解因不带入二次污染、条件温和,而越来越受到重视,已成为当前食品安全领域的研究热点。化学农药的生物降解主要是通过微生物、降解酶、工程菌、植物来进行,其中降解酶往往比产生这类酶的微生物菌体更能忍受异常环境条件,而且酶的降解效果远胜于微生物本身,尤其是在残留农药质量浓度低的情况下。
氨基甲酸酯类农药的结构基于毒扁豆碱,骨架为氨基甲酸,属于酯类有机化合物,酯键断裂后即失去毒性作用,常用的是N-甲酰氨基甲酸酯。它们是目前使用仅次于有机磷农药的一类杀虫剂,常用的品种有呋喃丹、西维因、速灭威等。氨基甲酸酯类杀虫剂的毒理机制是抑制乙酰胆碱酯酶活性,阻断正常神经传导,多数属中等神经毒,这与有机磷类类似。但同有机磷类的机制又有所不同:1.它不需经代谢活化,可直接与乙酰胆碱酯酶形成疏松复合体,抑制后者的活性。2.与乙酰胆碱酯酶可逆结合,形成的复合物可迅速分解,故症状较轻,恢复较快。
现在随着氨基甲酸酯类的广泛使用,其残留问题也凸显了出来。但到目前为止,发现的能水解氨基甲酸酯类农药的酶,要么分子量过大,不利于工业化的应用,要么活性不够强。因此,寻找一种酶蛋白和方法,能有效地水解氨基甲酸酯类农药,显得愈发重要。
发明内容
本发明所要解决的技术问题是寻找一种能高效降解氨基甲酸酯类杀虫剂的酶蛋白。
为解决上述问题,
一方面,本发明公开了一种CehA突变体蛋白,为如下(a)或(b)的蛋白:
(a)其氨基酸序列如SEQ ID NO.1所述的蛋白;
(b)至少与(a)中的氨基酸序列70%同源性且具有水解的氨基甲酸酯类杀虫剂或毒素活性的蛋白,除了氨基酸序列如SEQ ID NO.7所述的蛋白。
其中所述CehA突变体蛋白与SEQ ID NO.1所述氨基酸序列具有至少75%的同源性。更优选地,该CehA突变体蛋白与SEQ ID NO.1所述的氨基酸序列具有至少85%的同源性。
在实施方案里,本发明(b)中所述CehA突变体蛋白优选自氨基酸序列如SEQ IDNO.2~6所述的蛋白,其中最优选氨基酸序列如SEQ ID NO.2所述的蛋白。
本发明的发明思路为通过基因工程技术人为缩短CehA蛋白序列,从中获得较原始CehA蛋白具有更高水解氨基甲酸酯类杀虫剂或毒素活性的突变体蛋白。在这一思路下,本发明所保护范围包括但不局限于上述突变体蛋白。
一方面,本发明公开了一种多核苷酸分子,其特征在于该多核苷酸分子编码本发明所述CehA突变体蛋白。
一方面,本发明公开了一种包含本发明所述多核苷酸分子的重组表达载体。
一方面,本发明公开了一种包含本发明所述重组表达载体的转化体。
在一实施方式中,所述转化体为大肠杆菌。
另一方面,本发明公开了一种本发明所述CehA突变体蛋白的制备方法,包括如下步骤:
①CehA突变体蛋白表达载体的构建;
②CehA突变体蛋白转化体的制备;
③CehA突变体蛋白的表达;
④CehA突变体蛋白的纯化。
另一方面,本发明公开了一种降解氨基甲酸酯类杀虫剂或毒素的组合物,包括本发明所述CehA突变体蛋白和一种或多种可接受的载体。
另一方面,本发明公开了本发明所述CehA突变体蛋白在去除或降低氨基甲酸酯类杀虫剂或毒素的残留或污染方面的用途。
与现有的CehA蛋白比较,本发明所述的CehA突变体蛋白活性更高,能有效地水解氨基甲酸酯类农药,并且分子量更小,更稳定,可开发为工业应用低成本和高质量的酶制剂。这为解决氨基甲酸酯农药残留或污染提供了新的选择。
附图说明
图1.纯化后不同CehA突变体蛋白的电泳图。
图2.不同CehA突变体蛋白对西维因的降解效果。
具体实施方式
下文将进一步详细讨论本发明的多个方面。
氨基甲酸酯类杀虫剂或毒素(carbamates)用作农药的杀虫剂、除草剂、杀菌剂等。这类杀虫剂分为五大类:①萘基氨基甲酸酯类,如西维因;②苯基氨基甲酸酯类,如叶蝉散;③氨基甲酸肟酯类,如涕灭威;④杂环甲基氨基甲酸酯类,如呋喃丹;⑤杂环二甲基氨基甲酸酯类,如异索威。
氨基甲酸酯类杀虫剂或毒素包括克百威、丁硫克百威、丙硫克百威、仲丁威、异丙威、残杀威、灭多威、硫双灭多威、棉铃威、苯硫威、抗蚜威、双氧威、唑蚜威、速灭威、杀草丹、禾草特。
CehA突变体蛋白
蛋白的同源性百分比由GAP(Needleman和Wunsh,1970)分析(GCG程序)确定,其中参数gap creation penalty=5,gap extension penalty=0.3。被分析的序列长度至少为15个氨基酸时,GAP分析就在参与测试的两个序列的至少为15个氨基酸的区域进行测试。更优选地,被分析的序列长度至少为50个氨基酸时,GAP分析就在参与测试的两个序列的至少为50个氨基酸的区域进行测试。更优选地,被分析的序列长度至少为100个氨基酸时,GAP分析就在参与测试的两个序列的至少为100个氨基酸的区域进行测试。更优选地,被分析的序列长度至少为250个氨基酸时,GAP分析就在参与测试的两个序列的至少为250个氨基酸的区域进行测试。甚至更优选地,被分析的序列长度至少为500个氨基酸时,GAP分析就在参与测试的两个序列的至少为500个氨基酸的区域进行测试。
此处使用的术语“CehA突变体蛋白”是指CehA蛋白的突变体,优选为CehA蛋白(BAB85626.1 GI:19032285)的突变体。相比于天然存在的CehA蛋白,CehA突变体蛋白保留了至少一些对氨基甲酸酯类杀虫剂或毒素的水解活性。优选地,该突变体与它们起源的天然存在的CehA蛋白相比,具有增强的活性和/或改变了的立体专一性。天然存在的CehA蛋白的氨基酸序列突变体可通过向本发明的核苷酸中引入适当的核苷酸变化、或通过体外合成所需多肽来制备。这些突变体包括,例如缺失、插入或替换该氨基酸序列中的残基。可以通过缺失、插入和替换的组合以得到最终的构建体,提供最终的蛋白产品。
本发明涉及的方面还包括CehA突变体蛋白类似物,在它们合成期间或合成后进行了不同的修饰,例如,通过生物素化、苄基化、糖基化、乙酰化、磷酸化、由已知保护/封闭基团的衍生作用、蛋白水解的切割作用、连接到抗体分子或其它细胞配体上等。这些修饰可以用来增加本发明CehA突变体蛋白的稳定性和/或生物活性。
CehA突变体蛋白的表达
本发明包括编码本发明的CehA突变体蛋白的DNA以及含有这些DNA的载体、转化体。
本发明中,使用的术语“转化体”(transformant),即带有异源DNA分子的宿主细胞。
本发明还包括通过合成和重组技术生产本发明的CehA突变体蛋白的方法。通过本领域已知的方法可以分离和纯化多核苷酸(DNA或RNA)、载体、转化体和生物体。
用于本发明的载体可以是如噬菌体、质粒、粘粒、微型染色体、病毒或逆转录病毒载体。可用于克隆和/或表达本发明的多核苷酸的载体是能在需复制和/或表达多核苷酸的宿主细胞中复制和/或表达多核苷酸的载体。一般说来,多核苷酸和/或载体可用于任何真核或原核细胞,包括哺乳动物细胞(如人(如HeLa)、猴(如Cos)、兔(如兔网织红细胞)、大鼠、仓鼠(如CHO、NSO和幼仓鼠肾细胞)或小鼠细胞(如L细胞))、植物细胞、酵母细胞、昆虫细胞或细菌细胞(如大肠杆菌)。有关适用于多种类型宿主细胞的适当载体的例子可参见例如F.Ausubel et al.,CurrentProtocols in Molecular Biology.Greene Publishing Associates andWiley-Interscience(1992)和Sambrook et al.(1989)。可以使用含有这些多核苷酸的宿主细胞来大量表达可用于例如药物、诊断试剂、疫苗和治疗剂的蛋白质。
已开发出多种方法用于经由互补的粘性末端使多核苷酸与载体可操作相连。例如,可在欲插入载体DNA内的DNA区段添加互补的同聚体序列片段。然后通过互补同聚体尾之间的氢键连接载体和DNA区段以形成重组DNA分子。
含有一或多种限制性位点的合成接头提供了另一种连接DNA区段与载体的方法。用噬菌体T4 DNA聚合酶或大肠杆菌DNA聚合酶I处理通过内切核酸酶限制性消化产生的DNA区段,所述的两种聚合酶用其3’,5’-核酸外切活性除去突出的γ-单链末端,并用其聚合活性补平3’-凹端。因此,这些活性的联合产生了平端DNA区段。然后在能催化平端DNA分子连接的酶,如噬菌体T4 DNA连接酶的存在下将平端区段与大摩尔过量的接头分子一起保温。因此,反应产物是末端携有聚合接头序列的DNA区段。然后用适当的限制性酶裂解这些DNA区段,并连接至已用酶裂解的表达载体中,所述酶能产生与所述DNA区段相容的末端。从多个商家可以买到含有多个限制性内切核酸酶位点的合成接头。
多核苷酸插入物应该可操作地连接于同表达多核苷酸的宿主细胞相容的适当启动子上。启动子可以是强启动子和/或诱导型启动子。列举的一些启动子的例子包括噬菌体λPL启动子、大肠杆菌lac、trP、phoA、tac启动子、SV40早期和晚期启动子以及逆转录病毒LTR启动子。其它适当启动子是本领域技术人员已知的。表达重组载体进一步含有转录起始、终止位点,并在转录区含有用于翻译的核糖体结合位点。重组载体表达的转录物的编码部分可包括位于起点处的翻译起始密码子和适当地位于被翻译多肽的末端的终止密码子(UAA,UGA或UAG)。
如上所述,表达载体可包括至少一个选择标记。所述标记包括对真核细胞培养物而言的二氢叶酸还原酶、G418、谷氨酰胺合酶或新霉素抗性;以及用于大肠杆菌和其它细菌培养的四环素、卡那霉素或氨卞青霉素抗性基因。适当宿主的代表性例子包括但不限于:细菌细胞,如大肠杆菌、链霉菌和鼠伤寒沙门氏菌细胞;真菌细胞,如酵母细胞(如酿酒酵母或巴斯德毕赤酵母);昆虫细胞,如果蝇S2和夜蛾SF9细胞;动物细胞,如CHO,COS,NSO,293和Bowes黑素瘤细胞;和植物细胞。上述宿主细胞的适当培养基和培养条件是本领域已知的。
为了有效地分离纯化或分泌目标蛋白,常常还可利用便于分离纯化的标签蛋白或标签多肽(Tag)。常用的有谷胱甘肽-S-转移酶(glutathione S-transferase,GST)、六聚组氨酸肽(His.Tag)、蛋白质A(protein A)和纤维素结合位点(cellulose binding domain)等。通过特殊性蛋白或多肽与目标蛋白构成融合蛋白的形式,表达后利用所述的标签蛋白或标签多肽的特殊性质可对目标蛋白进行分离和纯化。如His.Tag与Ni-ChelatingSepharose柱特异性结合。所述的标签蛋白或标签多肽可以在纯化后用位点特异性蛋白酶消化去除融合序列,如可用凝血酶、肠激酶和Xa因子等,以获得天然的目标蛋白。
本发明还包括含有本发明的核苷酸序列的宿主细胞,所述核苷酸序列经本领域已知的技术与一或多种异源控制区(如启动子和/或增强子)可操作相连。可以选择能调节插入的基因序列的表达,或能按照所需的特殊方式修饰和加工基因产物的宿主菌株。在某些诱导物的存在下,某些启动子启动的表达会升高;因此,可以控制经基因改造的多肽的表达。另外,不同宿主细胞具有特征性的和特殊的翻译、翻译后加工和修饰(如磷酸化、裂解)蛋白质的机制。可以选择适当的细胞系以确保对表达的外源蛋白质进行合乎需要的修饰和加工。
通过磷酸钙转染、DEAE-葡聚糖介导的转染、阳离子脂质介导的转染、电穿孔、转导、感染或其它方法,即可将本发明的核酸和核酸重组载体导入宿主细胞。所述方法描述于多个标准的实验室手册中,如Davis et al.,Basic Methods In MolecularBiology(1986)。
编码本发明的CehA突变体蛋白的多核苷酸可以与含有选择标记的载体连接以在宿主中增殖。一般说来,可在沉淀物,如磷酸钙沉淀物或其与带电脂质的复合物中导入质粒载体。如果载体是病毒,可使用适当的包装细胞系在体外对其进行包装,再转导至宿主细胞。
通过众所周知的技术可以鉴定出被成功转化的细胞,即含有本发明的DNA重组载体的细胞。例如,可培养导入表达重组载体所得的细胞以产生所需多肽。收集并裂解细胞,使用如Southem(1975)J.Mol.Biol.95,503或Berent et al(1985)Biotech.3,208所述的方法,检测其DNA内容物中DNA的存在。或者,使用抗体检测上清液中蛋白质的存在。
通过众所周知的方法从重组细胞培养物中回收和纯化本发明的CehA突变体蛋白较为有利,所述方法包括硫酸按或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析、疏水电荷作用层析和凝集素层析。在一些实施方案中,可使用高效液相层析(HPLC)进行纯化。
在一些实施方案中,可使用上述的一种或多种层析方法纯化本发明的CehA突变体蛋白。在其它实施方案中,可使用下述的一种或多种层析柱纯化本发明的CehA突变体蛋白,所述层析柱有:Q sepharose FF柱、SP sepharose FF柱、Q sepharose HighPerformance柱、Blue sepharose FF柱、Blue柱、Phenyl Sepharose FF柱、DEAESepharose FF、Ni-Chelating Sepharose FF柱或Methyl柱等。
另外,可使用国际公开号WO00/44772(全文列入本文作为参考)中描述的方法纯化本发明的CehA突变体蛋白。本领域技术人员可以容易地改动其中所述的方法以用于纯化本发明的CehA突变体蛋白。可以从包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞的原核或真核宿主经重组技术产生的产物中回收本发明的CehA突变体蛋白。
组合物
用于本发明或者含有本发明CehA突变体蛋白的组合物,包括赋形剂,此处也指“可接受的载体”。赋形剂是可以被处理的动物、植物、植物或动物材料、或环境(包括土壤或水样品)可进行处理的任何材料。这种赋形剂的例子包括水、盐水、Ringer’s溶液、葡萄糖溶液、Hank’s溶液和其它生理平衡盐溶液。非水载体,如固态油、芝麻油、油酸乙酯或一甘油三酯都可以使用。其它有用的剂型包括含有粘度增强剂的悬浮液,如羧甲基纤维素钠、山梨醇或葡聚糖。赋形剂液可含有微量添加剂,如增强等渗压性和化学稳定性的物质。缓冲液的例子包括磷酸缓冲液、碳酸氢盐缓冲液和Tris缓冲液,而防腐剂的例子包括硫柳汞或0-甲酚,福尔马林和苯甲醇。赋形剂也可用于增加组分的半衰期,例如,但不限于,聚合控释载体、生物可降解的植入物、脂质体、细菌、病毒、其它细胞、油、酯和乙二醇。
此外,CehA突变体蛋白可被固化到一组分中,该组分可增加氨基甲酸酯类杀虫剂或毒素的降解率和/或降解度,或可增加蛋白的稳定性。所述固化方法如本领域技术人员所理解的,可参考WO0064539公开了昆虫酯酶或其突变体能够固化在海绵或泡沫中使用的方法,它们的内容在此处完全引入。
本发明的一个实施方案是一种控释剂型,它能将含有CehA突变体蛋白的组分缓慢释放到动物、植物、动物或植物材料或环境(包括土壤和水样品)中。如此处所用,控释剂型配方是在一种控释载体中包含CehA突变体蛋白。合适的控释载体包括,但不限于,生物相容聚合物、其它聚合基质、胶囊、微囊剂、微粒、大丸剂、渗透泵、扩散装置、脂质体、脂球(liposphere)和透皮输送体系。优选的控释剂型是生物降解的(即生物可侵蚀的)。
本发明优选的控释剂型能将CehA突变体蛋白释放到用氨基甲酸酯类杀虫剂或毒素喷射区域的土壤或水中。该剂型优选释放1至12个月的时间段。本发明优选的控释剂型能有效处理优选至少约1个月,更优选至少约3个月,甚至更优选至少约6个月,甚至更优选至少约9个月,甚至更优选至少约12个月。CehA突变体蛋白(或表达CehA突变体蛋白的转化体)的浓度要必须产生有效降解氨基甲酸酯类杀虫剂或毒素的组分,该浓度的选择取决于被净化样品的性质、样品中氨基甲酸酯类杀虫剂或毒素的浓度和组分的配方。组分中CehA突变体蛋白(或表达CehA突变体蛋白的转化体)的有效浓度可用本领域技术人员所了解的实验方法容易地确定。
以下结合具体实施例,进一步阐明本发明。无需进一步描述,可以相信本领域技术人员可使用上文的描述和下文性的实施例来制备和利用本发明中检测到的改变并且实践所要求的方法。因此,下述工作实施例具体描述了本发明的某些实施方案,不能将其看成是对其余内容的限制。
下列实施例中所用试剂均为市售,除非特别说明。
实施例1.CehA(1-729)突变体蛋白转化体的制备
1.CehA(1-729)突变体蛋白(SEQ ID NO.6)编码基因的制备
CehA野生型的基因(AB069723.1:2645..5029)通过核酸合成仪获得的,在其5’端加入了编码6×His标签和EK酶位点的DNA序列(SEQ ID NO.8),并克隆在pET30的Nde I和Not I位点之间。将CehA(1-729)突变体的正向引物(5’>GCCCATATGGAATTCCACCATCACCATCAC<3’SEQ ID NO.9)和反向引物(5’>GGCGCGGCCGCTTAGATGGTAACAAACACTGGATAG<3’SEQ ID NO.10)用灭菌重蒸水溶解为终浓度为50μM。按以下体系组织反应(100μl体系)
按以下参数进行循环扩增:
94℃预变性10min,94℃变性30s,55℃退火30s,72℃延伸3min。共30个循环,最后一个循环延伸增加10min。
2.CehA(1-729)突变体的克隆
收集实施例1中扩增得到的各个反应体系,向体系中加入1/10体积的预冷乙酸钠(3M,pH5.2),再加入2倍体积的预冷无水乙醇,混匀,-20℃冰箱放置30min,沉淀DNA。4℃,12,000rpm离心15min将沉淀收集到管底。弃去上清,用70%乙醇洗沉淀。弃去上清,短暂离心后吸弃尽可能多的剩余液体,自然风干DNA。用20μl灭菌重蒸水重溶DNA。
按以下体系组织酶切反应体系(限制性内切酶购自Takara公司)。
10×buffer H 5μl
0.1%BSA 5μl
DNA(PCR产物) 20μl
Nde I(20u) 2μl
Not I(20u) 2μl
ddH2O 16μl
同样的反应体系酶切消化pET30a(+),37℃酶切消化4小时。
将酶切后的DNA用0.7%琼脂糖电泳分离,EB染色,紫外灯下切下含有对应大小片段的胶条。用胶回收试剂盒(MBI)回收DNA。
按以下体系组织连接反应(连接酶购自Progema公司)
10×连接酶缓冲液 1μl
pET30载体片段 1μl
DNA片段 7μl
T4 DNA连接酶(5u) 1μl
16℃连接过夜
用CaCl2法制备TOP 10感受态细胞,取5μl连接产物用热冲击法转化TOP 10感受态细胞。转化产物涂布含卡那50μg/ml的LB平板,37℃培养箱培养14-18h。挑选分离良好的菌落接种于含卡那50μg/ml的LB液体培养基中,37℃摇床震荡培养过夜。用碱裂解法小量抽提质粒,按以下体系组织酶切反应。
10×buffer H 2μl
0.1%BSA 2μl
DNA 10μl
Nde I(20u) 1μl
Not I(20u) 1μl
ddH2O 4μl
37℃酶切反应4小时,走0.7% TAE琼脂糖电泳检测,挑选插入片段大小合适的克隆,通过自动测序仪进一步测序鉴定,挑选序列正确的克隆。
实施例2-3.其它CehA突变体蛋白转化体的制备
CehA(1-659)突变体蛋白和CehA(1-568)突变体蛋白编码基因的制备中各自特异性引物如下:
突变体 引物序列
CehA(1-659)突 正向引物(SEQ ID NO.9):
变体(SEQ ID 5′>GCCCATATGGAATTCCACCATCACCATCAC<3′
NO.4) 反向引物(SEQ ID NO.11):
5′>GGCGCGGCCGCTTAGTTCAATAAATGATACCATGC<3′
CehA(1-568)突 正向引物(SEQ ID NO.9):
变体(SEQ ID 5′>GCCCATATGGAATTCCACCATCACCATCAC<3′
NO.2)
反向引物(SEQ ID NO.12):
5′>GGCGCGGCCGCTTAGTTCAATAAATGATACCATGC<3′
其它突变体的PCR扩增反应同上,只是将相应的正向和反向引物换为相应的正向和反向引物。其它的克隆和筛选操作同实施例1。
实施例4.重组蛋白的诱导表达
用CaCl2法制备BL21(DE3)感受态细胞。用碱裂解法分别提取实施例1-3中得到的重组质粒,热冲击法转化BL21(DE3)感受态细胞。转化产物涂布含卡那50μg/ml的LB平板,37℃培养箱培养14-18h。挑选分离良好的菌落接种于含卡那50μg/ml的LB液体培养基中,37℃摇床震荡培养过夜。按1∶100转接于4L含同样抗生素的LB培养基中,37℃震荡培养至OD600=0.8左右,加入IPTG至终浓度为0.5mM,转至30℃诱导表达4-6小时。取部分诱导后的产品电泳鉴定。同样的方法诱导野生型CehA表达。
实施例5.重组蛋白质的分离纯化
4℃,6000rpm离心收集菌体,弃去上清液。按每克菌体湿重:20ml的比例用A液(50mM Tris-HCl,pH 8.0)重悬菌体,超声波破碎细胞。12,000rpm离心15min,收集上清。用A液平衡Ni-Chelating Sepharose FF,将离心后收集的上清上Ni-ChelatingSepharose FF柱,用A液洗平,再用0-100%B(50mM Tris-HCl,500mM咪唑,pH8.0)对目的蛋白进行梯度洗脱,收集目的蛋白所在组份。用等体积A液稀释收集到的蛋白溶液,将稀释液上用A液预平衡的Q-Sepharose FF柱,用A液洗平,再用0-100%C(50mM Tris-HCl,500mM NaCl,pH 8.0)对目的蛋白进行洗脱。收集目的蛋白所在的组分,分别获得野生型CehA重组蛋白(SEQ ID NO.7)、CehA(1-749)(SEQ ID NO.6)、CehA(1-659)(SEQ ID NO.4)、CehA(1-568)(SEQ ID NO.2)。电泳分析表明蛋白质的纯度已达到90%以上,见图1提纯的CehA及其各个突变体,M:分子量标准,1:野生型CehA重组蛋白,2:CehA(1-749),3:CehA(1-659),4.CehA(1-568).分子量标准的大小(kDa)依次是(从上往下)116.0,66.2,45.0,35.0,25.0,18.4,14.4。
另外,纯化步骤中,在Ni-Chelating Sepharose分离后和Q-Sepharose分离前,可采用EK酶处理除去重组蛋白N端14个氨基酸,而相应获得SEQ ID NO.1、3、5所示蛋白:CehA(15-568)(SEQ ID NO.1)CehA(15-659)(SEQ ID NO.3)CehA(15-749)(SEQ ID NO.5)。
与CehA(15-568)(SEQ ID NO.1)比较,CehA(1-749)(SEQ ID NO.6)、CehA(15-749)(SEQ ID NO.5)同源性约为75%;CehA(1-659)(SEQ ID NO.4)、CehA(15-659)(SEQID NO.3)同源性约为85%、CehA(1-568)(SEQ ID NO.2)同源性约为95%。
实施例6.重组蛋白降解西维因的活性
重组蛋白为实施例5所制备的野生型CehA重组蛋白、CehA(1-749)、CehA(1-659)、CehA(1-568)
用Bradford法测定重组蛋白的浓度,用50mMTris-HCl,pH8.0调整浓度为0.1mg/ml用无水甲醇将西维因纯药溶解为1mg/ml的溶液,按下述体系组织2个反应体系(5ml)。
1.对照体系
西维因 0.1ml
重组蛋白溶液 0ml
50mM PB,pH7.0 4.9ml
2.反应体系
西维因 0.1ml
重组蛋白溶液 0.1ml
50mM PB,pH7.0 4.8ml
37℃反应30分钟后,按GB/T 20769-2006用LC-MS检测反应体系中的西维因的浓度。以对照体系的峰面积为100.0%,按以下公式计算各反应体系中农药的降解百分比,结果见图2:1:野生型CehA重组蛋白,2:CehA(1-749),3:CehA(1-659),4.CehA(1-568)。
降解西维因的百分率=(对照峰面积-样品峰面积)/对照峰面积×100%
上述结果表明:与野生型的CehA重组蛋白比较,CehA突变体蛋白降解西维因能力更强,活性更高。
实施例7.CehA突变体蛋白对农药降解的动物实验
重组蛋白为实施例5所制备的CehA(1-568)。
用Bradford法测定重组蛋白的浓度,用50mMTris-HCl,pH8.0调整浓度为0.1mg/ml用无水甲醇将西维因纯药溶解为1mg/ml的溶液,按以下体系组织反应
1.对照体系
西维因 0.1ml
CehA(1-568)蛋白溶液 0ml
50mM PB,pH7.0 4.9ml
2.反应体系
西维因 0.1ml
CehA(1-568)蛋白溶液 0.1ml
50mM PB,pH7.0 4.8ml
37℃反应2h后,取两只2L的烧杯,各加入1L自来水。一只烧杯里加入0.5ml加有CehA(1-568)的反应产物,另一只加入0.5ml未加CehA(1-568)的反应产物,并混匀。挑选10只大小一致,活性较强的小金鱼,每只烧杯里放入5只,观察金鱼的生存情况。加入未用CehA(1-568)处理样品的烧杯中的金鱼,在1小时内全部死亡,而加入用CehA(1-568)处理样品的烧杯中的金鱼,8h后无一死亡。
本发明的范围不受所述具体实施方案的限制,所述实施方案只欲作为阐明本发明各个方面的单个例子,本发明范围内还包括功能等同的方法和组分。实际上,除了本文所述的内容外,本领域技术人员参照上文的描述和附图可以容易地掌握对本发明的多种改进。所述改进也落入所附权利要求书的范围之内。上文提及的每篇参考文献皆全文列入本文作为参考。
序列表
<110>上海普天欣生物技术有限公司
<120>CehA突变体蛋白、基因、重组载体及其用途和制备方法
<130>说明书序列表
<160>12
<170>PatentIn version 3.3
<210>1
<211>554
<212>PRT
<213>artificial sequence
<400>1
Met Asp Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala
1 5 10 15
Thr Leu Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp
20 25 30
Ala Ile Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu
35 40 45
Gln Leu Ala Ala Met Gly Gln Pro Ile Ala Asp Ala Asp Met Ala Arg
50 55 60
Leu Ala Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala
65 70 75 80
Glu Ala Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys
85 90 95
Gly Gly Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val
100 105 110
Glu Gln Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser
115 120 125
Leu Thr Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg
130 135 140
Met Phe Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu
145 150 155 160
Ala Asp Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met
165 170 175
Ser Gln Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr
180 185 190
Lys Ile Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg
195 200 205
Leu Gly Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala
210 215 220
Val Ser Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser
225 230 235 240
Gln Pro Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly
245 250 255
Gly Cys Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr
260 265 270
Pro Pro Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His
275 280 285
Ile Tyr Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr
290 295 300
His Ile Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr
305 310 315 320
Val Arg Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg
325 330 335
Trp Ile Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu
340 345 350
His Ala Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala
355 360 365
Pro Glu Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly
370 375 380
Glu Val Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe
385 390 395 400
Ser Gly Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu
405 410 415
Gln Ala Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp
420 425 430
Arg Glu Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser
435 440 445
Ser Leu Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr
450 455 460
Pro Gly Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val
465 470 475 480
Ala Lys Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys
485 490 495
Ser Phe Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile
500 505 510
Pro Thr Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr
515 520 525
His Gly Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala
530 535 540
Glu Leu Asn Ala Trp Tyr His Leu Leu Asn
545 550
<210>2
<211>568
<212>PRT
<213>artificial sequence
<400>2
Met Glu Phe His His His His His His Asp Asp Asp Asp Lys Met Asp
1 5 10 15
Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala Thr Leu
20 25 30
Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp Ala Ile
35 40 45
Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu Gln Leu
50 55 60
Ala Ala Met Gly Gln Pro Ile Ala Asp Ala Asp Met Ala Arg Leu Ala
65 70 75 80
Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala Glu Ala
85 90 95
Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys Gly Gly
100 105 110
Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val Glu Gln
115 120 125
Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser Leu Thr
130 135 140
Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg Met Phe
145 150 155 160
Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu Ala Asp
165 170 175
Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met Ser Gln
180 185 190
Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr Lys Ile
195 200 205
Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg Leu Gly
210 215 220
Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala Val Ser
225 230 235 240
Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser Gln Pro
245 250 255
Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly Gly Cys
260 265 270
Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr Pro Pro
275 280 285
Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His Ile Tyr
290 295 300
Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr His Ile
305 310 315 320
Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr Val Arg
325 330 335
Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg Trp Ile
340 345 350
Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu His Ala
355 360 365
Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala Pro Glu
370 375 380
Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly Glu Val
385 390 395 400
Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe Ser Gly
405 410 415
Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu Gln Ala
420 425 430
Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp Arg Glu
435 440 445
Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser Ser Leu
450 455 460
Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr Pro Gly
465 470 475 480
Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val Ala Lys
485 490 495
Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys Ser Phe
500 505 510
Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile Pro Thr
515 520 525
Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr His Gly
530 535 540
Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala Glu Leu
545 550 555 560
Asn Ala Trp Tyr His Leu Leu Asn
565
<210>3
<211>645
<212>PRT
<213>artificial sequence
<400>3
Met Asp Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala
1 5 10 15
Thr Leu Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp
20 25 30
Ala Ile Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu
35 40 45
Gln Leu Ala Ala Met Gly Gln Pro Ile Ala Asp Ala Asp Met Ala Arg
50 55 60
Leu Ala Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala
65 70 75 80
Glu Ala Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys
85 90 95
Gly Gly Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val
100 105 110
Glu Gln Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser
115 120 125
Leu Thr Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg
130 135 140
Met Phe Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu
145 150 155 160
Ala Asp Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met
165 170 175
Ser Gln Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr
180 185 190
Lys Ile Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg
195 200 205
Leu Gly Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala
210 215 220
Val Ser Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser
225 230 235 240
Gln Pro Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly
245 250 255
Gly Cys Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr
260 265 270
Pro Pro Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His
275 280 285
Ile Tyr Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr
290 295 300
His Ile Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr
305 310 315 320
Val Arg Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg
325 330 335
Trp Ile Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu
340 345 350
His Ala Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala
355 360 365
Pro Glu Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly
370 375 380
Glu Val Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe
385 390 395 400
Ser Gly Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu
405 410 415
Gln Ala Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp
420 425 430
Arg Glu Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser
435 440 445
Ser Leu Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr
450 455 460
Pro Gly Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val
465 470 475 480
Ala Lys Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys
485 490 495
Ser Phe Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile
500 505 510
Pro Thr Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr
515 520 525
His Gly Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala
530 535 540
Glu Leu Asn Ala Trp Tyr His Leu Leu Asn Cys Gly Tyr Thr Leu Met
545 550 555 560
Met Ala Gly Glu Thr Asp Tyr Pro Cys Ile Val Pro Ser Val Asp Ser
565 570 575
Arg Pro Gly Ile Gly Arg Thr Tyr Val Lys Leu Pro Gln Arg Pro Val
580 585 590
Asp Asp Ala Gly Tyr Ser Ala Trp Val Asp Gly Leu Glu Asn Gly His
595 600 605
Leu Tyr Trp Gly Asp Gly Arg Thr His Phe Leu His Phe Thr Val Asn
610 615 620
Gly Arg Glu Ser Gly Lys Gln Pro Leu Ala Phe Val Arg Ala Ser Asn
625 630 635 640
Val Arg Val Ser Ala
645
<210>4
<211>659
<212>PRT
<213>artificial sequence
<400>4
Met Glu Phe His His His His His His Asp Asp Asp Asp Lys Met Asp
1 5 10 15
Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala Thr Leu
20 25 30
Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp Ala Ile
35 40 45
Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu Gln Leu
50 55 60
Ala Ala Met Gly Gln Pro Ile Ala Asp Ala Asp Met Ala Arg Leu Ala
65 70 75 80
Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala Glu Ala
85 90 95
Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys Gly Gly
100 105 110
Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val Glu Gln
115 120 125
Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser Leu Thr
130 135 140
Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg Met Phe
145 150 155 160
Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu Ala Asp
165 170 175
Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met Ser Gln
180 185 190
Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr Lys Ile
195 200 205
Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg Leu Gly
210 215 220
Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala Val Ser
225 230 235 240
Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser Gln Pro
245 250 255
Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly Gly Cys
260 265 270
Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr Pro Pro
275 280 285
Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His Ile Tyr
290 295 300
Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr His Ile
305 310 315 320
Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr Val Arg
325 330 335
Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg Trp Ile
340 345 350
Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu His Ala
355 360 365
Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala Pro Glu
370 375 380
Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly Glu Val
385 390 395 400
Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe Ser Gly
405 410 415
Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu Gln Ala
420 425 430
Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp Arg Glu
435 440 445
Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser Ser Leu
450 455 460
Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr Pro Gly
465 470 475 480
Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val Ala Lys
485 490 495
Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys Ser Phe
500 505 510
Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile Pro Thr
515 520 525
Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr His Gly
530 535 540
Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala Glu Leu
545 550 555 560
Asn Ala Trp Tyr His Leu Leu Asn Cys Gly Tyr Thr Leu Met Met Ala
565 570 575
Gly Glu Thr Asp Tyr Pro Cys Ile Val Pro Ser Val Asp Ser Arg Pro
580 585 590
Gly Ile Gly Arg Thr Tyr Val Lys Leu Pro Gln Arg Pro Val Asp Asp
595 600 605
Ala Gly Tyr Ser Ala Trp Val Asp Gly Leu Glu Asn Gly His Leu Tyr
610 615 620
Trp Gly Asp Gly Arg Thr His Phe Leu His Phe Thr Val Asn Gly Arg
625 630 635 640
Glu Ser Gly Lys Gln Pro Leu Ala Phe Val Arg Ala Ser Asn Val Arg
645 650 655
Val Ser Ala
<210>5
<211>735
<212>PRT
<213>artificial sequence
<400>5
Met Asp Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala
1 5 10 15
Thr Leu Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp
20 25 30
Ala Ile Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu
35 40 45
Gln Leu Ala Ala Met Gly Gln Pro Ile Ala Asp Ala Asp Met Ala Arg
50 55 60
Leu Ala Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala
65 70 75 80
Glu Ala Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys
85 90 95
Gly Gly Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val
100 105 110
Glu Gln Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser
115 120 125
Leu Thr Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg
130 135 140
Met Phe Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu
145 150 155 160
Ala Asp Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met
165 170 175
Ser Gln Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr
180 185 190
Lys Ile Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg
195 200 205
Leu Gly Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala
210 215 220
Val Ser Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser
225 230 235 240
Gln Pro Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly
245 250 255
Gly Cys Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr
260 265 270
Pro Pro Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His
275 280 285
Ile Tyr Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr
290 295 300
His Ile Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr
305 310 315 320
Val Arg Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg
325 330 335
Trp Ile Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu
340 345 350
His Ala Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala
355 360 365
Pro Glu Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly
370 375 380
Glu Val Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe
385 390 395 400
Ser Gly Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu
405 410 415
Gln Ala Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp
420 425 430
Arg Glu Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser
435 440 445
Ser Leu Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr
450 455 460
Pro Gly Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val
465 470 475 480
Ala Lys Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys
485 490 495
Ser Phe Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile
500 505 510
Pro Thr Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr
515 520 525
His Gly Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala
530 535 540
Glu Leu Asn Ala Trp Tyr His Leu Leu Asn Cys Gly Tyr Thr Leu Met
545 550 555 560
Met Ala Gly Glu Thr Asp Tyr Pro Cys Ile Val Pro Ser Val Asp Ser
565 570 575
Arg Pro Gly Ile Gly Arg Thr Tyr Val Lys Leu Pro Gln Arg Pro Val
580 585 590
Asp Asp Ala Gly Tyr Ser Ala Trp Val Asp Gly Leu Glu Asn Gly His
595 600 605
Leu Tyr Trp Gly Asp Gly Arg Thr His Phe Leu His Phe Thr Val Asn
610 615 620
Gly Arg Glu Ser Gly Lys Gln Pro Leu Ala Phe Val Arg Ala Ser Asn
625 630 635 640
Val Arg Val Ser Ala Thr Ile Ala Ala Met Leu Glu Leu Thr Pro Ser
645 650 655
Pro Glu Thr Val Gln Asn Ala Ser Glu Glu Pro Trp His Ile Glu His
660 665 670
Ala Arg Ile Gly Asn Ser Arg Lys Val Ala Val Glu Leu Ile Val Asn
675 680 685
Gly Val Ala Val Lys Arg Gln Glu Met Leu Ala Asp Gly Ser Leu Gln
690 695 700
Gln Ile Ser Phe Lys Glu Lys Ile Asp Arg Ser Ser Trp Ile Ala Met
705 710 715 720
Arg Val Leu Gly Ser Gly His Thr Tyr Pro Val Phe Val Thr Ile
725 730 735
<210>6
<211>749
<212>PRT
<213>artificial sequence
<400>6
Met Glu Phe His His His His His His Asp Asp Asp Asp Lys Met Asp
1 5 10 15
Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala Thr Leu
20 25 30
Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp Ala Ile
35 40 45
Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu Gln Leu
50 55 60
Ala Ala Met Gly Gln ProIle Ala Asp Ala Asp Met Ala Arg Leu Ala
65 70 75 80
Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala Glu Ala
85 90 95
Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys Gly Gly
100 105 110
Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val Glu Gln
115 120 125
Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser Leu Thr
130 135 140
Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg Met Phe
145 150 155 160
Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu Ala Asp
165 170 175
Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met Ser Gln
180 185 190
Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr Lys Ile
195 200 205
Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg Leu Gly
210 215 220
Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala Val Ser
225 230 235 240
Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser Gln Pro
245 250 255
Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly Gly Cys
260 265 270
Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr Pro Pro
275 280 285
Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His Ile Tyr
290 295 300
Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr His Ile
305 310 315 320
Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr Val Arg
325 330 335
Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg Trp Ile
340 345 350
Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu His Ala
355 360 365
Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala Pro Glu
370 375 380
Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly Glu Val
385 390 395 400
Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe Ser Gly
405 410 415
Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu Gln Ala
420 425 430
Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp Arg Glu
435 440 445
Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser Ser Leu
450 455 460
Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr Pro Gly
465 470 475 480
Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val Ala Lys
485 490 495
Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys Ser Phe
500 505 510
Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile Pro Thr
515 520 525
Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr His Gly
530 535 540
Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala Glu Leu
545 550 555 560
Asn Ala Trp Tyr His Leu Leu Asn Cys Gly Tyr Thr Leu Met Met Ala
565 570 575
Gly Glu Thr Asp Tyr Pro Cys Ile Val Pro Ser Val Asp Ser Arg Pro
580 585 590
Gly Ile Gly Arg Thr Tyr Val Lys Leu Pro Gln Arg Pro Val Asp Asp
595 600 605
Ala Gly Tyr Ser Ala Trp Val Asp Gly Leu Glu Asn Gly His Leu Tyr
610 615 620
Trp Gly Asp Gly Arg Thr His Phe Leu His Phe Thr Val Asn Gly Arg
625 630 635 640
Glu Ser Gly Lys Gln Pro Leu Ala Phe Val Arg Ala Ser Asn Val Arg
645 650 655
Val Ser Ala Thr Ile Ala Ala Met Leu Glu Leu Thr Pro Ser Pro Glu
660 665 670
Thr Val Gln Asn Ala Ser Glu Glu Pro Trp His Ile Glu His Ala Arg
675 680 685
Ile Gly Asn Ser Arg Lys Val Ala Val Glu Leu Ile Val Asn Gly Val
690 695 700
Ala Val Lys Arg Gln Glu Met Leu Ala Asp Gly Ser Leu Gln Gln Ile
705 710 715 720
Ser Phe Lys Glu Lys Ile Asp Arg Ser Ser Trp Ile Ala Met Arg Val
725 730 735
Leu Gly Ser Gly His Thr Tyr Pro Val Phe Val Thr Ile
740 745
<210>7
<211>794
<212>PRT
<213>Rhizobium sp.
<400>7
Met Asp Gln Pro Phe Lys Pro Asp Arg Arg Gln Leu Leu Ala Gly Ala
1 5 10 15
Thr Leu Leu Leu Gly Ala Ser His Trp Pro Val Phe Ala Ser Thr Asp
20 25 30
Ala Ile Glu Pro Gln Pro Tyr Phe Ala Ser Val Lys Arg Ala Val Glu
35 40 45
Gln Leu Ala Ala Met Gly Gln Pro Ile Ala Asp Ala Asp Met Ala Arg
50 55 60
Leu Ala Ser Leu Phe Ser Arg Glu Asp Ala Glu Ala Val Ile Ala Ala
65 70 75 80
Glu Ala Leu Leu Glu Arg Tyr Thr Leu Ala Arg Val Thr Leu Asp Lys
85 90 95
Gly Gly Met Gly Ala Ala Ala Leu Gly Gly Ala Lys Arg His Leu Val
100 105 110
Glu Gln Gly Trp Thr Ala Phe Leu Val Arg Val Ser Asn Pro Ser Ser
115 120 125
Leu Thr Gln Ala Phe Glu Ile Tyr Ser Gly Ser Ala Met Pro Ala Arg
130 135 140
Met Phe Pro Gln Ala Ser Lys Phe Ala Ala Glu Gln Lys Ala Tyr Leu
145 150 155 160
Ala Asp Thr Val Arg Lys Glu Ala Leu Ile Glu Arg Met Trp Leu Met
165 170 175
Ser Gln Ile Glu Ala Ser Pro Val Leu Ser Gly Asn Val Val Glu Tyr
180 185 190
Lys Ile Ala Thr Ile Tyr Ser Arg Asp Arg Gly Arg Lys Thr Gly Arg
195 200 205
Leu Gly Phe Gly Ala Gly Ile Leu Gln Asp Asn Pro Thr Trp Gly Ala
210 215 220
Val Ser Arg Ala Ser Val Ala Asn Pro Leu Val Thr Asp Phe Val Ser
225 230 235 240
Gln Pro Ser Arg Asp Ile Gln Leu Gln Ile Leu Asp Asp Asp Gly Gly
245 250 255
Gly Cys Met Ala Ser Leu Met Ile His Asp Ala Asn Lys His Ile Tyr
260 265 270
Pro Pro Gln Val Met Arg Leu Ala Pro Asp Leu Ala Phe Gln Pro His
275 280 285
Ile Tyr Arg Ala Asp Gly Glu Thr Val Arg Leu Pro Asp Gly Glu Tyr
290 295 300
His Ile Met Val Arg Arg Gly Pro Glu Tyr Leu Val Gln Arg Ala Thr
305 310 315 320
Val Arg Val Ser Ala Ser Asp Ala Arg Ile Ala Val Arg Leu Lys Arg
325 330 335
Trp Ile Asp Pro Ala Lys Trp Gly Trp Tyr Ser Gly Asp Thr His Leu
340 345 350
His Ala Ala Gly Cys Ala His Tyr Met Leu Pro Thr Glu Gly Val Ala
355 360 365
Pro Glu Thr Met Ile Arg His Ile Arg Gly Glu Ala Leu Ser Val Gly
370 375 380
Glu Val Leu Thr Trp Ala Gly Gly Tyr Ser Tyr Gln Lys Gln Phe Phe
385 390 395 400
Ser Gly Ala Ala Ile Ser Pro Glu Ala Arg Leu Glu His Pro Gln Leu
405 410 415
Gln Ala Ala Asn Asn Ala Asp Trp Lys Pro Met Pro Thr Pro Lys Asp
420 425 430
Arg Glu Ser Met Leu Arg Tyr Asp Leu Glu Ile Ser Gly Phe Pro Ser
435 440 445
Ser Leu Ser Gly His Leu Ile Leu Met Arg Leu Lys Glu Leu Ser Tyr
450 455 460
Pro Gly Thr His Ala Val Glu Asp Trp Pro Ser Trp Asn Leu Pro Val
465 470 475 480
Ala Lys Trp Ala Lys Ala Gln Gly Ala Leu Val Gly Tyr Thr His Cys
485 490 495
Ser Phe Gly Met Ile Val Gly Thr Asn Ala Leu Pro Asn Tyr Glu Ile
500 505 510
Pro Thr Phe Asn Ser Val Gly Thr Asn Glu Ala Ile Val Gly Val Thr
515 520 525
His Gly Ala Val Asp Phe Leu Ala Gly Cys Asn Gly Pro Pro Ala Ala
530 535 540
Glu Leu Asn Ala Trp Tyr His Leu Leu Asn Cys Gly Tyr Thr Leu Met
545 550 555 560
Met Ala Gly Glu Thr Asp Tyr Pro Cys Ile Val Pro Ser Val Asp Ser
565 570 575
Arg Pro Gly Ile Gly Arg Thr Tyr Val Lys Leu Pro Gln Arg Pro Val
580 585 590
Asp Asp Ala Gly Tyr Ser Ala Trp Val Asp Gly Leu Glu Asn Gly His
595 600 605
Leu Tyr Trp Gly Asp Gly Arg Thr His Phe Leu His Phe Thr Val Asn
610 615 620
Gly Arg Glu Ser Gly Lys Gln Pro Leu Ala Phe Val Arg Ala Ser Asn
625 630 635 640
Val Arg Val Ser Ala Thr Ile Ala Ala Met Leu Glu Leu Thr Pro Ser
645 650 655
Pro Glu Thr Val Gln Asn Ala Ser Glu Glu Pro Trp His Ile Glu His
660 665 670
Ala Arg Ile Gly Asn Ser Arg Lys Val Ala Val Glu Leu Ile Val Asn
675 680 685
Gly Val Ala Val Lys Arg Gln Glu Met Leu Ala Asp Gly Ser Leu Gln
690 695 700
Gln Ile Ser Phe Lys Glu Lys Ile Asp Arg Ser Ser Trp Ile Ala Met
705 710 715 720
Arg Val Leu Gly Ser Gly His Thr Tyr Pro Val Phe Val Thr Ile Gly
725 730 735
Asn Lys Pro Ile Arg Ala Ser Arg Arg Ser Ala Glu Trp Leu Arg Thr
740 745 750
Cys Val Asp Ala Leu Trp Asn Glu Lys His Ser Leu Ile Arg Asp Thr
755 760 765
Glu Leu Ala Asp Ala Ala Ala Ala Tyr Asp His Ala Arg Gln Thr Tyr
770 775 780
Asp Arg Ile Ile Ala Glu Ser Asp Leu Thr
785 790
<210>8
<211>2438
<212>DNA
<213>artificial sequence
<400>8
catatggaat tccaccatca ccatcaccat gacgatgacg ataaaatgga ccagccattc 60
aagcctgatc gtcgtcaatt gttagcaggt gccaccttgt tattgggtgc atctcactgg 120
ccagtgtttg cctccaccga cgcaatcgag cctcagccat atttcgcctc tgttaaacgt 180
gcagtcgaac aattagccgc aatgggtcag cctattgccg atgcagacat ggcccgtttg 240
gcatccttat tttctcgtga ggatgccgaa gcagtgatcg ccgcagaggc cttgttagaa 300
cgttacacct tggcacgtgt taccttagac aagggtggta tgggtgccgc agccttgggt 360
ggtgcaaaac gtcatttagt cgagcaaggt tggaccgcct tcttggtgcg tgtttccaac 420
ccatcttcct taacccaggc atttgaaatt tattctggtt ccgccatgcc tgcacgtatg 480
ttcccacaag cctctaagtt tgcagccgag cagaaagcat acttggccga taccgtccgt 540
aaggaagcat taatcgagcg tatgtggttg atgtcccaaa ttgaagcctc tcctgtgtta 600
tccggtaatg ttgtcgagta taaaatcgca accatttact ctcgtgaccg tggtcgtaag 660
accggtcgtt tgggtttcgg tgccggtatc ttacaggata acccaacctg gggtgcagtg 720
tcccgtgcct ctgttgcaaa tcctttggtc accgactttg tgtcccaacc atctcgtgat 780
attcagttac aaatcttgga cgatgacggt ggtggttgca tggcctcctt aatgattcac 840
gatgcaaaca aacatatcta tcctccacag gtcatgcgtt tggcccctga cttagcattc 900
caaccacaca tttaccgtgc cgatggtgaa accgtgcgtt tgcctgacgg tgagtatcat 960
atcatggttc gtcgtggtcc agaatactta gtccagcgtg caaccgtgcg tgtttctgcc 1020
tccgatgcac gtattgccgt ccgtttgaag cgttggatcg accctgcaaa atggggttgg 1080
tattctggtg atacccactt acatgccgca ggttgtgccc actacatgtt gccaaccgag 1140
ggtgtggcac ctgaaaccat gattcgtcat atccgtggtg aggccttatc cgttggtgaa 1200
gtcttgacct gggcaggtgg ttattcttac caaaagcagt ttttctccgg tgccgcaatt 1260
tctccagagg cccgtttaga acaccctcaa ttgcaggcag ccaataacgc agactggaaa 1320
ccaatgccta ccccaaagga tcgtgagtcc atgttacgtt atgacttgga aatctctggt 1380
tttccttcct ctttatccgg tcatttgatt ttaatgcgtt tgaaagagtt atcttaccca 1440
ggtacccacg ccgtggaaga ttggccttcc tggaatttgc cagttgcaaa gtgggccaaa 1500
gcacaaggtg ccttagtcgg ttatacccat tgctctttcg gtatgatcgt gggtaccaac 1560
gcattgccta attacgagat tccaaccttt aactccgttg gtaccaatga agccatcgtc 1620
ggtgtgaccc acggtgcagt tgacttctta gccggttgta acggtcctcc agcagccgag 1680
ttgaatgcat ggtatcattt attgaactgc ggttacacct taatgatggc cggtgaaacc 1740
gattatcctt gtattgtccc atctgtggac tcccgtcctg gtatcggtcg tacctacgtt 1800
aagttgccac agcgtcctgt cgatgacgca ggttattctg cctgggtgga tggtttagag 1860
aatggtcact tgtactgggg tgacggtcgt acccattttt tacacttcac cgttaacggt 1920
cgtgaatccg gtaaacaacc attggcattt gtccgtgcct ctaatgtgcg tgtttccgca 1980
accattgccg caatgttaga gttgacccct tctccagaaa ccgtccagaa cgcctccgag 2040
gaaccttggc atatcgagca cgcacgtatt ggtaattctc gtaaggtggc cgttgaatta 2100
atcgtcaacg gtgtggcagt taaacgtcaa gagatgttgg ccgatggttc cttacagcaa 2160
atttctttca aggaaaaaat cgaccgttcc tcttggattg caatgcgtgt cttgggttcc 2220
ggtcatacct atccagtgtt tgttaccatc ggtaataagc ctattcgtgc ctctcgtcgt 2280
tccgcagagt ggttacgtac ctgcgtcgat gccttgtgga acgaaaaaca ctctttaatc 2340
cgtgacaccg agttggcaga tgccgcagcc gcatacgacc atgcccgtca gacctatgat 2400
cgtattatcg cagaatccga cttaacctaa gcggccgc 2438
<210>9
<211>30
<212>DNA
<213>artificial sequence
<400>9
gcccatatgg aattccacca tcaccatcac 30
<210>10
<211>36
<212>DNA
<213>artificial sequence
<400>10
ggcgcggccg cttagatggt aacaaacact ggatag 36
<210>11
<211>35
<212>DNA
<213>artificial sequence
<400>11
ggcgcggccg cttagttcaa taaatgatac catgc 35
<210>12
<211>35
<212>DNA
<213>artificial sequence
<400>12
ggcgcggccg cttagttcaa taaatgatac catgc 35