发明内容
本申请提供了一种利用生物多酶偶联法氧化还原不对称制备L-草铵膦的方法,其以D,L-草铵膦为原料,经多酶催化体系获得L-草铵膦。该方法原料转化率高、分离精制过程简单、产品收率高、生产成本低,易于工业化。
在一些实施方式中,本申请提供了一种制备L-草铵膦的方法,其包括:
a)在(R)-转氨酶和氨基受体的存在下,使D,L-草铵膦发生转氨反应得到2-羰基-4-[羟基(甲基)膦酰基]丁酸和氨基受体的加氨基产物;
b)在(S)-转氨酶和氨基供体的存在下,使步骤a)中得到的2-羰基-4-[羟基(甲基)膦酰基]丁酸发生转氨反应得到L-草铵膦和氨基供体的脱氨基产物。
在步骤a)中,以外消旋D,L-草铵膦为底物,在微量氨基受体例如丙酮酸(反应后无需分离)存在的条件下,(R)-转氨酶将D-草铵膦的氨基转移到氨基受体上,脱氨生成2-羰基-4-(羟基甲基膦酰基)丁酸(PPO),而L-草铵膦不参与反应而完全保留。
转氨酶(Amine Transaminase,ATA,EC 2.6.1.X)属于转移酶类,是催化1个氨基供体(氨基酸或简单的胺)上的氨基转移到前手性的受体酮,得到手性胺和副产物酮或者α-酮酸的一类酶,其催化的反应是可逆的。根据氨基被转移到不同位置的氨基受体上,转氨酶又可以被分为α-转氨酶和ω-转氨酶(EC 2.6.1.1)。ω-转氨酶反应过程可分为两步,第一步反应是在ω-转氨酶的作用下将氨基供体上的氨基转移到PLP的羰基上,从而形成5-磷酸吡哆胺(PMP)和与氨基供体对应的酮;第二步反应同样在ω-转氨酶的作用下将PMP上的氨基转移到氨基受体上,PMP又转变为PLP实现循环。转氨酶的立体选择性可在包含手性中心的底物外消旋混合物的外消旋拆分中测定。ω-转氨酶根据立体选择性可分为“(R)-转氨酶”((R)-amine transaminase)和(S)-转氨酶((S)-amine transaminase)。
根据本申请,(R)-转氨酶可以是在存在酮底物(例如丙酮酸)的情况下,优先从外消旋D,L-草铵膦中诱导D-草铵膦的转氨反应的酶。(R)-转氨酶可以为本领域已知的任何具有(R)-转氨酶活性的酶。在一些实施方式中,所述(R)-转氨酶为选自以下中的任一种:APH1(例如NCBI序列号为WP_015938787.1)、HEA-2(例如NCBI序列号为ABX05998.1)、TSP-1(例如NCBI序列号为WP_013128145.1)、DEP-2(例如NCBI序列号为WP_013615256.1)和MPH(例如NCBI序列号为WP_013863226.1)。在一些实施方式中,所述(R)-转氨酶为APH1。在一些实施方式中,所述(R)-转氨酶来自Pseudarthrobacter chlorophenolicus,例如来自Pseudarthrobacter chlorophenolicus的APH1。在一些实施方式中,所述(R)-转氨酶的氨基酸序列与SEQ ID No.1所示的氨基酸序列具有至少70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述(R)-转氨酶的核苷酸序列与SEQ ID No.2所示的核苷酸序列具有至少60%、70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述(R)-转氨酶的氨基酸序列为SEQ ID No.1。在一些实施方式中,所述(R)-转氨酶的核苷酸序列为SEQ ID No.2。
在一些实施方式中,步骤a)中的所述氨基受体为丙酮酸、丙酮酸甲酯或丙酮酸乙酯。在一些优选的实施方式中,步骤a)中的所述氨基受体为丙酮酸。
在一些实施方式中,步骤a)中所述氨基受体的加氨基产物为D-丙氨酸。
在一些实施方式中,步骤a)中另外存在能够使所述氨基受体的加氨基产物转化为所述氨基受体的催化酶。这样,氨基受体得到氨基转化为的加氨基产物在所述催化酶的作用下又转化回氨基受体,从而在使反应体系具有更好的催化效率的同时实现氨基受体的原位再生,避免了大量氨基受体的使用。
在一些实施方式中,步骤a)中能够使所述氨基受体的加氨基产物转化为所述氨基受体的所述催化酶为D-氨基酸氧化酶,其使得D-丙氨酸转化为丙酮酸。
本申请所述的D-氨基酸氧化酶(EC 1.4.3.3)可以为本领域已知的任何具有D-氨基酸氧化酶活性的酶。在一些实施方式中,所述D-氨基酸氧化酶来自Rhodotorula sp.。在一些实施方式中,所述D-氨基酸氧化酶来自Rhodotorula sp.CCFEE 5036。在一些实施方式中,所述D-氨基酸氧化酶的氨基酸序列与SEQ ID No.3所示的氨基酸序列具有至少70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述D-氨基酸氧化酶的核苷酸序列与SEQ ID No.4所示的核苷酸序列具有至少60%、70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述D-氨基酸氧化酶的氨基酸序列为SEQ ID No.3。在一些实施方式中,所述D-氨基酸氧化酶的核苷酸序列为SEQ ID No.4。
在一些实施方式中,步骤a)的反应体系中还包括过氧化氢酶(EC 1.11.1.6)。所述过氧化氢酶用于去除副产物过氧化氢,因为过氧化氢积累会对酶催化剂有毒害作用。过氧化氢酶可以为本领域已知的任何具有过氧化氢酶活性的酶,例如购自宁夏夏盛实业集团有限公司,商品编号为CAT-400的过氧化氢酶。
在一些实施方式中,步骤a)的反应在反应缓冲液中进行。优选地,所述反应缓冲液是pH为8-9的磷酸氢二钠-磷酸二氢钠缓冲液。在pH为8-9的磷酸氢二钠-磷酸二氢钠缓冲液中进行反应时可以获得更优的反应效率。
在一些实施方式中,步骤a)的转氨反应的pH值为6-9,例如7-9或8-9。
在一些实施方式中,在步骤a)中,反应开始时氨基受体与D,L-草铵膦的摩尔比为1:500-1:5。
在一些实施方式中,步骤a)的反应体系中还包括辅酶磷酸吡哆醛。在一些实施方式中,磷酸吡哆醛与底物的摩尔比为1:10-1:200。在一些实施方式中,以摩尔浓度计,磷酸吡哆醛的添加量为0.1-2mM;更优选为1mM。
在一些实施方式中,步骤a)的转氨反应的温度为25-45℃,例如30-45℃,35-45℃等;时间为10-48小时,例如14-48小时,24-48小时,例如15小时、30小时等。
在步骤b)中,步骤a)中产生的PPO被(S)-转氨酶催化还原为L-草铵膦,从而实现D,L-草铵膦的原位去消旋化,得到光学纯的L-草铵膦。
根据本发明,(S)-转氨酶是在存在酮底物比如丙酮酸的情况下,优先从外消旋D,L-草铵膦诱导L-草铵膦的转氨反应的酶。本申请所述的(S)-转氨酶可以为本领域已知的任何具有(S)-转氨酶活性的酶。在一些实施方式中,所述(S)-转氨酶为选自以下中的任一种:ATA-0602(例如NCBI序列号为WP_012404126.1)、ATA-0607(例如NCBI序列号为WP_012404467.1)、ATA-0611(EN3)(例如NCBI序列号为WP_012403900.1)、ATA-0701(例如NCBI序列号为WP_013601929.1)和ATA-0801(例如NCBI序列号为WP_013614910.1)。在一些实施方式中,所述(R)-转氨酶为ATA-0611(EN3)。在一些实施方式中,所述(S)-转氨酶来自Paraburkholderia phymatum,例如来自Paraburkholderia phymatum的ATA-0611(EN3)。在一些实施方式中,所述(S)-转氨酶的氨基酸序列与SEQ ID No.7所示的氨基酸序列具有至少70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述(S)-转氨酶的核苷酸序列与SEQ ID No.8所示的核苷酸序列具有至少60%、70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述(S)-转氨酶的氨基酸序列为SEQ ID No.7。在一些实施方式中,所述(S)-转氨酶的核苷酸序列为SEQ ID No.8。
在一些实施方式中,步骤b)中的所述氨基供体为L-丙氨酸或异丙胺。在一些优选的实施方式中,所述氨基供体为L-丙氨酸。
在一些实施方式中,步骤b)中的所述氨基供体的脱氨基产物为丙酮酸。
在一些实施方式中,步骤b)中另外存在能够除去所述氨基供体的脱氨基产物的催化酶,在该催化酶的存在下,所述反应副产物(氨基供体的脱氨基产物,例如丙酮酸)通过所述催化酶被除去以利于完全转化。
在一些实施方式中,步骤b)中能够除去所述氨基供体的脱氨基产物的所述催化酶为丙酮酸脱羧酶。
本申请所述的丙酮酸脱羧酶(EC 4.1.1.1)可以为本领域已知的任何具有丙酮酸脱羧酶活性的酶。在一些实施方式中,所述丙酮酸脱羧酶是Zymobacter palmae。在一些实施方式中,所述丙酮酸脱羧酶的氨基酸序列与SEQ ID No.5所示的氨基酸序列具有至少70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述丙酮酸脱羧酶的核苷酸序列与SEQ ID No.6所示的核苷酸序列具有至少60%、70%、80%、90%、91%、91%、93%、94%、95%、96%、97%、98%或99%或100%的同一性。在一些实施方式中,所述丙酮酸脱羧酶的氨基酸序列为SEQ ID No.5。在一些实施方式中,所述丙酮酸脱羧酶的核苷酸序列为SEQ ID No.6。
本申请所述的酶,例如(R)-转氨酶、(S)-转氨酶、能够使所述氨基受体的加氨基产物转化为所述氨基受体的催化酶、能够除去所述氨基供体的脱氨基产物的催化酶和所述过氧化氢酶的形式可以为纯化的酶;部分纯化的酶;无细胞提取物或粗细胞提取物;液体、粉末或固定形式;含有酶的可透化处理的细胞、完整细胞或完整发酵液或其他任何合适形式。因此,在一些实施方式中,所述(R)-转氨酶、(S)-转氨酶、能够使所述氨基受体的加氨基产物转化为所述氨基受体的催化酶、能够除去所述氨基供体的脱氨基产物的催化酶和所述过氧化氢酶的形式各自独立地选自:部分纯化的酶;无细胞提取物或粗细胞提取物;液体、粉末或固定形式;含有酶的可透化处理的细胞、完整细胞或完整发酵液、冻干细胞或其任何组合。
在一些实施方式中,步骤b)的转氨反应的温度为25-45℃,例如30-45℃,35-45℃等;时间为10-48小时,例如14-48小时,24-48小时,例如15小时、30小时等。
在一些实施方式中,在步骤b)中,反应开始时氨基供体与底物的摩尔比为1:2~5:1,例如1:1、1.5:1、2:1、3:1或4:1。
在一些实施方式中,步骤b)的转氨反应的pH值为6-9,例如7-9或8-9。
在一些实施方式中,步骤b)的反应在反应缓冲液中进行。优选地,所述反应缓冲液是pH为8-9的磷酸氢二钠-磷酸二氢钠缓冲液。在pH为8-9的磷酸氢二钠-磷酸二氢钠缓冲液中进行反应时可以获得更优的反应效率。
在一些实施方式中,步骤b)的反应体系中还包括辅酶磷酸吡哆醛。在一些实施方式中,磷酸吡哆醛与底物的摩尔比为1:10-1:200。在一些实施方式中,以摩尔浓度计,磷酸吡哆醛的添加量为0.1-2mM;更优选为1mM。
在一些优选的实施方式中,本申请提供了一种生产L-草铵膦的方法,其以D,L-草铵膦为原料,经多酶催化体系获得L-草铵膦,所述多酶催化体系包括:(R)-转氨酶、D-氨基酸氧化酶、(S)-转氨酶和丙酮酸脱羧酶,以及任选地过氧化氢酶。所述方法包括:
a)在(R)-转氨酶、D-氨基酸氧化酶和丙酮酸的存在下,使D,L-草铵膦发生转氨反应得到2-羰基-4-[羟基(甲基)膦酰基]丁酸并使得到的D-丙氨酸转化为丙酮酸;
b)在(S)-转氨酶、丙酮酸脱羧酶和L-丙氨酸的存在下,使步骤a)中获得的2-羰基-4-[羟基(甲基)膦酰基]丁酸发生转氨反应得到L-草铵膦并除去得到的丙酮酸。
在一些实施方式中,步骤a)的反应完成后和进行步骤b)之前,可以对步骤a)得到的反应混合物进行热处理,从而灭活催化剂,即步骤a)中所用的酶。加热温度和时间为使反应混合物中的酶失活的任何合适温度和时间。在一些实施方式中,加热的温度为65℃以上,例如75℃以上。在一些实施方式中,加热的时间为15分钟以上,例如15分钟至1小时,例如20、30、40、50分钟。
本申请所述的方法可以在一个或更多个反应容器中进行。优选地,本申请所述的方法在一个反应容器中进行(即“一锅两步法”)。
在一些优选的实施方式中,步骤a)中使用的(R)-转氨酶和能够使所述氨基受体的加氨基产物转化为所述氨基受体的催化酶(例如D-氨基酸氧化酶)由第一重组微生物共表达。因此,步骤a)可以包括:在共表达(R)-转氨酶和能够使氨基受体的加氨基产物转化为所述氨基受体的催化酶的第一重组微生物和所述氨基受体的存在下,使D,L-草铵膦发生转氨反应得到2-羰基-4-[羟基(甲基)膦酰基]丁酸并使得到的所述加氨基产物转化为所述氨基受体。利用所述第一重组微生物能够赋予本申请方法更高的催化效率。可以利用本领域已知的任何方法构建所述第一重组微生物。例如,所述第一重组微生物可以如下构建:构建含所述(R)-转氨酶基因和所述催化酶基因的重组载体,将所述重组载体转化至微生物,对获得的重组微生物进行诱导培养,分离培养液得到含有(R)-转氨酶基因和所述催化酶基因的第一重组微生物。优选地,按照10000rpm离心10min后的菌体湿重计,所述第一重组微生物的添加量为5-200g湿菌体/L反应液,或者,以干菌体重量计,所述第一重组微生物的添加量为1-50g干菌体/L反应液。
在一些优选的实施方式中,步骤b)中使用的(S)-转氨酶和所述能够除去所述氨基供体的脱氨基产物的催化酶由第二重组微生物共表达。因此,步骤b)可以包括:在共表达(S)-转氨酶和所述能够除去所述氨基供体的脱氨基产物的催化酶的第二重组微生物和氨基供体的存在下,使步骤a)获得的2-羰基-4-[羟基(甲基)膦酰基]丁酸发生转氨反应得到L-草铵膦并除去得到的反应副产物,即所述氨基供体的脱氨基产物。利用所述第二重组微生物能够赋予本申请方法更高的催化效率。可以利用本领域已知的任何方法构建所述第二重组微生物。例如,所述第二重组微生物可以如下构建:构建含所述(S)-转氨酶和所述催化酶基因的重组载体,将所述重组载体转化至微生物,对获得的重组微生物进行诱导培养,分离培养液得到含有(S)-转氨酶和所述催化酶基因的第二重组微生物。优选地,按照10000rpm离心10min后的菌体湿重计,所述第二重组微生物的添加量为5-200g湿菌体/L反应液,或者,以干菌体重量计,所述第二重组微生物的添加量为1-50g干菌体/L反应液。
所述第一和第二重组微生物可以是任何适用于酶表达的工程菌。在一些实施方式中,所述第一和第二重组微生物各自独立地属于以下属中的一种:酵母属(Saccharomyces)、曲霉属(Aspergillus)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、汉逊酵母属(Hansenula)、腐质霉属(Humicola)、伊萨酵母属(Issatchenkia)、毛孢子菌属(Trichosporon)、酒香酵母属(Brettanomyces)、管囊酵母属(Pachysolen)、耶氏酵母属(Yarrowia)或埃希氏杆菌属(Escherichia)。在一些优选的实施方式中,所述第一和第二重组微生物各自独立地选自酿酒酵母(Saccharomycescerevisiae)、解脂耶氏酵母(Yarrowia lipolitica)、克鲁斯假丝酵母(Candida krusei)、东方伊萨酵母(Issatchenkia orientalis)或大肠杆菌(Escherichia coli)。在一些更优选的实施方式中,所述第一和第二重组微生物均是大肠杆菌。
本申请方法的产率可以通过本领域已知的任何方法测量。例如,可以通过手性HPLC来测量所获得的草铵膦产物中两个构型含量。在一些实施方式中,获得的草铵膦产物的对映体过量(e.e.)至少为80%、85%、90%、95%、96%、97%、98%、99%或99.9%。
本申请方法具有以下有益效果:
(1)D-氨基酸氧化酶的引入使反应体系具有更好的催化效率,以外消旋D,L-草铵膦为底物进行催化反应时,转化率远高于单酶催化,PPO产率也大幅提升。
(2)D-草铵膦被氧化为2-羰基-4-[羟基(甲基)膦酰基]丁酸,L-草铵膦因不参与反应而被完全保留;产物2-羰基-4-[羟基(甲基)膦酰基]丁酸又可以被转氨酶继续催化还原为L-草铵膦,进而实现D,L-草铵膦的原位去消旋化。而传统的氧化方法则需要将D-草铵膦和L-草铵膦都转化为2-羰基-4-[羟基(甲基)膦酰基]丁酸,造成了原料的浪费。
(3)能够直接以D,L-草铵膦为底物进行拆分,无需昂贵的拆分试剂,也无需合成草铵膦衍生物,更无需对D-草铵膦进行分离、再消旋、再拆分等步骤。
(4)克服了化学法合成L-草铵膦前体2-羰基-4-[羟基(甲基)膦酰基]丁酸的缺陷,是一种绿色,环保,低碳的工艺路线,适合大规模工业化生产应用。
对序列表的描述
SEQ ID NO:1是来源于Pseudarthrobacter chlorophenolicus的注释为(R)-转氨酶(APH1)的氨基酸序列。
SEQ ID NO:2是来源于Pseudarthrobacter chlorophenolicus的注释为(R)-转氨酶(APH1)的核苷酸序列。
SEQ ID NO:3是来源于Rhodotorula sp.CCFEE 5036的注释为D-氨基酸氧化酶(DAAO)的氨基酸序列。
SEQ ID NO:4是来源于Rhodotorula sp.CCFEE 5036的注释为D-氨基酸氧化酶(DAAO)的核苷酸序列。
SEQ ID NO:5是来源于Zymobacter palmae注释为丙酮酸脱羧酶(PDC)的氨基酸序列。
SEQ ID NO:6是来源于Zymobacter palmae注释为丙酮酸脱羧酶(PDC)的核苷酸序列。
SEQ ID NO:7是来源于Paraburkholderia phymatum STM815注释为(S)-转氨酶(EN3)的氨基酸序列。
SEQ ID NO:8是来源于Paraburkholderia phymatum STM815注释为(S)-转氨酶(EN3)的核苷酸序列。
具体实施方式
实施例
材料和方法
基因工程所用材料和试剂:基因组提取试剂盒、质粒提取试剂盒、DNA纯化回收试剂盒购自康宁生命科学(吴江)有限公司;一步克隆试剂盒是诺唯赞有限公司(Vazyme)的
MultiS One Step Cloning Kit;E.coli DH5α、E.coli BL21(DE3)、质粒pET-28a(+)、pCDFduet-1载体等购自上海旭冠生物科技发展有限公司;DNA marker、低分子量标准蛋白、蛋白胶等购自北京GenStar有限公司;过氧化氢酶购自宁夏夏盛实业集团有限公司,商品编号为CAT-400。以上试剂使用方法参考商品说明书。
序列合成,序列测序工作由杭州擎科梓熙生物技术有限公司完成。
催化工艺所用试剂2-羰基-4-[羟基(甲基)膦酰基]丁酸(简称PPO),D,L-草铵膦购自永农生物科学有限公司;其他常用试剂购自国药集团化学试剂有限公司。
通过高效液相色谱(HPLC)检测反应的进行,并对PPO进行分析。HPLC分析方法为:色谱柱/PBr;柱温/30℃;流速/0.8mL/min;检测波长/210nm;流动相:50mM(NH4)2HPO4,加入12%的乙腈。
通过手性HPLC分析方法检查草铵膦的两个构型含量,手性HPLC分析方法为:色谱柱/OA-5000L;流动相/0.5%五水硫酸铜;检测波长/254nm;流速/0.7mL/min;柱温/35℃。
实施例1:工程菌菌体的培养
将工程菌重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1、E.coli BL21(DE3)/pET-28a-DAAO、E.coli BL21(DE3)/pET-28a-EN3、E.coli BL21(DE3)/pET-28a-PDC经平皿划线活化后,挑单菌落接种至含有50μg/mL卡那霉素的10mL LB液体培养基中,37℃震荡培养10h。按2%的接种量转接至50mL同样含有50μg/mL卡那霉素的LB液体培养基中,37℃震荡培养至OD600达到0.8左右时,加入终浓度为0.5mM的IPTG,28℃下震荡培养12h。培养结束后,将培养液8000rpm离心10min,弃上清,收集菌体,放到-80℃超低温冰箱中保存,待用。
实施例2:酶序列合成和菌株构建
将来源于Pseudarthrobacter chlorophenolicus的注释为(R)-转氨酶(APH1)的序列(氨基酸序列为SEQ ID NO.1所示,核苷酸序列为SEQ ID NO.2所示)进行全基因合成后,插入表达质粒pET-28a(+)得到pET28a-APH1。测序验证无误后将pET28a-APH1转入表达宿主大肠杆菌E.coli BL21(DE3)中用于后续重组酶的表达。
将来源于Rhodotorula sp.CCFEE 5036的注释为D-氨基酸氧化酶(DAAO)的序列(氨基酸序列为SEQ ID NO.3所示,核苷酸序列为SEQ ID NO.4所示)进行全基因合成后,插入表达质粒pET-28a(+)得到pET28a-DAAO。测序验证无误后将pET28a-DAAO转入表达宿主大肠杆菌E.coli BL21(DE3)中用于后续重组酶的表达。
将来源于Paraburkholderia phymatum STM815注释为(S)-转氨酶(EN3)的序列(氨基酸序列为SEQ ID NO.7所示,核苷酸序列为SEQ ID NO.8所示)进行全基因合成后,插入表达质粒pET-28a(+)得到pET28a-EN3。测序验证无误后将pET28a-EN3转入表达宿主大肠杆菌E.coli BL21(DE3)中用于后续重组酶的表达。
将来源于Zymobacter palmae注释为丙酮酸脱羧酶(PDC)的序列(氨基酸序列为SEQ ID NO.5所示,核苷酸序列为SEQ ID NO.6所示)进行全基因合成后,插入表达质粒pET-28a(+)得到pET28a-PDC。测序验证无误后将pET28a-PDC转入表达宿主大肠杆菌E.coliBL21(DE3)中用于后续重组酶的表达。
实施例3:用重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1和E.coli BL21(DE3)/pET-28a-DAAO拆分消旋PPT
(i)重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1单酶催化体系实验:30ml的反应体系中含有500mM D,L-PPT,250mM丙酮酸,和100mM磷酸盐缓冲液,用氨水将反应体系的pH调节至8.0,加入重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1 30g/L干细胞。反应条件为:温度30℃,转速250rpm。反应10h取样(100μl),加入900μl去离子水,加热终止反应。通过HPLC检测D-PPT的转化情况,反应结果如图2-1所示。
(ii)重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1和E.coli BL21(DE3)/pET-28a-DAAO双酶催化体系实验:30ml的反应体系中含有500mM D,L-PPT,250mM丙酮酸,和100mM磷酸盐缓冲液,用氨水将反应体系的pH调节至8.0,加入重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1和E.coli BL21(DE3)/pET-28a-DAAO各30g/L干细胞。反应条件为:温度30℃,转速250rpm。反应10h取样(100μl),加入900μl去离子水,加热终止反应。通过HPLC检测D-PPT的转化情况,反应结果如图2-1所示。
结果显示,在反应体系中添加DAAO能够明显提高APH1转化D-PPT的效率。
(iii)D-PPT拆分进程曲线实验:30ml的反应体系中含有500mM D,L-PPT,10mM丙酮酸,4000U/mL过氧化氢酶和100mM磷酸盐缓冲液,用氨水将反应体系的pH调节至8.0,加入重组大肠杆菌E.coli BL21(DE3)/pET-28a-APH1和E.coli BL21(DE3)/pET-28a-DAAO各30g/L干细胞。反应条件为:温度30℃,转速250rpm。每隔一段时间取样(100μl),加入900μl去离子水,加热终止反应。通过HPLC检测D-PPT的转化情况,反应进程曲线如图2-2所示。
结果显示,随着时间的推移,D-PPT转化率逐渐升高,60h内反应完成,底物转化率大于99.9%。
实施例4:用重组大肠杆菌E.coli BL21(DE3)/pET-28a-EN3和E.coli BL21(DE3)/pET-28a-PDC还原胺化PPO合成L-PPT
30ml的反应体系中含有500mM PPO,1.2M L-丙氨酸,100mM磷酸盐缓冲液,用氨水将反应体系的pH调节至8.0,加入重组大肠杆菌E.coli BL21(DE3)/pET-28a-EN3和pET-28a-PDC各30g/L干细胞。反应条件为:温度30℃,转速250rpm。每隔一段时间取样(100μl),加入900μl去离子水,加热终止反应。通过HPLC检测PPO的转化情况,反应进程曲线如图3所示。
结果显示,随着时间的推移,PPO转化率逐渐升高,44h内反应完成,底物转化率大于85%。
实施例5:共表达菌株的构建
一、含(R)-转氨酶和D-氨基酸氧化酶的共表达菌株的构建
将实施例2中使用的APH1基因序列通过一步克隆试剂盒连接到多克隆位点载体pCDFduet-1上,酶切位点为HindIII和XhoI,一步克隆引物为C1-F和C1-R(表1),构建得到质粒pCDFduet-1-APH1。再在pCDFduet-1-APH1质粒的基础上,通过所述一步克隆试剂盒将实施例2中使用的DAAO片段连接到多克隆位点载体pCDFduet-1第二个克隆位点上,酶切位点为NdeI和XhoI,一步克隆引物为C2-F和C2-R(表1),构建得到质粒pCDFduet-1-APH1-DAAO,将质粒转化入菌株E.coli BL21(DE3)得到共表达菌株E.coli BL21(DE3)/pCDFduet-1-APH1-DAAO。图4显示了APH1-DAAO构建体。
二、含(S)-转氨酶和丙酮酸脱羧酶的共表达菌株构建
将实施例2中使用的EN3基因通过一步克隆试剂盒连接到多克隆位点载体pCDFduet-1上,酶切位点为NcoI和HindⅢ,一步克隆引物为C3-F和C3-R(表1),构建得到质粒pCDFduet-1-EN3。再在pCDFduet-1-EN3质粒的基础上,通过所述一步克隆试剂盒将PDC连接到多克隆位点载体pCDFduet-1第二个克隆位点上,酶切位点为NdeI和EcoRI,一步克隆引物为C4-F和C4-R(表1),构建得到质粒pCDFduet-1-EN3-PDC,将质粒转入菌株E.coli BL21(DE3)得到共表达菌株E.coli BL21(DE3)/pCDFduet-1-EN3-PDC。图5显示了EN3-PDC构建体。
表1:克隆引物序列
引物 |
序列 |
C1-F |
CCCAAGCTTAAGGAGATATACATATGACCTCTCCCGCTTCCGT |
C1-R |
CCGCTCGAGCTATTGGATTCCGGCGTAAAGC |
C2-F |
CCCAAGCTT5ATGCACAGCCAGAAACGCGTAGTTGTTCTGGGTAG |
C2-R |
CCGCTCGAG TTACAGTTTGCTTTCGCGTGCTGCGCCATGATAAC |
C3-F |
CCGGAATTCAAGGAGATATACATATGAAGAATGCTGAACTGAAGAGCC |
C3-R |
ATAAGAATGCGGCCGCTCAGGCCGCTACGCCAAC |
C4-F |
CCGGAATTCATGTATACCGTTGGTATGTACTTGGCAGAACGCCT |
C4-R |
ATAAGAATGCGGCCGCTTACGCTTGTGGTTTGCGAGAGTTGGTAGCTGCTA |
实施例6:用重组大肠杆菌共表达菌株E.coli BL21(DE3)/pCDFduet-1-APH1-DAAO拆分消旋PPT
按照实施例5(一)的方法构建并培养能够表达(R)-转氨酶和D-氨基酸氧化酶的共表达菌株E.coli BL21(DE3)/pCDFduet-1-APH1-DAAO。
30ml的反应体系含有500mM D,L-PPT,10mM丙酮酸,4000U/mL过氧化氢酶,100mM磷酸盐缓冲液,用氨水调节将反应体系的pH调节至8.0,加入共表达菌株E.coli BL21(DE3)/pCDFduet-1-APH1-DAAO 30g/L干细胞。反应条件为:温度30℃,转速250rpm。每隔一段时间取样(100μl),加入900μl去离子水,加热终止反应。通过HPLC检测D-PPT的转化情况,反应进程曲线如图6所示。
结果显示,随着时间的推移,D-PPT转化率逐渐升高,16h内反应完成,底物转化率大于99.9%。
实施例7:用共表达菌株E.coli BL21(DE3)/pCDFduet-1-EN3-PDC还原胺化PPO合成L-PPT
按照实施例5(二)的方法构建和培养能够表达(S)-转氨酶和丙酮酸脱羧酶的共表达菌株E.coli BL21(DE3)/pETduet-1-EN3-PDC,离心收集菌体细胞。
30ml反应体系中含有500mM PPO,1.2M L-丙氨酸,100mM磷酸盐缓冲液,用氨水将反应体系的pH调节至8.0,加入共表达菌株E.coli BL21(DE3)/pCDFduet-1-EN3-PDC 30g/L干细胞。反应条件为:温度30℃,转速250rpm。每隔一段时间取样(100μl),加入900μl去离子水,加热终止反应。通过HPLC检测PPO的转化情况,反应进程曲线如图7所示。
结果显示,随着时间的推移,PPO转化率逐渐升高,EN3-PDC在30h内完成反应,底物转化率大于99.9%。
实施例8:双菌多酶一锅两步法去消旋化制备L-草铵膦
按照实施例5(一)的方法构建和培养能够表达(R)-转氨酶和D-氨基酸氧化酶的共表达菌株E.coli BL21(DE3)/pCDFduet-1-APH1-DAAO。按照实施例5(二)的方法构建和培养能够表达(S)-转氨酶和丙酮酸脱羧酶的共表达菌株E.coli BL21(DE3)/pETduet-1-EN3-PDC,离心收集菌体细胞。
在1L反应器中,加入600mL pH=8的磷酸盐缓冲液,温度设定为30℃,加入500mMD,L-PPT、消泡剂泡敌、10mM丙酮酸,过氧化氢酶1%v/v(4000U/ml),30g/L E.coli BL21(DE3)/pCDFduet-1-APH1-DAAO菌体,通入空气,通气量为2L/min,反应14小时;75℃加热30min,再加入30g/L E.coli BL21(DE3)/pETduet-1-EN3-PDC菌体和300mM L-丙氨酸,用氨水控制pH为8,反应15小时。液相检测D-PPT为0mM,D-PPT转化率为99.9%,PPO为2mM,L-PPT为398mM,产品草铵膦的e.e.值为99.9%。反应进程曲线如图8所示。
序列表
<110>永农生物科学有限公司
华东理工大学
宁夏永农生物科学有限公司
<120> 利用生物多酶偶联法制备L-草铵膦的方法
<130> PD200279N
<160> 8
<170> PatentIn版本3.5
<210> 1
<211> 309
<212> PRT
<213> Pseudarthrobacter chlorophenolicus
<400> 1
Met Thr Ser Pro Ala Ser Val Val Leu Val Phe Leu Asp Pro Ala Phe
1 5 10 15
Pro Asp Gly Arg Leu Ala Asp Ala Ala Gln Pro Gln Leu Met Val Thr
20 25 30
Asp Gln Gly Ala Thr Arg Gly Asp Gly Ile Phe Glu Thr Met Leu Ala
35 40 45
Val Arg Gly Ser Val Arg Lys Ile Gln Ala His Leu Asp Arg Leu Asp
50 55 60
Gly Ser Ala Ala Ala Leu Asp Leu Ser Ile Pro Gly Gln Asp Asp Trp
65 70 75 80
Arg Arg Ala Ile Ala Thr Ala Ile Ala Glu His Gln Ala Gln Tyr Pro
85 90 95
Ala Pro Asp Ala Gly Asp Asp Glu Leu Val Val Lys Leu Val Val Thr
100 105 110
Arg Gly Val Glu Gly Ala Gly Ser Pro Thr Ala Trp Val Gln Val Ser
115 120 125
Pro Ala Pro Ala Ala Gly Arg Arg Gln Arg Glu Thr Gly Ile Asp Val
130 135 140
Ile Leu Leu Asp Arg Gly Tyr Asp Ser Asp Val Ala Glu Arg Ala Pro
145 150 155 160
Trp Leu Leu Met Gly Ala Lys Thr Leu Ser Tyr Ala Val Asn Met Ala
165 170 175
Ala Leu Arg His Ala Arg Arg Gln Gly Ala Asp Asp Val Ile Phe Leu
180 185 190
Ser Ser Asp Gly Arg Val Leu Glu Gly Pro Thr Ser Thr Val Leu Leu
195 200 205
Ala His Val Glu Glu Ser Ala Asp Gly Thr Ala Ile Lys Arg Leu Ile
210 215 220
Thr Pro Gln Leu Asp Ser Gly Ile Leu Pro Gly Thr Ser Gln Gly Ala
225 230 235 240
Leu Phe Thr Ala Ala Lys Ala Ala Gly Trp Glu Leu Gly Tyr Gly Pro
245 250 255
Leu Glu Pro Gln Asp Leu Leu Asp Ala Asp Ala Val Trp Leu Ile Ser
260 265 270
Ser Val Arg Leu Leu Ala Pro Val Asn Thr Ile Asp Gly Lys Gln Ile
275 280 285
Gly Thr Pro Ala Leu Gln Lys Glu Leu Thr Ala Glu Leu Thr Gly Leu
290 295 300
Tyr Ala Gly Ile Gln
305
<210> 2
<211> 930
<212> DNA
<213> Pseudarthrobacter chlorophenolicus
<400> 2
atgacctctc ccgcttccgt ggtactcgtt ttccttgatc ccgccttccc cgacggccgg 60
ctggccgacg ccgcccagcc gcagctgatg gtcacggacc agggcgccac caggggcgat 120
ggcatcttcg aaacgatgct cgccgtgcgc gggtcagtcc gaaaaatcca ggcccacctg 180
gaccgcctgg acggctccgc ggcggcgctg gacctcagca tcccgggcca ggatgactgg 240
cggcgggcca ttgccactgc cattgccgaa caccaggcgc agtacccggc ccccgatgcg 300
ggcgacgatg aactggtggt caagctggtg gtcacccgcg gcgttgaagg tgcgggctcc 360
cccaccgcct gggtgcaggt ctcccctgct ccggccgccg gccgccgcca acgggaaaca 420
ggcatcgacg tcatcctcct tgaccgcggg tacgacagtg acgttgccga gcgtgcgccg 480
tggctgctca tgggcgccaa gacgctctcc tacgccgtca acatggccgc cctgcgccat 540
gcccgcaggc agggcgcaga cgacgtcatc ttcctgtcct cggatggccg cgtgcttgag 600
ggccccacgt ccacggtgct gctggcgcac gtggaggagt ccgctgacgg gacggccatc 660
aagcgcctca tcacgccgca gctggacagc ggcatcctgc ccggaacatc gcagggggcc 720
ctcttcaccg cggcaaaggc ggcgggctgg gaactgggct acggacccct ggaaccgcag 780
gacctgctgg atgccgacgc ggtctggctg atctccagtg tccgcctcct cgccccggtc 840
aacacgatcg acggcaagca gatcggtacc ccggcgctgc agaaggagct gacggctgag 900
ctcacggggc tttacgccgg aatccaatag 930
<210> 3
<211> 372
<212> PRT
<213> Rhodotorula sp. CCFEE 5036
<400> 3
Met Thr Gln Asp Lys Arg Val Val Val Leu Gly Ser Gly Val Ile Gly
1 5 10 15
Leu Ser Cys Ala Leu Ala Leu Ala Gln Lys Gly Tyr Lys Val His Val
20 25 30
Val Ala Arg Asp Leu Pro Glu Asp Thr Val Ala Gln Thr Phe Ala Ser
35 40 45
Pro Trp Ala Gly Ala Asn Trp Thr Pro Phe Met Ser Lys Glu Ala Gly
50 55 60
Pro Arg Gln Ala Lys Trp Glu Glu Ala Thr Phe Lys Gln Trp Val Asp
65 70 75 80
Leu Val Pro Gln Gly Leu Ala Met Trp Leu Lys Gly Thr Arg Arg Phe
85 90 95
Ala Glu Asn Glu Ala Asp Leu Leu Gly His Trp Tyr Lys Asp Ile Val
100 105 110
Pro Asn Tyr Arg His Leu Asn Pro Ser Asp Cys Pro Pro Gly Ala Ile
115 120 125
Gly Val Thr Tyr Asp Thr Leu Ser Val Asn Ala Pro Lys Phe Cys Gln
130 135 140
Tyr Leu Gln Arg Glu Gly Gln Lys Leu Gly Val Thr Phe Glu Arg Arg
145 150 155 160
Leu Val Thr Ser Leu Glu Gln Ile Ala Asp Gly Ala Asp Leu Ile Val
165 170 175
Asn Ala Thr Gly Leu Gly Ala Lys Ser Ile Ala Gly Val Glu Asp Gln
180 185 190
Glu Val Glu Pro Ile Arg Gly Gln Thr Val Leu Val Lys Ser Asn Cys
195 200 205
Lys Arg Cys Thr Met Asp Ser Ser Asp Pro Lys Ser Pro Ala Tyr Ile
210 215 220
Ile Pro Arg Pro Gly Gly Glu Val Ile Cys Gly Gly Thr Tyr Leu Val
225 230 235 240
Gly Asn Tyr Asp Leu Ser Val Asp Pro Ala Thr Ile Pro Arg Ile Leu
245 250 255
Lys His Cys Leu Arg Leu Asp Pro Ser Ile Ser Thr Asp Gly Thr Leu
260 265 270
Glu Gly Ile Glu Ile Leu Arg His Asn Val Gly Leu Arg Pro Ala Arg
275 280 285
Arg Gly Gly Pro Arg Val Glu Leu Glu Arg Val Ser Leu Pro Leu Lys
290 295 300
Arg Gly Gln Ser Leu Leu Ala Leu Gly Thr Ala Lys Ala Ala Glu Gly
305 310 315 320
Lys Ala Pro Arg Thr Val Pro Val Val His Ala Tyr Gly Phe Ser Ser
325 330 335
Ala Gly Tyr Gln Gln Gly Trp Gly Ala Ala Leu Glu Val Arg Asp Leu
340 345 350
Val Asp Gln Ala Ile Gly Ser Ser Ser Ser Ser Ser Ser Gly Arg His
355 360 365
Leu Ala Lys Leu
370
<210> 4
<211> 1119
<212> DNA
<213> Rhodotorula sp. CCFEE 5036
<400> 4
atgactcagg acaagcgcgt cgttgtactc ggctcgggag ttatcgggtt gtcttgcgcc 60
ctggcactcg cgcagaaggg ctacaaggtg catgtcgttg cccgcgattt gccagaagac 120
accgtcgcgc agacgtttgc gagcccgtgg gcgggtgcta attggacacc gttcatgtcg 180
aaagaagccg gtccgaggca agcaaagtgg gaggaagcga cgttcaagca atgggtcgac 240
cttgtcccgc aaggtctcgc aatgtggctc aaggggaccc ggcggttcgc agagaacgag 300
gccgatctgc tcggccactg gtacaaagat atcgttccga actaccgaca cttgaacccg 360
tccgactgcc ctcccggcgc gatcggcgtc acgtacgaca ccctctcggt caatgctcca 420
aagttctgtc aatacctcca acgcgaggga cagaagctcg gcgtcacgtt cgagcgaagg 480
ctcgtcactt cgctcgagca gattgcagac ggtgccgatc tcatcgtcaa cgcgaccggg 540
ctcggtgcca agtctatcgc cggcgtggaa gaccaagagg ttgaaccgat ccgaggccag 600
actgttctcg tcaaatccaa ctgcaagcgc tgcacgatgg attcttcgga cccgaaaagc 660
ccggcttaca tcattcctcg gcctggtggc gaagtcatct gcggcggtac ctatctcgtt 720
ggcaactatg acctttctgt cgacccggcg accatccccc ggatcctcaa acactgcctc 780
cgcctcgacc cctccatctc gaccgacggg acgctcgaag ggatcgaaat cctccgccac 840
aatgtcggac tccgccccgc ccgccgcggc ggtccccgcg tcgaactcga acgcgtctcg 900
ctcccgctca agcggggtca gtcgctcctc gcgctcggga cggcaaaggc tgccgagggc 960
aaagcgccac ggacggtgcc cgtcgtgcac gcttacgggt tctccagcgc gggttaccag 1020
cagggctggg gcgccgcgct cgaggtgcga gacttggtcg atcaggcgat cgggtcttcc 1080
tcctcttcct cgagtgggcg gcacctcgcc aagctctag 1119
<210> 5
<211> 556
<212> PRT
<213> Zymobacter palmae
<400> 5
Met Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Ala Gln Ile Gly
1 5 10 15
Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu Leu
20 25 30
Asp Gln Leu Leu Leu Asn Lys Asp Met Glu Gln Val Tyr Cys Cys Asn
35 40 45
Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Arg Gly
50 55 60
Ala Ala Ala Ala Ile Val Thr Phe Ser Val Gly Ala Ile Ser Ala Met
65 70 75 80
Asn Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu Ile
85 90 95
Ser Gly Ser Pro Asn Thr Asn Asp Tyr Gly Thr Gly His Ile Leu His
100 105 110
His Thr Ile Gly Thr Thr Asp Tyr Asn Tyr Gln Leu Glu Met Val Lys
115 120 125
His Val Thr Cys Ala Arg Glu Ser Ile Val Ser Ala Glu Glu Ala Pro
130 135 140
Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys Pro
145 150 155 160
Ala Tyr Leu Glu Ile Ala Cys Asn Val Ala Gly Ala Glu Cys Val Arg
165 170 175
Pro Gly Pro Ile Asn Ser Leu Leu Arg Glu Leu Glu Val Asp Gln Thr
180 185 190
Ser Val Thr Ala Ala Val Asp Ala Ala Val Glu Trp Leu Gln Asp Arg
195 200 205
Gln Asn Val Val Met Leu Val Gly Ser Lys Leu Arg Ala Ala Ala Ala
210 215 220
Glu Lys Gln Ala Val Ala Leu Ala Asp Arg Leu Gly Cys Ala Val Thr
225 230 235 240
Ile Met Ala Ala Glu Lys Gly Phe Phe Pro Glu Asp His Pro Asn Phe
245 250 255
Arg Gly Leu Tyr Trp Gly Glu Val Ser Ser Glu Gly Ala Gln Glu Leu
260 265 270
Val Glu Asn Ala Asp Ala Ile Leu Cys Leu Ala Pro Val Phe Asn Asp
275 280 285
Tyr Ala Thr Val Gly Trp Asn Ser Trp Pro Lys Gly Asp Asn Val Met
290 295 300
Val Met Asp Thr Asp Arg Val Thr Phe Ala Gly Gln Ser Phe Glu Gly
305 310 315 320
Leu Ser Leu Ser Thr Phe Ala Ala Ala Leu Ala Glu Lys Ala Pro Ser
325 330 335
Arg Pro Ala Thr Thr Gln Gly Thr Gln Ala Pro Val Leu Gly Ile Glu
340 345 350
Ala Ala Glu Pro Asn Ala Pro Leu Thr Asn Asp Glu Met Thr Arg Gln
355 360 365
Ile Gln Ser Leu Ile Thr Ser Asp Thr Thr Leu Thr Ala Glu Thr Gly
370 375 380
Asp Ser Trp Phe Asn Ala Ser Arg Met Pro Ile Pro Gly Gly Ala Arg
385 390 395 400
Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser
405 410 415
Ala Phe Gly Asn Ala Val Gly Ser Pro Glu Arg Arg His Ile Met Met
420 425 430
Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445
Ile Arg Tyr Glu Ile Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
450 455 460
Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys
465 470 475 480
Asn Trp Asn Tyr Ala Gly Leu Ile Asp Val Phe Asn Asp Glu Asp Gly
485 490 495
His Gly Leu Gly Leu Lys Ala Ser Thr Gly Ala Glu Leu Glu Gly Ala
500 505 510
Ile Lys Lys Ala Leu Asp Asn Arg Arg Gly Pro Thr Leu Ile Glu Cys
515 520 525
Asn Ile Ala Gln Asp Asp Cys Thr Glu Thr Leu Ile Ala Trp Gly Lys
530 535 540
Arg Val Ala Ala Thr Asn Ser Arg Lys Pro Gln Ala
545 550 555
<210> 6
<211> 1671
<212> DNA
<213> Zymobacter palmae
<400> 6
atgtataccg ttggtatgta cttggcagaa cgcctagccc agatcggcct gaaacaccac 60
tttgccgtgg ccggtgacta caacctggtg ttgcttgatc agctcctgct gaacaaagac 120
atggagcagg tctactgctg taacgaactt aactgcggct ttagcgccga aggttacgct 180
cgtgcacgtg gtgccgccgc tgccatcgtc acgttcagcg taggtgctat ctctgcaatg 240
aacgccatcg gtggcgccta tgcagaaaac ctgccggtca tcctgatctc tggctcaccg 300
aacaccaatg actacggcac aggccacatc ctgcaccaca ccattggtac tactgactat 360
aactatcagc tggaaatggt aaaacacgtt acctgcgcac gtgaaagcat cgtttctgcc 420
gaagaagcac cggcaaaaat cgaccacgtc atccgtacgg ctctacgtga acgcaaaccg 480
gcttatctgg aaatcgcatg caacgtcgct ggcgctgaat gtgttcgtcc gggcccgatc 540
aatagcctgc tgcgtgaact cgaagttgac cagaccagtg tcactgccgc tgtagatgcc 600
gccgtagaat ggctgcagga ccgccagaac gtcgtcatgc tggtcggtag caaactgcgt 660
gccgctgccg ctgaaaaaca ggctgttgcc ctagcggacc gcctgggctg cgctgtcacg 720
atcatggctg ccgaaaaagg cttcttcccg gaagatcatc cgaacttccg cggcctgtac 780
tggggtgaag tcagctccga aggtgcacag gaactggttg aaaacgccga tgccatcctg 840
tgtctggcac cggtattcaa cgactatgct accgttggct ggaactcctg gccgaaaggc 900
gacaatgtca tggtcatgga caccgaccgc gtcactttcg caggacagtc cttcgaaggt 960
ctgtcattga gcaccttcgc cgcagcactg gctgagaaag caccttctcg cccggcaacg 1020
actcaaggca ctcaagcacc ggtactgggt attgaggccg cagagcccaa tgcaccgctg 1080
accaatgacg aaatgacgcg tcagatccag tcgctgatca cttccgacac tactctgaca 1140
gcagaaacag gtgactcttg gttcaacgct tctcgcatgc cgattcctgg cggtgctcgt 1200
gtcgaactgg aaatgcaatg gggtcatatc ggttggtccg taccttctgc attcggtaac 1260
gccgttggtt ctccggagcg tcgccacatc atgatggtcg gtgatggctc tttccagctg 1320
actgctcaag aagttgctca gatgatccgc tatgaaatcc cggtcatcat cttcctgatc 1380
aacaaccgcg gttacgtcat cgaaatcgct atccatgacg gcccttacaa ctacatcaaa 1440
aactggaact acgctggcct gatcgacgtc ttcaatgacg aagatggtca tggcctgggt 1500
ctgaaagctt ctactggtgc agaactagaa ggcgctatca agaaagcact cgacaatcgt 1560
cgcggtccga cgctgatcga atgtaacatc gctcaggacg actgcactga aaccctgatt 1620
gcttggggta aacgtgtagc agctaccaac tctcgcaaac cacaagcgta a 1671
<210> 7
<211> 427
<212> PRT
<213> Paraburkholderia phymatum STM815
<400> 7
Met Lys Asn Ala Glu Leu Lys Ser Arg Lys Asp Ala Ala Thr Pro Arg
1 5 10 15
Gly Val Gly Val Met Cys Asp Phe Tyr Ala Ala Arg Ala Glu Asn Ala
20 25 30
Glu Leu Trp Asp Val Glu Gly Arg Arg Phe Ile Asp Phe Ala Ala Gly
35 40 45
Ile Ala Val Cys Asn Thr Gly His Arg His Pro Lys Ile Val Glu Ala
50 55 60
Val Arg Ala Gln Leu Asp His Phe Thr His Thr Ala Tyr Gln Ile Val
65 70 75 80
Pro Tyr Ala Ser Tyr Val Glu Leu Ala Glu Lys Ile Asn Glu Arg Ala
85 90 95
Pro Gly Asp Tyr Pro Lys Lys Thr Ala Phe Phe Thr Thr Gly Ala Glu
100 105 110
Ala Val Glu Asn Ala Ile Lys Ile Ala Arg Ala Phe Thr Gly Arg Pro
115 120 125
Gly Val Ile Ala Phe Thr Gly Gly Phe His Gly Arg Thr Met Met Gly
130 135 140
Met Ala Leu Thr Gly Lys Val Ala Pro Tyr Lys Leu Asn Phe Gly Pro
145 150 155 160
Phe Pro Ala Asp Val Phe His Ala Pro Phe Pro Asn Pro Leu His Gly
165 170 175
Val Thr Thr Ala Asp Ser Leu Lys Ala Ile Glu Phe Leu Phe Lys Ala
180 185 190
Asp Ile Asp Pro Lys Arg Val Ala Ala Ile Ile Phe Glu Pro Val Gln
195 200 205
Gly Glu Gly Gly Phe Tyr Pro Ala Pro Ala Glu Phe Val Arg Ala Leu
210 215 220
Arg Lys Leu Cys Asn Glu His Gly Ile Leu Leu Ile Ala Asp Glu Val
225 230 235 240
Gln Thr Gly Phe Ala Arg Thr Gly Lys Leu Phe Ala Met Asn His Tyr
245 250 255
Asp Val Val Pro Asp Leu Met Thr Met Ala Lys Ser Leu Ala Gly Gly
260 265 270
Met Pro Leu Ser Gly Val Val Gly Arg Ala Asp Val Met Asp Ala Ala
275 280 285
Ala Pro Gly Gly Leu Gly Gly Thr Tyr Ala Gly Asn Pro Leu Ala Val
290 295 300
Ala Ser Ala His Ala Val Leu Asp Ile Ile Asp Glu Glu Arg Leu Cys
305 310 315 320
Glu Arg Ala Val Val Leu Gly Asp Arg Leu Lys Ala Lys Leu Thr Ala
325 330 335
Leu Gln Ser Glu Val Pro Leu Ile Ala Asp Val Arg Gly Pro Gly Gly
340 345 350
Met Val Ala Val Glu Phe Cys Lys Pro Gly Thr Ser Glu Ala Asp Ala
355 360 365
Asp Phe Thr Lys Arg Val Gln Thr Arg Ala Leu Glu Arg Gly Leu Leu
370 375 380
Leu Leu Val Cys Gly Val Tyr Ser Asn Val Val Arg Phe Leu Phe Pro
385 390 395 400
Leu Thr Ile Gln Asp Ser Val Phe Asp Glu Ala Val Ser Ile Leu Glu
405 410 415
Glu Val Leu Lys Glu Thr Val Gly Val Ala Ala
420 425
<210> 8
<211> 1284
<212> DNA
<213> Paraburkholderia phymatum STM815
<400> 8
atgaagaatg ctgaactgaa gagccgcaag gacgccgcca cgccgcgcgg cgtaggcgtg 60
atgtgcgatt tctacgctgc gcgtgcggag aatgcggagc tgtgggacgt cgagggccgc 120
cgcttcatcg atttcgcggc cggcattgcc gtttgcaaca cggggcatcg tcatccgaag 180
atcgtcgagg ccgtgcgcgc ccaactcgac cacttcacgc acaccgctta tcagatcgtg 240
ccgtatgcgt cgtatgtcga gctggcggaa aagatcaacg agcgcgcgcc gggcgactat 300
ccgaagaaga ctgcattctt tacgacgggc gccgaagccg tcgaaaacgc gatcaagatc 360
gcacgcgcct tcacgggccg tccgggcgtg atcgcgttca cgggcggctt tcacggccgc 420
acgatgatgg gcatggcgct gacgggcaag gtcgcgccgt acaagctgaa cttcggcccg 480
ttcccggccg atgtattcca cgcaccgttc ccgaatccgc tgcatggcgt gacgacggcg 540
gactcgttga aggcgatcga atttctgttc aaggcggaca tcgatccgaa gcgcgtcgcg 600
gcgatcattt tcgagccggt gcaaggcgaa ggcggtttct atccggcgcc tgccgagttc 660
gtgcgggcgc tgcgcaagct gtgcaacgag cacggcattc tgctgatcgc ggacgaagtg 720
cagacgggtt ttgcacgcac gggcaagctg ttcgcgatga atcactatga cgtggttccc 780
gacctgatga cgatggcgaa gagcctcgcg ggcggcatgc cgctgtcggg tgtggtcggg 840
cgtgcggatg tgatggatgc ggctgcgccg ggcggactgg gcggcacgta cgcgggcaat 900
ccgctcgcgg ttgcttcggc gcatgcggtg ctcgacatca tcgacgaaga gcggctctgc 960
gagcgggctg tggtgttggg ggatcgcctg aaggcgaagt tgacggcgct tcagtcggaa 1020
gtgccgctga tcgccgatgt gcgcgggccg ggcggcatgg tggccgtcga gttctgcaag 1080
ccgggtacgt cggaggcgga tgccgatttc acgaagcgcg tgcagactcg cgcgctcgag 1140
cgcgggttgc tgttgctggt gtgtggtgtt tattcgaacg ttgttcggtt tttgttcccg 1200
ttgactattc aggattcggt cttcgatgaa gctgtttcca ttctcgaaga ggtgctgaaa 1260
gagactgttg gcgtagcggc ctga 1284