CN101627109A - 用于生产正丁醇的工程化改造的微生物及相关方法 - Google Patents

用于生产正丁醇的工程化改造的微生物及相关方法 Download PDF

Info

Publication number
CN101627109A
CN101627109A CN200780050853A CN200780050853A CN101627109A CN 101627109 A CN101627109 A CN 101627109A CN 200780050853 A CN200780050853 A CN 200780050853A CN 200780050853 A CN200780050853 A CN 200780050853A CN 101627109 A CN101627109 A CN 101627109A
Authority
CN
China
Prior art keywords
recombinant microorganism
approach
propyl carbinol
coa
nadh
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200780050853A
Other languages
English (en)
Inventor
托马斯·比尔特
安德鲁·霍金斯
卡利布·克什
彼得·迈恩霍尔德
马修·彼得斯
伊齐尔卡尼·萨比安
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gevo Inc
Original Assignee
Gevo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gevo Inc filed Critical Gevo Inc
Publication of CN101627109A publication Critical patent/CN101627109A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

表达NADH依赖性途径中将碳源转化成正丁醇、其代谢中间产物和/或衍生物的至少一种异源酶且能够以高产率生成正丁醇、其代谢中间产物和/或衍生物的重组微生物及相关方法。工程化改造以灭活与NADH依赖性异源途径竞争的一种或多种途径的天然酶和/或在NADH生成和消耗方面平衡NADH依赖性异源途径的重组微生物。

Description

用于生产正丁醇的工程化改造的微生物及相关方法
相关申请的交叉引用
本申请要求2006年12月1日提交的美国临时申请流水号60/868,326、2007年5月30日提交的美国临时申请流水号60/940,877、2007年2月16日提交的美国临时申请流水号60/890,329、2007年3月6日提交的美国临时申请流水号60/905,550和2007年6月21日提交的美国临时申请流水号60/945,576的优先权,所有这些申请通过提述以其整体并入本文。
发明领域
本公开内容涉及工程化改造的微生物。具体而言,它涉及用于生产生物燃料诸如正丁醇、其代谢中间产物和/或其衍生物的工程化改造的微生物。
发明背景
从生物质衍生的糖变成正丁醇的碳水化合物生物转化是已知的,而且已经大规模实施了大约100年。它的历史可以回溯到路易斯·巴斯德(LouisPasteur),他在1861年观察到某些细菌生成正丁醇。在1912,钱恩·魏茨曼(ChaimWeizmann)发现了一种称作丙酮丁醇梭菌(Clostridium acetobutylicum)的微生物,它能够将淀粉发酵成丙酮、正丁醇和乙醇(因此称作ABE发酵)。此过程基于在梭菌属的厌氧性革兰氏阳性细菌中找到的一套独特的代谢途径(见图1),它们也提供副产物诸如丙酮和乙醇的生成。
最近来自中东的石油供应的不稳定性,加上在美国易于获得可再生的、基于农业的生物质的供应,已经重新刺激了对在梭菌中生产正丁醇的兴趣,而且已经推动了在其它微生物中生产丁醇的尝试。
已经产生了梭菌属的工程化改造菌株,它们优化了自经过处理的生物质废物生产正丁醇。另外,已经开发了新的正丁醇生产工艺,它们利用多种梭菌属菌株,优化了碳水化合物变成丁酸的转化或外源丁酸变成正丁醇的后续转化。
能够生成可检测量的丁醇的其它微生物诸如大肠杆菌或大肠埃希氏菌(E.coli)的工程化改造菌株的生成也已有报道。
发明概述
本文中公开了能以大于理论产率的70%的高产率提供正丁醇的重组微生物。
具体而言,本文中所公开的重组微生物被工程化改造以活化用于生成正丁醇的异源途径,将碳流指向正丁醇,和可能地在NADH生成和消耗方面平衡所述异源途径以使可获得的产率最大化。
依照一个实施方案,描述了能够以理论产率的至少5%的产率生成正丁醇的重组微生物。具体而言,该重组微生物是通过如下可获得的:工程化改造微生物以活化用于NADH依赖性途径中的异源酶,该途径通过生成一种或多种代谢中间产物而将碳源转化正丁醇;工程化改造微生物以灭活一种或多种途径的天然酶,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一;和工程化改造微生物以活化至少NADH生成酶和NADH生成途径之一以平衡所述NADH依赖性异源途径。
依照另一个实施方案,描述了能够以理论产率的至少2%的产率生成正丁醇的重组微生物。该重组微生物是通过如下可获得的:工程化改造微生物以活化NADH依赖性途径的异源酶,该途径通过生成一种或多种代谢中间产物而将碳源转化正丁醇;和工程化改造微生物以灭活一种或多种途径的天然酶,该途径将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
依照又一个实施方案,描述了表达用于将碳源转化成正丁醇的异源途径的重组微生物。该异源途径包含以下底物变成产物的转化:乙酰-CoA变成乙酰乙酰-CoA;乙酰乙酰-CoA变成羟基丁酰-CoA;羟基丁酰-CoA变成巴豆酰-CoA;巴豆酰-CoA变成丁酰-CoA;丁酰-CoA变成丁醛;和丁醛变成正丁醇。重组微生物被工程化改造以灭活一种或多种用于将底物转化成产物的天然途径,其中所述底物是丙酮酸或乙酰CoA。重组微生物被进一步工程化改造以活化至少厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶和用于将甘油转化成丙酮酸的异源途径之一。重组微生物能够以理论产率的至少5%的产率生成正丁醇。
依照另一个实施方案方面,描述了表达用于将碳源转化成正丁醇的异源途径的重组微生物。该异源途径包含以下底物变成产物的转化:乙酰-CoA变成乙酰乙酰-CoA;乙酰乙酰-CoA变成羟基丁酰-CoA;羟基丁酰-CoA变成巴豆酰-CoA;巴豆酰-CoA变成丁酰-CoA;丁酰-CoA变成丁醛;和丁醛变成正丁醇。重组微生物被工程化改造以灭活一种或多种用于将底物转化成产物的天然途径,其中所述底物是丙酮酸或乙酰CoA。重组微生物能够以理论产率的至少XX%的产率生成正丁醇。
本文中所描述的重组微生物能以高产率生成正丁醇,同时副产物的生成最小化,这对于在梭菌属中生产正丁醇的现有技术体系是有利的。
本文中所描述的重组微生物能以比在梭菌属以外的微生物中生产正丁醇的现有技术体系显著更高的产率生成正丁醇。
依照另一个实施方案,描述了用于生产正丁醇的方法,包括提供本文中所描述的重组微生物,并使该重组微生物接触碳源,接触的时间和条件足以容许正丁醇生成,直至生成了可回收数量的正丁醇。该方法还可包括回收可回收量的正丁醇。
依照另一个实施方案,描述了能够以理论产率的至少5%的产率生成丁酸的重组微生物。该重组微生物是通过如下可获得的:工程化改造微生物以活化NADH依赖性异源途径,该途径通过生成一种或多种代谢中间产物而将碳源转化成丁酸;和工程化改造微生物以灭活天然途径,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
依照另一个实施方案,描述了能够以理论产率的至少5%的产率生成丁酸和正丁醇的混合物的重组微生物。该重组微生物是通过如下可获得的:工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成丁酸;工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;工程化改造微生物以灭活天然途径,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一;和/或工程化微生物以活化至少NADH生成酶和NADH生成途径之一以平衡所述NADH依赖性异源途径。
附图和下文描述阐明了本公开内容的一个或多个实施方案的详情。根据说明书和附图,及根据权利要求书,其它特征、目标和优点会是显而易见的。
附图简述
并入本说明书并形成本说明书一部分的附图图示了本公开内容的一个或多个实施方案,并且与详述一起用于解释本公开内容的原理和实施。
图1图示了丙酮丁醇梭菌中葡萄糖转化成酸和溶剂所牵涉的代谢途径。己糖(例如葡萄糖)和戊糖被转化成丙酮酸、ATP和NADH。随后,丙酮酸-铁氧还蛋白氧化还原酶将丙酮酸氧化性脱羧成乙酰-CoA。只含铁的氢化酶(aniron-only hydrogenase)将此步骤中所生成的还原当量转化成氢。乙酰-CoA是分支点中间产物,通向有机酸(乙酸和丁酸)和溶剂(丙酮、正丁醇和乙醇)的生成。
图2图示了微生物中生成正丁醇的化学途径。在理想条件下,此途径每代谢1分子葡萄糖就生成1分子正丁醇(最大值)。所描绘的正丁醇生成途径在NADH生成和消耗方面是平衡的,即每代谢1个葡萄糖就生成和消耗4个NADH。
图3图示了大肠杆菌中的混合酸发酵,其产物包括琥珀酸、乳酸、乙酸、乙醇、甲酸、二氧化碳和氢气。加框的酶已经被删除或灭活,在一种或多种大肠杆菌菌株中依照本公开内容或是单一的或是各式各样组合的。
图4图示了用于在大肠杆菌中生成厌氧活性丙酮酸脱氢酶的代谢工程化改造策略。在此策略中,加框的酶被删除/灭活,而且在基本培养基和诸如葡萄糖的碳源上厌氧培养细胞。在那些条件下,唯一生长的细胞是那些生成丙酮酸脱氢酶的细胞,因为它们能够经粗体所示途径平衡NADH生成和消耗。
图5描绘了5614bp的EcoRI-BamHI限制性片段,其显示了来自丙酮丁醇梭菌的作为单一转录物合成的thl、adh、crt和hbd基因(seq tach,其是自质粒pGV1191表达的)。
图6描绘了3027bp的EcoRI-BamHI限制性片段,其显示了来自丙酮丁醇梭菌的作为单一转录物合成的bcd、etfA和etfB基因(seq Cbab,其是自pGV1088表达的)。
图7描绘了3128bp的限制性片段,其显示了来自埃氏巨球形菌(M.elsdenii)的作为单一转录物合成的bcd、etfA和etfB基因(seq Mbab,其是自pGV1052表达的)。
图8描绘了Seq tach-pZA11(=pGV1191)质粒,其含有插入在载体MCS中的EcoRI和BamHI位点处和改良噬菌体λtetO启动子(PL-tet)下游的thl、adhE2、crt和hbd ORF-该质粒还携带p15A复制起点和氨苄青霉素抗性基因。
图9描绘了Seq Cbab-pZE32(=pGV1088)质粒,其含有插入在载体MCS中的EcoRI和BamHI位点处和改良噬菌体λLacO启动子(PL-lac)下游的bcd、etfA和etfB ORF-该质粒还携带ColE1复制起点和氯霉素抗性基因。
图10显示了包括GEVO1005(大肠杆菌W3110)、GEVO922(大肠杆菌W3110(ΔglpK,ΔglpD))和GEVO926(大肠杆菌W3110(ΔglpK,ΔglpD,进化的))的培养皿。GEVO926在板上标有“GO2XKO-I”。
图11显示了示意图,图示了在非生长条件下遵循厌氧生物转化本文中所描述的重组微生物(GEVO927)消耗的甘油的量,与相应的野生型微生物(GEVO1005,pGV1010)所消耗的量比较。
图12显示了示意图,图示了遵循厌氧的、非生长的生物催化本文中所描述的重组微生物(GEVO927)生成的3-羟基丁酸乙酯的量,与相应的野生型微生物(GEVO1005,pGV1010)所生成的量比较。
图13显示了示意图,图示了遵循厌氧的、非生长的生物催化本文中所描述的微生物(GEVO1005,pGV1010)在甘油消耗方面的碳平衡和观察到的乙酸量。
图14显示了示意图,图示了遵循厌氧的、非生长的生物催化本文中所描述的重组微生物(GEVO927)在甘油消耗方面的碳平衡和观察到的乙酸量。
图15显示了使用利用来自纤细眼虫(Euglena gracilis)(pGV1191,pGV1113)和嗜水气单胞菌(pGV1191,pGV1117)的TER表达正丁醇生成途径的大肠杆菌菌株的发酵中随时间的正丁醇形成,与表达不含有TER酶的正丁醇生成途径的大肠杆菌(pGV1191)比较。实验是使用一式两份生物学复制品(two biologicalreplicates)进行的。
图16显示了示意图,图示了用本文中所公开的表达不同TER同系物(homologue)的重组微生物进行的正丁醇发酵(pGV1340;pGV1344;pGV1345;pGV1346;pGV1347;pGV1348;pGV1349;pGV1272(对照))。pGV1344含有编码齿垢密螺旋体(Treponema denticola)TER的基因。pGV1272含有编码纤细眼虫TER的基因。实验是使用一式两份生物学复制品进行的。
图17显示了示意图,图示了用含有所示表达不同TER同系物的质粒的重组微生物进行的正丁醇发酵(pGV1341;pGV1342;pGV1343;pGV1272(对照))。pGV1272含有编码纤细眼虫TER的基因。实验是使用一式两份生物学复制品进行的。
图18显示了示意图,图示了本文中所描述的重组微生物(菌株A:GEVO1083,pGV1191,pGV1113;菌株B:GEVO1121,pGV1191,pGV1113)在厌氧瓶发酵期间的乳酸生成。实验是使用一式两份生物学复制品进行的。
图19显示了示意图,图示了被工程化改造以灭活乙酸发酵性途径的依照本文中所描述的实施方案的重组微生物的正丁醇生成(菌株1137:GEVO1137,pGV1190,pGV1113;菌株1083:GEVO1083,pGV1190,pGV1113)。实验是使用一式两份生物学复制品进行的。
图20A显示了示意图,图示了依照本公开内容的实施方案的重组微生物(菌株1:GEVO1083,pGV1113,pGV1190;菌株2:GEVO1083,pGV1281,pGV1190)的正丁醇生成。实验是使用一式两份生物学复制品进行的。
图20B显示了示意图,图示了依照本公开内容的实施方案的重组微生物的葡萄糖消耗(矩形:GEVO1083,pGV1113,pGV1190;三角形:GEVO1083,pGV1281,pGV1190)。实验是使用一式两份生物学复制品进行的。
图21A显示了示意图,图示了用依照本文中所公开的实施方案的重组微生物进行的发酵,其是厌氧的,没有中和或补料(圆形:GEVO768,pGV1191,pGV1113;三角形:GEVO768)。实验是使用一式两份生物学复制品进行的。
图21B显示了示意图,图示了用图21A的重组微生物进行的发酵,其中在整个发酵过程中每8个小时补料葡萄糖和中和发酵液,且其中以需氧生长阶段和厌氧生物催化阶段实施发酵(圆形:GEVO768,pGV1191,pGV1113;三角形:GEVO768)。实验是使用一式两份生物学复制品进行的。
图22A显示了示意图,图示了用依照本文中所公开的实施方案的重组微生物(GEVO1083,pGV1190,pGV1113)在从需氧到厌氧培养条件的不同转换(transition)下进行的发酵期间的正丁醇生成。发酵罐1(F1)具有2小时转换,发酵罐2(F2)具有6小时转换,发酵罐3(F3)具有12小时转换,而在发酵罐4中,转换是以细胞消耗停止供氧后发酵罐中剩下的氧所用时间进行的。
图22B显示了示意图,图示了用依照本文中所公开的实施方案的重组微生物(GEVO1083,pGV1190,pGV1113)在从需氧到厌氧培养条件的不同转换下进行的发酵期间的生成。发酵罐1(F1)具有2小时转换,发酵罐2(F2)具有6小时转换,发酵罐3(F3)具有12小时转换,而在发酵罐4中,转换是以细胞消耗停止供氧后发酵罐中剩下的氧所用时间进行的。
图23A显示了示意图,图示了依照本公开内容的实施方案的重组微生物的葡萄糖消耗(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图23B显示了示意图,图示了依照本公开内容的实施方案的重组微生物甲酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图23C显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙醇生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图23D显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图24A显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乳酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图24B显示了示意图,图示了依照本公开内容的实施方案的重组微生物的琥珀酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图25A显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙醇生成(矩形:GEVO992,pGV1278;三角形:GEVO992,pGV1279;圆形:GEVO992,pGV772)。实验是使用一式两份生物学复制品进行的。
图25B显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙酸生成(矩形:GEVO992,pGV1278;三角形:GEVO992,pGV1279;圆形:GEVO992,pGV772)。实验是使用一式两份生物学复制品进行的。
图26显示了示意图,图示了野生型大肠杆菌和自质粒pGV1563表达DHA激酶的大肠杆菌GEVO926中的甘油代谢。
图27显示了微生物中用以生成正丁醇与丁酸的混合物的化学途径。所描绘的正丁醇生成途径在NADH生成和消耗方面是平衡的,即每代谢1个葡萄糖就生成和消耗(4)个NADH。
发明详述
描述了被工程化改造以以高产率将碳源转化成正丁醇的重组微生物。具体而言,描述了能够代谢碳源用于以理论产率的至少5%的产率生成正丁醇的重组微生物。
如本文中所使用的,术语“微生物”包括原核的和真核的微生物物种,其来自古细菌、细菌和真核生物范畴,后一种包括酵母和丝状真菌、原生动物、藻类、或高等原生生物。术语“细胞”和“微生物细胞”可以与术语“微生物”互换使用。在一个优选的实施方案中,微生物是大肠杆菌或酵母(诸如粟酒裂殖糖酵母(S.pombe)或酿酒酵母或啤酒糖酵母(S.cerevisiae))。
“细菌”或“真细菌”指原核生物体的一个范畴。细菌包括至少11个不同的组,如下:(1)革兰氏阳性(Gram+)细菌,其中有两个主要的分部:(a)高G+C组(放线菌属(Actinomycetes)、分支杆菌属(Mycobacteria)、微球菌属(Micrococcus)等),(b)低G+C组(芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、乳杆菌属(Lactobacillus)、葡萄球菌属(Staphylococci)、链球菌属(Streptococci)、支原体属(Mycoplasmas));(2)变形细菌(Proteobacteria),例如,紫色光合的和非光合的革兰氏阴性细菌(包括最“普通的”革兰氏阴性细菌);(3)蓝细菌属(Cyanobacteria),例如,生氧光养生物;(4)螺旋体属(Spirochetes)及相关物种;(5)浮霉状菌属(Planctomyces);(6)拟杆菌属(Bacteroides)、黄杆菌属(Flavobacteria);(7)衣原体属(Chlamydia);(8)绿色硫磺细菌;(9)绿色非硫磺细菌(也称作厌氧光养生物);(10)抗放射性微球菌及亲属;(11)栖热袍菌属(Thermotoga)和嗜热栖热腔菌(Thermosipho thermophiles)。
“革兰氏阴性细菌”包括球菌、非肠的(nonenteric)杆状菌和肠的杆状菌。革兰氏阴性细菌的属包括,例如,奈瑟氏菌属(Neisseria)、螺菌属(Spirillum)、巴斯德氏菌属(Pasteurella)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、弗朗西丝氏菌属(Francisella)、嗜血杆菌属(Haemophilus)、博德特氏菌属(Bordetella)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、克雷伯氏菌属(Klebsiella)、变形菌属(Proteus)、假单胞菌属(Pseudomonas)、拟杆菌(Bacteroides)、醋杆菌属(Acetobacter)、气杆菌属(Aerobacter)、土壤杆菌属(Agrobacterium)、固氮菌属(Azotobacter)、粘球菌属(Myxococcus)、螺菌属(Spirilla)、沙雷氏菌属(Serratia)、弧菌属(Vibrio)、根瘤菌属(Rhizobium)、衣原体属(Chlamydia)、立克次氏体属(Rickettsia)、密螺旋体属(Treponema)和梭杆菌属(Fusobacterium)。
“革兰氏阳性”细菌包括球菌、不形成孢子的杆状菌和形成孢子的杆状菌。革兰氏阳性细菌的属包括,例如,放线菌属(Actinomyces)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、丹毒丝菌属(Erysipelothrix)、乳杆菌属(Lactobacillus)、利斯特氏菌属(Listeria)、分支杆菌属(Mycobacterium)、诺卡氏菌属(Nocardia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。
术语“碳源”一般指适合用作原核细胞或简单的真核细胞的生长的碳来源的底物或化合物。碳源可以是各种形式,包括,但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。这些包括,例如,各种单糖诸如葡萄糖、寡糖、多糖、纤维素材料、饱和的或不饱和的脂肪酸、琥珀酸、乳酸、乙醇等,或其混合物。碳源还可以是光合作用的产物,包括,但不限于葡萄糖。术语“碳源”可以与术语“能源(energy source)”互换使用,因为在化能有机营养代谢中,碳源既用作分解代谢期间的电子供体又用作细胞生长期间的碳来源。
充当用于生成正丁醇产物的合适起始材料的碳源包括,但不限于,生物质水解产物、葡萄糖、淀粉、纤维素、半纤维素、木糖、木质素、右旋糖、果糖、半乳糖、玉米、液化玉米粉、玉米浆(玉米湿磨工艺的副产品,其含有浸泡期间自玉米浸出的营养物)、糖蜜、木质纤维素和麦芽糖。光合生物体能另外生成碳源,作为光合作用的产物。在一个优选的实施方案中,碳源可选自生物质水解产物和葡萄糖。葡萄糖、右旋糖和淀粉可以来自内源的或外源的来源。
应当注意,可以用其它更加易得的和/或便宜的碳源替代葡萄糖,这对宿主微生物的改动是较为微小的。例如,在某些实施方案中,使用其它可再生的和经济上可行的底物可能是优选的。这些包括:农业废物、基于淀粉的包装材料、玉米纤维水解产物、大豆糖蜜、水果加工业废物和乳清渗透物等。
五碳糖只被能够加工这些糖的微生物菌株用作碳源,例如大肠杆菌B。在一些实施方案中,可以使用甘油(glycerol)(一种三碳碳水化合物)作为生物转化的碳源。在其它实施方案中,可以使用甘油(glycerin)或通过水解来自植物和动物脂肪和油的甘油三酸酯得到的不纯的甘油作为碳源,只要任何杂质不会对宿主微生物产生不利影响。
如本文中所使用的,术语“产率”指摩尔产率。例如,若1摩尔葡萄糖被转化成1摩尔正丁醇,则产率等于100%。具体而言,术语“产率”定义为每摩尔碳源单体得到的产物摩尔数,而且可以表述为%。除非另有说明,产率表述为理论产率的%。“理论产率”定义为根据用于生成产物的代谢途径的化学计量的规定,每摩尔指定底物能生成的产物最大摩尔数。例如,葡萄糖变成正丁醇的一种典型转化的理论产率为100%。因此,葡萄糖变成正丁醇的产率为95%会表述为理论产率的95%或95%理论产率。例如,甘油变成正丁醇的一种典型转化的理论产率为50%。因此,甘油变成正丁醇的产率为45%会表述为理论产率的90%或90%理论产率。
本文中所公开的微生物是使用遗传工程技术被工程化改造的,以提供利用异源表达的酶来以高产率生成正丁醇的微生物,具体而言,产率为理论产率的至少5%。
术语“酶”,如本文中所使用的,指任何催化或促进一种或多种化学或生物化学反应的物质,其通常包括完全或部分由多肽构成的酶,但是可以包括由不同分子(包括多核苷酸)构成的酶。
术语“多核苷酸”在本文中可以与术语“核酸”互换使用,指由两个或更多个单体(包括核苷酸、核苷或其类似物)构成的有机聚合物,包括但不限于单链的或双链的、有义的或反义的任何长度脱氧核糖核酸(DNA)及适当时单链的或双链的、有义的或反义的任何长度核糖核酸(RNA),包括siRNA。术语“核苷酸”指数种由核糖或脱氧核糖与嘌呤或嘧啶碱基及与磷酸基团相连接而组成的化合物之任一,其是核酸的基本结构单元。术语“核苷”指由嘌呤或嘧啶碱基与脱氧核糖或核糖相组合而组成的化合物(像鸟苷或腺苷),其尤其见于核酸。术语“核苷酸类似物”或“核苷类似物”分别指其中一个或多个单独的原子被不同的原子或被不同的官能团替换的核苷酸或核苷。因而,术语多核苷酸包括任何长度的核酸、DNA、RNA、其类似物和片段。三个或更多个核苷酸的多核苷酸称作核苷酸寡聚物或寡核苷酸。
术语“蛋白质”或“多肽”,如本文中所使用的,指由两个或更多个氨基酸单体和/或其类似物构成的有机聚合物。如本文中所使用的,术语“氨基酸”或“氨基酸单体”指任何天然的和/或合成的氨基酸,包括甘氨酸和D或L两种光学异构体。术语“氨基酸类似物”指其中一个或多个单独的原子被不同的原子或不同的官能团替换的氨基酸。因而,术语多肽包括任何长度的氨基酸聚合物,包括全长蛋白质,和肽以及其类似物和片段。三个或更多个氨基酸的多肽称作蛋白质寡聚物或寡肽。
术语“异源”或“外源”,如本文中关于分子(尤其是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体以外的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。
另一方面,术语“天然”或“内源”,如本文中关于分子(尤其是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。
在某些实施方案中,天然的、未工程化改造的微生物不能够将碳源转化成正丁醇或一种或多种其代谢中间产物,因为,例如,此类野生型宿主缺乏正丁醇生成途径中所需要的一种或多种酶。
在某些实施方案中,天然的、未工程化改造的微生物只能够以小于理论产率的0.1%的产率将微量的碳源转化成正丁醇。
例如,微生物诸如大肠杆菌或酵母属菌种(Saccharomyces sp.)一般不具有将糖诸如葡萄糖转化成正丁醇的代谢途径,但是有可能将来自生成正丁醇的菌株(例如梭菌)的正丁醇生成途径转移入细菌的或真核的异源宿主中,诸如大肠杆菌或酵母属菌种,并使用所得重组微生物来生产正丁醇。
微生物,一般而言,作为宿主是合适的,如果它们拥有内在特性,诸如溶剂抗性,这会容许它们在含有溶剂的环境中代谢碳源。
术语“宿主”、“宿主细胞”和“重组宿主细胞”在本文中可以互换使用,不仅指特定的受试细胞而且指这样的细胞的后代或潜在后代。因为在后续世代中由于突变或环境影响可能发生某些修饰,所以这样的后代事实上与亲本细胞可能不是同样的,但是仍然包括在如本文中所使用的该术语的范围内。
对于生产正丁醇有用的宿主可以是真核的或原核的微生物。虽然大肠杆菌是优选的宿主之一,但是其它宿主包括酵母菌株诸如糖酵母属菌株,其能耐受对大肠杆菌有毒的正丁醇水平。
在某些实施方案中,其它合适的真核宿主微生物包括,但不限于,毕赤氏酵母属(Pichia)、Hangeul、耶氏酵母属(Yarrowia)、曲霉属(Aspergillus)、克鲁维酵母属(Kluyveromyces)、管囊酵母属(Pachysolen)、红酵母属(Rhodotorula)、
接合糖酵母属(Zygosaccharomyces)、Galactomyces、裂殖糖酵母属(Schizosaccharomyces)、青霉属(Penicillhim)、球拟酵母属(Torulaspora)、德巴利氏酵母属(Debaryomyces)、威尔氏酵母属(Williopsis)、德克酵母属(Dekkera)、克勒克氏酵母属(Kloeckera)、梅奇酵母属(Metschnikowia)和假丝酵母属(Candida)物种。
在另一个优选的实施方案中,宿主是细菌宿主。在一个更加优选的实施方案中,宿主包括节杆菌属(Arthrobacter)、芽孢杆菌属(Bacillus)、短杆菌属(Brevibacterium)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、葡萄糖杆菌属(Gluconobacter)、诺卡氏菌属(Nocardia)、假单胞菌属(Pseudomonas)、红球菌属(Rhodococcus)、链霉菌属(Streptomyces)、黄单胞菌属(Xanthomonas)。在一个更加优选的实施方案中,此类宿主是大肠杆菌或假单胞菌属。在一个甚至更加优选的实施方案中,此类宿主是大肠杆菌(诸如大肠杆菌W3110或大肠杆菌B)、食油假单胞菌(Pseudomonas oleovorans)、荧光假单胞菌(Pseudomonas fluorescens)、或恶臭假单胞菌(Pseudomonas putida)。
在某些实施方案中,本文中所公开的重组微生物对生长培养基中的某些水平的正丁醇有抗性,使得它能够在含至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.2%、1.5%、1.8%、2%、3%、4%、5%、6%、7%、8%或更多正丁醇的培养基中以与该微生物在不含正丁醇的培养基中生长的速率基本上相同的速率生长。如本文中所使用的,“基本上相同”指野生型生长速率的至少约80%、90%、100%、110%、或120%。
具体而言,本文中所公开的重组微生物被工程化改造以活化(尤其是表达)能在正丁醇生产中使用的异源酶。具体而言,在某些实施方案中,该重组微生物被工程化改造以活化催化乙酰-CoA转化成正丁醇的异源酶。
术语“活化”,如本文中关于生物学活性分子(诸如酶)所使用的,指微生物的基因组和/或蛋白质组中提高该微生物中的生物学活性分子的生物学活性的任何修饰。例示性的活化包括但不限于导致分子从生物学无活性形式变成生物学有活性形式及从生物学有活性形式变成生物学更有活性形式的转化的修饰,及导致生物学活性分子在微生物中表达的修饰,其中该生物学活性分子先前不表达。例如,生物学活性分子的活化可以如下来实施,即在微生物中表达编码生物学活性分子的天然的或异源的多核苷酸,在微生物中表达编码生物学活性分子的合成途径中所牵涉的酶的天然的或异源的多核苷酸,在微生物中表达增强生物学活性分子的表达的天然的或异源的分子。
在一些实施方案中,重组微生物可表达一种或多种编码赋予正丁醇生成能力的酶的异源基因。例如,本文中所公开的重组微生物可表达编码以下一项或多项的异源基因:厌氧活性丙酮酸脱氢酶(Pdh)、NADH依赖性甲酸脱氢酶(Fdh)、乙酰-CoA-乙酰基转移酶(硫解酶)、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶、正丁醇脱氢酶、双功能丁醛/正丁醇脱氢酶。此类异源DNA序列优选得自异源微生物(诸如丙酮丁醇梭菌或拜氏梭菌(Clostridium beijerinckii)),而且可以使用常规分子生物学技术导入适宜宿主中。这些异源DNA序列使得重组微生物能够生成正丁醇,至少以比野生型对应(counterpart)微生物所生成的量更大的量生成正丁醇或其代谢中间产物。
在某些实施方案中,本文中所公开的重组微生物表达异源硫解酶或乙酰-CoA-乙酰基转移酶,诸如由来自梭菌属的thl基因所编码的。
硫解酶(E.C.2.3.1.19)或乙酰-CoA乙酰基转移酶是催化乙酰基缩合到乙酰-CoA分子上的酶。该酶在丙酮丁醇梭菌由基因thl编码(GenBank登录号U08465,蛋白质ID AAA82724.1),在其它酶中,该酶在大肠杆菌中在其用于丙酮生成的天然启动子下过表达(Bermejo等,Appl.Environ.Mirobiol.64:1079-1085,1998)。同源酶也已经鉴定,而且本领域技术人员通过实施针对上述蛋白质序列的BLAST搜索能容易地鉴定。这些同系物也能充当异源表达的正丁醇途径中的合适硫解酶。仅举几例,这些同源酶包括,但不限于那些来自以下各项的:丙酮丁醇梭菌(例如,蛋白质TD AAC26026.1),巴氏梭菌(C.pasteurianum)(例如,蛋白质ID ABA18857.1),拜氏梭菌(例如,蛋白质IDEAP59904.1或EAP59331.1),产气荚膜梭菌(Clostridium perfringens)(例如,蛋白质ID ABG86544.1,ABG83108.1),艰难梭菌(Clostridium difficile)(例如,蛋白质ID CAJ67900.1或ZP_01231975.1),热解糖热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)(例如,蛋白质IDCAB07500.1),腾冲热厌氧杆菌(Thermoanaerobacter tengcongensis)(例如,AAM23825.1),生氢氧化碳嗜热菌(Carboxydothermus hydrogenoformans)(例如,蛋白质ID ABB 13995.1),Desulfotomaculum reducens MI-1(例如,蛋白质ID EAR45123.1),热带假丝酵母(Candida tropicalis)(例如,蛋白质IDBAA02716.1或BAA02715.1),酿酒酵母(例如,蛋白质ID AAA62378.1或CAA30788.1),芽孢杆菌属菌种,埃氏巨球形菌(Megasphaera elsdenii)或溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)等。另外,内源大肠杆菌硫解酶在异源表达的正丁醇途径中也可以是有活性的。大肠杆菌合成两种不同的3-酮酰-CoA硫解酶。一种是fadA基因的产物,另一种是atoB基因的产物。
根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约65%、70%、80%或90%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适硫解酶同系物。此类同系物包括(但不限于):拜氏梭菌NCIMB 8052(ZP_00909576.1或ZP_00909989.1),丙酮丁醇梭菌ATCC 824(NP_149242.1),破伤风梭菌(Clostridium tetani)E88(NP_781017.1),产气荚膜梭菌菌株13(NP_563111.1),产气荚膜梭菌SM101(YP_699470.1),巴氏梭菌(ABA18857.1),热解糖热厌氧杆菌(CAB04793.1),艰难梭菌QCD-32g58(ZP_01231975.1),艰难梭菌630(CAJ67900.1)等。
在某些实施方案中,本文中所公开的重组微生物表达异源3-羟基丁酰-CoA脱氢酶,诸如由来自梭菌属的hbd基因所编码的。
3-羟基丁酰-CoA脱氢酶(BHBD)是催化乙酰乙酰-CoA转化成3-羟基丁酰-CoA的酶。此酶存在生成3-羟基丁酰-CoA的(S)或(R)异构体的不同变体。在其它基因中,携带含有BHBD(hbd)的丙酮丁醇梭菌ATCC 824基因的大肠杆菌-丙酮丁醇梭菌穿梭载体的大肠杆菌已经显示出功能性过表达此酶。许多同源酶也已经鉴定。本领域技术人员通过例如实施针对上述丙酮丁醇梭菌BHBD的BLAST搜索能容易地鉴定别的同源酶。所有这些同源酶能充当异源表达的正丁醇途径中的BHBD。这些同源酶包括,但不限于以下各项:克氏梭菌(Clostridium kluyveri)表达此酶的两种不同形式(Miller等,J.Bacteriol.138:99-104,1979)。解纤维丁酸弧菌含有bhbd基因,其组织在其丁酸途径剩余部分的相同基因座内(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,Current Microbiology 47:203-207,2003)。编码短链酰基-CoA脱氢酶(SCAD)的基因克隆自埃氏巨球形菌并在大肠杆菌中表达。能测定体外活性(Becker等,Biochemistry 32:10736-10742,1993)。在大肠杆菌中鉴定了其它同系物(fadB),其中它是脂肪酸氧化途径的一部分(Pawar等,J.Biol.Chem.256:3894-3899,1981),还有其它梭菌属菌株诸如克氏梭菌(Hillmer等,FEBS Lett.21:351-354,1972;Madan等,Eur.J.BioChem.32:51-56,1973),拜氏梭菌,热解糖梭菌(C.thermosaccharolyticum),破伤风梭菌。
在某些实施方案中,其中表达BHBD,选择与上游硫解酶或下游巴豆酸酶起源相同的生物体的酶可能是有益的。这可避免在表达来自不同生物体的酶时对该途径中邻近蛋白质之间的潜在蛋白质-蛋白质相互作用的破坏。
在某些实施方案中,本文中所公开的重组微生物表达异源巴豆酸酶,诸如由来自梭菌属的crt基因所编码的。
巴豆酸酶或烯酰-CoA水合酶是催化顺式和反式烯酰-CoA底物可逆水合成相应的β-羟酰CoA衍生物的酶。在丙酮丁醇梭菌中,丁酸代谢的这个步骤由crt基因所编码的EC 4.2.1.55来催化(GenBank蛋白质编号AAA95967,Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52)。来自丙酮丁醇梭菌的巴豆酸酶(Crt)已经纯化至均质并表征(Waterson等,J.Biol.Chem.247:5266-5271,1972)。它在天然的和变性的状态都表现为均质的蛋白质。该酶表现出作为四聚体发挥功能,亚基分子量为28.2kDa和261个残基(Waterson等报道了分子量为40kDa和长度为370个残基)。纯化的酶在缓冲溶液中在4℃保存时或在冷冻时丧失活性(Waterson等,J.Biol Chem.247:5266-5271,1972)。该酶的最适pH为pH 8.4(Schomburg等,Nucleic Acids Res.32:D431-433,2004)。与具有广泛底物特异性的哺乳动物巴豆酸酶不同,细菌的酶只水合巴豆酰-CoA和己烯酰-CoA。为巴豆酰-CoA得到了Vmax和Km值为6.5×106摩尔每分每摩尔和3×10-5M。该酶在巴豆酰-CoA浓度高于7×105M时受到抑制(Waterson等,J.Biol.Chem.247:5252-5257,1972;Waterson等,J.Biol.Chem.247:5258-5265,1972)。
已经解析出了巴豆酸酶家族的许多酶的结构(Engel等,J.Mol.Biol.275:847-859,1998)。crt基因在大肠杆菌中高表达,而且展现出比在丙酮丁醇梭菌中所看到的更高的比活(187.5U/mg胜过128.6U/mg)(Boynton等,J.Bacteriol.178:3015-3024,1996)。真核生物和原核生物中编码了巴豆酸酶的许多不同同系物,它们作为丁酸代谢、脂肪酸合成、β-氧化和其它相关途径的一部分发挥作用(Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52;Schomburg等,Nucleic Acids Res.32:D431-433,2003)。这些酶中许多已经被深入研究。来自牛肝的烯酰-CoA水合酶得到了极度深入的研究和彻底的表征(Waterson等,J.Biol Chem.247:5252-5257,1972)。生成了来自细菌的巴豆酸酶的20种最亲近直向同系物的ClustalW比对。同系物的序列同一性的变化范围为40-85%。可得到来自丙酮丁醇梭菌的Crt的蛋白质序列和crt的DNA序列(见下文,通过提述将所有序列并入本文)。巴豆酸酶(Crt)蛋白质序列(GenBank登录号AAA95967)显示于SEQ ID NO:2。
根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约55%、65%、75%或85%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适Crt同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_782956.1),产气荚膜梭菌SM101(YP_699562.1),产气荚膜梭菌菌株13(NP_563217.1),拜氏梭菌NCIMB 8052(ZP_00909698.1或ZP_00910124.1),沃氏共养单胞菌沃氏亚种(Syntrophomonas wolfei subsp.wolfei)菌株Goettingen(YP_754604.1),Desulfotomaculum reducens MI-1(ZP_01147473.1或ZP_01149651.1),热解糖热厌氧杆菌(CAB07495.1),生氢氧化碳嗜热菌Z-2901(YP_360429.1)等。
在梭菌中进行的研究证明了编码巴豆酸酶的crt基因是作为更大的BCS操纵子的一部分编码的。然而,对溶纤维丁酸弧菌(一种来自瘤胃的生成丁酸的细菌)的研究显示了略有不同的排列。虽然I型溶纤维丁酸弧菌具有作为操纵子的部分而簇集和排列的thl、crt、hbd、bcd、etfA和etfB基因,II型菌株具有类似的簇但缺少crt基因(Asanuma等,Curr.Microbiol 51:91-94,2005;Asanuma等,Curr.MicroBiol.47:203-207,2003)。既然该蛋白质在大肠杆菌中充分表达且彻底表征,那么丙酮丁醇梭菌酶是异源表达的正丁醇途径所优选的酶。其它可能的靶物是来自聚核梭杆菌文氏亚种(Fusobacterium nucleatum subsp.Vincentii)(Q7P3U9-Q7P3U9_FUSNV)、艰难梭菌(P45361-CRT_CLODI)、巴氏梭菌(P81357-CRT_CLOPA)和马尔他布鲁氏菌(Brucella melitensis)(Q8YDG2-Q8YDG2_BRUME)的同源基因。
在某些实施方案中,本文中所公开的重组微生物表达异源丁酰-CoA脱氢酶和必要时相应的电子传递蛋白,诸如由来自梭菌属的bcd、etfA和etfB基因所编码的。
丙酮丁醇梭菌丁酰-CoA脱氢酶(Bcd)是催化巴豆酰-CoA中的碳-碳双键还原以产生丁酰-CoA的酶。此反应偶联NADH的氧化。然而,该酶需要两种电子传递蛋白,即etfA和etfB(Bennett等,Ferns Microbiology Reviews 17:241-249,1995)。
丙酮丁醇梭菌ATCC 824的编码酶β-羟基丁酰-辅酶A(CoA)脱氢酶、巴豆酸酶和丁酰-CoA脱氢酶的基因在BCS操纵子上簇集,其GenBank登录号为U17110。
丁酰-CoA脱氢酶(Bcd)蛋白质序列(GenBank登录号AAA95968.1)显示于SEQ ID NO:3。
根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约70%、80%、85%或90%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适Bcd同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_782955.1或NP_781376.1),产气荚膜梭菌菌株13(NP_563216.1),拜氏梭菌(AF494018_2),拜氏梭菌NCMB 8052(ZP_00910125.1或ZP_00909697.1),热解糖热厌氧杆菌(CAB07496.1),腾冲热厌氧杆菌MB4(NP_622217.1)等。
电子传递黄素蛋白(EtfA)的α-亚基蛋白质序列(GenBank登录号AAA95970.1)显示于SEQ ID NO.4)。
电子传递黄素蛋白(EtfB)的β-亚基蛋白质序列(GenBank登录号AAA95969.1)显示于SEQ ID NO:5。
3-羟基丁酰-CoA脱氢酶(Hbd)蛋白质序列(GenBank登录号AAA95971.1)显示于SEQ ID NO:6。
根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约60%、70%、80%或90%序列同源性的同系物是能在本文中所描述的重组微生物中使用的合适Hbd同系物。此类同系物包括(但不限于):丙酮丁醇梭菌ATCC 824(NP_349314.1),破伤风梭菌E88(NP_782952.1),产气荚膜梭菌SM101(YP_699558.1),产气荚膜梭菌菌株13(NP_563213.1),糖丁酸梭菌(Clostridium saccharobutylicum)(AAA23208.1),拜氏梭菌NCIMB 8052(ZP_00910128.1),拜氏梭菌(AF494018_5),腾冲热厌氧杆菌MB4(NP_622220.1),热解糖热厌氧杆菌(CAB04792.1),Alkaliphilusmetalliredigenes QYMF(ZP_00802337.1)等。
Bcd对丁酰-CoA的Km为5。丙酮丁醇梭菌bcd和编码相应ETF的基因已经克隆入大肠杆菌-丙酮丁醇梭菌穿梭载体中。在用此质粒转化的丙酮丁醇梭菌ATCC 824中检测到升高的Bcd活性(Boynton等,Journal of Bacteriology 178:3015-3024,1996)。丙酮丁醇梭菌P262 Bcd对丁酰-CoA的Km为大约6μM(DiezGonzalez等,Current Microbiology 34:162-166,1997)。Bcd的同系物和相关ETF已经在生成丁酸的厌氧生物埃氏巨球形菌(Williamson等,Biochemical Journal 218:521-529,1984)、埃氏消化链球菌(Peptostreptococcuselsdenii)(Engel等,Biochemical Journal 125:879,1971)、布氏共养生孢菌(Syntrophospora bryanti)(Dong等,Antonie Van Leeuwenhoek InternationalJournal of General arid Molecular Microbiology 67:345-350,1995)和溃蚀密螺旋体(Treponema phagedemes)(George等,Journal of Bacteriology 152:1049-1059,1982)中鉴定。埃氏巨球形菌Bcd的结构已经解析(Djordjevic等,Biochemistry 34:2163-2171,1995)。丙酮丁醇梭菌ATCC 824 Bcd的BLAST搜索在极其多个物种中鉴定了大量同源序列,本文中上文列举了同系物中的一些。任何编码这些同系物的基因都可用于本发明。注意到,在一种微生物(诸如大肠杆菌)中异源表达这些基因时可产生表达和/或电子传递组织,但是在另一种微生物中则不然。另外,一种同源酶可在给定微生物中具有表达和/或电子传递组织,但是其它同源酶则可不然。不同的、大体等同的基因的可得性在工程化改造重组微生物时提供了更多设计选择。
一种早已在大肠杆菌中克隆和表达的有前途的bcd来自埃氏巨球形菌,而且所表达的酶的体外活性能测定(Becker等,Biochemistry 32:10736-10742,1993)。O′Neill等报道了etfA和eftB基因在大肠杆菌中的克隆和异源表达及所编码的来自埃氏巨球形菌的蛋白质的功能表征(O′Neill等,J.Biol.Chem.273:21015-21024,1998)。用ETF测定法测量了活性,该测定法将NADH氧化与巴豆酰-CoA经Bcd的还原偶联起来。含Bcd的重组ETF在ETF测定法中的活性与如Whitfield和Mayhew所报道的天然酶活性类似。因此,利用埃氏巨球形菌Bcd及其ETF蛋白提供了合成丁酰-CoA的解决方案。埃氏巨球形菌Bcd在重组表达时的Km测量为5μM,而在天然宿主中表达时为14μM(DuPlessis等,Biochemistry 37:10469-77,1998)。埃氏巨球形菌Bcd表现出在极低浓度受到乙酰乙酸抑制(Ki为0.1uM)(Vanberkel等,Eur.J.Biochem.178:197-207,1988)。在两个生成丁酸的解纤维丁酸弧菌的菌株中鉴定了含有thl、crt、hbd、bcd、etfA和etfB的基因簇。与丙酮丁醇梭菌相比,这些蛋白质的氨基酸序列相似性是高的(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,CurrentMicrobiology 47:203-207,2003)。在哺乳动物系统中,在线粒体中找到了牵涉短链脂肪酸氧化的类似的酶。
在某些实施方案中,本文中所公开的重组微生物表达异源“反式-2-烯酰-CoA还原酶”或“TER”。
反式-2-烯酰-CoA还原酶或TER是能够催化巴豆酰-CoA转化成丁酰-CoA的蛋白质。在某些实施方案中,重组微生物表达与来自梭菌属和其它细菌物种的Bcd/EtfA/EtfB催化相同反应的TER。来自纤细眼虫的线粒体TER已有描述,而且衍生自许多物种的许多TER蛋白和具有TER活性的蛋白质已经鉴定,形成TER蛋白质家族(美国专利申请2007/0022497,Cirpus等;Hoffmeister等,J.Biol.Chem.280:4329-4338,2005,通过提述将它们完整并入本文)。纤细眼虫基因的截短cDNA已经在大肠杆菌中功能性表达。此cDNA或来自其它微生物的同系物的基因能与正丁醇途径基因thl、crt、adhE2和hbd一起表达,用以在大肠杆菌、酿酒酵母或其它宿主中生成正丁醇。
TER蛋白还可通过本领域技术人员知道的生物信息学方法来鉴定,诸如BLAST。TER蛋白的例子包括,但不限于,来自以下物种的TER:
眼虫属(Euglena spp.),包括但不限于纤细眼虫;气单胞菌属(Aeromonasspp.),包括但不限于嗜水气单胞菌(A.hydrophila);冷单胞菌属(Psychromonasspp.),包括但不限于深海冷单胞菌(P.ingrahamii);发光杆菌属(Photobacteriumspp.),包括但不限于深海发光杆菌(P.profundum);弧菌属(Vibrio spp.),包括但不限于V angustum、霍乱弧菌(V.cholerae)、解藻朊酸弧菌(V.alginolyticus)、副溶血弧菌(V.parahaemolyticus)、创伤弧菌(V.vulnificus)、费氏弧菌(V.fischeri)、灿烂弧菌(V.splendidus);希瓦氏菌属(Shewanella spp.),包括但不限于S.amazonensis,S.woodyi,S.frigidimarina,S.paeleana,S.baltica,反硝化希瓦氏菌(S.denitrificans);海洋螺菌属(Oceanospirillum spp.);黄单胞菌属(Xanthomonas spp.),包括但不限于稻黄单胞菌(X.oryzae)、田野黄单胞菌(X.campestris);色盐杆菌属(Chromohalobacter spp.),包括但不限于需盐色盐杆菌(C.salexigens);Idiomarina spp.,包括但不限于I.baltica;交替假单胞菌属(Pseudoalteromonas spp.),包括但不限于大西洋交替假单胞菌(P.atlantica);交替单胞菌属(Alteromonas spp.);Saccharophagus spp.,包括但不限于S.degradans,S.marine gamma proteobacterium,S.alpha proteobacterium,假单胞菌属(Pseudomonas spp.),包括但不限于铜绿假单胞菌(P.aeruginosa)、恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens);伯克霍尔德菌属(Burkholderia spp.),包括但不限于B.phytofirmans,新洋葱伯克霍尔德氏菌(B.cenocepacia),洋葱伯克霍尔德氏菌(B.cepacia),B.ambifaria,越南伯克霍尔德氏菌(B.vietnamensis),B.multivorans,B.dolosa;甲基杆菌属(Methylbacillusspp.),包括但不限于M.flageliatus;寡养单胞菌属(Stenotrophomonas spp.),包括但不限于嗜麦芽糖寡养单胞菌(S.maltophilia);聚集杆菌属(Congregibacterspp.),包括但不限于C.litoralis;沙雷氏菌属(Serratia spp.),包括但不限于变形斑沙雷氏菌(S.proteamaadans);海洋单胞菌(Marinomonas spp.);Xytella spp.,包括但不限于X.fastidiosa;Reinekea spp.;科尔韦尔氏菌属(Colwellia spp.),包括但不限于C.psychrerythraea;耶尔森氏菌属(Yersinia spp.),包括但不限于鼠疫耶尔森氏菌(Y.pestis)、假结核耶尔森氏菌(Y.pseudotuberculosis);甲基菌属(Methylobacillus spp.),包括但不限于M.flageliatus;噬纤维菌菌属(Cytophagaspp.),包括但不限于哈氏噬纤维菌(C.hutchinsonii);黄杆菌属(Flavobacteriumspp.),包括但不限于F.johnsoniae;微颤菌属(Microscilla spp.),包括但不限于M.marina;极地杆菌属(Polaribacter spp.),包括但不限于P.irgensii;梭菌属,包括但不限于丙酮丁醇梭菌、拜氏梭菌、解纤维梭菌;柯克斯体属(Coxiellaspp.),包括但不限于贝氏柯克斯体(C.burnetii)。
在前述之外,术语“反式-2-烯酰-CoA还原酶”或“TER”指能够催化巴豆酰-CoA转化成丁酰-CoA且根据使用缺省参数的NCBI BLAST的计算,与SEQ ID NO:7所示截短的纤细眼虫TER或SEQ ID NO:8所示全长的嗜水气单胞菌TER之任一或二者共享至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大序列同一性,或至少约50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更大序列相似性的蛋白质。
如本文中所使用的,“序列同一性”指所比对的序列中同一位置中完全相同核苷酸或氨基酸的存在。“序列相似性”考虑到了大致匹配,而且只在依照“差异”或“相同性”的一些量度对此类替代打分时有意义,在所述度量中保守的或高度可能的替代被赋以比非保守的或不大可能的替代更有利得分。
使用TER代替Bcd/EtfA/EtfB的另一个优点是TER在单体形式是有活性的,而且蛋白质表达和酶自身都对氧不敏感。
如本文中所使用的,“反式-2-烯酰-CoA还原酶(TER)同系物”指来自其它生物体(例如,属于眼虫或气单胞菌类(phylum))的酶同源多肽,其具有与上文所定义的相同的TER本质特征,但是共享小于40%的序列同一性和50%的序列相似性标准,如上文所讨论的。突变涵盖一个或多个氨基酸残基的替代、添加、删除、倒位或插入。这容许需氧生长和正丁醇过程的表达阶段期间的酶表达,能潜在容许更加高效的生物燃料生成过程。
在某些实施方案中,本文中所公开的重组微生物表达异源丁醛脱氢酶/正丁醇脱氢酶,诸如由来自梭菌属的bdhA/bdhB、aad或adhE2基因所编码的。
丁醛脱氢酶(BYDH)是催化丁酰-CoA NADH依赖性还原成丁醛的酶。丁醛进一步被正丁醇脱氢酶(BDH)还原成正丁醇。此还原也伴有NADH氧化。丙酮丁醇梭菌含有已经显示出将丁酰-CoA转化成正丁醇的数种酶的基因。
这些酶之一由aad编码(Nair等,J.Bacteriol.176:871-885,1994)。此基因在丙酮丁醇梭菌菌株DSM 792中称作adhE。该酶是sol操纵子的一部分,而且它编码功能性BYDH/BDH(Fischer等,Journal of Bacteriology 175:6959-6969,1993;Nair等,J.Bacteriol 176:871-885,1994)。此蛋白质的蛋白质序列(GenBank登录号AAD04638.1)显示于SEQ ID NO:9。
aad的基因产物在大肠杆菌中功能性表达。然而,在需氧条件下,所得活性保持很低,指示氧敏感性。根据对丁醛的活性相对于对乙醛的活性为超过100倍高,Aad的主要作用在正丁醇的形成中而非乙醇(Nair等,Journal ofBacteriology 176:5843-5846,1994)。
根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_781989.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC13124(YP_697219.1),产气荚膜梭菌SM101(YP_699787.1),拜氏梭菌NCIMB8052(ZP_00910108.1),丙酮丁醇梭菌ATCC 824(NP_149199.1),艰难梭菌630(CAJ69859.1),艰难梭菌QCD-32g58(ZP_01229976.1),热纤维梭菌(Clostridiumthermocellum)ATCC 27405(ZP_00504828.1)等。
另外两种NADH依赖性正丁醇脱氢酶(BDH I,BDH II)已经纯化,而且它们的基因(bdhA,bdhB)已经克隆。BDH I的GenBank登录号是AAA23206.1,而蛋白质序列显示于SEQ ID NO:10。
BDH II的GenBank登录号是AAA23207.1,而蛋白质序列显示于SEQ IDNO:11。
这些基因在染色体上是相邻的,但是由它们自己的启动子转录(Walter等,Gene 134:107-111,1993)。BDH I利用NADPH作为辅因子,而BDH II利用NADH。然而,注意到相对辅因子偏爱是pH依赖性的。在自质粒表达bdhA后在大肠杆菌裂解物(lysate)中观察到BDH I活性(Petersen等,Journal ofBacteriology 173:1831-1834,1991)。BDH II据报道具有对丁醛的活性是对乙醛的活性的46倍高,而且在逆方向的活性低50倍。BDH I对丁醛的活性只为对乙醛的活性约2倍高(Welch等,Archives of Biochemistry和Biophysics 273:309-318,1989)。如此,在一个实施方案中,在异源表达的正丁醇途径中使用BDH II或BDH II同系物。另外,这些酶在5.5的相对较低pH更有活性,在选择合适的宿主和/或工艺条件时可考虑此性状。
虽然上文所述基因在产溶剂的条件下转录,一种不同的基因,adhE2在产醇的条件下转录(Fontaine等,J.Bacteriol.184:821-830,2002,GenBank登录号AF321779)。这些条件在相对中性的pH存在。该酶已经在大肠杆菌的厌氧培养中过表达,且具有高NADH依赖性BYDH和BDH活性。在某些实施方案中,此酶是优选的酶。此酶的蛋白质序列(GenBank登录号AAK09379.1)显示于SEQ ID NO:1。
根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括(但不限于):产气荚膜梭菌SM101(YP_699787.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC 13124(YP_697219.1),破伤风梭菌E88(NP_781989.1),拜氏梭菌NCIMB8052(ZP_00910108.1),艰难梭菌QCD-32g58(ZP_01229976.1),艰难梭菌630(CAJ69859.1),丙酮丁醇梭菌ATCC 824(NP_149325.1),热纤维梭菌ATCC27405(ZP_00504828.1)等。
在某些实施方案中,可以使用与任何上述多肽至少约70%、80%、90%、95%、99%同一的,或共享至少约60%、70%、80%、90%、95%序列同源性(相似的)的任何同源酶代替这些野生型多肽。这些共享必需序列同一性或相似性的酶可以是来自不同生物体的野生型酶,或者可以是人工的/重组的酶。
在某些实施方案中,可以使用编码具有与任何上述酶相同活性的酶的任何基因代替编码上述酶的基因。这些酶可以是来自不同生物体的野生型酶,或者可以是人工的、重组的、或工程化改造的酶。
另外,由于遗传密码的内在简并性,也可以使用编码基本上相同的或功能上等同的氨基酸序列的其它核酸序列来克隆和表达编码此类酶的多核苷酸。本领域技术人员会理解,修饰编码序列以增强其在特定宿主中的表达会是有利的。在一种物种中最常被利用的密码子称作最佳密码子(optimalcodon),而不太经常利用的密码子归为罕见或低使用率密码子。可以替代密码子以反映宿主优选的密码子选择,即有时称作“密码子优化”或“控制物种密码子偏好”的过程。提供了为植物中的表达而优化核苷酸序列的方法学,例如,美国专利No.6,015,891及其中引用的参考文献。
在某些实施方案中,本文中所公开的重组微生物具有一种或多种来自产溶剂的梭菌属,诸如丙酮丁醇梭菌或拜氏梭菌的异源DNA序列。例示性的丙酮丁醇梭菌是菌株ATCC824,而例示性的拜氏梭菌是菌株NCIMB 8052。
基因的表达可以通过常规分子生物学手段来实现。例如,异源基因可以在诱导型启动子或组成性启动子的控制下。异源基因可以整合入宿主微生物的染色体中,或者作为能稳定传递(“遗传”)给子细胞的染色体外遗传元件存在。此类染色体外遗传元件(诸如质粒、BAC、YAC等)可以另外含有确保此类遗传元件在子细胞中的存在的选择标志。
在某些实施方案中,本文中所公开的重组微生物还可生成正丁醇生成途径的一种或多种代谢中间产物,诸如乙酰乙酰-CoA、羟基丁酰-CoA、巴豆酰-CoA、丁酰-CoA、或丁醛,和/或其衍生物,诸如丁酸。
在一些实施方案中,本文中所描述的为生成正丁醇而被工程化改造以活化一种或多种上文所述异源酶的重组微生物经异源途径生成正丁醇。
如本文中所使用的,术语“途径”指包括一种或多种受酶控制的、将底物转化成产物的化学反应的生物学过程。因而,用于将碳源转化成正丁醇的途径是包括一种或多种受酶控制的、将碳源转化成正丁醇的反应的生物学过程。“异源途径”指其中至少一种或多种化学反应之至少一种由至少一种异源酶催化的途径。另一方面,“天然途径”指其中一种或多种化学反应由天然酶催化的途径。
在某些实施方案中,本文中所公开的重组微生物被工程化改造以活化正丁醇生成异源途径(在本文中也称作正丁醇途径),其包含:(1)2个乙酰-CoA转化成乙酰乙酰-CoA,(2)乙酰乙酰-CoA转化成羟基丁酰-CoA,(3)羟基丁酰-CoA转化成巴豆酰-CoA,(4)巴豆酰-CoA转化成丁酰-CoA,(5)丁醛转化成正丁醇(见图2例示性图解)。
2个乙酰-CoA转化成乙酰乙酰-CoA可通过在重组微生物中表达编码乙酰-CoA-乙酰基转移酶(硫解酶)或Thl的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性硫解酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的thl,或来自巴氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB 8052或菌株BA101)、热带假丝酵母、芽孢杆菌属、埃氏巨球形菌、或解纤维丁酸弧菌的编码同源酶的基因,或选自fadA或atoB的大肠杆菌硫解酶基因编码。
乙酰乙酰-CoA转化成羟基丁酰-CoA可通过在重组微生物中表达编码羟基丁酰-CoA脱氢酶Hbd的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性Hbd由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的hbd,或来自克氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB 8052或菌株BA101)、热解糖梭菌、破伤风梭菌、解纤维丁酸弧菌、埃氏巨球形菌、或大肠杆菌(fadB)的编码同源酶的基因编码。
羟基丁酰-CoA转化成巴豆酰-CoA可通过在重组微生物中表达编码巴豆酸酶或Crt的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性crt由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的crt,或来自溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、艰难梭菌、巴氏梭菌、或马尔他布鲁氏菌的编码同源酶的基因编码。
巴豆酰-CoA转化成丁酰-CoA可通过在重组微生物中表达编码丁酰-CoA脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁酰-CoA脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的bcd/etfA/etfB,或来自埃氏巨球形菌、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、解纤维丁酸弧菌的编码同源酶的基因,或哺乳动物线粒体Bcd同系物编码。
丁醛转化成正丁醇可通过在重组微生物中表达编码丁醛脱氢酶或正丁醇脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁醛脱氢酶/正丁醇脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC824)的bdhA、bdhB、aad、或adhE2,或来自拜氏梭菌(具体而言来自菌株NCIMB8052或菌株BA101)的编码ADH-1、ADH-2、或ADH-3的基因编码。
在某些实施方案中,自乙酰-CoA至正丁醇的代谢途径的酶是(i)硫解酶(Thl),(ii)羟基丁酰-CoA脱氢酶(Hbd),(iii)巴豆酸酶(Crt),(iv)至少一种醇脱氢酶(AdhE2),或正丁醇脱氢酶(Aad)或丁醛脱氢酶(Ald)加之单功能正丁醇脱氢酶(BdhA/BdhB),和(v)反式-2-烯酰-CoA还原酶(TER)(图2)。在某些实施方案中,Thl、Hbd、Crt、AdhE2、Ald、BdhA/BdhB和Aad来自梭菌属。在某些实施方案中,梭菌属是丙酮丁醇梭菌。在某些实施方案中,TER来自纤细眼虫或来自嗜水气单胞菌。
表达异源正丁醇途径的重组微生物以很低的产率生成正丁醇,因为大部分碳被天然途径所代谢。表达异源正丁醇途径的微生物的正丁醇产率可限于低于2%的水平。如实施例19中所例示的,表达质粒pGV1191和pGV1113上的正丁醇途径的野生型大肠杆菌W3110以理论产率的约1.4%的产率将葡萄糖转化成正丁醇。
为了提供高正丁醇产率,包括用于正丁醇生成的活化的酶的重组微生物被进一步工程化改造以将源自碳源代谢的碳流指向正丁醇。具体而言,将碳流指向正丁醇可通过灭活与正丁醇生成竞争的代谢途径来实施。
关于正丁醇生成的“竞争性途径”指如下的将底物转化成产物的途径,其中至少一种底物是正丁醇生成中的代谢中间产物。在某些实施方案中,竞争性途径也能消耗NADH(在NADH消耗方面竞争)。与正丁醇生成竞争的例示性途径是通向不想要的发酵副产物且可能利用或消耗NADH的内源发酵途径。
术语“灭活的”或“灭活”,如本文中关于途径所使用的,指示一个途径,其中任何控制该途径中反应的酶无生物学活性,这包括但不限于通过删除一种或多种编码途径的酶的基因来实施酶的灭活。术语“活化的”或“活化”,如本文中关于途径所使用的,指示一个途径,其中任何控制该途径中反应的酶有生物学活性。因而,若至少一种控制途径中反应的酶被灭活,使得受所述酶控制的反应不发生,则该途径被灭活。相反,若所有控制途径中反应的所有酶被活化,则该途径被活化。
在某些实施方案中,竞争性代谢途径的灭活是通过灭活竞争性代谢途径中牵涉将底物转化成产物的酶来实施的。被灭活的酶可优选催化用于正丁醇生成的代谢中间产物的转化,或者可催化竞争性途径的代谢中间产物的转化。在某些实施方案中,该酶还消耗NADH,并因此也与正丁醇生成还在NADH消耗方面竞争。
术语“灭活”,如本文中关于生物学活性分子(诸如酶)所使用的,指微生物基因组和/和蛋白质组中防止或降低微生物中生物学活性分子的生物学活性的任何修饰。例示性的灭活包括但不限于导致分子从生物学有活性形式变成生物学无活性形式及从生物学有活性形式变成生物学较低或降低的活性形式的转化的修饰,及导致生物学活性分子完全或部分删除的任何修饰。例如,生物学活性分子的灭活可通过删除或突变微生物中编码该生物学活性分子的天然或异源多核苷酸,通过删除或突变微生物中编码酶(该酶牵涉生物学活性分子的合成途径)的天然或异源多核苷酸,通过活化微生物中抑制该生物学活性分子表达的其它天然或异源分子来实施。
具体而言,在一些实施方案中,生物学活性分子(诸如酶)的灭活可通过自重组微生物的基因组删除一个或多个编码酶的内源基因来实施。
因而,在某些实施方案中,灭活是通过自微生物基因组删除编码酶的基因来实施的,该酶牵涉与正丁醇生成竞争的途径,使得碳/NADH对于一种或多种用于生成正丁醇或其代谢中间产物的多肽是可得的。
在某些实施方案中,编码这些酶的基因的删除改善正丁醇产率,因为更多的碳和/或NADH变得对于一种或多种用于生成正丁醇或其代谢中间产物的多肽是可得的。
在某些实施方案中,自重组微生物的基因组删除的DNA序列编码选自下组的酶:D-乳酸脱氢酶,丙酮酸甲酸裂合酶,乙醛/醇脱氢酶,磷酸乙酰转移酶,乙酸激酶A,延胡索酸还原酶,丙酮酸氧化酶,和甲基乙二醛合酶。
具体而言,若微生物是大肠杆菌,则自基因组删除的DNA序列可以选自下组:ldhA pflB,pflDC,adhE,pta,ackA,frd,poxB和mgsA。
为大肠杆菌例示了被删除或敲除以生成本文中所公开的微生物的基因。本领域技术人员能容易地通过常规分子生物学技术(诸如序列同源性搜索、基于同源序列的克隆等)鉴定在其它微生物中编码与正丁醇生成途径竞争碳和/或NADH的酶的相应同源基因。一旦鉴定,可以依照完善建立的分子生物学方法在这些宿主生物体中删除或敲除靶基因。
在一个实施方案中,感兴趣基因的删除是依照同源重组的原理发生的。依照此实施方案,含有包含至少一种标志基因的模块的整合盒任一侧翼均为与靶定整合位点末端的DNA片段同源的DNA片段。通过适宜方法用该盒转化宿主微生物后,侧翼序列之间的同源重组可导致标志物替换介于染色体上与整合盒侧翼序列对应的两个位点之间的染色体区域。重组酶可推动同源重组事件,该重组酶可以是对宿主微生物而言天然的,或者是过表达的。
酶D-乳酸脱氢酶、丙酮酸甲酸裂合酶、乙醛/醇脱氢酶、磷酸乙酰转移酶、乙酸激酶A、延胡索酸还原酶、丙酮酸氧化酶和/或甲基乙二醛合酶可能是生成琥珀酸、乳酸、乙酸、乙醇、甲酸、二氧化碳和/或氢气的某些竞争性内源途径所要求的。
具体而言,酶D-乳酸脱氢酶(在大肠杆菌中由ldhA编码)将NADH的氧化与丙酮酸还原成D-乳酸偶联起来。先前已经显示ldhA的删除可消除发酵液中D-乳酸的形成(Causey,T.B.等,2003,Proc.Natl.Acad.Sci.100,825-32)。
酶丙酮酸甲酸裂合酶(在大肠杆菌中由pflB编码)将丙酮酸氧化成乙酰-CoA和甲酸。已经证明pflB的删除对于乙酸(Causey,T.B.等,2003,Proc.Natl.Acad.Sci.100,825-32)、丙酮酸(Causey,T.B.等,2004,Proc.Natl.Acad.Sci.101,2235-40)和乳酸(Zhou,S.,2005,Biotechnol.Lett.27,1891-96)的过度生成是重要的。甲酸能被甲酸氢裂合酶复合物进一步氧化成CO2和氢,但是在不存在pflB的情况中此复合物的删除应当不是必须的。pflDC是pflB的同系物,而且能通过突变来活化。如上文所指出的,对于正丁醇的厌氧发酵,丙酮酸甲酸裂合酶可能不需要删除。若宿主中没有早就可得的,则可提供(异源)NADH依赖性甲酸脱氢酶,来实现与NADH生成偶联的丙酮酸转化成乙酰-CoA。
酶乙醛/醇脱氢酶(在大肠杆菌由adhE编码)牵涉乙酰-CoA转化成乙醛脱氢酶和醇脱氢酶。具体而言,在需氧条件下,丙酮酸也被转化成乙酰-CoA,乙醛脱氢酶和醇脱氢酶,但是此反应是由多酶丙酮酸脱氢酶复合物催化的,产生CO2和1个当量的NADH。乙酰-CoA给TCA循环提供燃料,但是也能被乙醛脱氢酶和醇脱氢酶(二者均由基因adhE编码)氧化成乙醛和乙醇。这些反应每一个都与1个当量的NADH的还原偶联。
酶磷酸乙酰转移酶(在大肠杆菌中由pta编码)和乙酸激酶A(在大肠杆菌中由ackA编码)牵涉经乙酰磷酸将乙酰-CoA转化成乙酸的途径。ackA的删除先前已经用于指引代谢流远离乙酸生成(Underwood,S.A.等,2002,Appl.Environ.Microbiol,68,6263-72;Zhou,S.D.等,2003,Appl.Environ.Mirobiol,69,399-407),但是pta的删除应当实现相同的结果。
酶延胡索酸还原酶(在大肠杆菌中由frd编码)牵涉将丙酮酸转化成琥珀酸的途径。具体而言,在厌氧条件下,磷酸烯醇丙酮酸能经草酰乙酸、苹果酸和延胡索酸被还原成琥珀酸,导致2个当量的NADH被氧化成NAD+。每一种牵涉那些转化的酶可被灭活以消除此途径。例如,由延胡索酸还原酶催化的最终反应将延胡索酸转化成琥珀酸。此反应的电子供体是还原型甲萘醌,而且每一个所传递的电子导致两个质子的易位。已经证明了frd的删除对于还原型丙酮酸产物的生成是有用的。
酶丙酮酸氧化酶(在大肠杆菌中由poxB编码)前述将丙酮酸转化成乙酸的途径。此酶不需要NADH。然而,在丙酮酸脱羧时,丙酮酸氧化酶将电子自丙酮酸转移至泛醌以形成泛醇。由于此电子传递至醌池,丙酮酸氧化酶间接地提高了微生物对氧的需求。自微生物消除丙酮酸氧化酶会防止氧被此途径消耗。
酶甲基乙二醛合酶(MGS,在大肠杆菌中由mgsA编码)牵涉将丙酮酸转化成乳酸的途径。已经发现了即使在ldhA基因被灭活时,仍然生成显著的残余乳酸量。大部分残余乳酸可归于糖酵解途径的甲基乙二醛旁路。具体而言,甲基乙二醛旁路的第一步由甲基乙二醛合酶(MGS)(E.C.4.2.99.11)催化,其在大肠杆菌中由mgsA基因编码,或者称作yccG。通过数据库搜索在流感嗜血菌(Haemophilus influenzae)(D6411169)、枯草芽孢杆菌(Bacillus subtilis)(P42980)、流产布鲁氏菌(Brucella abortus)(BAU21919_2)和集胞蓝细菌属(Synechocystis)(SYCSLLLH_17)(
Figure A20078005085300341
等,Molecular Microbiology 27:553-562,1998)中鉴定出mgsA的同系物。MGS催化二羟基丙酮磷酸(DHAP)变成甲基乙二醛和正磷酸的表观不可逆转化。甲基乙二醛合酶已经在多种生物体中鉴定出,包括嗜糖假单胞菌(Pseudomonas saccarophila)、杜氏假单胞菌(Pseudomonas doudoroffi)、破伤风形梭菌(Clostridium tetanomorphum)、巴氏梭菌、巨大脱硫弧菌(Desulfovibrio gigas)和普通变形菌(Proteus vulgaris)(参见Saadat等,Biochemistry 37:10074-10086,1998;
Figure A20078005085300342
等,MolecularMicrobiology 27:553-562,1998)。甲基乙二醛在毫摩尔浓度是极度细胞毒性的。在大肠杆菌中,酶乙二醛酶I和II是用于通过催化甲基乙二醛变成D(-)-乳酸的谷胱甘肽依赖性转化而使甲基乙二醛解毒的主要酶。D(-)-乳酸能经连接有黄素的脱氢酶转化成丙酮酸。
基因fnr的表达与大肠杆菌中的一系列活性相关。与通过fnr表达的活性有关的途径通常与氧气利用有关,即随氧气的消减而下调,而且以相反的方式,发酵的备选厌氧途径被Fnr上调。那些途径的指示可见于ChrystalaConstantinidou等,“A Reassessment of the FNR Regulon and TranscriptomicAnalysis of the Effects of Nitrate,Nitrite,NarXL,and NarQP as Escherichia coliKl2 Adapts from Aerobic to Anaerobic Growth”,J.Biol.Chem.2006,281:4802-4815;Kirsty Salmon等,“Global Gene Expression Profiling inEscherichia coli Kl2-The Effects Of Oxygen Availability And FNR”,J.Biol.Chem.2003,278(32):29837-55;及Kirsty A.Salmon等,“Global Gene ExpressionProfiling in Escherichia coli Kl2-the Effects of Oxygen Availability and ArcA”,J.Biol.Chem.2005,280(15):15084-15096,通过提述将它们完整并入本申请。
通过所述酶中的一些催化的途径和转化示意性地图示于图3的例示性示意图。
鉴于上文,特别是通过所述酶的灭活而被灭活的途径,本文中公开了被工程化改造以活化用于正丁醇生成的一种或多种异源酶的重组微生物,该重组微生物被进一步工程化改造以灭活竞争性代谢途径,其包括(1)丙酮酸转化成乳酸,(2)乙酰-CoA转化成乙酸,(3)乙酰-CoA转化成乙醛,(4)丙酮酸转化成琥珀酸,和(5)丙酮酸转化成乙酸,和(6)任何与fnr基因在微生物中的表达有关的代谢途径。上文途径的示意图图示于图3。
具体而言,丙酮酸转化成乳酸的删除可通过灭活竞争酶D-乳酸脱氢酶和/或甲基乙二醛合酶,具体而言通过灭活微生物中编码D-乳酸脱氢酶的基因和/和微生物中编码甲基乙二醛合酶的基因来实施。
乙酰-CoA转化成乙酸的删除可通过灭活竞争酶乙醛/醇脱氢酶,具体而言通过灭活微生物中编码乙醛/醇脱氢酶的基因来实施。
乙酰-CoA转化成乙醛的删除可通过灭活竞争酶磷酸乙酰转移酶和/或竞争酶乙酸激酶A,具体而言通过灭活微生物中编码磷酸乙酰转移酶和/或乙酸激酶A的基因来实施。
丙酮酸转化成琥珀酸的删除可通过灭活竞争酶延胡索酸还原酶,具体而言通过灭活微生物中编码延胡索酸还原酶的基因来实施。
丙酮酸转化成乙酸的删除可通过灭活竞争酶丙酮酸氧化酶,具体而言通过灭活微生物中编码丙酮酸氧化酶的基因来实施。
任何与fnr基因有关的途径的删除可通过灭活微生物中的相关基因来实施。
在一些实施方案中,重组微生物被工程化改造以灭活这些途径之一。在一些实施方案中,重组微生物被工程化改造以灭活上文途径中的一些或全部。如此,涵盖并非全部的这些途径在所有实施方案中消除。这些途径中的一种或多种可保持大体的或部分的完整。另外,这些途径中的一种或多种可有条件地灭活,诸如通过使用诱导型启动子来指导这些途径中一种或多种关键酶的表达,或通过使用这些途径中的一种或多种关键酶的温度敏感性突变。尽管通常不是必须的,有可能使同一途径中的所有酶失能(disable)。
在一些实施方案中,乳酸脱氢酶的灭活及相关的丙酮酸转化成乳酸的灭活能提高正丁醇产率至约2%。例如,GEVO1082(大肠杆菌W3110,ΔldhA)的正丁醇产率预期为理论产率的约2%,其比没有消除任何竞争性途径的菌株高40%。然而,此菌株主要生成乙醇。在消除乙醇生成和进一步提高正丁醇产率的尝试中,可消除编码将乙酰-CoA转化成乙醇的醇脱氢酶的基因。
在一些实施方案中,醇脱氢酶的灭活和及相关的乙酰-CoA转化成乙醇的灭活能提高正丁醇产率至约6%。例如,GEVO1054(大肠杆菌W3110,ΔadhE)的正丁醇产率预期为理论产率的约5-5.6%。
在一些实施方案中,乳酸脱氢酶的灭活及相关的丙酮酸转化成乳酸的灭活和醇脱氢酶的灭活及相关的乙酰-CoA转化成乙醇的灭活可降低乳酸和乙醇的生成且可提高正丁醇产率至约7%。例如,GEVO1084(大肠杆菌W3110,ΔldhA,ΔadhE)的正丁醇产率预期为理论产率的约7%。
在一些实施方案中,乳酸脱氢酶、醇脱氢酶和延胡索酸还原酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇和丙酮酸转化成琥珀酸的灭活可降低乳酸、乙醇和琥珀酸的生成且可提高正丁醇产率至约21%。如实施例17中所例示的,GEVO1083(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd)的正丁醇产率可以为理论产率的约20-22.4%。
在一些实施方案中,乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和甲基乙二醛合酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、丙酮酸转化成琥珀酸和丙酮酸转化成甲基乙二醛的灭活可降低乳酸、乙醇和琥珀酸的生成和提高正丁醇产率至约21%。如实施例16中所例示的,GEVO1121(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd,ΔmgsA)的正丁醇产率可以比GEVO1083(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd)高约19%,如此可预期给出至少多至理论产率的25%的产率。
在一些实施方案中,乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和乙酸激酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、丙酮酸转化成琥珀酸和乙酰-CoA转化成乙酸的灭活可降低乳酸、乙醇、琥珀酸和乙酸的生成且可提高正丁醇产率至约25%。如实施例17中所例示的,GEVO1121(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd,ΔackA)的正丁醇产率为理论产率的约25%。
在某些实施方案中,本文中所公开的重组微生物中正丁醇的生成通过NADH依赖性途径发生,即其中底物转化成产物需要由NAD(P)H在所述途径内一些催化步骤途径所提供的还原当量或由所述途径内一些或一种酶或生物学活性分子所提供的还原当量。
具体而言,在其中正丁醇生成途径包括乙酰-CoA转化成正丁醇的实施方案中(见例如正丁醇途径,图2),将2分子的乙酰-CoA转化成1分子的正丁醇需要4分子的NADH。然而,在厌氧条件下将葡萄糖转化成乙酰-CoA期间,只生成2分子的NADH。
只给需要4分子NADH的正丁醇途径提供2分子NADH的微生物是不平衡的,如此,不能以大于理论产率的50%的产率生成正丁醇。因此,可以工程化改造微生物以提高自1摩尔葡萄糖生成的NADH摩尔数。优选的是,自1摩尔葡萄糖生成4摩尔NADH。
因而,在一些实施方案中,为了提供高正丁醇产率,将表达正丁醇生成的异源酶的重组微生物进一步工程化改造以在正丁醇生成方面平衡NADH生成和消耗,即,所生成的NADH分子的总数目(例如,糖酵解期间和丙酮酸转化成乙酰-CoA期间所生成的)等于正丁醇生成途径所消耗的NADH分子的总数目,如此不剩下多余的NADH也没有NADH不足。
因而,在那些实施方案中,将碳源转化成正丁醇在NADH生成和消耗方面是平衡的。碳源氧化反应期间所生成的NADH等于被利用来将乙酰-CoA转化成正丁醇的NADH。只有在这些条件下,所有的NADH才得到再循环。在没有再循环的情况中,NADH/NAD+比变得不平衡且会引起生物体最终死亡,除非有备选代谢途径可用来维持平衡。
具体而言,在某些实施方案中,重组微生物被工程化改造,使得正丁醇的生成通过发酵异源途径来发生,其中未工程化改造的微生物不能够经平衡的发酵来生成正丁醇,因为该微生物未生成足够的NADH来将乙酰-CoA转化成正丁醇。
如此,在某些实施方案中,如果必须或想要,在正丁醇生成的培养条件下,优选的是,在厌氧条件下,活化丙酮酸脱氢酶。在某些实施方案中,丙酮酸脱氢酶被工程化改造以在厌氧条件下有活性。或者,可以在微生物中表达来自在厌氧条件下利用该酶的异源宿主的丙酮酸脱氢酶。
在另一个实施方案中,甲酸氢裂合酶被NADH依赖性甲酸脱氢酶替换。
在又一个实施方案中,微生物被工程化改造以经工程化改造的生成足够NADH来将乙酰-CoA转化成正丁醇的代谢途径利用甘油作为碳源。
例如,在大肠杆菌宿主微生物中,在NADH生成方面平衡如图2所描绘的正丁醇生成途径,因为总共生成了4个NADH分子,然后通过途径酶消耗了总共4个NADH分子。这可以以数种方式来实现。在一个实施方案中,宿主可在厌氧条件下功能性表达天然丙酮酸脱氢酶。在另一个实施方案中,来自其它生物体的丙酮酸脱氢酶也可在厌氧条件下用于此目的。可以将由这些大肠杆菌或异源基因编码的多肽置于诱导型启动子的控制之下以实现功能性表达。
在某些实施方案中,本文中所公开的重组微生物包括活化的NADH依赖性甲酸脱氢酶,其在厌氧或微需氧条件下有活性。
NADH依赖性甲酸脱氢酶(Fdh;EC 1.2.1.2)催化甲酸氧化成CO2及同时的NAD+还原成NADH。Fdh能依照本公开内容用于提高宿主微生物内NADH的胞内可得性,而且可用于在NADH方面平衡正丁醇生成途径。具体而言,可以在宿主微生物中活化(特别是过表达)生物学活性NADH依赖性Fdh。在存在这些新导入的甲酸脱氢酶途径的情况中,当1摩尔甲酸被转化成二氧化碳时会形成1摩尔NADH。在某些实施方案中,在天然微生物中,甲酸脱氢酶将甲酸转化成CO2和H2,不牵涉辅因子。
在某些实施方案中,诸如在其中微生物是大肠杆菌的实施方案中,宿主利用内源丙酮酸-甲酸-裂合酶(在大肠杆菌中由pfl编码)来在厌氧条件下将丙酮酸转化成乙酰-CoA,此反应不生成NADH,因为丙酮酸-甲酸-裂合酶不是NADH依赖性的。在此情形下,可以在微生物中活化NADH依赖性甲酸脱氢酶,使得在厌氧或微需氧条件下类似地实现与内源非NADH依赖性丙酮酸-甲酸-裂合酶组合的下列反应化学计量(Berrios-Rivera,SJ.等,2002,Metabol.Eng.2002,217-29):
丙酮酸+NAD+→乙酰-CoA+NADH+CO2
具体而言,可活化异源NADH依赖性甲酸脱氢酶,使得丙酮酸的转化导致相同的净化学计量:对于每摩尔的丙酮酸,形成1摩尔的二氧化碳,产生必需当量的NADH。这容许细胞保持还原能力,其在其它情况中在天然途径中会因释放甲酸或氢而丧失。
在本文中所描述的重组微生物中合适的例示性fdh包括博伊丁氏假丝酵母(Candida boidinii)的NADH依赖性Fdh1(GenBank登录号AF004096),来自Candida methylica(GenBank登录号CAA57036)、拟南芥(Arabidopsis thaliana)(GenBank登录号AAF19436)、假单胞菌101(GenBank登录号P33160)和金黄色葡萄球菌(Staphylococcus aureus)(GenBankAccession NO:BAB94016)的fdh。
另外的在本文中所描述的重组微生物中合适的例示性fdh包含下列微生物的天然fdh:Saccharomyces servazzii,巴扬氏糖酵母(Saccharomyces bayanus),鲁氏接合糖酵母(Zygosaccharomyces rouxii),微小糖酵母(Saccharomycesexiguus),克鲁维酵母(Saccharomyces kluyveri),乳酸克鲁维酵母(Kluyveromyceslactis),耐热克鲁维酵母(Kluyveromyces thermotolerans),马克思克鲁维酵母(Kluyveromyces marxianus),汉逊氏德巴利氏酵母(Debaryomyces hansenii),Pichia sorbitophila,安格斯毕赤酵母(pichia angusta),热带假丝酵母和解脂肪耶氏酵母(Yarrowia lipolytica)。
fdh的活化可以使用数种办法在宿主中实施。例如,在具有降低的丙酮酸-甲酸-裂合酶活性的菌株中表达来自博伊丁氏假丝酵母的Fdh(SEQ ID NO:13)提高乙醇生成(见图23B),这指明了每摩尔葡萄糖消耗至少3摩尔NADH的胞内NADH利用度。另外,每摩尔葡萄糖消耗高达4摩尔NADH的Fdh依赖性利用度已有记载(Berrios-Rivera等,Metabol.Eng.4,217,2007;US 2003/0175903A1;实施例8)。
如此,NADH依赖性甲酸脱氢酶的过表达预期将可用于正丁醇途径的NADH的摩尔数提高至2.5、3、3.5、4,而且因此实现平衡微生物中的正丁醇途径。如实施例21中所例示的,自pGV1248表达Fdh的大肠杆菌菌株GEVO1034生成约3摩尔NADH每摩尔葡萄糖。如果正丁醇生成途径能与内源发酵途径竞争的话,那么表达Fdh的微生物中正丁醇生成途径的表达预期导致大于1.4%的正丁醇产率。如实施例24中所例示的,自pGV1191和pGV1583表达NADH依赖性Fdh和正丁醇生成途径的GEVO768(大肠杆菌W3110)以比自质粒pGV1191和pGV1435表达正丁醇生成途径的对照菌株GEVO768高30%(理论产率的2%)的产率生成正丁醇。
在某些实施方案中,本文中所公开的重组微生物包括在厌氧或微需氧条件下有活性的丙酮酸脱氢酶(Pdh)。丙酮酸脱氢酶或NADH依赖性甲酸脱氢酶对于重组微生物而言可以是异源的,即编码这些酶的编码序列是异源的,或者转录调节区是异源的(包括人工的),或者所编码的多肽包含使得酶对某些代谢中间产物或底物的反馈抑制有抗性的序列变化。
酶丙酮酸脱氢酶(Pdh)催化丙酮酸转化成乙酰-CoA,同时(with)生成二氧化碳。在催化此反应的同时,Pdh生成1个NADH并消耗1个ATP。此酶通常在需氧条件下表达,其中ATP是丰富的,且NADH可容易地被呼吸途径中的酶NADH脱氢酶消耗,导致相对较低的NADH/NAD+比。在厌氧条件下,当不需要另外的NADH时,和当NADH/NAD+比相对较高时,丙酮酸甲酸裂合酶被细胞用来将丙酮酸转化成乙酰-CoA和甲酸。在此情况中,由Pdh反应释放的电子维持在甲酸中,甲酸或是被分泌或是被甲酸氢裂合酶转化成二氧化碳和氢气。为了平衡大肠杆菌中的正丁醇生成途径,丙酮酸转化成乙酰-CoA必须在厌氧条件下生成一个NADH。
直到最近,才广泛接受了Pdh在厌氧条件下不发挥功能,但是数份最近的报告证明了情况并非如此(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57;Vernuri,G.N.等,2002,Applied and Environmental Microbiology,68,1715-27)。此外,其它微生物诸如粪肠球菌(Enterococcus faecalis)即使在厌氧条件下也展现出Pdh复合物的高体内活性,前提是生长条件使得稳态NADH/NAD+比足够低(Snoep,J.L.等,1991,Fems Microbiology Letters,81,63-66)。代替调节Pdh表达和功能的氧,已经显示了Pdh受到NADH/NAD+比的调节(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57)。来自大肠杆菌的Pdh一般通过提高NADH水平(NADH水平与变成厌氧代谢的转换有关)来灭活,但是如果备选电子受体对于细胞降低NADH水平是可利用的,那么可使用Pdh。如果在大肠杆菌中表达的正丁醇途径消耗NADH快得足以在细胞内部维持低NADH/NAD+水平,那么内源Pdh可维持足以平衡该途径的活性,尤其是在丙酮酸甲酸裂合酶的基因被敲除的情况中。
如此,在一些实施方案中,重组微生物表达正丁醇生成途径中的功能性内源Pdh。优选的是,在那些实施方案中,酶丙酮酸甲酸裂合酶也是被灭活的。或者,可使用进化策略来提高Pdh在厌氧条件下的活性。这种策略依赖于利用具有所有发酵途径但消除了乙醇生成的工程化改造的大肠杆菌变体(图4)。此菌株在厌氧条件下以葡萄糖为生。在这些条件下,葡萄糖发酵成乙醇只在由功能性表达的Pdh提供另外的NADH当量的情况中才是有可能的。可使用这种方法生成在厌氧条件下具有升高的活性的Pdh,并在本文中所公开的重组微生物中使用。
在其中天然Pdh在厌氧条件下没有驱动正丁醇生成的活性的实施方案中(例如在大肠杆菌中),可表达来自另一种生物体的Pdh。例如,来自粪肠球菌的Pdh与来自大肠杆菌的Pdh类似,但是在低得多的NADH/NAD+水平被灭活。另外,有些生物体诸如枯草芽孢杆菌和几乎所有乳酸细菌菌株使用厌氧代谢中的Pdh。这些Pdh酶能在本文中所公开的重组微生物中平衡正丁醇途径。
在厌氧条件下发挥功能的Pdh的表达预期提高每摩尔葡萄糖的NADH摩尔数。如前文所描述的Pdh进化可提高其在厌氧条件下的活性,这通过提高的自葡萄糖生成的乙醇对乙酸比可观察到。如实施例22中所例示的,乙醇对乙酸比可自0.8提高至1.1,指明了Pdh展现出升高的在厌氧条件下的活性。Kim等记载了Pdh使得在大肠杆菌中消耗每摩尔葡萄糖可得到多达4摩尔NADH(Kim Y.等,Appl.Enviromn.Microbiol.,2007,73,1766-1771)。如此,厌氧活性Pdh的利用预期将可用于正丁醇途径的NADH的摩尔数提高至2.5、3、3.5、4,且因此预期实现平衡微生物中的正丁醇途径。如果正丁醇生成途径能与内源发酵途径竞争的话,那么在表达在厌氧条件下有功能的Pdh的微生物中表达正丁醇生成途径预期导致大于1.4%的正丁醇产率。
在某些实施方案中,比葡萄糖更还原的(more reduced)碳源可被用于平衡正丁醇途径。具体而言,所述碳源可以是甘油,其一般通过其转化成糖酵解中间产物甘油醛-3-磷酸而代谢(Lin,E.C.C.,1976,Annu.Rev.Microbiol.,30,535-78)。每个甘油转化成乙酰-CoA可实现高达2分子的NADH的产率,如此为乙酰-CoA转化成正丁醇提供足够的NADH。
在某些实施方案中,重组微生物被工程化改造以活化用于将甘油转化成丙酮酸的异源途径。
具体而言,在一些实施方案中,要被转化成正丁醇的碳源包含甘油,而且甘油降解途径被活化以避免甘油-3-磷酸脱氢酶催化的步骤,其使电子流入醌池。甘油降解途径可通过灭活编码甘油激酶和甘油-3-磷酸脱氢酶的基因来活化(Jin,R.Z.等,1983,Journal of Molecular Evolution,19,429-36)。该途径通过表达可来自弗氏柠檬酸杆菌(Citrobacter freundii)、酿酒酵母或其它生物体的DHA激酶而变得更加高效(图26)。DHA激酶避免磷酸转移酶系统(PTS)对DHA的磷酸化,该磷酸化要求DHA扩散到细胞外并在被磷酸化的同时通过PTS再次进入(图26)。
在一些实施方案中,本文中所公开的重组微生物被工程化改造以补足甘油脱氢酶的进化增强的表达或过表达,其中天然微生物不会经中间产物二羟基丙酮(DHA)来代谢甘油。具体而言,在某些实施方案中,宿主生物体具有经中间产物DHA转化甘油的天然途径,其中转化经DHA变成二羟基丙酮-磷酸(DHAP)的PEP依赖性PTS转化进行。通过重组表达可溶性DHA激酶(例如弗氏柠檬酸杆菌、肺炎克雷伯氏菌(Klebsiella pneumonia)、或酿酒酵母的DHA激酶),可克服天然DHA利用途径需要PEP和DHA扩散至细胞膜的限制,使得DHAP对于细胞是更加高效可得的。从此,DHAP代谢的后续代谢物,诸如可被细胞利用来进行生物转化(它们是天然或重组表达的酶)的丙酮酸和乙酰-CoA和NAD(P)H当量对于细胞也可以是更加高效可得的。
在一个实施方案中,通过本领域技术人员公知的方法利用适合于获得完整基因的线性双链DNA的聚合酶链式反应和引物克隆来自弗氏柠檬酸杆菌、肺炎克雷伯氏菌或酿酒酵母的编码DHA激酶的基因。
来自弗氏柠檬酸杆菌的编码DHA激酶的基因的序列(GenBank登录号DQ473522.1)显示于SEQ ID NO:12。肺炎克雷伯氏菌基因组上编码DHA激酶的基因的序列显示于SEQ ID NO:14。酿酒酵母基因组上编码DHA激酶的基因Dak1的序列显示于SEQ ID NO:15。酿酒酵母基因组上编码DHA激酶的基因Dak2的序列显示于SEQ ID NO:16。
在一个实施方案中,在不删除宿主生物体的野生型DHA操纵子的情况中使用编码DHA激酶的基因。在一个备选的实施方案中,宿主生物体的野生型DHA操纵子被删除。在一个实施方案中,DHA激酶自质粒过表达,该质粒具有适合于给定菌株所要求的表达水平的多个启动子和抗生素抗性基因之一。
在一个实施方案中,编码DHA激酶的基因整合入染色体中。使基因整合入染色体中的方法是本领域已知的。依照此实施方案,通过使用标准分子生物学技术,将DHA激酶的弗氏柠檬酸杆菌、肺炎克雷伯氏菌或酿酒酵母基因插入微生物基因组。
插入染色体中的编码DHA激酶的基因的存在和完整性可使用被置换基因相邻的和外部的以及与编码DHA激酶的基因的内部序列互补的引物通过PCR来验证,使得预期大小的PCR产物证实染色体DNA中预期变化和插入基因的存在。以这种方式,可验证内部序列以及修饰的边缘的完整性。
在经中间产物甘油-3-磷酸代谢甘油的野生型大肠杆菌和其它细菌中,二羟基丙酮(DHA)的代谢依赖于与磷酸转移系统(PTS)的蛋白质相互作用的DHA调节子的蛋白质对其的磷酸化(图26)。
PTS系统将DHA磷酸化成DHAP(二羟基丙酮磷酸)。DHAP是糖酵解的中间产物,而且因为它对于甘油代谢途径是共同的,所以它连接甘油代谢与中心细菌代谢。PTS系统是膜结合的。因此,由可溶性甘油脱氢酶(诸如大肠杆菌甘油脱氢酶,由gldA编码)形成的DHA必须扩散至膜,之后它才能被转化成DHAP,此时它可进入中心代谢,随后产生另外的NADH和ATP以及乙酰-CoA,所有这些都可被重组生物催化酶或途径所利用。
PTS介导的磷酸化需要PEP,即磷酸烯醇丙酮酸。PEP将其高能磷酰基团供给PTS的酶I和然后供给本领域称作HPr的酶,二者都定位在细胞质中。然而,特异性结合DHA的蛋白质是PTS的规范(canonical)酶II的同系物,其由亚基IIA、IIB和IIC组成,其中IIC定位在细胞膜中。一般而言,这些IIA、B和C蛋白可以是单体或共价连接在一起。IIA和IIB是亲水性的,而IIC是六或八区段的跨膜蛋白质。磷酰基团据信自P-HPr转移至IIA,然后转移至IIB,而且最终转移到随后磷酸化的糖上,其中IIC从未被磷酸化。
在弗氏柠檬酸杆菌和肺炎克雷伯氏菌中都类似的DHA利用途径牵涉单一ATP依赖性酶,其在细胞质中是可溶的,而且携带与PTS的酶II的一些相似性。在具有基于PTS的DHA利用途径的微生物(诸如大肠杆菌和其它细菌)中的重组表达可减轻先前记录的一种或多种限制,诸如对PEP的需要和DHA扩散至膜(即使DHA是在细胞质内形成的)。
举例而言,在一个实施方案中,从甘油到丙酮酸的途径的反应如下:
甘油→二羟基丙酮+NADH(1)
二羟基丙酮→二羟基丙酮-磷酸+ADP(2)
二羟基丙酮-磷酸→丙酮酸+NADH+2ATP(3)
其中净反应如下:
甘油+2NAD++2H++1ADP→丙酮酸+1ATP+2NADH(4)
在一个实施方案中,NADH依赖性甘油脱氢酶GldA酶催化反应(1),而自弗氏柠檬酸杆菌或自肺炎克雷伯氏菌衍生的酶DHA激酶催化反应(2)(见图26)。
在一个实施方案中,自宿主微生物的基因组删除基因glpK(编码甘油激酶)和glpD(编码G3P脱氢酶),而gldA(编码NADH连接的甘油脱氢酶)和PEP(磷酸烯醇丙酮酸)依赖性二羟基丙酮(DHA)激酶作为甘油降解的活性途径出现。在一个实施方案中,宿主生物体经如下转化途径来代谢甘油,该转化途径经DHA变成DHAP的PEP依赖性PTS(磷酸转移系统)转化进行。在这些宿主中,通过重组表达弗氏柠檬酸杆菌、肺炎克雷伯氏菌或酿酒酵母的可溶性DHA激酶,可克服天然DHA利用途径需要PEP和DHA扩散至细胞膜的限制。DHAP可由此对于细胞是更加高效可得的。从此,DHAP代谢的后续代谢物,诸如可被细胞利用来进行生物催化(它们是天然或异源表达的酶)的乙酰-CoA和NAD(P)H当量对于细胞也可以是更加高度可得的。
如本文中所描述的功能性甘油利用途径的表达预期提高每摩尔甘油的NADH摩尔数。具体而言,每摩尔甘油的NADH摩尔数可提高至高达每摩尔甘油2摩尔NADH。如此,如本文中所描述的功能性甘油利用途径的表达预期将正丁醇途径可得的NADH摩尔数提高至1.25、1.5、1.75、2,并由此实现平衡微生物中的正丁醇途径。如实施例4中所例示的,GEVO926生成约2摩尔NADH每摩尔甘油。如果正丁醇生成途径能与内源发酵途径竞争的话,正丁醇生成途径在表达如上文所描述的功能性甘油利用途径的微生物中的表达可导致大于1.4%的正丁醇产率。
在某些实施方案中,本文中所描述的表达用于正丁醇生成的异源酶(特别是正丁醇生成的NADH依赖性异源途径,诸如正丁醇途径)的重组微生物被进一步工程化改造以灭活竞争性代谢途径和在正丁醇生成方面平衡微生物中的NADH生成和消耗。
具体而言,在一些实施方案中,在为了给正丁醇生成途径供应足够的NADH而通过活化(特别是过表达)Fdh、通过活化厌氧活性Pdh、或通过利用甘油作为碳源来工程化改造微生物之外,加上乳酸脱氢酶的灭活及相关的丙酮酸转化成乳酸的灭活预期将正丁醇产率提高至理论产率的约5%。在那些实施方案中,大部分碳可仍被转化成乙醇。具体而言,如实施例27中所例示的,GEVO1082(其被工程化改造以删除编码乳酸脱氢酶的基因)的正丁醇产率预期是理论产率的约5%。
在一些实施方案中,在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的重组微生物中,在竞争性代谢途径的灭活之外,加上NADH依赖性Fdh的活化(特别是过表达)预期进一步将正丁醇产率提高至理论产率的至少约30%,35%、40%、50%、60%、70%、80%、90%和95%,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例18中所例示的,重组微生物诸如表达Fdh且灭活了乳酸脱氢酶、醇脱氢酶和延胡索酸还原酶的GEVO1083的正丁醇产率预期为比不表达Fdh的菌株(实施例18的pGV1281)高约42%。GEVO1034中自与pGV1281类似的表达系统表达的Fdh只产生3摩尔NADH每摩尔葡萄糖,这指明了Fdh表达导致NADH利用度升高。然而,这种升高不足以容许平衡正丁醇途径,如此将预期产率限制至约35%。
在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的一些实施方案中,在竞争性代谢途径的灭活之外,加上厌氧活性Pdh的活化(特别是表达)预期进一步将正丁醇产率提高至理论产率的至少约30%、35%、40%、50%、60%、70%、80%、90%和95%,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例23中所例示的,在厌氧条件下表达Pdh且灭活了乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的重组微生物诸如GEVO1510的正丁醇产率预期为理论产率的约73%。
在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的一些实施方案中,在竞争性代谢途径的灭活之外,加上功能性Fdh的活化(特别是表达)预期将正丁醇产率进一步提高至理论产率的至少约30%、35%、40%、50%、60%、70%、80%、90%和95%,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例27中所例示的,表达Fdh且灭活了乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的重组微生物诸如GEVO1507(大肠杆菌W3110,ΔldhA,ΔadhE,Δfrd,ΔackA,ΔmgsA)的正丁醇产率预期为理论产率的约70%。
在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的一些实施方案中,在灭活竞争性代谢途径之外,加上功能性甘油利用途径的活化(特别是表达)预期将正丁醇产率提高至理论产率的至少50%、60%、70%、80%、90%和95%的水平,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例中所例示的,利用甘油作为碳源且灭活了乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd,ΔackA,ΔmgsA)的正丁醇产率预期为理论产率的约70%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上将乙酰-CoA转化成乙醇的醇脱氢酶的灭活预期将正丁醇产率提高至理论产率的至少约40%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶的基因的GEVO1084的正丁醇产率预期为理论产率的约40%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶和醇脱氢酶的灭活及分别相关的丙酮酸转化成乳酸和乙酰-CoA转化成乙醇的灭活预期将正丁醇产率提高至理论产率的约50%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶和乳酸脱氢酶的基因的GEVO1084的正丁醇产率预期为理论产率的约50%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶和延胡索酸还原酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇和延胡索酸转化成琥珀酸的灭活预期将正丁醇产率提高中约55%。如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶和延胡索酸还原酶的基因的重组微生物诸如GEVO1508的正丁醇产率预期为理论产率的约55%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和甲基乙二醛合酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸和二羟基-丙酮磷酸转化成甲基乙二醛的灭活可将正丁醇产率提高至约60%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶、延胡索酸还原酶和甲基乙二醛合酶的基因的重组微生物诸如GEVO1509的正丁醇产率预期为理论产率的约60%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和乙酸激酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸和乙酰-磷酸转化成乙酸的灭活预期将正丁醇产率提高至理论产率的约65%。如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶、延胡索酸还原酶和乙酸激酶的基因的重组微生物诸如GEVO1085的正丁醇产率预期为理论产率的约65%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、乙酸激酶和甲基乙二醛合酶的灭活及相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸、乙酰-磷酸转化成乙酸和二羟基-丙酮磷酸转化成甲基乙二醛的灭活可将正丁醇产率提高至约70%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的基因的重组微生物诸如GEVO1507的正丁醇产率预期为理论产率的约70%。
因而,在某些实施方案中,本文中所公开的重组微生物包括诸如以下菌株及其衍生物的重组微生物,诸如GEVO788,GEVO789,GEVO800,GEVO801,GEVO802,GEVO803,GEVO804,GEVO805,GEVO817,GEVO818,GEVO821,GEVO822,GEVO1054,GEVO1084,GEVO1085,GEVO1083,GEVO1493,GEVO1494,GEVO1495,GEVO1496,GEVO1497,GEVO1498,GEVO1499,GEVO1500,GEVO1501,GEVO1502,GEVO1503,GEVO1504,GEVO1505,GEVO1507,GEVO1508,GEVO1509,GEVO1510,GEVO1511。优选的微生物包括GEVO1495和GEVO1505。实施例部分中进一步描述了那些微生物、它们的生成和用途。
在某些实施方案中,通过工程化改造正丁醇生成途径以提高其效率,能进一步提高正丁醇产率。具体而言,这在其中一种或多种异源表达的生物催化剂最初没有为了用作宿主微生物内的代谢酶而优化的实施方案中。然而,通过例如使用进化办法,通常能改善这些酶。
例如,使用上文所述含有期望的正丁醇生成途径的最高效变体的工程化改造的微生物,可以施加选择性压力以获得改善的生物催化剂。在此办法中,将正丁醇生成途径转化入合适的宿主微生物中,其中生长速率取决于该途径的效率,即,其中正丁醇途径是再氧化NADH的唯一手段。可以自此文库鉴定展现出生长速率有可检测的提高(该提高不是由于另一种发酵产物的形成)的微生物。通过经本领域技术人员知道的分析方法分析发酵液,可鉴定其它发酵产物。可反复地重复此过程。
例如,使用上文所述含有期望的正丁醇生成途径的最高效变体的工程化改造的大肠杆菌菌株,可实施定向进化以获得改善的生物催化剂。在此办法中,使用本领域技术人员知道的方法突变酶,优选正丁醇生成途径的限速酶。将突变基因的文库掺入正丁醇生成途径中,将该正丁醇生成途径转化入合适的宿主微生物,其中生长速率取决于该途径的效率,即,其中正丁醇途径是再氧化NADH的唯一手段。可以自此文库鉴定展现出生长速率有提高的微生物,该提高是由于基因内的有益突变,而不是由于另一种发酵产物的形成。通过经本领域技术人员知道的分析方法分析发酵液,可鉴定其它发酵产物。可反复地重复此过程。例如,可依照本领域技术人员知道的方法通过定向进化来优化正丁醇生成途径的酶。
葡萄糖通过异源表达的正丁醇途径的代谢是经工程化改造的细胞能生成ATP的唯一方式,而且也是它们能维持稳定的NAD+/NADH比的唯一方式。因此,生长速率取决于正丁醇形成的速率。通过连续稀释或恒化进化,可容易地实施对升高的生长速率的选择。
相同技术可用于选择具有升高的对正丁醇耐受的突变体。正丁醇对于所有微生物都是有毒物质,主要因为它破坏细胞膜。先前已经使用进化策略来工程化改造大肠杆菌以提高乙醇抗性(Yomano,L.P.等,1998,Journal ofIndustrial Microbiology&Biotechnology,20,132-38)。因此,预期能以相同方式工程化改造展示升高的正丁醇抗性的突变体。
因而,在一些实施方案中,描述了如下可获得的重组微生物,即提供工程化改造以活化用于将碳源转化成正丁醇的异源途径且具有第一生长速率的重组微生物,该第一生长速率取决于正丁醇生成,该重组微生物还能够以第一生成速率生成丁醇;鉴定异源途径中在异源途径方面限速的酶;突变所述酶;使包含突变酶的重组微生物与培养基接触,接触的时间和条件用以检测相对于第一生长速率升高的第二生长速率;并选择具有第二生长速率的重组微生物,该选定的重组微生物能够以第二生成速率生成正丁醇,该第二生成速率大于第一生成速率。
类似的过程也可用于鉴定/分离具有较高的正丁醇产率每代谢的葡萄糖的菌株。
在另一个实施方案中,微生物被工程化改造以活化在正丁醇或其衍生物的生长中用于将碳源转化成代谢中间产物的代谢途径。具体而言,在一些实施方案中,重组微生物被工程化改造以活化代谢途径丁酸。在此途径中,过表达基因来将乙酰-CoA转化成丁酰-CoA。例如,可表达编码硫解酶、羟基丁酰-CoA-脱氢酶、巴豆酸酶和丁酰-CoA脱氢酶的基因来将乙酰-CoA转化成丁酰-CoA。
然后,两种酶,即磷酸丁酰转移酶和丁酸激酶将丁酰-CoA转化成丁酸。在释放CoA的情况中,磷酸丁酰转移酶(由例如来自丙酮丁醇梭菌的基因ptb编码)将丁酰-CoA转化成丁酰-磷酸:
Figure A20078005085300481
然后,在释放ATP的情况下,丁酸激酶(由例如来自丙酮丁醇梭菌的基因buk编码)将丁酰-磷酸去磷酸化成丁酸:
Figure A20078005085300491
在一个实施方案中,大肠杆菌被工程化改造以将碳源转化成丁酸。在此途径中,可表达编码硫解酶、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、磷酸丁酰转移酶和丁酸激酶的基因以将乙酰-CoA转化成丁酸。
在一个实施方案中,使用酪丁酸梭菌(C.tyrobutyricum)作为宿主生物体来生成丁酸。在一个实施方案中,酪丁酸梭菌利用TER异源酶以催化巴豆酰-CoA转化成丁酰-CoA。依照此实施方案,可敲除编码牵涉竞争性乙酸形成途径的酶AK和PTA的基因ack和pta,如X.Liu和S.T.Yang,Construction andCharacterization of pta Gene Deleted Mutant of Clostridium tyrobutyricum forButyric Acid Fermentation,Biotechnol.Bioeng.,90:154-166(2005),Y.Yang,S.Basu,D.L.Tomasko,LJ.Lee,和S.T.Yang,通过提述将其完整并入本文。
既然乙酰-CoA转化成丁酸只需要2摩尔NADH,那么可使用丙酮酸甲酸裂合酶来将丙酮酸转化成乙酰-CoA。消除竞争性代谢途径可提高葡萄糖变成正丁酸的转化的产率并降低副产物的水平。
消除编码分别将丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸和乙酰-磷酸转化成乙酸的乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和乙酸激酶的基因可降低乳酸、乙醇、琥珀酸和乙酸的生成,而且可提高丁酸产率。
在另一个实施方案中,微生物被工程化改造以将碳源转化产物,其中产物是丁酸与正丁醇的混合物。该微生物表达乙酰-CoA转化成丁酰-CoA的基因、丁酰-CoA转化成正丁醇的基因和丁酰-CoA转化成丁酸的基因。
在一个实施方案中,为乙酰-CoA转化成丁酰-CoA而表达的基因可包括那些编码硫解酶、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶的基因,为丁酰-CoA转化成正丁醇而表达的基因可包括那些编码丁醛脱氢酶和正丁醇脱氢酶或双功能性丁醛/丁醇脱氢酶的基因,而为丁酰-CoA转化成丁酸而表达的基因可包括那些编码磷酸丁酰转移酶和丁酸激酶的基因,如图27中所示的。
此混合物的比例可取决于NADH的利用度,因为乙酰-CoA转化成正丁醇需要4分子NADH,但乙酰-CoA转化成丁酸只需要2分子NADH。因此,为了生成丁酸与正丁醇的等摩尔混合物,每个葡萄糖转化成乙酰-CoA产生3分子NADH。
本文中进一步公开了用于生产正丁醇的方法,该方法包括在合适的培养基中培养本文中所公开的重组微生物。
在某些实施方案中,该方法进一步包括自培养基分离正丁醇。例如,可以通过任何本领域公认方法自培养基分离正丁醇,诸如渗透蒸发(pervaporation)、液液萃取(liquid-liquid extraction)、或气提(gas stripping)(见下文更多详情)。
在某些实施方案中,如果微生物不使用需氧或厌氧呼吸,那么正丁醇产率最高,因为在这些情况中碳以二氧化碳的形式流失(lost)。
在某些实施方案中,微生物在厌氧条件下发酵性地生成正丁醇,使得碳不以二氧化碳的形式流失。
术语“需氧呼吸”指其中氧是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径。术语“需氧呼吸途径”在本文中与措词“需氧代谢”、“氧化性代谢”或“细胞呼吸”可互换使用。
另一方面,术语“厌氧呼吸”指其中氧不是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径,其包括其中氧以外的有机或无机分子(例如硝酸、延胡索酸、二甲亚砜、含硫化合物诸如硫酸和金属氧化物)是最终电子受体的呼吸途径。措词“厌氧呼吸途径”在本文中与措词“厌氧代谢”和“厌氧呼吸”可互换使用。
“厌氧呼吸”必须与“发酵”区分开。在“发酵”中,NADH将其电子贡献给由生成NADH中携带的电子的同一代谢途径所生成的分子。例如,在大肠杆菌的发酵性途径之一中,通过糖酵解生成的NADH将其电子转移给丙酮酸,产生乳酸。
在发酵性条件下运行的微生物只能在发酵是“平衡”的情况中代谢碳源。若碳源的氧化反应期间所生成的NADH等于乙酰-CoA转化成发酵终产物所利用的NADH,则说发酵是“平衡”的。只有在这些条件下,所有NADH才是再循环的。如果没有再循环,NADH/NAD+比会变得不平衡,这导致生物体最终死亡,除非有可得的备选代谢途径来维持平衡NADH/NAD+比。依照White,2000#168,若氧化期间所生成的氢等于转移给发酵终产物的氢,则说书面发酵(written fermentation)是“平衡”的。只有在这些条件下,所有NADH和还原型铁氧还蛋白才再循环成氧化形式。重要的是要知道,发酵是否是平衡的,因为如果不是这样,那么整体书面反应是不正确的。
厌氧条件是高产率的生成正丁醇的微生物所优选的。
在一些实施方案中,用于生成本文中所公开的重组微生物的方法包括:(1)如下生成重组微生物的文库:(a)将编码能够利用NADH来转化乙酰-CoA和正丁醇生成途径的一种或多种代谢中间产物的一种或多种多肽的一种或多种异源DNA序列导入对应的野生型微生物,(b)自对应的微生物的基因组删除用于(竞争性内源)厌氧发酵的编码直接或间接消耗NADH和代谢中间产物的一种或多种酶的一种或多种内源DNA序列,其中步骤(a)和(b)以任一次序实施,(2)自步骤(1)中所生成的重组微生物选择能够厌氧生长同时生成正丁醇的一种或多种重组微生物,其中对应的野生型微生物不能够厌氧生长同时生成正丁醇。
在该方法中,将编码能够利用NADH来转化乙酰-CoA和正丁醇生成途径的一种或多种代谢中间产物的一种或多种多肽的一种或多种异源DNA序列导入预先选定的宿主微生物。在该宿主微生物,还删除编码与正丁醇生成途径竞争碳和/或NADH的一种或多种酶的一种或多种内源DNA序列以使得碳/NADH对于用于生成正丁醇或其代谢中间产物的一种或多种多肽是可得的。然后对如此生成的重组微生物施加选择压力,使得那些能够在厌氧条件下更快生长同时生成正丁醇的自群体中长出来并富集。
任选的是,可通过本领域公认手段随机诱变该重组微生物,诸如通过向培养物中添加化学诱变剂,诸如甲磺酸乙酯或N-甲基-N′-硝基-N-亚硝基胍。另外,任何通过本发明方法生成的生成正丁醇的微生物可进行额外轮次的诱变和选择,以生成更高产率的菌株。
在某些实施方案中,该方法还可包括选择耐受正丁醇的微生物菌株的步骤,该步骤在选择能够在所生成的正丁醇上存活的重组微生物之前或之后。例如,该方法可包括选择能够在含至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.2%、1.5%、1.8%、2%、3%、4%、5%、6%、7%、8%或更多正丁醇的培养基中以与在不含正丁醇的培养基中生长的对应的野生型微生物基本上相同的速率厌氧性生长的一种或多种重组微生物的步骤。
在某些实施方案中,用于生成正丁醇的方法包括在合适的培养基中在合适的培养条件下培养本发明的重组微生物。
合适的培养条件取决于宿主微生物的最适温度、最适pH和营养物要求,是本领域技术人员知道的。这些培养条件可以通过本领域技术人员知道的方法来控制。
例如,通常在约25℃至约40℃的温度和约pH4.0至pH8.0的pH培养大肠杆菌细胞。用于依照本发明生成正丁醇的培养基包括普通培养基,诸如LuriaBertani(LB)培养基、富含EZ的培养基和商业上相关的利用氮、矿物盐、痕量元素和所限定的碳源的便宜来源的基本培养基。
可以在需氧或厌氧条件下实施发酵,其中厌氧或微需氧条件是正丁醇生成阶段期间所优选的。
在一个实施方案中,发酵由需氧阶段和厌氧阶段组成。在需氧条件下比在厌氧条件下更加高效地生成生物质和表达途径酶。生物转化,即葡萄糖转化成正丁醇,发生在厌氧阶段期间。
生物质生成和蛋白质表达在需氧条件下更加高效,因为来自碳源的能量产率更高。这容许更高的生长收率、生长速率和蛋白质表达速率。这些优点胜过给发酵容器通气的花费。
发酵培养基中所生成的1-丁醇的量可使用本领域已知的许多方法来测定,例如,高效液相层析或气相层析。
在一些实施方案中,提供了生成正丁醇的方法,该方法包括在需氧条件或宏需氧(macroaerobic)条件下培养本公开内容的任何重组微生物一段时间,以生成细胞群(cell mass),具体而言在约1至约190g干细胞升-1的范围内、或优选在约1至约50g干细胞升-1的范围内,然后改变培养条件,改变的时间和条件用以生成一种或多种生物燃料和/或生物燃料前体,特别是其中在培养物中可检测到一种或多种生物燃料的时间和条件,并回收一种或多种生物燃料和/或生物燃料前体。在某些实施方案中,将培养条件自需氧或宏需氧条件改变成厌氧条件。在某些实施方案中,将培养条件自需氧条件改变成宏需氧条件。在某些实施方案中,将培养条件自需氧条件或宏需氧条件改变成微需氧条件。
术语培养的“需氧条件”指其中溶解在培养物的液体级分中的氧相对于空气饱和为10%或更高(要考虑由于设备可变性引起的变动)的条件。
术语培养的“微需氧条件”指其中溶解在培养物的液体级分中的氧相对于空气饱和为约0.5%至约5%(要考虑由于设备可变性引起的变动)的条件。
术语培养的“宏需氧条件”指其中溶解在培养物的液体级分中的氧相对于空气饱和为约5%至约10%(要考虑由于设备可变性引起的变动)的条件。
由于停工期、长的延滞期和产物抑制,分批反应器的生产力常常是低的。虽然使用连续培养能消除停工期和延滞期,产物抑制的问题仍然存在。通过应用新的产物清除技术,能消除此问题。在连续培养之外,也可将补料-分批技术应用于发酵过程。然而,发酵必须与合适的产物清除技术组合。另外,固定化细胞培养和细胞再循环反应器的应用已知将反应器的生产力与分批反应器相比提高40-50倍。生产力的提高导致工艺体积和反应器尺寸的降低,如此改善工艺经济性。
反应器生产力低的原因之一是生物反应器中细胞的浓度低。在分批反应器中,很少实现3g/L以上的细胞浓度。因此,通过提高反应器中的细胞浓度能改善反应器生产力。通过将细胞固定化到支持物或凝胶颗粒上能提高细胞浓度。用于提高细胞浓度的另一个选项是应用如下的膜,该膜使细胞返回反应器同时含有产物的水溶液透过膜。
下列三个分部描述了可能适合于正丁醇生成的不同反应器。
A)分批、补料-分批和无细胞连续发酵
分批工艺是用于正丁醇生产的发酵的简单方法。在培养基冷却期间,穿过表面通入氮或二氧化碳以使得培养基缺氧。接种后,用这些气体喷射(sparge)培养基以混合接种体。
补料-分批发酵是一种工业技术,其应用于高底物浓度对培养物有毒的过程。在此类情况中,以分批模式以低底物浓度(对培养物无抑制作用)和低培养基体积(通常少于发酵罐体积的一半)启动反应器。随着底物被培养物使用,通过以慢速添加浓缩的底物溶液来替换它,由此保持发酵罐中的底物浓度低于对培养物有毒的水平。在这种类型的系统中,反应器中培养物的体积随时间增加。在液体体积为反应器体积的大约75%时收获培养物。
既然正丁醇对重组微生物有毒,那么不能应用补料-分批发酵技术,除非应用新的产物回收技术之一来同时分离产物。作为底物降低或降低的产物抑制的结果,发生更多的细胞生长,而且反应器生产力得到改善。
可使用连续培养技术来改善反应器生产力和研究培养物在稳态中的生理学。在此类系统中,以分批模式启动反应器,并且容许细胞生长直至细胞处于指数期。作为防范措施,不让发酵进入稳定期,因为正丁醇的积累会杀死细胞。当细胞处于指数期的时候,给反应器连续补料培养基,并以与补料相同的流速取出产物流,如此保持反应器中的恒定体积。以这种方式运行发酵消除了停工期,如此改善反应器生产力。另外,发酵比典型的分批工艺运行长得多。
在连续培养中,可能存在一个严重的问题,即溶剂生成在一长段时间里可能不稳定,而且可能最终随时间下降,而伴随酸生成的升高。在单阶段连续系统中,可获得高反应器生产力,但是这是以与分批工艺中所实现的相比的低产物浓度为代价的。
B)固定化细胞连续反应器
高细胞浓度导致高反应器生产力。此类系统是连续的,其中在底部将进料导入管状反应器,而产物在顶部离开。这些系统常常是不混合的反应器,其中产物抑制显著降低。为了改善反应器生产力,可以通过吸附将细胞固定化到粘土砖颗粒上,并实现更高的反应器生产力,导致经济的优点。
C)膜式细胞再循环反应器
膜式细胞再循环反应器是用于改善反应器生产力的另一个选项。在此类系统中,以分批模式启动反应器并容许细胞生长。在达到稳定期之前,使发酵液穿过膜循环。膜容许产物水溶液通过,同时保留细胞。反应器进料和产物(渗透物)清除是连续的,而且在反应器中维持恒定的体积。在此类细胞再循环系统中,能实现100g/L以上的细胞浓度。然而,为了保持细胞生产性,应当自反应器取出少量放出物(bleed)(<10%稀释率)。
A)蒸馏
通过蒸馏回收正丁醇的成本是高的,因为,由于产物抑制,其在发酵液中的浓度是低的。在产物浓度低之外,正丁醇的沸点比水高(118℃)。发酵液中总溶剂的浓度通常是18-33g/L(使用淀粉或葡萄糖),其中正丁醇只有约13-18g/L。这使得通过蒸馏回收正丁醇耗能多。如果发酵液中的正丁醇浓度能从10g/L提高到40g/L,那么就能节约大量的能量。
为了降低正丁醇回收的成本,已经调查了许多回收技术,包括原位气提、液液萃取和渗透蒸发。这些技术的详情已经另有记载(参见Maddox,Biotechnol.&Genetic Eng.Revs.7:190,1989;Groot等,Process BioChem.27:61,1992;通过提述并入本文)。这些技术可应用于原位正丁醇清除,如此在正丁醇生成的同时自反应器清除正丁醇。目的是防止正丁醇的浓度超过培养物的耐受水平。随后通过浓缩(气提或渗透蒸发)或通过蒸馏(萃取)回收产物。
B)备选的经济上可行的技术
气提
气提是用于自发酵液回收正丁醇(丙酮或乙醇)的一种简单技术。穿过发酵液用氮或发酵气体(CO2和H2)鼓泡,接着使该一种或多种气体通过冷凝器。随着穿过发酵罐用气体鼓泡,它捕获(capture)溶剂(例如,正丁醇)。然后,溶剂在冷凝器中冷凝,并在接收器中收集。一旦溶剂冷凝,使气体再循环回到发酵罐以捕获更多的溶剂。继续此过程,直至发酵罐中所有的糖被培养物利用掉。在有些情况中,可使用分开的剥离器来剥离溶剂,之后将溶剂含量低的剥离器流出物再循环。气提已经成功地应用于自多种反应器清除溶剂。
为了降低底物抑制,可以将补料-分批发酵与气提整合。为此目的,可以以100g/L葡萄糖启动反应器。随着糖被培养物消耗掉,通过添加已知体积的浓缩的(500g/L)糖溶液来替换被使用掉的葡萄糖。反应器内糖的水平保持在有毒水平以下,优选小于80g/L。通过气提清除溶剂,由溶剂引起的细胞抑制得到了降低。
液液萃取
液液萃取是能用于自发酵液清除溶剂(例如,正丁醇)的另一种技术。在此工艺中,将萃取溶剂与发酵液混合。正丁醇被萃取入萃取溶剂中,并通过反萃取入另一种萃取溶剂或通过蒸馏来回收。
萃取式正丁醇发酵的一些要求是:
1.对生产生物体无毒;
2.发酵产物的分配系数高;
3.与发酵液不能混溶且不形成乳状液;
4.萃取溶剂不贵且易于获得;
5.萃取溶剂能灭菌且没有健康危害。
例如,可使用玉米油作为萃取溶剂。文献中已经报道了许多用于正丁醇的萃取溶剂。其中,油醇(oleyl alcohol)表现出达到一些上述要求。
萃取剂的毒性是萃取性发酵中的重大问题。为了避免萃取溶剂带来的毒性问题,可使用膜自细胞培养物分离萃取溶剂。例如,在连续发酵细胞再循环系统中,可以是发酵液穿过膜循环,而使细菌返回发酵罐,同时用癸醇萃取渗透物以清除正丁醇。
用于降低毒性和改善分配系数的另一种办法是混合分配系数高、毒性高的萃取剂与分配系数低、毒性低的萃取剂。所得混合物是总体分配系数高且毒性低的萃取剂。油醇可用于此目的。
渗透蒸发
渗透蒸发是基于膜的工艺,其用于通过使用选择性膜自发酵液清除溶剂。液体或溶剂穿过固体膜扩散,在后面留下营养物、糖和微生物细胞。穿过膜的溶剂的浓度取决于膜的组成和膜的选择性,其是进料溶剂浓度的函数。
例如,可以在多微孔的聚丙烯25mm厚的扁平片上支持含有油醇的液体膜。穿过膜扩散的液体显示出180的选择性,比较而言,有机硅膜的选择性为大约45。估计,如果使用此渗透蒸发膜作为正丁醇分离的预处理工艺,那么能量需求会是只有常规蒸馏所要求的10%。
为了开发具有高度选择性的稳定膜,可以在有机硅膜中包括硅质盐(一种吸附剂)。这可改善有机硅-硅质盐膜的选择性水平。该膜的工作寿命为数年。该膜可用于正丁醇模型溶液和发酵液二者。
实施例
以下实施例还举例说明了本公开内容,其是作为例示提供的,并非意图限制。
表1列举了本公开内容中所提及的(特别是以下实施例中所描述的)某些菌株。
表1:菌株
  菌株   基因型
  GEVO709(大肠杆菌WA837)CGSC 90266   大肠杆菌B,gal-151,met-100,[malB+(LamS)],hsdR11,Δ46
  GEVO768   大肠杆菌W3110,attB::(Sp+lacIq+tetR+)
  大肠杆菌DH5α   大肠杆菌F-endA1 glnV44 thi-1 recA1 relA1 gyrA96 deoR nupGΦ80dlacZΔM15Δ(lacZYA-argF)U169,hsdR17(rK -mK +),λ-
  GEVO788   大肠杆菌W3110,ΔldhA
  GEVO789   大肠杆菌WA837,ΔldhA
  GEVO800   大肠杆菌W3110,ΔadhE
  GEVO801   大肠杆菌W3110,ΔpoxB
  GEVO802   大肠杆菌W3110,ΔfocA-pflB
  GEVO803   大肠杆菌WA837,ΔadhE
  GEVO804   大肠杆菌WA837,ΔpoxB r
  GEVO805   大肠杆菌WA837,ΔfocA-pflB
  GEVO817   大肠杆菌W3110,ΔackA
  菌株   基因型
  GEVO818   大肠杆菌W3110,Δfrd
  GEVO821   大肠杆菌WA837,ΔackA
  GEVO822   大肠杆菌WA837,Dfrd
  GEVO914   大肠杆菌W3110,Δldh,ΔpoxB,Δfrd
  GEVO916   大肠杆菌W3110,ΔglpD
  GEVO917   大肠杆菌W3110,ΔglpK
  GEVO922   大肠杆菌W3110,ΔglpK,ΔglpD
  GEVO926   大肠杆菌W3110,ΔglpD,ΔglpK*
  GEVO927   大肠杆菌W3110,ΔglpD,ΔglpK*,pGV1010
  GEVO954 DSMZ 615   大肠杆菌B
  GEVO992   大肠杆菌W3110,ΔldhA,Δfrd
  GEVO1005(大肠杆菌W3110)DSMZ 5911 大肠杆菌F-L-rph-1 INV(rrnD,rrnE)
  GEVO1007   大肠杆菌W3110,Δldh,ΔpoxB,ΔackA
  GEVO1034   大肠杆菌W3110,ΔfdhF
  GEVO1039   大肠杆菌W3110,Δndh,Δldh,ΔadhE,ΔfocA-pflB,Δfrd,Δfnr,attB::(Sp+lacIq+tetR+)
  GEVO1043   大肠杆菌W3110,Δndh,Δldh,ΔadhE,ΔfocA-pflB,ΔackA,Δfrd,Δfnr,attB::(Sp+lacIq+tetR+)
  GEVO1044   大肠杆菌W3110,Δndh,ΔpoxB,ΔackA,Δ(fnr-ldhA),attB::(Sp+lacIq+tetR+)
  GEVO1047   大肠杆菌W3110,ΔldhA,Δfrd,attB::(Sp+lacIq+tetR+)
  GEVO1054   大肠杆菌W3110,ΔadhE,attB::(Sp+lacIq+tetR+)
  GEVO1082   大肠杆菌W3110,ΔldhA,attB::(Sp+lacIq+tetR+)
  GEVO1083   大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+)
  GEVO1084   大肠杆菌W3110,ΔldhA,ΔadhE,attB::(Sp+lacIq+tetR+)
  GEVO1085   大肠杆菌W3110,ΔldhA,ΔadhE,Δfrd,ΔackA,attB::(Sp+lacIq+tetR+)
  GEVO1086   大肠杆菌W3110,ΔldhA,Δfrd,ΔackA,attB::(Sp+lacIq+tetR+)
  GEVO1121   大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,ΔmgsA,attB::(Sp+lacIq+tetR+)
  GEVO1137   大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+),ΔackA
  GEVO1200   大肠杆菌W3110,ΔldhA,ΔackA
  GEVO1227   大肠杆菌W3110,ΔlpdA
  GEVO1228   大肠杆菌WA837,ΔlpdA
  GEVO1229   大肠杆菌W3110,ΔlpdA::lpdAmut
  菌株  基因型
  GEVO1230  大肠杆菌W3110,ΔlpdA::lpdAN
  GEVO1470  大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+)*
  GEVO1493  大肠杆菌W3110,ΔldhA
  GEVO1494  大肠杆菌W3110,ΔldhA,ΔackA
  GEVO1495  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE
  GEVO1496  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE,ΔfocApflB
  GEVO1497  大肠杆菌W3110,ΔpflDC
  GEVO1498  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE,ΔfocApflB,ΔpflDC
  GEVO1499  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE,ΔfocApflB,Δfrd
  GEVO1500  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔfocApflB
  GEVO1501  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC
  GEVO1502  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC,Δfrd
  GEVO1503  大肠杆菌W3110,Δfnr
  GEVO1504  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC,Δfnr
  GEVO1505  大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC,Δfnr,attB::(Sp+lacIq+tetR+)
  GEVO1507  大肠杆菌W3110,ΔldhA,ΔadhEΔackA,ΔmgsA,ΔackA,Δfrd,attB::(Sp+lacIq+tetR+)
  GEVO1508  大肠杆菌W3110,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+)
  GEVO1509  大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔmgsA attB::(Sp+lacIq+tetR+)
  GEVO1510  大肠杆菌W3110,Δldh,ΔadhE,ΔpflB,ΔpflDC,Δfrd,ΔmgsAattB::(Sp+lacIq+tetR+)*
  GEVO1511  大肠杆菌W3110,Δldh,ΔadhE,ΔpflB,ΔpflDC,Δfrd,ΔmgsAattB::(Sp+lacIq+tetR+)
*进化得到的菌株
以下表2列举了本公开内容中所提及的和以下实施例中描述的实验中所使用的某些质粒。
表2:质粒
Figure A20078005085300591
Figure A20078005085300601
以下表3中列举了本公开内容中所提及的和此部分中描述的实验中所使用的某些引物。
表3:引物
  Cac_thlF   AATTGAATTCTTATTATTTAGGAGGAGTAAAACAT(SEQ ID NO:69)
  Cac_thlR   AATTGGATCCTTAGTCTCTTTCAACTACGAGAGCT(SEQ ID NO:70)
  Cac_aadF   AATTGAATTCATATTTTAGAAAGAAGTGTATATTT(SEQ ID NO:71)
  Cac_aadR   AATTACGCGTTTAAGGTTGTTTTTTAAAACAATTTATATACA(SEQ ID NO:72)
  Cac_bdhF   AATTGAATTCATTAGATGCTTGTATTAAAATAATAA(SEQ ID NO:73)
  Cac_bdhR   AATTGGATCCTTACACAGATTTTTTGAATATTTGTA(SEQ ID NO:74)
  Cac_hbdF   AATTGAATTCATTGATAGTTTCTTTAAATTTAGGG(SEQ ID NO:75)
  Cac_hbdR   AATTGGATCCTTATTTTGAATAATCGTAGAAACCT(SEQ ID NO:76)
  Cac_crtF   AATTGAATTCCTATCTATTTTTGAAGCCTTCAATT(SEQ ID NO:77)
  Cac_crtR   AATTGGATCCAATATTTTAGGAGGATTAGTCATGGA(SEQ ID NO:78)
  Cac_bcdF   AATTGGTACCTTAATTATTAGCAGCTTTAACTTGAGC(SEQ ID NO:79)
  Cac_bcdR   AATTGGATCCAAAATTGAAGGCTTCAAAAATAGATAGGAG(SEQ ID NO:80)
  Cac_adhF   AATTGTCGACATTTTATAAAGGAGTGTATATAAATGAAAGTTAC(SEQ ID NO:81)
  Cac_adhR   TTAATCTAGATTAAAATGATTTTATATAGATATCCT(SEQ ID NO:82)
  glpDchk_F   CCGTGGGTGAAACAGTTCTT(SEQ ID NO:83)
  glpDchk_R   CGTAAGTGCGAGCGTAATGA(SEQ ID NO:84)
  glpKchk_F   AAAGCTCCACGCTGGTAGAA(SEQ ID NO:85)
  glpKchk_R   GTCACGCGTCTGATAAGCAA(SEQ ID NO:86)
实施例1:自宿主微生物基因组消除竞争性代谢途径
此实施例例示了正丁醇生成宿主菌株的构建。宿主生物体的竞争性途径是将NADH的氧化与化合物诸如琥珀酸、乳酸、乙醇、二氧化碳和氢气的生成偶联的发酵性途径和竞争来自碳源的碳的途径诸如乙酸途径和甲酸生成。
表1中所列举的菌株是通过删除细菌基因组中的基因而获得的。基因是使用同源重组技术而删除的。使用噬菌体P1转导在各菌株间转移基因删除。通过各个基因的序贯删除来组合基因删除。
亲本菌株用于代谢工程化改造GEVO1005(大肠杆菌W3110(DSMZ 5911))和大肠杆菌B(DSMZ 613)。为了将来自大肠杆菌K12的基因组删除、插入和基因破坏转移至大肠杆菌B菌株,使用大肠杆菌WA837(CGSC 90266)作为中间宿主。在菌株构建期间,在Luria-Bertani(LB)培养基或琼脂上培养培养物(Sambrook和Russel,Molecular Cloning,A Laboratory Manual,第3版,2001,Cold Spring Harbor,New York:Cold Spring Harbor Laboratory Press)。除非另有说明,使用标准方法,诸如使用噬菌体P1的转导、PCR和测序(Miller,A shortCourse in Bacterial Genetics:A Laboratory Manual and Handbook or Escherichiacoli and Related Bacteria,1992,Cold Spring Harbor,N.Y.:Cold Spring HarborPress;Sambrook和Russel,Molecular Cloning,A Laboratory Manual,第3版,2001,Cold Spring Harbor,New York:Cold Spring Harbor Laboratory Press)。用于将基因和表达盒插入大肠杆菌染色体的DNA是通过Horton,Mol.Biotechnol.3:93-99,1995的重叠延伸法(SOE)用剪接而构建的。染色体整合和删除用适宜的标志物和通过PCR分析,或者在整合的情况中,通过测序来验证。
D-乳酸脱氢酶(由ldhA编码):删除了大肠杆菌中大多数编码乳酸脱氢酶的基因(ldhA)(删除了核苷酸11-898)。含有ldhA删除的所得菌株是:
将ldhA删除与nuoA_N和ndh删除组合。用自GEVO788制备的P1裂解物转导GEVO914,所得菌株命名为GEVO915。为了构建相应的大肠杆菌B菌株,用自GEVO789制备的P1裂解物转导GEVO916,转导后的菌株命名为GEVO917。
乙酸激酶A(由ackA编码):用删除破坏大肠杆菌中编码乙酸激酶的基因(ackA)(删除了核苷酸29-1062)。含有ackA删除的菌株为GEVO817和GEVO821。
将ackA删除与ldhA删除组合。用自GEVO817制备的P1裂解物转导GEVO1493,所得菌株命名为GEVO1494。
丙酮酸氧化酶(由poxB编码):用poxB中的删除破坏大肠杆菌中编码丙酮酸氧化酶的基因(poxB)(删除了核苷酸30-1600)。所得菌株为GEVO801和GEVO804。
将poxB删除与ldhA和ackA删除组合。用自GEVO801制备的P1裂解物转导GEVO1494,所得菌株命名为GEVO1007。
乙醛/醇脱氢酶(由adhE编码):用删除破坏大肠杆菌中编码醇脱氢酶的基因(adhE)(删除了核苷酸-308至2577)。所得菌株为GEVO800和GEVO803。
将adhE删除与ldhA、ackA和poxB删除组合。用自GEVO800制备的P1裂解物转导GEVO1007,所得菌株命名为GEVO1495。为了构建相应的大肠杆菌B菌株,用自GEVO803制备的P1裂解物转导GEVO1211,所得菌株命名为GEVO1212。
在糖酵母属中,丙酮酸脱羧酶将丙酮酸转化成乙醛。已知至少五种独立的NADH依赖性醇脱氢酶然后将乙醛还原成乙醇。它们是ADH1、ADH2、ADH3、ADH4和ADH5。
丙酮酸甲酸裂合酶(由pflB编码):通过focA和pflB删除破坏大肠杆菌中编码丙酮酸甲酸裂合酶的基因(pflB)(删除了核苷酸-69(focA)-2240(pflB))。所得菌株为GEVO802和GEVO805。
将pflB删除与ldhA、ackA、poxB和adhE删除组合。用自GEVO802制备的P1裂解物转导所得菌株GEVO1495,所得菌株命名为GEVO1496。
丙酮酸甲酸裂合酶2(由pflDC编码):通过pflDC删除破坏大肠杆菌中编码丙酮酸甲酸裂合酶2的基因(pflDC)(删除了核苷酸-69(pflD)-2240(pflC))。所得菌株为GEVO2000和GEVO2001。
将pflDC删除与ldhA、ackA、poxB、adhE和pflB删除组合。用自GEVO1497制备的P1裂解物转导所得菌株GEVO1496,所得菌株命名为GEVO1498。
延胡索酸还原酶(由frd编码):用frdABCD删除破坏大肠杆菌中编码延胡索酸还原酶的基因(frdABCD)(删除了核苷酸-86(frdA)-178(frdD))。所得菌株为GEVO818和GEVO822。
将frdABCD删除与ldhA、ackA、poxB、adhE和focA-pflB删除组合。用自GEVO818制备的P1裂解物转导GEVO1496,所得菌株命名为GEVO1499。
实施例2:工程化改造以使用还原型碳源(甘油)来平衡生成正丁醇的异源途径的重组大肠杆菌
平衡大肠杆菌中的正丁醇途径的一种方法是使用甘油作为碳源。对于甘油上的生长,备选的甘油降解途径必须是有活性的,该途径避免了甘油磷酸脱氢酶催化的步骤,该步骤使电子流入醌池。
通过灭活编码甘油激酶和甘油-3-磷酸脱氢酶的基因,能活化该备选途径。通过表达来自弗氏柠檬酸杆菌、肺炎克雷伯氏菌、酿酒酵母或其它生物体的DHA激酶,使得该途径更加高效。DHA激酶的表达避免了磷酸转移酶系统(PTS)偶联的DHA磷酸化,这要求DHA扩散到细胞外并通过pts再进入同时被磷酸化。
利用适宜获得完整基因的线性双链DNA的聚合酶链式反应和引物,自弗氏柠檬酸杆菌克隆编码DHA激酶的基因。将该基因克隆入表达质粒中,该质粒与正丁醇途径表达质粒相容。
所得构建体为pGV1563。为了表达正丁醇途径用pGV1191和pGV1113转化GEVO926(大肠杆菌W3110(F-L-rph-1INV(rrnD,rrnE)),ΔglpD,ΔglpK)(菌株A),并为了表达正丁醇途径和表达来自弗氏柠檬酸杆菌的DHA激酶用pGV1191、pGV1113和pGV1563转化GEVO926。通过正丁醇瓶发酵来比较菌株A(GEVO926,pGV1191,pGV1113)和菌株B(GEVO926,pGV1191,pGV1113,pGV1563)。
在培养基B(富含EZ的培养基,含有0.4%甘油、100mg/L Cm和200mg/LAmp和50mg/L Kan)中在管中以37℃和250rpm需氧培养菌株A和B。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用1mM IPTG和100ng/mL aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了菌株A以产率60%生成正丁醇,而菌株B以产率70%生成正丁醇。此实施例显示了删除了天然甘油降解途径的生产菌株提供足够的NADH以达到高于理论产率的50%的正丁醇产率。另外,这些结果显示了DHA激酶的表达提高这样的甘油途径删除菌株中自甘油生成正丁醇的产率。
实施例3:能够经二羟基丙酮和二羟基丙酮磷酸代谢甘油的重组大肠杆菌的生成
此实施例演示了将甘油转化成乙酰-CoA同时生成2分子NADH每分子甘油的菌株的生成。
使用菌株GEVO1005(大肠杆菌W3110(F-L-rph-1 INV(rrnD,rrnE)))作为亲本菌株。自宿主基因组删除基因glpD和glpK。通过P1转导构建双重敲除glpDglpK。所得菌株为GEVO922。
将GEVO922进行强化进化规程(enrichment evolution protocol),因为它显示出与野生型亲本菌株相比非常差的在基本甘油培养基上的生长。在此强化进化的4周过程期间,以2.4×1012个细胞开始,使用甘油作为碳源,并隔天用甘油补料。头2周隔天用甘油补料至终浓度2mM,第3周为1mM,而第4周和最后一周为0.5mM。在此过程结束时,分离到数个突变体。
与预期的基因型一致,以甘油作为唯一的碳源和能源,GEVO922,即glpDglpK双重敲除,与亲本野生型菌株相比生长缓慢。在四周强化进化之后,选择一个在基本M9甘油板上生长快速的克隆(GEVO926)用于继续研究。GEVO926在以甘油作为碳源的基本培养板上具有与野生型水平类似的生长速率(图10)。强化进化过程之后,通过PCR验证所进化的菌株中的基因删除,使用表4中所列举的PCR引物。
表4:用于验证染色体DNA变化的维持的PCR引物
  CCG TGG GTGAAA CAG TTC TT   glpOchk_F   引物与glpD基因的上游和外部结合以验证glpD的基因敲除
  CGT AAG TGCGAG CGT AAT GA   glpOchk_R   引物与glpD基因的下游和外部结合以验证glpD的基因敲除
  AAA GCT CCA CGCTGG TAG AA   glpKchk_F   引物与glpK基因的上游和外部结合以验证glpK的基因敲除
  GTC ACG CGT CTGATA AGC AA   glpKchk_R   引物与glpK基因的下游和外部结合以验证glpK的基因敲除
最后,用pGV1010,即含有氯霉素抗生素抗性遗传标志和在lac启动子控制下的编码NADPH依赖性酵母酮还原酶/脱氢酶的基因的质粒转化野生型GEVO1005和强化进化的、双重敲除的GEVO926二者。然而,由于GEVO1005是大肠杆菌K-12菌株的衍生物,因此它在染色体上只有一个lac阻抑基因,而且两种菌株中的酮还原酶的还原都是组成性的。在生物催化细胞的生长中不使用诱导物,因为显示了有和没有诱导物的情况中的表达水平是大致相同的。
实施例4:工程化改造以使用还原型碳源(甘油)来平衡生成正丁醇的异源途径的重组大肠杆菌
此实施例演示了工程化改造的微生物将1摩尔甘油转化成乙酰-CoA并产生2摩尔NADH,而且达到了使用平衡的正丁醇生成途径利用甘油来生成正丁醇在NADH方面的要求。相反,野生型、未工程化改造的和未修饰的菌株只产生1摩尔NADH。
平衡的正丁醇途径对每生成1摩尔正丁醇要求4摩尔NADH和2摩尔乙酰-CoA。途径的氧化还原平衡对于达到最高产率是至关重要的。实施例2和3中所描述的工程化改造高效生成了大肠杆菌生物催化剂,其在非生长条件下每厌氧代谢1摩尔甘油生成总共2摩尔NADH和1摩尔乙酰-CoA;相反,未工程化改造的野生型菌株在非生长条件下每厌氧生成1摩尔乙酰-CoA只生成1摩尔NADH,因此,使得它不能作为使用甘油作为碳源的正丁醇生产的高效生物催化剂工作。证实了作为实施例3的结果生成的工程化改造的大肠杆菌生成作为平衡的正丁醇生成途径的生物催化剂发挥功能所需要的代谢中间产物。
生物催化
将GEVO1005和GEVO926用pGV1010转化,并涂布在补充有50mg/mL氯霉素的LB板上,以确保细胞保留具有氯霉素抗生素抗性标志和酵母AA3酮还原酶编码基因的质粒。自单菌落在3mL M9Y+0.4%甘油中接种起始培养物的3份生物学复制品,在摇动温箱中以37℃和250rpm过夜生长。使用1.2mL每一种起始培养物作为接种体,接种120mL M9Y+0.4%甘油的培养物并以37℃和250rpm培养至稳定期。通过以4000g离心15分钟来收获细胞,在收获时测量OD600。将细胞用60mL供生物催化用的不含碳源和氮的培养基(生物催化培养基)清洗一次。此培养基不容许细胞生长。再次将培养物以4000g离心15分钟,并重悬于等于收获时OD600的10倍的生物催化培养基体积中。为了厌氧生物催化,自第一次清洗步骤起,所有工作都在在厌氧条件下实施。
在生物催化之前,在丰富培养基M9Y+0.4%甘油中进行需氧生长阶段,以促进高收获OD。凭借丰富培养基,由于酵母提取物的存在,细胞不必像在基本培养基中那样自甘油从头合成所有生物分子。然而,虽然工程化改造的菌株中已经消除了glpK,但是经GpsA酶经DHAP和NAD+可以为三酰甘油合成合成很少量的G3P。因此,glpK基因删除不阻止菌株GEVO926生成三酰甘油。
在只含甘油作为碳源的缺氧生物催化培养基中实施生物催化阶段以精确计算(account for)消耗的碳。厌氧地进行生物催化以匹配正丁醇发酵的生物催化条件和大大简化因碳需氧地经二氧化碳流失而变得复杂的碳计算。在需氧情况中,通过甘油代谢产生的NADH比该途径可能使用的NADH要多,因而正丁醇途径会是不平衡的;乙酰-CoA以CO2形式流失至TCA循环。在厌氧情况中,工程化改造的菌株GEVO926生成2摩尔NADH,因而正丁醇途径是平衡的。
使用酮还原酶反应来监测由甘油代谢生成的NADH的利用度,因为1个3-羟基丁酸乙酯分子的酶促形成需要1个NAD(P)H和乙酰乙酸乙酯。假设,NAD(P)H转氢酶容易地将NADH转化成酮还原酶优先利用的NADPH。如下实施生物催化反应。将重悬浮的细胞保存在冰上,直至准备好用于在30℃进行的厌氧生物催化。添加酮还原酶的底物乙酰乙酸乙酯至40mM浓度,并通过添加经过滤除菌的10%甘油至浓度5.5mM来启动反应。取决于实验,还与实验反应平行运行有底物但无碳源的背景反应,以监测不给料碳源时酶促反应的任何代谢物或产物。定期采集样品,至少每半小时一次。
测定法:细胞干重
将甘油消耗、产物形成和代谢物生成的速率相对于细胞干重标准化。细胞干重是通过如下测定的:每一份生物学复制品一式三份地取出10mL重悬浮细胞等分试样放入预称重的15mL锥形管中,以4000g离心15分钟,并丢弃上清液。将沉淀物在80℃烘箱中干燥,冷却,并记录细胞沉淀物的重量。
测定法:蛋白质凝胶
蛋白质凝胶证实了相似的细胞群具有丰富的和相似的酮还原酶量。
分析性层析:样品制备
自生物催化制备样品,供液相和气相层析用。具体而言,小心操作所有实验中的样品,使样品对室温和空气的暴露最小化。在采集了指定时间点的所有样品后立即将样品冷冻于-80℃。然后,将样品在微量离心机中以12000g离心15分钟,一旦自-80℃贮存取出无需在先解冻。将上清液转移至深孔、多孔板顶部的多孔过滤板(Pall AcroPrep 96 Filter Plate,0.2微米GH聚丙烯)的各个孔。凭借抽吸器和目的特异性多支管(purpose-specific manifold),使样品穿过滤器,进入下板。随后将每个样品转移至管形瓶(vial),供液相层析(LC)分析和气相层析(GC)分析用。典型地,在LC上加工样品,然后添加GC分析的内部标准品,并随后实施GC分析。
分析性层析:混合的酸代谢物、甘油、乙酰乙酸乙酯和3-羟基丁酸乙酯 的LC分析
为了测定每代谢1个甘油可得的NADH的比率,甘油和NADH依赖性转化的产物即3-羟基丁酸乙酯的定量是必需的。为了计算生成的所有NADH,还对经NADH依赖性转化生成的任何可能的其它代谢物进行定量,因为那些化合物反映了自酮还原酶转向的(diverted)NADH。这些代谢物包括琥珀酸和乳酸。定量的其它代谢物为甲酸和乙酸。乙酸是特别感兴趣的,因为它指示乙酰-CoA的利用度。
如下文表5所述实施LC分析的参数。
表5:LC分析的参数
  柱:  BioRad Aminex 87H(硫酸衍生柱)
  流动相:  0.04N H2SO4
  温度:  60℃柱温
  检测器:  RID;210nm UV
通过如下制备标准品:独立称取一式三份固体或挥发性组分入分析天平上的10mL容量瓶中,然后用HPLC级水或milliQ水补足溶液体积。3条个别绘制的曲线之间的一致确认了标准品的制备。制备好的标准品要在数天内使用,而且在各次使用之间保存于4℃。
分析性层析:乙醇的GC分析
下文表6描述了乙醇的GC分析的参数。
表6:GC分析的参数
Figure A20078005085300681
通过如下制备用于乙醇定量的标准品:称取无水乙醇入分析天平上的10mL容量瓶中并立即给瓶盖上盖子。然后,用HPLC级水或milliQ纯化的水将瓶充至体积。制备并运行3组独立制备的稀释液以确认标准品。向每毫升制备好的样品添加50μL内部标准1-戊醇。用冷却至4°的水循环GC的样品支架(sample holder)以防止挥发物自液相蒸发掉。
然后,根据测量得到的细胞干重,将产物、代谢物和甘油消耗的原始浓度标准化成mmol/g细胞干重。
结果:厌氧生物催化-测定NADH每甘油,自速率推导
NAD(P)H依赖性产物的产率指明了工程化改造的途径生成2摩尔NADH每甘油,而野生型途径为1摩尔NADH每甘油。以下解释了指明工程化改造的菌株GEVO926可提供必需的代谢中间产物用来以甘油作为碳源生成正丁醇的两种办法中的第一种。
使用生物催化剂每消耗1个单位的甘油所形成的产物浓度作为每消耗1个甘油通过代谢可利用的NAD(P)H的指标。图11图示了通过厌氧生物催化而消耗的甘油。图12图示了随时间形成的产物量。通过线性回归计算产物形成和甘油消耗在反应的第一个小时里的速率。在该时间段期间,产物形成和甘油消耗是线性的,而碳源和底物都不构成限制。使用来自每一个菌株的那些计算的速率,评估每一个菌株的产物每甘油比。表8列出了这些比值。注意,GEVO927是工程化改造的菌株GEVO926进化得到的,其含有pGV1010质粒,自该质粒表达酮还原酶基因。将用于每一个生物催化的各个细胞悬浮液复制品每一个的产物形成和甘油消耗的速率相对于细胞干重标准化。
然后,既然本质上没有其它代谢物指示观察到NADH可得性,那么得出结论,通过甘油代谢变得可得的几乎所有NADH都被酮还原酶利用来形成3-羟基丁酸乙酯。因此,每一个菌株的形成的产物对消耗的甘油的比等于NADH每甘油比。计算工程化改造的对野生型的NADH每甘油比,以确定工程化改造菌株相对于野生型菌株的NADH利用度升高的比值。工程化改造途径(像在GEVO926中发挥功能的)确实生成与野生型途径(像在GEVO1005中发挥功能的)相比大约几乎2倍量的NAD(P)H每甘油。在没有氧可利用的情况中,工程化改造途径应当理论上比野生型途径多生成1个NADH,因为甘油被代谢成丙酮酸。FADH2连接的GlpD酶的消除导致减少1个当量,它没有流失至电子传递链。在工程化改造的菌株中,NADH依赖性甘油脱氢酶(GldA)将可利用的还原性当量自甘油转移至NADH。
每一个菌株的产物每甘油比比理论上预期的略高。这可能是略微高估所形成的产物浓度的结果。无论是归于低估所消耗的甘油还是高估所形成的产物,此系统误差在菌株对菌株比中被抵消。自速率推导得出,菌株对菌株比较指明了相对于非工程化改造的菌株GEVO1005,GEVO926中有2摩尔NADH可利用。计算比值1.74+/-0.5在预期比值2的误差范围内。
比理论预期值要高的产物每甘油比也能反映随生物催化过程给料的甘油以外的碳源,可能是悬浮液中自溶的细胞或胞内碳源的代谢。通过使用这两种菌株的比较,贡献诸如假定的贡献取消(cancel out),假设同一过程在每一种菌株中都工作(at work)的话。如果在强化进化期间,工程化改造的菌株获得了改动(adation)来使自身以这种方式不同于野生型,那么此比较会遭受该警告(be subject to that caveat)。稍后讨论两种菌株之间能使此假说无效的可能差异的进一步讨论。
图13和图14比较了GEVO1005、pGV1010和工程化改造的菌株GEVO927为生成乙酸而消耗的甘油。这显示了进化得到的菌株提供了定量的乙酸每消耗甘油的量。倘若在细胞中表达正丁醇生成途径,那么自甘油生成的乙酰-CoA可被转化正丁醇,而非乙酸。
表7:来自厌氧生物催化的参数
Figure A20078005085300701
结果:厌氧生物催化-终点测定法
在一个独立的实验中,如上文所述实施厌氧生物催化,只是给生物催化给料有限量的甘油。通过这样做,不依赖时间地,所形成的产物的量每消耗的总甘油应当反映通过上文所述基于速率的办法计算得到的相同比率。使用在厌氧生物催化中所有甘油都被消耗掉时形成的产物的绝对量,产物每甘油比与对甘油代谢的预期变化一致。如表7中所示,相对于GEVO1005、pGV1010,工程化改造的菌株GEVO927自相同量的消耗的甘油生成NAD(P)H依赖性产物,例如3-羟基丁酸乙酯。
如果该系统的其它方面都不构成限制,而且生物催化剂可利用的底物是过量的,即使所有碳源都被消耗掉,所形成的NAD(P)H依赖性产物的量应当指示碳源代谢使之变得可利用的NADH的量。为了使底物绝不构成限制,碳源的浓度应当比供应给反应的底物的量小预期每个碳源分子的NADH当量的数目。在该情况中,不依赖时间地,如果所有碳源被消耗掉,那么所形成的产物指示给定碳源量使之变得对催化剂可利用的NAD(P)H的数量。这假设(assume)了上文描绘的条件,例如,即NAD(P)H当量没有被转向其它消耗NAD(P)H的途径。此办法预期会确认速率推导的测定的结果,而且情况确实如此。
如果碳源构成限制,那么生物催化剂形成的产物的量与通过该碳源的代谢变得对细胞可利用的NAD(P)H成比例,而不管产物形成或甘油消耗的速率。
碳平衡
碳平衡计算也确认了大部分乙醇来自非生物来源,因为把未修正的乙醇浓度包括在内会引起碳平衡计算高得不可能,就%回收的碳而言,野生型菌株高了7.4-3.5倍,而工程化改造的菌株高了4.3-2.4倍。(见图13和14)会使工程化改造的菌株GEVO926比野生型菌株产生更多的NADH每甘油的假设无效的结果会是野生型菌株通过将NADH转向生成还原型产物,像乙醇、琥珀酸和乳酸的发酵性途径而生成更多还原型代谢物的观察结果。然而,野生型的高%回收碳指示了很少的NADH被转向还原型代谢物。两种菌株之间的NADH依赖性代谢物的总量是不同的。然而,被用来形成这些代谢物的NADH的量与走向生物催化剂的量相比是小的。在厌氧代谢下,作为代谢物回收的碳应当等于以甘油形式消耗的碳。如果所有还原性当量走向生物催化剂,那么来自代谢的碳预期会作为未还原的产物即乙酸或甲酸显示出来,其可以通过甲酸脱氢酶的作用分解成CO2和H2。图13是GEVO1005,pGV1010的碳平衡的柱形图。图14是GEVO927的碳平衡的柱形图。
NADH依赖性酮还原酶生物催化剂的产物形成速率指示了通过转化所消耗的甘油而实现的NADH形成的速率,如果该系统满足某些要求的话:(1)催化剂和底物不构成限制,因此该反应在NADH方面是一级反应。这意味着就蛋白质浓度和活性而言有足够的催化剂来容易地将底物转化成产物,因为还原性辅因子因通过代谢的合成而在细胞中变得可得。如果催化剂的活性不足,那么变得可利用的NADH会走向其它利用NADH的酶,尤其是发酵途径。即使在这种情况中,两种菌株之间的代谢物谱应当在生成更多还原性当量的菌株中显示增加量的还原型发酵产物。
然而,结果指示几乎所有的NAD(P)H走向酮还原酶,因为任何可利用的NADH会以NADH依赖性酶促转化的还原型代谢物或产物的形式显示出来。通过代谢所生成的NAD(P)H不大可能被用于生物合成目的,因为蛋白质合成受到培养基中缺氮的抑制。在呼吸条件下唯一有活性的是NADH脱氢酶,因而势下降(potential sink)在厌氧条件下是不大可能的。
甘油的野生型代谢中假设会受到FAD+缺乏抑制的步骤的一个例子是在甘油的厌氧代谢下在没有外源电子受体的情况中甘油-3-磷酸变成二羟基丙酮磷酸(DHAP)的FADH2连接的脱氢。厌氧培养的大肠杆菌不代谢甘油,而且不能在没有外源电子受体(诸如延胡索酸或硝酸)的情况中生长。然而,有趣的是,此项研究中的厌氧生物催化揭示了即使不添加已知的电子受体,不知何故,野生型细胞确实消耗甘油和生成还原性当量,像NAD(P)H,正如NADPH依赖性产物和还原型代谢物的形成所反映的,指明了甘油代谢是有功能的。
注意,由于非生长培养基中细胞的氮饥饿,认为细胞蛋白质受困于(lockinto)需氧代谢机制,尽管细胞处于厌氧环境中。既然生成NADH的步骤在需要FAD+的步骤之后,那么必然可以得出结论,FAD+是G3P转化成DHAP可利用的,或者通过电子传递链的还原性当量以一些未知的方式穿梭。其它研究已经报道了其中不可能确定细胞如何在厌氧条件下发挥功能的情况,因为不能鉴定终端电子受体,但是无论如何发生生长(肺炎克雷伯氏菌基因使得能够在甘油上厌氧生长)。
表8描述了所公开的实施例中使用的培养基配方。
表8:培养基配方
Figure A20078005085300721
Figure A20078005085300731
实施例5:大肠杆菌为功能性表达丙酮酸脱氢酶在厌氧条件下进行的体内进化
平衡大肠杆菌中的正丁醇途径的一种方式是生成厌氧活性pdh基因产物。为了生成此类菌株,可使用将氧化还原平衡及因此的该大肠杆菌菌株的生长与Pdh的厌氧活性偶联的选择系统。例如,可构建在发酵途径中含有敲除而只保留乙醇生成途径完整的菌株,如图4中所概述的。这样的菌株不能在葡萄糖基本培养基上厌氧生长,因为不能维持氧化还原平衡。在糖酵解中每个葡萄糖生成2个NADH,而在乙醇途径中必须氧化4个NADH。导致厌氧Pdh活性的突变使代谢平衡并容许在葡萄糖上厌氧生长。
选择系统的菌株构建:GEVO1007适合于此选择系统。该菌株在葡萄糖基本培养基(M9)上生长很慢。对于在葡萄糖基本培养基上根本不生长的菌株,向这些菌株添加额外的frd和pflB敲除。另外,必须删除大肠杆菌中由pflDC编码的沉默Pfl,以避免它在选择压力下的突变活化。
丙酮酸甲酸裂合酶(由pflB编码):用自GEVO802制备的P1裂解物转导GEVO1007,所得菌株命名为GEVO1500。
丙酮酸甲酸裂合酶2(由pflDC编码):用自GEVO1497制备的P1裂解物转导GEVO1007,所得菌株命名为GEVO1501。
延胡索酸还原酶(由frd编码):用自GEVO818制备的P1裂解物转导GEVO1501,所得菌株命名为GEVO1502。为了构建相应的大肠杆菌B菌株,用自GEVO822制备的P1裂解物转导GEVO1225,转导得到的菌株命名为GEVO1226。
用于选择的菌株的表征:自LB板接种GEVO1007和GEVO1501的3mL LB培养物,并以37℃和250rpm温育过夜。使用这些培养物以5%接种第1代M9培养物(3mL)。将M9培养物以37℃和250rpm温育过日(over day)。使用需氧M9过日培养物以2%接种第2代M9过夜培养物。将管以37℃和250rpm温育。使用M9过夜培养物以2%接种第3代需氧M9培养物(3mL)。还使用M9过夜培养物以5%接种含M9培养基的厌氧管。将管以37℃和250rpm温育。在厌氧管中,GEVO1007显示出缓慢生长,在温育2天后OD达到0.2。GEVO1501在厌氧管中不生长。
将菌株GEVO1007和1501在M9板上划线,并将板在厌氧罐中于37℃厌氧温育。温育3天后无一菌株生成可见的菌落。
体内进化:通过在10ml含有葡萄糖作为唯一碳源的新鲜培养液中1∶100稀释,每天转移GEVO1007的厌氧培养物。将培养物在没有搅动的情况中于37℃温育24小时。为了富集厌氧Pdh活性,每周一次,将培养物稀释并涂布在含有葡糖酸(盐)作为唯一碳源的固体培养基上。然后将板在厌氧环境中温育。将生长最迅速的菌落刮入新鲜培养液中并如上所述处理。反复地重复此过程直至不再观察到生长速率的进一步升高。
实施例6:lpdA的定点诱变和定向进化
脱氢脂酸(Dehydrolipoate)脱氢酶(由lpdA编码)是结合NADH的Pdh多酶复合物的亚基。它的诱变能导致减轻Pdh在高NADH/NAD比(对于厌氧代谢是典型的)时的抑制的变体。为此目的,删除大肠杆菌染色体上的lpdA基因,并用突变型lpdA替换,其或是自质粒或是自染色体表达。将lpdA基因自制备自大肠杆菌W3110的基因组DNA克隆入pCRBlunt载体(Invitrogen)中并测序。使用所得质粒pCRBlpdA作为密码子55的定点诱变的模板,密码子55是NADH结合口袋的一部分。通过SOE诱变lpdA序列以生成突变A55V(Horton,见上文)。
在平行诱变中,实施PCR以生成突变A55V、I、L、F(Horton,见上文)。
通过删除基因的核苷酸107-1400来破坏大肠杆菌中编码脱氢脂酸脱氢酶的基因(lpdA)。所得菌株为GEVO1227,和GEVO1228。
为了构建用突变型lpdA替换lpdA,使用PCR引物自pCRBlpdAmut或pCRBlpdAN扩增基因。将突变型lpdA基因插入GEVO1227的基因组中。所得菌株GEVO1229含有突变型lpdA,即lpdAmut,而所得菌株GEVO1230含有突变型lpdA,即lpdAN,替换野生型lpdA基因。
实施例7:pdh表达的解除调节
PDH多酶复合物的表达在转录水平受到调节物ArcA和Fnr应答缺氧的调节。为了避免pdh基因表达在厌氧条件下的下调,自大肠杆菌基因组删除编码调节物Fnr的基因(fnr)。
转录双重调节物Fnr:
用删除来破坏大肠杆菌中编码应答调节物Fnr的基因(fnr)(删除了核苷酸-87至646),得到了菌株GEVO1503。将fnr删除与ldhA、ackA、poxB、pflB和frd删除组合。
用自GEVO1503制备的P1裂解物转导GEVO1501,所得菌株命名为GEVO1504。
正丁醇途径的表达水平的优化
通过使用诱导型启动子PLtetOI和PLlacOI来修饰合成操纵子中正丁醇途径基因的表达水平。在野生型大肠杆菌W3110中,PLtetOI是组成性的,因为细胞中不存在阻抑物tetR。由染色体lacI基因编码的阻抑物没有完全阻抑启动子PLlacOI,这限制了此启动子的调节范围。用自DH5αZ1制备的P1裂解物转导GEVO1504,所得菌株命名为GEVO1505。
实施例8:甲酸脱氢酶的异源表达
如(Berrios-Rivera等,Metabol.Eng.2002:217-229,2002)所述,用NADH依赖性Fdh替换不依赖天然辅因子的甲酸氢裂合酶。
实施例9:用于将乙酰-CoA转化成正丁醇的丙酮丁醇梭菌基因的异源表达
能用于在大肠杆菌中异源表达正丁醇发酵途径的一套基因编码硫解酶(thl)羟基丁酰-CoA脱氢酶(hbd)、巴豆酸酶(crt、丁酰-CoA脱氢酶(bcd)、电子传递蛋白(etfA和etfB)和醇脱氢酶(adhE2)。编码醇脱氢酶的基因(adhE2)可以用编码丁醛脱氢酶(bdhA/bdhB)或正丁醇脱氢酶(aad)的基因替换。
然后首先测试每一种蛋白质在大肠杆菌中的表达,并校准其活性。
每一种酶的活性测定法的校准:首先自商业上获得的丙酮丁醇梭菌ATCC824的基因组DNA个别地克隆上述基因。使用表3所列正向和反向引物,自基因组DNA PCR扩增每一种基因并使用适宜的限制酶位点个别地克隆入pZE32载体中。将基因与它们的天然核糖体结合位点一起克隆到改良的噬菌体λ(PL-lac)启动子之下(Lutz等,Nucleic Acids Res.25:1203-1210,1997)。然后在大肠杆菌细胞中表达基因并测定活性。
通过电穿孔将携带各基因的pZE32载体转化入电感受态的大肠杆菌-W3110细胞中。在50ml含有0.1mg/ml氨苄青霉素的Luria Bertani(LB)培养基中需氧地或厌氧地培养转化细胞。在对数生长中期,用0.1mM IPTG(异丙基-β-D-硫代吡喃半乳糖苷)诱导细胞。在细胞达到稳定期后,通过离心收获转化子。使用酶比活测定法监测酶的活性(Boynton等,J.Bacteriol.178(11):3015-3024,1996;Bermejo等,Applied and Environmental Microbiology 64:1079-1085,1998)。
将在需氧条件下培养的细胞重悬于含有1mM 1,4-二硫苏糖醇的50mM 4-吗啉-丙磺酸(MOPS)缓冲液(pH 7.0)。将细胞悬浮液以60%功率超声处理9-15分钟。通过于4℃以30,000g离心30分钟来清除细胞碎片。对上清液测试酶的活性。将在厌氧条件下培养的细胞重悬于不含1,4-二硫苏糖醇的缺氧MOPS缓冲液。用溶菌酶处理细胞悬浮液,然后通过在厌氧培养室内于0℃剧烈旋涡震动10分钟来破碎细胞。将样品以9000g离心20分钟,用以将裂解物与沉淀物分开。在离心期间给悬浮液紧密地盖上盖子。离心后,将上清液转移入安瓿中,并紧密密封以防止与空气接触。(Boynton等,J.Bacterol.178:3015-3024,1996)。
使用硫解反应对细胞测定硫解酶。于室温将硫解反应与借助于磷酸转乙酰酶的对乙酰-CoA的砷分解偶联。每份测定液含有67mM Tris盐酸(pH 8.0)、0.2mM未结合的CoA、0.2mM乙酰乙酰-CoA、25mM砷酸钾(pH 8.1)和2U磷酸转乙酰酶。通过添加乙酰乙酰-CoA来启动反应。监测由对乙酰-CoA键的切割引起的232nm吸光度的降低。1个单位的酶定义为催化对1μmol乙酰乙酰-CoA每分钟每mg蛋白质的硫解切割的酶量(Petersen等,Applied andEnvironmental Microbiology 57:2735-2741,1991)。
通过监测NADH的氧化速率来测定Hbd活性,其通过340nm吸光度的降低来测量,以乙酰乙酰-CoA作为底物(Boynton等,Journal of Bacteriology 178:3015-3024,1996)。在没有底物的情况中进行对照反应,用以监测背景活性。通过观察巴豆酰-CoA在263nm处特异性吸收带的吸光度的降低来分析巴豆酸酶活性(Boynton等,Journal of Bacteriology 178:3015-3024,1996)。通过将NADH的氧化与巴豆酰-CoA的还原(reduction)偶联来监测Bcd的活性。该测定法会在总体积1ml中含有30μM巴豆酰-CoA、60mM磷酸钾pH6.0和0.1mMNADH。使用NADH的340nm处吸光度的降低来确定Bcd、EtfA和EtfB的活性(Becker等,Biochemistry 32:10736-10742,1993)。通过测量在没有它们各自底物(即丁醛或丁酰-CoA)的情况中NADH的氧化速率来测定Aad、AdhE2和BdhA/B的活性。
通过Bradford的染料结合法来测量蛋白质浓度,以牛血清清蛋白(Bio-Rad)作为标准品。对于每一种酶,确定了野生型大肠杆菌中的活性的单位,其中一个单位指在1分钟里将1微摩尔底物转化成产物的酶量。
实施例10:经过密码子优化的、用于将乙酰-CoA转化成正丁醇的丙酮丁醇梭菌基因的异源表达
基因为表达宿主进行的密码子优化提高了蛋白质表达和稳定性二者(Gustafsson等,Trends Biotechnol.22:346-353,2004)。为了增强来自丙酮丁醇梭菌的基因的表达(图2),将基因为大肠杆菌进行密码子优化和商业合成。为了在大肠杆菌中表达完整途径,使用双质粒系统表达基因。thl、hbd、crt和adhE2基因作为一个转录物来表达(图5),而bcd、etfA和etfB基因作为第二个转录物来表达(图6和7)。将这两种质粒(图8和9)分开地和一起地转化入大肠杆菌细胞中并测试活性。
thl、adhE2、crt和hbd的表达:来自丙酮丁醇梭菌的thl、adh、crt和hbd基因是作为一个转录物(seq tach)合成的,每一种基因的侧翼有独特的限制酶位点(图5)。使用Codon Devices公司(Cambridge,MA)的私有密码子优化算法对基因进行密码子优化。天然核糖体结合位点位于每一种基因的上游。使用载体MCS中可利用的EcoRI和BamHI限制酶位点,将含有4种ORF的片段克隆入pZA11(Lutz等,Nucleic Acids Res.25:1203-1210,1997,图8)载体中。
此载体携带p15A复制起点、改良的噬菌体λ(PL-tet)启动子和氨苄青霉素抗性基因。将seq tach片段克隆到PL-tet启动子的下游。通过电穿孔将seqtach-pZA11质粒转化入大肠杆菌-W3110细胞中。在50ml含有0.1mg/ml氨苄青霉素的Luria Bertani(LB)培养基中于37℃需氧地或厌氧地培养转化子。在对数中期,使用100ng/ml无水四环素诱导基因表达。诱导后24小时通过以4000g离心15分钟来收获细胞。将所收获的细胞重悬于含有1mM 1,4-二硫苏糖醇的50mM 4-吗啉丙磺酸(MOPS)缓冲液(pH 7.0)。将细胞悬浮液以60%功率超声处理9-15分钟。通过于4℃以30,000g离心30分钟来清除细胞碎片。对上清液测试酶的表达和活性。
通过SDS-PAGE电泳(Sambrook,2001#172)通过比较诱导前后采集的培养物样品来监测每一种酶的表达。如上文所概述的,使用酶比活测定法来测定Crt、Thl、Hbd和AdhE2的活性。
bcd、etfA和etfB的表达:如图6和7中分别所概述的,在两个分开的构建体中合成来自丙酮丁醇梭菌的(seq Cbab)和来自埃氏巨球形菌的(seq Mbab)bcd、etfA和etfB基因。使用DNA 2.0 Inc.的私有密码子优化算法对基因进行密码子优化。核糖体结合位点和基因间区维持与天然的梭菌属操纵子相同(Boynton等,Applied and Environmental Microbiology 62:2758-2766,1996)。使用载体MCS中可利用的EcoRI和BamHI限制酶位点将这两种序列克隆入pZE32(Lutz等,Nucleic Acids Res.25:1203-1210,1997,图9)载体中。此载体携带ColEl复制起点、改良的噬菌体λ(PL-lac)启动子和氯霉素抗性基因。将seqCbab和seqMbab片段个别地克隆到PL-lac启动子的下游。
通过电穿孔将seqCbab-pZE32和seqMbab-pZE32质粒转化入大肠杆菌-W3110细胞中。在50ml含有0.05mg/ml氯霉素的Luria Bertani培养基中于37℃需氧地培养转化子。在对数中期,使用1mM IPTG(异丙基-β-D-硫代吡喃半乳糖苷)诱导基因表达。诱导后24小时通过以4000g离心15分钟来收获细胞,并重悬于不含1,4-二硫苏糖醇的缺氧MOPS缓冲液。用溶菌酶处理细胞悬浮液,然后通过在厌氧培养室内于0℃剧烈旋涡震动10分钟来破碎细胞。将样品以9000g离心20分钟,用以将裂解物与沉淀物分开。在离心期间给悬浮液紧密地盖上盖子。离心后,将上清液转移入安瓿中,并紧密密封以防止与空气接触。
通过SDS-PAGE电泳(Sambrook,2001#172)通过比较诱导前后采集的培养物样品来监测bcd、etfA和etfB的表达。通过将NADH的氧化与巴豆酰-CoA的还原偶联来监测Bcd的活性。该测定法会在总体积1ml中含有30μM巴豆酰-CoA、60mM磷酸钾pH6.0和0.1mM NADH。使用NADH的340nm处吸光度的降低来确定Bcd、EtfA和EtfB的活性(Boynton等,Applied and EnvironmentalMicrobiology 62:2758-2766,1996;O′Neill等,J.Biol.Chem.273(33):21015-21024,1998)。
完整途径的表达:通过电穿孔将seqCbab-pZE32和seqtach-pZA11转化入大肠杆菌-W3110细胞中。在250ml含有0.05mg/ml氯霉素和0.1mg/ml氨苄青霉素的Luria Bertani(LB)培养基中于37℃厌氧培养转化子。在对数中期,使用1mMIPTG(异丙基-β-D-硫代吡喃半乳糖苷)和100ng/ml无水四环素诱导基因表达。
在诱导后0、2、4、6、8、10、12和24小时,采集样品并分析多种特性。通过以4000g离心15分钟来收获2.5ml细胞,并重悬于不含1,4-二硫苏糖醇的缺氧MOPS缓冲液。用溶菌酶处理细胞悬浮液,然后通过在厌氧培养室内于0℃剧烈旋涡震动10分钟来破碎细胞。在离心期间给悬浮液紧密地盖上盖子。离心后,将上清液转移入安瓿中,并紧密密封以防止与空气接触。然后如上文所概述的对裂解物测试蛋白质表达和酶活性。通过高效液相层析依照标准规程分析反应培养基中葡萄糖和中间产物的浓度(Causey等,Proc.Natl.Acad.Sci.U.S.A.100:825-832,2003)。通过高效液相层析(HPLC)依照确立的规程(Fontaine,2002#5)测量正丁醇和其它途径中间产物的浓度。由此数据计算每消耗1分子葡萄糖所形成的正丁醇分子数的比率。在工程化改造的GEVO菌株中重复上文表达、活性和产物分析。在敲除了发酵性途径的情况中,细胞只能以有活性的正丁醇途径来生长。
实施例11:对于与丙酮丁醇梭菌同源的、用于将乙酰-CoA转化成正丁醇的基因的途径重排(shuffling)
对于催化将乙酰-CoA引向正丁醇的代谢反应的每一种酶,鉴定了来自多种生物体的数种同系物。为了评估这些备选酶和这些酶的所有组合对于正丁醇生成的合适性,可以自分开的DNA构建体表达途径酶的所有可能组合。
作为首先自两种质粒(pZE32和pZA11)表达的两个操纵子,合成正丁醇途径。自pZA11在PLtetO启动子的控制下表达基因thl、crt、adh和hbd,并且自pZE32在PlacOI启动子的控制下表达基因bcd、etfB和etfA。该文库含有上文所述同源基因的所有组合,除了总是来自同一生物体的etfA和etfB之外。将所有同源基因为了大肠杆菌表达宿主进行密码子优化。所有基因的前面是它们的天然SD和UTR序列。将质粒文库转化入GEVO1505。
从选择板上洗下来自此转化的选择板的菌落,并使用所得菌株文库接种9个以不同浓度含有诱导物无水四环素(aTc)和IPTG(0.01、0.1、1mM IPTGx1、10、100ng/ml aTc)的LB培养物。在摇动式温箱中以37℃和250rpm温育24小时后,使用这些培养物接种9个装有确定成分培养基的管,以葡萄糖作为唯一碳源。在摇动式温箱中以37℃和250rpm温育12小时后,使用培养物接种厌氧管中的100mL相同培养基和诱导物水平,起始OD为0.1。将管在摇动式温箱中以37℃和250rpm温育。
菌株的厌氧生长速率取决于正丁醇途径的功能性表达。通过连续稀释厌氧管来选择出组合途径文库中容许在厌氧条件下最快生长的成员。
实施例12:重组大肠杆菌为提高正丁醇生成速率的体内进化
通过在10ml含有葡萄糖作为唯一碳源的新鲜培养液中1∶100稀释,每天转移含有完整正丁醇途径的大肠杆菌的厌氧培养物。将培养物在没有搅动的情况中于37℃温育24小时。由于生长速率与正丁醇生成速率有关,因此通过每周一次稀释培养物并将它们涂布在含有葡萄糖作为唯一碳源的固体培养基上来实现升高的正丁醇生成速率的强化(enrichment)。然后将板在厌氧环境中温育。将生长最迅速的菌落刮入新鲜培养基并如上所述处理。反复地重复此过程直至不再观察到生长速率的进一步升高。
实施例13:对大肠杆菌测试正丁醇抗性
丁醇抑制不仅丙酮丁醇梭菌中的而且大肠杆菌中的最终正丁醇生成水平下的细胞生长。实施初始实验以确定正丁醇对大肠杆菌细胞的毒性水平。在这些实验中使用大肠杆菌DH5α细胞。
简言之,给250mL带挡板的锥形瓶中的50mL LB培养基补充0-5%正丁醇,以0.5%为增量。在接种500μL过夜培养物后测定生长速率和最大OD600。在0.5%正丁醇,生长速率和最大OD600大致减半。在1%正丁醇,生长速率不能定量,而最大OD600降低了约40倍。
实施例14:大肠杆菌为提高正丁醇抗性的体内进化
为了提高正丁醇耐受水平,通过在10ml含有正丁醇和葡萄糖的新鲜培养液中1∶100稀释,每天转移大肠杆菌培养物的厌氧培养物。将这些培养物在没有搅动的情况中于37℃温育24小时。随着培养物的密度在后续转移期间升高,逐渐提高正丁醇浓度以选择出抗性突变体。每周一次,稀释培养物并涂布到固体培养基上以富集正丁醇抗性突变体。自这些板刮取生长最快的菌落,并用于接种新鲜培养基。然后如上所述处理这些培养物。培养基中的初始正丁醇浓度为0.5%。每周将此浓度提高0.1%。重复此过程直至不再有明显的正丁醇耐受的进一步升高。
实施例15:表达经过优化的正丁醇途径的重组微生物-BCD/CCR/TER纤细眼虫/密螺旋体
测试了正丁醇途径中的丁酰CoA脱氢酶步骤的备选酶。来自埃氏巨球形菌的Bcd、EtfB和EtfA及来自丙酮丁醇梭菌的Bcd、EtfB和EtfA在发酵实验中不产生任何正丁醇。在正丁醇发酵实验中功能性表达来自山丘链霉菌(Sreptomyces collinus)的巴豆酰-CoA还原酶(Ccr),而且它是有活性的。来自纤细眼虫的反式-2-烯酰-CoA还原酶(TER)在正丁醇发酵实验中比来自山丘链霉菌的Ccr更具活性。
而且,来自纤细眼虫的TER在正丁醇发酵实验中比来自嗜水气单胞菌的FER更具活性。这是遵循如下实验观察到的,其中分别用pGV1191和pGV1113(TEREg-纤细眼虫)和pGV1117(TERAh-嗜水气单胞菌)转化GEVO768(W3110Z1)。通过正丁醇发酵比较转化子。结果图示于图15。具有TERAh的菌株的平均生产力为1.6*10-4g/L/h,而具有TEREg的菌株的平均生产力为3.2*10-4g/L/h。
另外,来自齿垢密螺旋体的细菌TER同系物在正丁醇发酵中比来自纤细眼虫的TER更具活性。这是遵循如下实验观察到的,其中为在大肠杆菌中表达而密码子优化并合成10种编码来自贝氏柯克斯体、α变形细菌HTCC2255、新洋葱伯克霍尔德氏菌、哈氏噬纤维菌、Reinekea、Shewanella woodyi、齿垢密螺旋体、弧菌Ex25、稻黄单胞菌KACC 10331和鼠疫耶尔森氏菌的细菌TER同系物的基因。将TER基因克隆入载体pGV1252中,该载体与正丁醇途径相容且确保TER相对于其它途径基因的低表达。使用pGV1252衍生物pGV1272、pGV1300-1309和pGV1190作为改良的双载体系统,其容许在使得TER活性对于途径是限制性的条件下比较TER基因。使用GEVO1121(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+),ΔmgsA)作为发酵的宿主菌株以测试同系物。在两个独立的瓶发酵实验中测试10个克隆,以pGV1272(TER-纤细眼虫)作为对照。
图示于图16和17的结果显示了,与用纤细眼虫TER进行的发酵相比,来自齿垢密螺旋体的细菌同系物(pGV1344)将发酵的最终效价(titer)提高了4倍,并将发酵的生产力改善了超过4倍(图16)。所测试的所有其它细菌同系物显示出相对于用纤细眼虫TER进行的发酵更低的生存力。凭借来自齿垢密螺旋体的TER,达到了效价0.81g/L和生产力0.022g/L/h。凭借来自纤细眼虫的TER,达到了效价0.2g/L和生产力0.005g/L/h。来自齿垢密螺旋体的TER确保当该基因在常规双载体系统(pGV1113衍生物+pGV1190)中表达时表达了足够的酶活性来确保巴豆酰-CoA的还原不是途径内的限速步骤。
进一步的实验还显示了,对于硫解酶、羟基丁酰-CoA脱氢酶和巴豆酸酶,经过密码子优化的来自丙酮丁醇梭菌的基因具有这些基因的所有测试同系物中的最高体外活性。
具体而言,表达并通过体外活性测定法比较了途径酶羟基丁酰-CoA脱氢酶(Hbd)、巴豆酸酶(Crt)和硫解酶(Thl)的同系物。所测试的羟基丁酰-CoA脱氢酶同系物为pGV1037(来自丙酮丁醇梭菌的Hbd)、pGV1041(来自解纤维丁酸弧菌的Hbd)、pGV1050(来自拜氏梭菌的Hbd)和pGV1154(来自丙酮丁醇梭菌的Hbd,经过密码子优化的基因序列)。所测试的巴豆酸酶同系物为pGV1040(来自溶纤维丁酸弧菌的Crt)、pGV1049(来自拜氏梭菌的Crt)、pGV1094(来自丙酮丁醇梭菌的Crt)和pGV1189(来自丙酮丁醇梭菌的Crt,经过密码子优化的基因序列)。所测试的硫解酶同系物为pGV1035(来自丙酮丁醇梭菌的Thl)、pGV1039(来自解纤维丁酸弧菌的Thl)和pGV1188(来自丙酮丁醇梭菌的Thl,经过密码子优化的基因序列)。遵循以下概述的方案,表达并测定基因。
用每一种质粒转化GEVO768(大肠杆菌W3110Z1),并将转化子涂布在含100μg/mL氯霉素的LB培养基上。将板于37℃温育14-16小时。使用克隆的单菌落接种3mL含100μg/mL氯霉素的LB培养基。将培养物以37℃和250rpm温育过夜。使用过夜培养物接种摇瓶中50mL含100μg/mL氯霉素的富含EZ的培养基。将培养物以37℃和250rpm温育。在指数生长中期(OD600为0.6-0.8),用1mM IPTG诱导培养物。这活化了克隆在lac启动子控制下的基因表达。4小时后,将细胞以4000g离心10分钟。将细胞重悬于100mM Tris缓冲液pH 7.5,并使用珠搅拌器(bead beater)裂解。将细胞以22000g离心5分钟以分离裂解物。将裂解物小心转移至新管并测试酶活性和蛋白质总量。
为了测试Hbd的活性,将10μL裂解物添加至190μL含有0.1mM乙酰乙酰-CoA和0.2mM NADH的50mM MOPS pH 7.0缓冲液。通过在340nm监测NADH的消耗来测量Hbd的活性。为了测试Crt的活性,将10μL裂解物添加至190μL含有30μM巴豆酰-CoA的100mM Tris pH 7.6缓冲液。通过在263nm监测巴豆酰-CoA的消耗来测量酶活性。为了测试Thl的活性,将10μL裂解物添加至190μL含有10mM MgCl2、250μM乙酰乙酰-CoA和200μM CoA的Tris pH 8.0缓冲液。通过在303nm监测乙酰乙酰-CoA的消耗来测量酶活性。用生物学复制品测试所有克隆,而且每种测定法以一式两份进行。
来自经过密码子优化的基因的酶在所测试的克隆中具有最高表达和因此的最高活性。正丁醇途径的这三种转化的最高比活(相对于总细胞蛋白质标准化的),Hbd为11.6nmol/min/μg总细胞蛋白质(表9),巴豆酸酶为1178nmol/min/μg总细胞蛋白质(表10),而硫解酶为2.96nmol/min/μg总细胞蛋白质(表11)。硫解酶、巴豆酸酶和羟基丁酰脱氢酶的经过密码子优化的基因导致最高体外酶活性,而且有可能是会产生最高途径生产力的基因。
表9:正丁醇途径酶Hbd的同系物的比活
  hbd   来源生物体   比活(nmol/min/ug总细胞蛋白质)
  pGV1037   丙酮丁醇梭菌   3.51
  pGV1041   溶纤维丁酸弧菌   0.85
  pGV1050   拜氏梭菌   2.91
  pGV1154   丙酮丁醇梭菌,密码子优化的   11.69
  pGV1111   载体对照   0.20
表10:Crt同系物的比活
  crt   来源生物体   比活(nmol/min/ug总细胞蛋白质)
  pGV1094   丙酮丁醇梭菌   83.39
  pGV1040   溶纤维丁酸弧菌   0.04
  pGV1049   拜氏梭菌   10.84
  GV1189   丙酮丁醇梭菌,密码子优化的   916.99
  pGV1111   载体对照   0.17
表11:Thl同系物的比活
  thl   来源生物体   比活(nmol/min/ug总细胞蛋白质)
  pGV1035   丙酮丁醇梭菌   0.36
  pGV1039   溶纤维丁酸弧菌   2.44
  pGV1188   丙酮丁醇梭菌,密码子优化的   2.50
  pGV1111   载体对照   0.18
实施例16:工程化改造以在碳生成和消耗方面平衡正丁醇生成的重组微生物-MgsA
在mgsA基因(GEVO1121)中具有额外删除的菌株GEVO1083显示出升高的正丁醇产率,并在其它地方描述。
通过正丁醇瓶发酵来比较GEVO1083(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))、pGV1191、pGV1113(A)和GEVO1121(GEVO1083,ΔmgsA)、pGV1191、pGV1113(B)。
结果图示于图18。菌株A在36小时里生成0.32g/L乳酸,尽管ldhA敲除消除了通向乳酸的发酵性途径。菌株B在36小时里只生成0.065g/L乳酸(图5)。菌株B生成正丁醇,作为主要的还原型发酵产物。菌株A达到了效价0.21g/L、产率0.048g/g和生产力0.006g/L/h。菌株B达到了效价0.22g/L、产率0.057g/g和生产力0.006g/L/h。
这些实验显示了正丁醇生产菌株中mgsA的删除导致正丁醇发酵中的更高产率。具体而言,这些实验显示了mgsA的删除导致乳酸生成降低5倍,这导致正丁醇产率改善19%。
实施例17:工程化改造以在碳生成和消耗方面平衡正丁醇生成的重组大肠杆菌-乙酸途径
通过删除ackA来删除通向乙酸的主要发酵性途径。用以下实验调查此敲除的效果:
通过正丁醇瓶发酵来比较GEVO1083(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))、pGV1190,pGV1113(A)和GEVO1137(GEVO1083,ΔackA)、pGV1190、pGV1113(B)。
将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
显示于图19和表12的分析结果显示了在ackA中具有删除的菌株达到了高10%的产率和高50%的生产力和效价(表13)(图19)。在ackA中具有基因删除的菌株中的乙酸生成与在ackA中没有删除的相同菌株相比降低了5倍(图19)。
表12:用于比较GEVO1083和GEVO1137的工艺参数
  产率   生产力   效价
  样品   g正丁醇/g葡萄糖   g/L/h   g/L
  1137A   0.1011   0.0174   0.627
  1137B   0.1034   0.0183   0.660
  1083C   0.0921   0.0117   0.422
  1083D   0.0921   0.0123   0.442
总之,ackA敲除降低乙酸生成和提高产率、生产力和效价。这显示了与正丁醇途径竞争碳的天然大肠杆菌途径的删除改善正丁醇生产工艺的工艺参数。
这些实验显示了乙酸发酵性途径的删除提高生产菌株在正丁醇发酵中的产率、生产力和效价。
实施例18:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌中的fdh
将基因fdh克隆入pGV1113中,在TER之后的操纵子中,以容许共表达fdh和正丁醇途径(pGV1281)。用pGV1113和pGV1190(1)及用pGV1281和pGV1190(2)转化GEVO1083(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))。通过正丁醇瓶发酵来菌株1和2。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
图示于图20A和20B的结果显示了在正丁醇途径之外还表达NADH依赖性Fdh的菌株1以产率0.086g/g的生成正丁醇,比只表达正丁醇途径的比较菌株2的正丁醇产率高42%(图20A和20B)。
此结果显示了NADH依赖性Fdh在正丁醇生产菌株中的表达提高正丁醇发酵的产率。
实施例19:生成正丁醇的方法-使用培养中和和厌氧条件
对上文表1所列菌株测试它们的正丁醇产率、它们的生产力和最大可实现效价。具体而言,依照以下步骤将培养条件从生长和生物催化都厌氧变成生长阶段需氧和生物催化阶段厌氧。
用用于正丁醇途径的适宜质粒新鲜转换要测试的菌株。然后挑取单菌落,使用3ml富含EZ的培养基+0.4%葡萄糖,一式两份地接种过夜培养物,并添加在丙酮中稀释的3μl Amp(100mg/ml)和3μl Cm(50mg/ml)。因为富含EZ的培养基易受污染,所以在无菌工作台中使用培养基。在乙醇以外的溶剂中稀释所使用的抗生素(即Cm)。
然后采集过夜培养物的O.D.读数,以标准化所需要的接种体的量。在60ml富含EZ的培养基+0.4%葡萄糖中使用过夜培养物的2%接种体,并添加在丙酮中稀释的60μl Amp(100mg/ml)和60μl Cm(50mg/ml),并以37℃/250rpm温育。同样地,在无菌工作台中使用培养基以避免污染富含EZ的培养基。
在O.D.约.600,通过添加60μl 1M IPTG和6μl 10,000x ATC[在甲醇中稀释]来诱导培养物,鉴于ATC的光敏感性,要确保在添加诱导物后培养物不受光照。使用甲醇来掩蔽GC中的乙醇峰。然后将培养物以30℃/250rpm温育6-8小时。然后每种培养物采集100μl样品,将样品置于冰上。获取pH和葡萄糖的读数及在600nm吸光度得到的O.D.读数,使用水作为参照物。具体而言,使用5-10pH范围的pH试纸条采集pH读数。使用OneTouch Ultra葡萄糖监测仪采集葡萄糖读数。
在必要时通过添加2M NaOH将pH调节至7.5,并通过添加40%葡萄糖以维持约0.2%葡萄糖(在葡萄糖计上为约500-600mg/dl)。然后采集2ml样品,以25000g和4℃离心(spin down)5分钟。然后取出上清液供GC/LC分析用,并将沉淀物置于盒中保存在冰箱中。将此样品标记为零小时时间点。
将50mL培养物转移入100mL厌氧充气锯齿形密封瓶(crimp seal flask)中,并将培养物放回温箱。将培养物以30℃/250rpm温育,添加在丙酮中稀释的50μlAmp(100mg/ml)和50μl Cm(50mg/ml)。在丙酮中稀释Cm是为了避免使用在乙醇中稀释的抗生素。
大约每12小时使用注射器在厌氧室中采集2ml样品。使用2ml样品采集O.D.、pH、葡萄糖读数,并将剩余样品用于GC/LC分析。每24小时向培养物中添加在丙酮中稀释的25μl Amp(100mg/ml)和25μl Cm(50mg/ml),避免使用在乙醇中稀释的抗生素。
在必要时,通过添加2M NaOH将pH调节至7.5,并通过添加40%葡萄糖以维持约0.2%葡萄糖(在葡萄糖计上为约500-600mg/dl)。
图示于图21A和21B的这些实验的结果显示了,通过延长发酵时间和通过缩短补料和中和事件之间的间隔,效价从0.011g/L到0.0525g/L,改善了4.7倍。生产力从0.000323g/L/h到0.000795g/L/h改善了超过2倍,而产率从0.001373g/g到0.005831g/g(丁醇/葡萄糖)改善了4倍(TB002-74)。这些发酵是用菌株GEVO768(W3110Z1)进行的。
这些结果显示了发酵条件的改动提高了正丁醇生产工艺的生产力、产率和效价。
实施例20:生成正丁醇的方法-发酵条件的优化
发酵罐中从生长到生物催化的转换的优化改善正丁醇生产力和效价。使用经质粒pGV1190和pGV1113转化的GEVO1083(大肠杆菌W3110 ndh,ldhA,adhE,frd)实施了在需氧到厌氧的不同转换下的正丁醇发酵。用转化菌株的过夜培养物接种4个发酵罐容器,即1、2、3和4,每个装有200mL含有适宜抗生素的富含EZ的培养基。生长阶段将发酵罐维持在37℃,并将pH控制在7.0。将发酵罐设定为搅动速度400rpm,并以1sL/h给它们通气100%空气。在指数中期,用1mM IPTG和100ng/mL无水四环素诱导培养物。在诱导后将发酵罐温度降低至30℃。诱导6小时后,将发酵罐1、2和3编程为通过控制进气的氧气百分比将%溶氧浓度自10%降低至0%。
此转换所需要的时间,发酵罐1为2小时,发酵罐2为6小时,而发酵罐3为12小时。一旦溶氧浓度处于0%,将进气混合物转换成气体流速为5sL/h的100%氮气。在发酵罐4中,在诱导后6小时完全关闭气流,让培养物消耗发酵罐中剩下的氧,直至达到厌氧条件。2小时后,将气体混合物转换成流速为5sL/h的100%氮气。所有发酵运行40小时,而且在不同时间点采集样品。通过HPLC和GC分析样品以测定发酵罐中有机酸、葡萄糖、乙醇和正丁醇的浓度。
结果图示于图22A和22B及下文表1。在具有从需氧到厌氧条件的2小时转换的发酵罐1中达到了最高效价0.88g/L。发酵罐1也具有最高生产力0.022g/L/h(表13)。
表13:具有从需氧到厌氧培养条件的不同转换的发酵中所达到的效价和生产力
  发酵罐   效价g/L   生产力g/L/h
  F1   0.88   0.022
  F2   0.73   0.018
  F3   0.79   0.02
  F4   0.58   0.015
这些结果显示了发酵工艺条件的优化如何改善正丁醇生产工艺的产率、生产力和效价。
实施例21:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌野生型菌株中的Fdh突变体
在GEVO1034(大肠杆菌W3110,ΔfdhF)中过表达来自博伊丁氏假丝酵母的NADH依赖性甲酸脱氢酶(在其天然fdhF基因中具有删除的大肠杆菌菌株中的NADH依赖性Fdh)。
通过依照SOP“厌氧瓶中的丁醇发酵”的正丁醇瓶发酵来比较GEVO1034(大肠杆菌W3110,ΔfdhF)、pGV1248(自中等拷贝质粒表达的来自博伊丁氏假丝酵母的fdh1)(A)和GEVO1034、pGV1111(只含载体的对照(vector onlycontrol))(B)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/LCm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。
将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
图示于图23A、23B、23C、23D、24A和24B的结果显示了菌株A以比率0.6+/-0.15生成乙醇和乙酸。菌株A以比率3.43生成乙醇和乙酸。菌株B以比率0.63生成乙醇和乙酸。菌株A生成2.97个NADH每个葡萄糖,而菌株B生成1.91个NADH每个葡萄糖。
总之,此结果指明了来自博伊丁氏假丝酵母的fdh1的表达提高了细胞中的可得NADH(更新数值):
这些实验显示了NADH依赖性Fdh的表达提高了细胞所生成的NADH每葡萄糖比。
实施例22:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌野生型菌株中的pdh突变体
通过正丁醇瓶发酵来比较菌株GEVO992(大肠杆菌W3110,ΔldhA,Δfrd)、pGV1278(PLtet::lpdA突变体)(A),GEVO992,pGV1279(PLtet::lpdA突变体)(B),GEVO992,pGV772(只含载体的对照)(C)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。
将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
图示于图25A和25B的结果显示了菌株A以比率1.1生成乙醇和乙酸。菌株B以比率0.8生成乙醇和乙酸。菌株C以比率0.8生成乙醇和乙酸。表达突变型lpdA的菌株A的比率是菌株B和菌株C的比率的1.4倍高。
这些结果指明了突变型LpdA的表达提高了细胞中的可得NADH。具体而言,这些结果显示了被突变以避免受到高NADH/NAD水平抑制的Pdh的表达提高了在厌氧条件下细胞所生成的NADH每葡萄糖比。
实施例23:以高于理论产率的50%的产率生成正丁醇
通过正丁醇瓶发酵来比较菌株GEVO1510(大肠杆菌W3110,ΔldhA,ΔpflB,ΔpflDC,ΔadhE,Δfrd,ΔackA,ΔmgsA),pGV1191,pGV1113(A)和GEVO1511(大肠杆菌W3110,ΔldhA,ΔpflB,ΔpflDC,ΔadhE,Δfrd,ΔackA,ΔmgsA),pGV1191,pGV1113(B)。GEVO1510是为在厌氧条件下表达Pdh而进化得到的。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用1mM IPTG和100ng/mL aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
如上文所述为提高NADH生成而进化得到的菌株A以产率0.3g/g生成正丁醇,对应于理论产率的73.2%。菌株B达到了产率0.1g/g(理论产率的24.4%)。此结果显示了为更高的NADH生成进化正丁醇生产菌株将正丁醇发酵的产率提高到理论产率的50%以上。
这些结果显示了厌氧地生成超过2摩尔NADH每摩尔葡萄糖的菌株容许高于50%的正丁醇产率。
实施例24:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌中fdh
用pGV1583和pGV1191(1)及用pGV1435和pGV1191(2)转化GEVO768(大肠杆菌W3110,attB::(Sp+laclq+tetR+))。通过正丁醇瓶发酵来比较菌株1和2。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了在正丁醇途径之外还表达NADH依赖性Fdh的菌株以理论产率的1.82%的产率生成正丁醇,比只表达正丁醇途径的比较菌株2的正丁醇产率高30%。
此结果显示了NADH依赖性Fdh在正丁醇生产菌株中的表达提高正丁醇发酵的产率。
实施例25:以高于理论产率的50%的产率生成正丁醇
通过正丁醇瓶发酵来比较菌株Gevo1083、pGV1191、pGV1583(A),和GEVO1083、pGV1191、pGV1435(B)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用1mM IPTG和100ng/mL aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。自高拷贝质粒表达来自博伊丁氏假丝酵母的NADH依赖性Fdh的菌株A以产率0.29g/g生成正丁醇,对应于理论产率的70.7%。菌株B达到了产率0.1g/g(理论产率的29%)。
实施例26:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌野生型菌株中的Fdh突变体
在Gevo1034(大肠杆菌W3110,ΔfdhF)中过表达来自博伊丁氏假丝酵母的NADH依赖性甲酸脱氢酶(在其天然fdhF基因中具有删除的大肠杆菌菌株中的NADH依赖性Fdh)。
通过依照SOP“厌氧瓶中的丁醇发酵”的正丁醇瓶发酵比较Gevo1034(大肠杆菌W3110,ΔfdhF),pGV1582(用强tac启动子表达的来自博伊丁氏假丝酵母fdh1)(A)和GEVO1034、pGV1569(只含载体的对照)(B)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/LAmp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。
将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了菌株A生成4个NADH每个葡萄糖,而菌株B生成2个NADH每个葡萄糖。总之,此结果指明了来自博伊丁氏假丝酵母的fdh1的表达提高了细胞中的可得NADH。
这些实验显示了NADH依赖性Fdh的表达提高了细胞所生成的NADH每葡萄糖比。
实施例27:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌中的fdh
使用用于表达丁醇途径的和用于表达来自博伊丁氏假丝酵母的NADH依赖性Fdh的质粒转化数种大肠杆菌。用pGV1191和pGV1583转化菌株GEVO1082(大肠杆菌W3110,Δldh,attB::(Sp+laclq+tetR+))(菌株A)、GEVO1054(大肠杆菌W3110,ΔadhE,attB::(Sp+laclg+tetR+))(菌株B)、GEVO1084(大肠杆菌W3110,Δldh,ΔadhE,attB::(Sp+laclq+tetR+))(菌株C)、GEVO1508(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))(菌株D)、GEVO1509(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔmgsA,attB::(Sp+laclq+tetR+))(菌株E)、GEVO1085(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔackA,attB::(Sp+laclq+tetR+))(菌株F)、GEVO1507(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔackA,ΔmgsA,attB::(Sp+laclq+tetR+))(菌株G)。(2).通过正丁醇瓶发酵来比较含有这些质粒的菌株A-F。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了菌株A以产率5%生成丁醇,菌株B以产率40%生成丁醇,菌株C以产率50%生成丁醇,菌株D以产率55%生成丁醇,菌株E以产率60%生成丁醇,菌株F以产率65%生成丁醇,菌株G以产率70%生成丁醇。
提供上文所列实施例是为了给本领域普通技术人员以关于如何制备和使用本公开内容中的装置、系统和方法的实施方案的完整公开和说明,并非意图限制发明人看作其公开内容的范围。对于本领域技术人员显而易见的用于实施本公开内容的上文所述模式的改动意欲在所附权利要求的范围内。说明书中提及的所有专利和出版物指示了本公开内容所属领域技术人员的技术水平。通过提述将此公开内容中引用的所有参考文献并入本文,其程度就像通过个别地提述将每一篇参考文献完整并入本文一样。
通过提述将背景、详述和实施例中引用的每一份文件的完整公开内容(包括专利、专利申请、期刊论文、摘要、实验室手册、书籍、或其它公开内容)并入本文。另外,通过提述将与之一起提交的序列表的硬拷贝及相应的计算机可读形式二者完整并入本文。
要理解,公开内容不限于特定的组合物或生物学系统,其当然可以有所变化。还要理解,本文中所使用的术语学只是出于描述特定实施方案的目的,并非意图限制。如本说明书和所附权利要求书中所使用的,单数形式“一个”、“一种”、“该”和“所述”包括复数称谓,除非另有明确说明。如此,例如,提到“一个/种生物合成中间产物”包括多个/种此类中间产物,提到“一个/种核酸”包括多个/种此类核酸,而提到“所述经过遗传修饰的宿主细胞”包括提到一个/种或多个/种经过遗传修饰的宿主细胞及其本领域技术人员知道的等同物,等等。如本说明书中所使用的,术语“多个/种”至两个/种或更多个/种称谓(reference),如所指示的,除非另有明确说明。
除非另有定义,本文中所使用的所有技术和科学术语具有与本公开内容所述领域普通技术人员常规理解相同的含义。虽然任何与本文所述方法和材料的类似的或等同的方法和材料都能在实践中用于测试本公开内容,但是本文中描述了适宜的材料和方法的具体实例。通过提述将本文中所提到的所有出版物并入本文以公开和描述与引用该参考文献有关的方法和/或材料。
虽然本文中明确地公开了本公开内容的具体实施方案,但是上文说明书和实施例是例示性的而非限制性的。应当理解,可以进行各式各样的改动而不背离本公开内容的精神和范围。在阅读此说明书和上文实施方案后,本公开内容的许多变化对于本领域技术人员会是显而易见的。本公开内容的完整范围应当通过参考实施方案以及它们的等同方案和说明书的完整范围以及此类变化来确定。因而,其它实施方案落在所附权利要求书的范围内。
序列表
<110>格沃股份有限公司(GEVO,INC.)
<120>用于生产正丁醇的工程化改造的微生物及相关方法
<130>56836.830004.US1
<150>60/868,326
<151>2006-12-01
<150>60/945,576
<151>2007-06-21
<150>60/890,329
<151>2007-02-16
<150>60/905,550
<151>2007-03-06
<150>60/940,877
<151>2007-05-30
<160>86
<170>PatentIn version 3.4
<210>1
<211>858
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>1
Met Lys Val Thr Asn Gln Lys Glu Leu Lys Gln Lys Leu Asn Glu Leu
1               5                   10                  15
Arg Glu Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp
            20                  25                  30
Lys Ile Phe Lys Gln Cys Ala Ile Ala Ala Ala Lys Glu Arg Ile Asn
        35                  40                  45
Leu Ala Lys Leu Ala Val Glu Glu Thr Gly Ile Gly Leu Val Glu Asp
    50                  55                  60
Lys Ile Ile Lys Asn His Phe Ala Ala Glu Tyr Ile Tyr Asn Lys Tyr
65                  70                  75                  80
Lys Asn Glu Lys Thr Cys Gly Ile Ile Asp His Asp Asp Ser Leu Gly
                85                  90                  95
Ile Thr Lys Val Ala Glu Pro Ile Gly Ile Val Ala Ala Ile Val Pro
            100                 105                 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
        115                 120                 125
Lys Thr Arg Asn Ala Ile Phe Phe Ser Pro His Pro Arg Ala Lys Lys
    130                 135                 140
Ser Thr Ile Ala Ala Ala Lys Leu Ile Leu Asp Ala Ala Val Lys Ala
145                 150                 155                 160
Gly Ala Pro Lys Asn Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
                165                 170                 175
Leu Ser Gln Asp Leu Met Ser Glu Ala Asp Ile Ile Leu Ala Thr Gly
            180                 185                 190
Gly Pro Ser Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Ile
        195                 200                 205
Gly Val Gly Ala Gly Asn Thr Pro Ala Ile Ile Asp Glu Ser Ala Asp
    210                 215                 220
Ile Asp Met Ala Val Ser Ser Ile Ile Leu Ser Lys Thr Tyr Asp Asn
225                 230                 235                 240
Gly Val Ile Cys Ala Ser Glu Gln Ser Ile Leu Val Met Asn Ser Ile
                245                 250                 255
Tyr Glu Lys Val Lys Glu Glu Phe Val Lys Arg Gly Ser Tyr Ile Leu
            260                 265                 270
Asn Gln Asn Glu Ile Ala Lys Ile Lys Glu Thr Met Phe Lys Asn Gly
        275                 280                 285
Ala Ile Asn Ala Asp Ile Val Gly Lys Ser Ala Tyr Ile Ile Ala Lys
    290                 295                 300
Met Ala Gly Ile Glu Val Pro Gln Thr Thr Lys Ile Leu Ile Gly Glu
305                 310                 315                 320
Val Gln Ser Val Glu Lys Ser Glu Leu Phe Ser His Glu Lys Leu Ser
                325                 330                 335
Pro Val Leu Ala Met Tyr Lys Val Lys Asp Phe Asp Glu Ala Leu Lys
            340                 345                 350
Lys Ala Gln Arg Leu Ile Glu Leu Gly Gly Ser Gly His Thr Ser Ser
        355                 360                 365
Leu Tyr Ile Asp Ser Gln Asn Asn Lys Asp Lys Val Lys Glu Phe Gly
    370                 375                 380
Leu Ala Met Lys Thr Ser Arg Thr Phe Ile Asn Met Pro Ser Ser Gln
385                 390                 395                 400
Gly Ala Ser Gly Asp Leu Tyr Asn Phe Ala Ile Ala Pro Ser Phe Thr
                405                 410                 415
Leu Gly Cys Gly Thr Trp Gly Gly Asn Ser Val Ser Gln Asn Val Glu
            420                 425                 430
Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn
        435                 440                 445
Met Leu Trp Phe Lys Val Pro Gln Lys Ile Tyr Phe Lys Tyr Gly Cys
    450                 455                 460
Leu Arg Phe Ala Leu Lys Glu Leu Lys Asp Met Asn Lys Lys Arg Ala
465                 470                 475                 480
Phe Ile Val Thr Asp Lys Asp Leu Phe Lys Leu Gly Tyr Val Asn Lys
                485                 490                 495
Ile Thr Lys Val Leu Asp Glu Ile Asp Ile Lys Tyr Ser Ile Phe Thr
            500                 505                 510
Asp Ile Lys Ser Asp Pro Thr Ile Asp Ser Val Lys Lys Gly Ala Lys
        515                 520                 525
Glu Met Leu Asn Phe Glu Pro Asp Thr Ile Ile Ser Ile Gly Gly Gly
    530                 535                 540
Ser Pro Met Asp Ala Ala Lys Val Met His Leu Leu Tyr Glu Tyr Pro
545                 550                 555                 560
Glu Ala Glu Ile Glu Asn Leu Ala Ile Asn Phe Met Asp Ile Arg Lys
                565                 570                 575
Arg Ile Cys Asn Phe Pro Lys Leu Gly Thr Lys Ala Ile Ser Val Ala
            580                 585                 590
Ile Pro Thr Thr Ala Gly Thr Gly Ser Glu Ala Thr Pro Phe Ala Val
        595                 600                 605
Ile Thr Asn Asp Glu Thr Gly Met Lys Tyr Pro Leu Thr Ser Tyr Glu
    610                 615                 620
Leu Thr Pro Asn Met Ala Ile Ile Asp Thr Glu Leu Met Leu Asn Met
625                 630                 635                 640
Pro Arg Lys Leu Thr Ala Ala Thr Gly Ile Asp Ala Leu Val His Ala
                645                 650                 655
Ile Glu Ala Tyr Val Ser Val Met Ala Thr Asp Tyr Thr Asp Glu Leu
            660                 665                 670
Ala Leu Arg Ala Ile Lys Met Ile Phe Lys Tyr Leu Pro Arg Ala Tyr
        675                 680                 685
Lys Asn Gly Thr Asn Asp Ile Glu Ala Arg Glu Lys Met Ala His Ala
    690                 695                 700
Ser Asn Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys
705                 710                 715                 720
His Ser Met Ala His Lys Leu Gly Ala Met His His Val Pro His Gly
                725                 730                 735
Ile Ala Cys Ala Val Leu Ile Glu Glu Val Ile Lys Tyr Asn Ala Thr
            740                 745                 750
Asp Cys Pro Thr Lys Gln Thr Ala Phe Pro Gln Tyr Lys Ser Pro Asn
        755                 760                 765
Ala Lys Arg Lys Tyr Ala Glu Ile Ala Glu Tyr Leu Asn Leu Lys Gly
    770                 775                 780
Thr Ser Asp Thr Glu Lys Val Thr Ala Leu Ile Glu Ala Ile Ser Lys
785                 790                 795                 800
Leu Lys Ile Asp Leu Ser Ile Pro Gln Asn Ile Ser Ala Ala Gly Ile
                805                 810                 815
Asn Lys Lys Asp Phe Tyr Asn Thr Leu Asp Lys Met Ser Glu Leu Ala
            820                 825                 830
Phe Asp Asp Gln Cys Thr Thr Ala Asn Pro Arg Tyr Pro Leu Ile Ser
        835                 840                 845
Glu Leu Lys Asp Ile Tyr Ile Lys Ser Phe
    850                 855
<210>2
<211>261
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>2
Met Glu Leu Asn Asn Val Ile Leu Glu Lys Glu Gly Lys Val Ala Val
1               5                   10                  15
Val Thr Ile Asn Arg Pro Lys Ala Leu Asn Ala Leu Asn Ser Asp Thr
            20                  25                  30
Leu Lys Glu Met Asp Tyr Val Ile Gly Glu Ile Glu Asn Asp Ser Glu
        35                  40                  45
Val Leu Ala Val Ile Leu Thr Gly Ala Gly Glu Lys Ser Phe Val Ala
    50                  55                  60
Gly Ala Asp Ile Ser Glu Met Lys Glu Met Asn Thr Ile Glu Gly Arg
65                  70                  75                  80
Lys Phe Gly Ile Leu Gly Asn Lys Val Phe Arg Arg Leu Glu Leu Leu
                85                 90                 95
Glu Lys Pro Val Ile Ala Ala Val Asn Gly Phe Ala Leu Gly Gly Gly
            100                 105                 110
Cys Glu Ile Ala Met Ser Cys Asp Ile Arg Ile Ala Ser Ser Asn Ala
        115                 120                 125
Arg Phe Gly Gln Pro Glu Val Gly Leu Gly Ile Thr Pro Gly Phe Gly
    130                 135                 140
Gly Thr Gln Arg Leu Ser Arg Leu Val Gly Met Gly Met Ala Lys Gln
145                 150                 155                 160
Leu Ile Phe Thr Ala Gln Asn Ile Lys Ala Asp Glu Ala Leu Arg Ile
                165                 170                 175
Gly Leu Val Asn Lys Val Val Glu Pro Ser Glu Leu Met Asn Thr Ala
            180                 185                 190
Lys Glu Ile Ala Asn Lys Ile Val Ser Asn Ala Pro Val Ala Val Lys
        195                 200                 205
Leu Ser Lys Gln Ala Ile Asn Arg Gly Met Gln Cys Asp Ile Asp Thr
    210                 215                 220
Ala Leu Ala Phe Glu Ser Glu Ala Phe Gly Glu Cys Phe Ser Thr Glu
225                 230                 235                 240
Asp Gln Lys Asp Ala Met Thr Ala Phe Ile Glu Lys Arg Lys Ile Glu
                245                 250                 255
Gly Phe Lys Asn Arg
            260
<210>3
<211>379
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>3
Met Asp Phe Asn Leu Thr Arg Glu Gln Glu Leu Val Arg Gln Met Val
1               5                   10                  15
Arg Glu Phe Ala Glu Asn Glu Val Lys Pro Ile Ala Ala Glu Ile Asp
            20                  25                  30
Glu Thr Glu Arg Phe Pro Met Glu Asn Val Lys Lys Met Gly Gln Tyr
        35                  40                  45
Gly Met Met Gly Ile Pro Phe Ser Lys Glu Tyr Gly Gly Ala Gly Gly
    50                  55                  60
Asp Val Leu Ser Tyr Ile Ile Ala Val GIu Glu Leu Ser Lys Val Cys
65                  70                  75                  80
Gly Thr Thr Gly Val Ile Leu Ser Ala His Thr Ser Leu Cys Ala Ser
                85                  90                  95
Leu Ile Asn Glu His Gly Thr Glu Glu Gln Lys Gln Lys Tyr Leu Val
            100                 105                 110
Pro Leu Ala Lys Gly Glu Lys Ile Gly Ala Tyr Gly Leu Thr Glu Pro
        115                 120                 125
Asn Ala Gly Thr Asp Ser Gly Ala Gln Gln Thr Val Ala Val Leu Glu
    130                 135                 140
Gly Asp His Tyr Val Ile Asn Gly Ser Lys Ile Phe Ile Thr Asn Gly
145                 150                 155                 160
Gly Val Ala Asp Thr Phe Val Ile Phe Ala Met Thr Asp Arg Thr Lys
                165                 170                 175
Gly Thr Lys Gly Ile Ser Ala Phe Ile Ile Glu Lys Gly Phe Lys Gly
            180                 185                 190
Phe Ser Ile Gly Lys Val Glu Gln Lys Leu Gly Ile Arg Ala Ser Ser
        195                 200                 205
Thr Thr Glu Leu Val Phe Glu Asp Met Ile Val Pro Val Glu Asn Met
    210                 215                 220
Ile Gly Lys Glu Gly Lys Gly Phe Pro Ile Ala Met Lys Thr Leu Asp
225                 230                 235                 240
Gly Gly Arg Ile Gly Ile Ala Ala Gln Ala Leu Gly Ile Ala Glu Gly
                245                 250                 255
Ala Phe Asn Glu Ala Arg Ala Tyr Met Lys Glu Arg Lys Gln Phe Gly
            260                 265                 270
Arg Ser Leu Asp Lys Phe Gln Gly Leu Ala Trp Met Met Ala Asp Met
        275                 280                 285
Asp Val Ala Ile Glu Ser Ala Arg Tyr Leu Val Tyr Lys Ala Ala Tyr
    290                 295                 300
Leu Lys Gln Ala Gly Leu Pro Tyr Thr Val Asp Ala Ala Arg Ala Lys
305                 310                 315                 320
Leu His Ala Ala Asn Val Ala Met Asp Val Thr Thr Lys Ala Val Gln
                325                 330                 335
Leu Phe Gly Gly Tyr Gly Tyr Thr Lys Asp Tyr Pro Val Glu Arg Met
            340                 345                 350
Met Arg Asp Ala Lys Ile Thr Glu Ile Tyr Glu Gly Thr Ser Glu Val
        355                 360                 365
Gln Lys Leu Val Ile Ser Gly Lys Ile Phe Arg
    370                 375
<210>4
<211>337
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>4
Met Asn Lys Ala Asp Tyr Lys Gly Val Trp Val Phe Ala Glu Gln Arg
1               5                   10                  15
Asp Gly Glu Leu Gln Lys Val Ser Leu Glu Leu Leu Gly Lys Gly Lys
            20                  25                  30
Glu Met Ala Glu Lys Leu Gly Val Glu Leu Thr Ala Val Leu Leu Gly
        35                  40                  45
His Asn Thr Glu Lys Met Ser Lys Asp Leu Leu Ser His Gly Ala Asp
    50                  55                  60
Lys Val Leu Ala Ala Asp Asn Glu Leu Leu Ala His Phe Ser Thr Asp
65                  70                  75                  80
Gly Tyr Ala Lys Val Ile Cys Asp Leu Val Asn Glu Arg Lys Pro Glu
                85                  90                  95
Ile Leu Phe Ile Gly Ala Thr Phe Ile Gly Arg Asp Leu Gly Pro Arg
            100                 105                 110
Ile Ala Ala Arg Leu Ser Thr Gly Leu Thr Ala Asp Cys Thr Ser Leu
        115                 120                 125
Asp Ile Asp Val Glu Asn Arg Asp Leu Leu Ala Thr Arg Pro Ala Phe
    130                 135                 140
Gly Gly Asn Leu Ile Ala Thr Ile Val Cys Ser Asp His Arg Pro Gln
145                 150                 155                 160
Met Ala Thr Val Arg Pro Gly Val Phe Phe Glu Lys Leu Pro Val Asn
                165                 170                 175
Asp Ala Asn Val Ser Asp Asp Lys Ile Glu Lys Val Ala Ile Lys Leu
            180                 185                 190
Thr Ala Ser Asp Ile Arg Thr Lys Val Ser Lys Val Val Lys Leu Ala
        195                 200                 205
Lys Asp Ile Ala Asp Ile Gly Glu Ala Lys Val Leu Val Ala Gly Gly
    210                 215                 220
Arg Gly Val Gly Ser Lys Glu Asn Phe Glu Lys Leu Glu Glu Leu Ala
225                 230                 235                 240
Ser Leu Leu Gly Gly Thr Ile Ala Ala Ser Arg Ala Ala Ile Glu Lys
                245                 250                 255
Glu Trp Val Asp Lys Asp Leu Gln Val Gly Gln Thr Gly Lys Thr Val
            260                 265                 270
Arg Pro Thr Leu Tyr Ile Ala Cys Gly Ile Ser Gly Ala Ile Gln His
        275                 280                 285
Leu Ala Gly Met Gln Asp Ser Asp Tyr Ile Ile Ala Ile Asn Lys Asp
    290                 295                 300
Val Glu Ala Pro Ile Met Lys Val Ala Asp Leu Ala Ile Val Gly Asp
305                 310                 315                 320
Val Asn Lys Val Val Pro Glu Leu Ile Ala Gln Val Lys Ala Ala Asn
                325                 330                 335
Asn
<210>5
<211>252
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>5
Met Asn Ile Val Val Cys Leu Lys Gln Val Pro Asp Thr Ala Glu Val
1               5                   10                  15
Arg Ile Asp Pro Val Lys Gly Thr Leu Ile Arg Glu Gly Val Pro Ser
            20                  25                  30
Ile Ile Asn Pro Asp Asp Lys Asn Ala Leu Glu Glu Ala Leu Val Leu
        35                  40                  45
Lys Asp Asn Tyr Gly Ala His Val Thr Val Ile Ser Met Gly Pro Pro
    50                  55                  60
Gln Ala Lys Asn Ala Leu Val Glu Ala Leu Ala Met Gly Ala Asp Glu
65                  70                  75                  80
Ala Val Leu Leu Thr Asp Arg Ala Phe Gly Gly Ala Asp Thr Leu Ala
                85                  90                  95
Thr Ser His Thr Ile Ala Ala Gly Ile Lys Lys Leu Lys Tyr Asp Ile
            100                 105                 110
Val Phe Ala Gly Arg Gln Ala Ile Asp Gly Asp Thr Ala Gln Val Gly
        115                 120                 125
Pro Glu Ile Ala Glu His Leu Gly Ile Pro Gln Val Thr Tyr Val Glu
    130                 135                 140
Lys Val Glu Val Asp Gly Asp Thr Leu Lys Ile Arg Lys Ala Trp Glu
145                 150                 155                 160
Asp Gly Tyr Glu Val Val Glu Val Lys Thr Pro Val Leu Leu Thr Ala
                165                 170                 175
Ile Lys Glu Leu Asn Val Pro Arg Tyr Met Ser Val Glu Lys Ile Phe
            180                 185                 190
Gly Ala Phe Asp Lys Glu Val Lys Met Trp Thr Ala Asp Asp Ile Asp
        195                 200                 205
Val Asp Lys Ala Asn Leu Gly Leu Lys Gly Ser Pro Thr Lys Val Lys
    210                 215                 220
Lys Ser Ser Thr Lys Glu Val Lys Gly Gln Gly Glu Val Ile Asp Lys
225                 230                 235                 240
Pro Val Lys Glu Ala Ala Asp Met Leu Ser Gln Asn
                245                 250
<210>6
<211>282
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>6
Met Lys Lys Val Cys Val Ile Gly Ala Gly Thr Met Gly Ser Gly Ile
1               5                   10                  15
Ala Gln Ala Phe Ala Ala Lys Gly Phe Glu Val Val Leu Arg Asp Ile
            20                  25                  30
Lys Asp Glu Phe Val Asp Arg Gly Leu Asp Phe Ile Asn Lys Asn Leu
        35                  40                  45
Ser Lys Leu Val Lys Lys Gly Lys Ile Glu Glu Ala Thr Lys Val Glu
    50                  55                  60
Ile Leu Thr Arg Ile Ser Gly Thr Val Asp Leu Asn Met Ala Ala Asp
65                  70                  75                  80
Cys Asp Leu Val Ile Glu Ala Ala Val Glu Arg Met Asp Ile Lys Lys
                85                  90                  95
Gln Ile Phe Ala Asp Leu Asp Asn Ile Cys Lys Pro Glu Thr Ile Leu
            100                 105                 110
Ala Ser Asn Thr Ser Ser Leu Ser Ile Thr Glu Val Ala Ser Ala Thr
        115                 120                 125
Lys Thr Asn Asp Lys Val Ile Gly Met His Phe Phe Asn Pro Ala Pro
    130                 135                 140
Val Met Lys Leu Val Glu Val Ile Arg Gly Ile Ala Thr Ser Gln Glu
145                 150                 155                 160
Thr Phe Asp Ala Val Lys Glu Thr Ser Ile Ala Ile Gly Lys Asp Pro
                165                 170                 175
Val Glu Val Ala Glu Ala Pro Gly Phe Val Val Asn Arg Ile Leu Ile
            180                 185                 190
Pro Met Ile Asn Glu Ala Val Gly Ile Leu Ala Glu Gly Ile Ala Ser
        195                 200                 205
Val Glu Asp Ile Asp Lys Ala Met Lys Leu Gly Ala Asn His Pro Met
    210                 215                 220
Gly Pro Leu Glu Leu Gly Asp Phe Ile Gly Leu Asp Ile Cys Leu Ala
225                 230                 235                 240
Ile Met Asp Val Leu Tyr Ser Glu Thr Gly Asp Ser Lys Tyr Arg Pro
                245                 250                 255
His Thr Leu Leu Lys Lys Tyr Val Arg Ala Gly Trp Leu Gly Arg Lys
            260                 265                 270
Ser Gly Lys Gly Phe Tyr Asp Tyr Ser Lys
        275                 280
<210>7
<211>405
<212>PRT
<213>纤细眼虫(E.gracilis)
<400>7
Met Ala Met Phe Thr Thr Thr Ala Lys Val Ile Gln Pro Lys Ile Arg
1               5                   10                  15
Gly Phe Ile Cys Thr Thr Thr His Pro Ile Gly Cys Glu Lys Arg Val
            20                  25                  30
Gln Glu Glu Ile Ala Tyr Ala Arg Ala His Pro Pro Thr Ser Pro Gly
        35                  40                  45
Pro Lys Arg Val Leu Val Ile Gly Cys Ser Thr Gly Tyr Gly Leu Ser
    50                  55                  60
Thr Arg Ile Thr Ala Ala Phe Gly Tyr Gln Ala AIa Thr Leu Gly Val
65                  70                  75                  80
Phe Leu Ala Gly Pro Pro Thr Lys Gly Arg Pro Ala Ala Ala Gly Trp
                85                  90                  95
Tyr Asn Thr Val Ala Phe Glu Lys Ala Ala Leu Glu Ala Gly Leu Tyr
            100                 105                 110
Ala Arg Ser Leu Asn Gly Asp Ala Phe Asp Ser Thr Thr Lys Ala Arg
        115                 120                 125
Thr Val Glu Ala Ile Lys Arg Asp Leu Gly Thr Val Asp Leu Val Val
    130                 135                 140
Tyr Ser Ile Ala Ala Pro Lys Arg Thr Asp Pro Ala Thr Gly Val Leu
145                 150                 155                 160
His Lys Ala Cys Leu Lys Pro Ile Gly Ala Thr Tyr Thr Asn Arg Thr
                165                 170                 175
Val Asn Thr Asp Lys Ala Glu Val Thr Asp Val Ser Ile Glu Pro Ala
            180                 185                 190
Ser Pro Glu Glu Ile Ala Asp Thr Val Lys Val Met Gly Gly Glu Asp
        195                 200                 205
Trp Glu Leu Trp Ile Gln Ala Leu Ser Glu Ala Gly Val Leu Ala Glu
    210                 215                 220
Gly Ala Lys Thr Val Ala Tyr Ser Tyr Ile Gly Pro Glu Met Thr Trp
225                 230                 235                 240
Pro Val Tyr Trp Ser Gly Thr Ile Gly Glu Ala Lys Lys Asp Val Glu
                245                 250                 255
Lys Ala Ala Lys Arg Ile Thr Gln Gln Tyr Gly Cys Pro Ala Tyr Pro
            260                 265                 270
Val Val Ala Lys Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val
        275                 280                 285
Val Pro Leu Tyr Ile Cys Leu Leu Tyr Arg Val Met Lys Glu Lys Gly
    290                 295                 300
Thr His Glu Gly Cys Ile Glu Gln Met Val Arg Leu Leu Thr Thr Lys
305                 310                 315                 320
Leu Tyr Pro Glu Asn Gly Ala Pro Ile Val Asp Glu Ala Gly Arg Val
                325                 330                 335
Arg Val Asp Asp Trp Glu Met Ala Glu Asp Val Gln Gln Ala Val Lys
            340                 345                 350
Asp Leu Trp Ser Gln Val Ser Thr Ala Asn Leu Lys Asp Ile Ser Asp
        355                 360                 365
Phe Ala Gly Tyr Gln Thr Glu Phe Leu Arg Leu Phe Gly Phe Gly Ile
    370                 375                 380
Asp Gly Val Asp Tyr Asp Gln Pro Val Asp Val Glu Ala Asp Leu Pro
385                 390                 395                 400
Ser Ala Ala Gln Gln
                405
<210>8
<211>397
<212>PRT
<213>嗜水气单胞菌(A.hydrophila)
<400>8
Met Ile Ile Lys Pro Lys Val Arg Gly Phe Ile Cys Thr Thr Thr His
1               5                   10                  15
Pro Val Gly Cys Glu Ala Asn Val Arg Arg Gln Ile Ala Tyr Thr Lys
            20                  25                  30
Ala Lys Gly Thr Ile Glu Asn Gly Pro Lys Lys Val Leu Val Ile Gly
        35                  40                  45
Ala Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Ala Ala Ala Phe Gly
    50                  55                  60
Ser Gly Ala Ala Thr Leu Gly Val Phe Phe Glu Lys Ala Gly Ser Glu
65                  70                  75                  80
Thr Lys Thr Ala Thr Ala Gly Trp Tyr Asn Ser Ala Ala Phe Asp Lys
                85                  90                  95
Ala Ala Lys Glu Ala Gly Leu Tyr Ala Lys Ser Ile Asn Gly Asp Ala
            100                 105                 110
Phe Ser Asn Glu Cys Arg Ala Lys Val Ile Glu Leu Ile Lys Gln Asp
        115                 120                 125
Leu Gly Gln Ile Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Val Arg
    130                 135                 140
Lys Leu Pro Asp Thr Gly Glu Val Val Arg Ser Ala Leu Lys Pro Ile
145                 150                 155                 160
Gly Glu Val Tyr Thr Thr Thr Ala Ile Asp Thr Asn Lys Asp Gln Ile
                165                 170                 175
Ile Thr Ala Thr Val Glu Pro Ala Asn Glu Glu Glu Ile Gln Asn Thr
            180                 185                 190
Ile Thr Val Met Gly Gly Gln Asp Trp Glu Leu Trp Met Ala Ala Leu
        195                 200                 205
Arg Asp Ala Gly Val Leu Ala Asp Gly Ala Lys Ser ValAla Tyr Ser
    210                 215                 220
Tyr Ile Gly Thr Asp Leu Thr Trp Pro Ile Tyr Trp His Gly Thr Leu
225                 230                 235                 240
Gly Arg Ala Lys Glu Asp Leu Asp Arg Ala Ala Ala Ala Ile Arg Gly
                245                 250                 255
Asp Leu Ala Gly Lys Gly Gly Thr Ala His Val Ala Val Leu Lys Ser
            260                 265                 270
Val Val Thr Gln Ala Ser Ser Ala Ile Pro Val Met Pro Leu Tyr Ile
        275                 280                 285
Ser Met Ala Phe Lys Ile Met Lys Glu Lys Gly Ile His Glu Gly Cys
    290                 295                 300
Met Glu Gln Val Asp Arg Met Met Arg Thr Arg Leu Tyr Ala Ala Asp
305                 310                 315                 320
Met Ala Leu Asp Asp Gln Ala Arg Ile Arg Met Asp Asp Trp Glu Leu
                325                 330                 335
Arg Glu Asp Val Gln Gln Thr Cys Arg Asp Leu Trp Pro Ser Ile Thr
            340                 345                 350
Ser Glu Asn Leu Cys Glu Leu Thr Asp Tyr Thr Gly Tyr Lys Gln Glu
        355                 360                 365
Phe Leu Arg Leu Phe Gly Phe Gly Leu Glu Glu Val Asp Tyr Asp Ala
    370                 375                 380
Asp Val Asn Pro Asp Val Lys Phe Asp Val Val Glu Leu
385                 390                 395
<210>9
<211>318
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>9
Met Asn Leu Leu Asn Leu Phe Thr Tyr Val Ile Pro Ile Ala Ile Cys
1               5                   10                  15
Ile Ile Leu Pro Ile Phe Ile Ile Val Thr His Phe Gln Ile Lys Ser
            20                  25                  30
Leu Asn Lys Ala Val Thr Ser Phe Asn Lys Gly Asp Arg Ser Asn Ala
        35                  40                  45
Leu Glu Ile Leu Ser Lys Leu Val Lys Ser Pro Ile Lys Asn Val Lys
    50                  55                  60
Ala Asn Ala Tyr Ile Thr Arg Glu Arg Ile Tyr Phe Tyr Ser Arg Asp
65                  70                  75                  80
Phe Glu Leu Ser Leu Arg Asp Leu Leu Gln Ala Ile Lys Leu Arg Pro
                85                  90                  95
Lys Thr Ile Asn Asp Val Tyr Ser Phe Ala Leu Ser Tyr His Ile Leu
            100                 105                 110
Gly Glu Pro Glu Arg Ala Leu Lys Tyr Phe Leu Arg Ala Val Glu Leu
        115                 120                 125
Gln Pro Asn Val Gly Ile Ser Tyr Glu Asn Leu Ala Trp Phe Tyr Tyr
    130                 135                 140
Leu Thr Gly Lys Tyr Asp Lys Ala Ile Glu Asn Phe Glu Lys Ala Ile
145                 150                 155                 160
Ser Met Gly Ser Thr Asn Ser Val Tyr Arg Ser Leu Gly Ile Thr Tyr
                165                 170                 175
Ala Lys Ile Gly Asp Tyr Lys Lys Ser Glu Glu Tyr Leu Lys Lys Ala
            180                 185                 190
Leu Asp Ala Glu Pro Glu Lys Pro Ser Thr His Ile Tyr Phe Ser Tyr
        195                 200                 205
Leu Lys Arg Lys Thr Asn Asp Ile Lys Leu Ala Lys Glu Tyr Ala Leu
    210                 215                 220
Lys Ala Ile Glu Leu Asn Lys Asn Asn Phe Asp Gly Tyr Lys Asn Leu
225                 230                 235                 240
Ala Glu Val Asn Leu Ala Glu Asp Asp Tyr Asp Gly Phe Tyr Lys Asn
                245                 250                 255
Leu Glu Ile Phe Leu Glu Lys Ile Asn Phe Val Thr Asn Gly Glu Asp
            260                 265                 270
Phe Asn Asp Glu Val Tyr Asp Lys Val Lys Asp Asn Glu Lys Phe Lys
        275                 280                 285
Glu Leu Ile Ala Lys Thr Lys Val Ile Lys Phe Lys Asp Leu Gly Ile
    290                 295                 300
Glu Ile Asp Asp Lys Lys Ile Leu Asn Gly Lys Phe Leu Val
305                 310                 315
<210>10
<211>389
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)ATCC 824
<400>10
Met Leu Ser Phe Asp Tyr Ser Ile Pro Thr Lys Val Phe Phe Gly Lys
1               5                   10                  15
Gly Lys Ile Asp Val Ile Gly Glu Glu Ile Lys Lys Tyr Gly Ser Arg
            20                  25                  30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
        35                  40                  45
Asp Arg Ala Thr Ala Ile Leu Lys Glu Asn Asn Ile Ala Phe Tyr Glu
    50                  55                  60
Leu Ser Gly Val Glu Pro Asn Pro Arg Ile Thr Thr Val Lys Lys Gly
65                  70                  75                  80
Ile Glu Ile Cys Arg Glu Asn Asn Val Asp Leu Val Leu Ala Ile Gly
                85                  90                  95
Gly Gly Ser Ala Ile Asp Cys Ser Lys Val Ile Ala Ala Gly Val Tyr
            100                 105                 110
Tyr Asp Gly Asp Thr Trp Asp Met Val Lys Asp Pro Ser Lys Ile Thr
        115                 120                 125
Lys Val Leu Pro Ile Ala Ser Ile Leu Thr Leu Ser Ala Thr Gly Ser
    130                 135                 140
Glu Met Asp Gln Ile Ala Val Ile Ser Asn Met Glu Thr Asn Glu Lys
145                 150                 155                 160
Leu Gly Val Gly His Asp Asp Met Arg Pro Lys Phe Ser Val Leu Asp
                165                 170                 175
Pro Thr Tyr Thr Phe Thr Val Pro Lys Asn Gln Thr Ala Ala Gly Thr
            180                 185                 190
Ala Asp Ile Met Ser His Thr Phe Glu Ser Tyr Phe Ser Gly Val Glu
        195                 200                 205
Gly Ala Tyr Val Gln Asp Gly Ile Arg Glu Ala Ile Leu Arg Thr Cys
    210                 215                 220
Ile Lys Tyr Gly Lys Ile Ala Met Glu Lys Thr Asp Asp Tyr Glu Ala
225                 230                 235                 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
                245                 250                 255
Ser Leu Gly Lys Asp Arg Lys Trp Ser Cys His Pro Met Glu His Glu
            260                 265                 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
        275                 280                 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asp Asp Thr Leu His Lys
    290                 295                 300
Phe Val Ser Tyr Gly Ile Asn Val Trp Gly Ile Asp Lys Asn Lys Asp
305                 310                 315                 320
Asn Tyr Glu Ile Ala Arg Glu Ala Ile Lys Asn Thr Arg Glu Tyr Phe
                325                 330                 335
Asn Ser Leu Gly Ile Pro Ser Lys Leu Arg Glu Val Gly Ile Gly Lys
            340                 345                 350
Asp Lys Leu Glu Leu Met Ala Lys Gln Ala Val Arg Asn Ser Gly Gly
        355                 360                 365
Thr Ile Gly Ser Leu Arg Pro Ile Asn Ala Glu Asp Val Leu Glu Ile
    370                 375                 380
Phe Lys Lys Ser Tyr
385
<210>11
<211>390
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)ATCC 824
<400>11
Met Val Asp Phe Glu Tyr Ser Ile Pro Thr Arg Ile Phe Phe Gly Lys
1               5                   10                  15
Asp Lys lle Asn Val Leu Gly Arg Glu Leu Lys Lys Tyr Gly Ser Lys
            20                  25                  30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
        35                  40                  45
Asp Lys Ala Val Ser Ile Leu Glu Lys Asn Ser Ile Lys Phe Tyr Glu
    50                  55                  60
Leu Ala Gly Val Glu Pro Asn Pro Arg Val Thr Thr Val Glu Lys Gly
65                  70                  75                  80
Val Lys Ile Cys Arg Glu Asn Gly Val Glu Val Val Leu Ala Ile Gly
                85                  90                  95
Gly Gly Ser Ala Ile Asp Cys Ala Lys Val Ile Ala Ala Ala Cys Glu
            100                 105                 110
Tyr Asp Gly Asn Pro Trp Asp Ile Val Leu Asp Gly Ser Lys Ile Lys
        115                 120                 125
Arg Val Leu Pro Ile Ala Ser Ile Leu Thr Ile Ala Ala Thr Gly Ser
    130                 135                 140
Glu Met Asp Thr Trp Ala Val Ile Asn Asn Met Asp Thr Asn Glu Lys
145                 150                 155                 160
Leu Ile Ala Ala His Pro Asp Met Ala Pro Lys Phe Ser Ile Leu Asp
                165                 170                 175
Pro Thr Tyr Thr Tyr Thr Val Pro Thr Asn Gln Thr Ala Ala Gly Thr
            180                 185                 190
Ala Asp Ile Met Ser His Ile Phe Glu Val Tyr Phe Ser Asn Thr Lys
        195                 200                 205
Thr Ala Tyr Leu Gln Asp Arg Met Ala Glu Ala Leu Leu Arg Thr Cys
    210                 215                 220
Ile Lys Tyr Gly Gly Ile Ala Leu Glu Lys Pro Asp Asp Tyr Glu Ala
225                 230                 235                 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
                245                 250                 255
Thr Tyr Gly Lys Asp Thr Asn Trp Ser Val His Leu Met Glu His Glu
            260                 265                 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
        275                 280                 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asn Asp Thr Val Tyr Lys
    290                 295                 300
Phe Val Glu Tyr Gly Val Asn Val Trp Gly Ile Asp Lys Glu Lys Asn
305                 310                 315                 320
His Tyr Asp Ile Ala His Gln Ala Ile Gln Lys Thr Arg Asp Tyr Phe
                325                 330                 335
Val Asn Val Leu Gly Leu Pro Ser Arg Leu Arg Asp Val Gly Ile Glu
            340                 345                 350
Glu Glu Lys Leu Asp Ile Met Ala Lys Glu Ser Val Lys Leu Thr Gly
        355                 360                 365
Gly Thr Ile Gly Asn Leu Arg Pro Val Asn Ala Ser Glu Val Leu Gln
    370                 375                 380
Ile Phe Lys Lys Ser Val
385                 390
<210>12
<211>552
<212>PRT
<213>弗氏柠檬酸杆菌(Citrobacter freundii)
<400>12
Met Ser Gln Phe Phe Phe Asn Gln Arg Thr His Leu Val Ser Asp Val
1               5                   10                  15
Ile Asp Gly Thr Ile Ile Ala Ser Pro Trp Asn Asn Leu Ala Arg Leu
            20                  25                  30
Glu Ser Asp Pro Ala Ile Arg Ile Val Val Arg Arg Asp Leu Asn Lys
        35                  40                  45
Asn Asn Val Ala Val Ile Ser Gly Gly Gly Ser Gly His Glu Pro Ala
    50                  55                  60
His Val Gly Phe Ile Gly Lys Gly Met Leu Thr Ala Ala Val Cys Gly
65                  70                  75                  80
Asp Val Phe Ala Ser Pro Ser Val Asp Ala Val Leu Thr Ala Ile Gln
                85                  90                  95
Ala Val Thr Gly Glu Ala Gly Cys Leu Leu Ile Val Lys Asn Tyr Thr
            100                 105                 110
Gly Asp Arg Leu Asn Phe Gly Leu Ala Ala Glu Lys Ala Arg Arg Leu
        115                 120                 125
Gly Tyr Asn Val Glu Met Leu Ile Val Gly Asp Asp Ile Ser Leu Pro
    130                 135                 140
Asp Asn Lys His Pro Arg Gly Ile Ala Gly Thr Ile Leu Val His Lys
145                 150                 155                 160
Ile Ala Gly Tyr Phe Ala Glu Arg Gly Tyr Asn Leu Ala Thr Val Leu
                165                 170                 175
Arg Glu Ala Gln Tyr Ala Ala Asn Asn Thr Phe Ser Leu Gly Val Ala
            180                 185                 190
Leu Ser Ser Cys His Leu Pro Gln Glu Ala Asp Ala Ala Pro Arg His
        195                 200                 205
His Pro Gly His Ala Glu Leu Gly Met Gly Ile His Gly Glu Pro Gly
    210                 215                 220
Ala Ser Val Ile Asp Thr Gln Asn Ser Ala Gln Val Val Asn Leu Met
225                 230                 235                 240
Val Asp Lys Leu Met Ala Ala Leu Pro Glu Thr Gly Arg Leu Ala Val
                245                 250                 255
Met Ile Asn Asn Leu Gly Gly Val Ser Val Ala Glu Met Ala Ile Ile
            260                 265                 270
Thr Arg Glu Leu Ala Ser Ser Pro Leu His Pro Arg Ile Asp Trp Leu
        275                 280                 285
Ile Gly Pro Ala Ser Leu Val Thr Ala Leu Asp Met Lys Ser Phe Ser
    290                 295                 300
Leu Thr Ala Ile Val Leu Glu Glu Ser Ile Glu Lys Ala Leu Leu Thr
305                 310                 315                 320
Glu Val Glu Thr Ser Asn Trp Pro Thr Pro Val Pro Pro Arg Glu Ile
                325                 330                 335
Ser Cys Val Pro Ser Ser Gln Arg Ser Ala Arg Val Glu Phe Gln Pro
            340                 345                 350
Ser Ala Asn Ala Met Val Ala Gly Ile Val Glu Leu Val Thr Thr Thr
        355                 360                 365
Leu Ser Asp Leu Glu Thr His Leu Asn Ala Leu Asp Ala Lys Val Gly
    370                 375                 380
Asp Gly Asp Thr Gly Ser Thr Phe Ala Ala Gly Ala Arg Glu Ile Ala
385                 390                 395                 400
Ser Leu Leu His Arg Gln Gln Leu Pro Leu Asp Asn Leu Ala Thr Leu
                405                 410                 415
Phe Ala Leu Ile Gly Glu Arg Leu Thr Val Val Met Gly Gly Ser Ser
            420                 425                 430
Gly Val Leu Met Ser Ile Phe Phe Thr Ala Ala Gly Gln Lys Leu Glu
        435                 440                 445
GIn Gly Ala Ser Val Ala Glu Ser Leu Asn Thr Gly Leu Ala Gln Met
    450                 455                 460
Lys Phe Tyr Gly Gly Ala Asp Glu Gly Asp Arg Thr Met Ile Asp Ala
465                 470                 475                 480
Leu Gln Pro Ala Leu Thr Ser Leu Leu Thr Gln Pro Gln Asn Leu Gln
                485                 490                 495
Ala Ala Phe Asp Ala Ala Gln Ala Gly Ala Glu Arg Thr Cys Leu Ser
            500                 505                 510
Ser Lys Ala Asn Ala Gly Arg Ala Ser Tyr Leu Ser Ser Glu Ser Leu
        515                 520                 525
Leu Gly Asn Met Asp Pro Gly Ala His Ala Val Ala Met Val Phe Lys
    530                 535                 540
Ala Leu Ala Glu Ser Glu Leu Gly
545                 550
<210>13
<211>364
<212>PRT
<213>博伊丁氏假丝酵母(Candida boidinii)
<400>13
Met Lys Ile Val Leu Val Leu Tyr Asp Ala Gly Lys His Ala Ala Asp
1               5                   10                  15
Glu Glu Lys Leu Tyr Gly Cys Thr Glu Asn Lys Leu Gly Ile Ala Asn
            20                  25                  30
Trp Leu Lys Asp Gln Gly His Glu Leu Ile Thr Thr Ser Asp Lys Glu
        35                  40                  45
Gly Glu Thr Ser Glu Leu Asp Lys His Ile Pro Asp Ala Asp Ile Ile
    50                  55                  60
Ile Thr Thr Pro Phe His Pro Ala Tyr Ile Thr Lys Glu Arg Leu Asp
65                  70                  75                  80
Lys Ala Lys Asn Leu Lys Leu Val Val Val Ala Gly Val Gly Ser Asp
                85                  90                  95
His Ile Asp Leu Asp Tyr Ile Asn Gln Thr Gly Lys Lys Ile Ser Val
            100                 105                 110
Leu Glu Val Thr Gly Ser Asn Val Val Ser Val Ala Glu His Val Val
        115                 120                 125
Met Thr Met Leu Val Leu Val Arg Asn Phe Val Pro Ala His Glu Gln
    130                 135                 140
Ile Ile Asn His Asp Trp Glu Val Ala Ala Ile Ala Lys Asp Ala Tyr
145                 150                 155                 160
Asp Ile Glu Gly Lys Thr Ile Ala Thr Ile Gly Ala Gly Arg Ile Gly
                165                 170                 175
Tyr Arg Val Leu Glu Arg Leu Leu Pro Phe Asn Pro Lys Glu Leu Leu
            180                 185                 190
Tyr Tyr Asp Tyr Gln Ala Leu Pro Lys Glu Ala Glu Glu Lys Val Gly
        195                 200                 205
Ala Arg Arg Val Glu Asn Ile Glu Glu Leu Val Ala Gln Ala Asp Ile
    210                 215                 220
Val Thr Val Asn Ala Pro Leu His Ala Gly Thr Lys Gly Leu Ile Asn
225                 230                 235                 240
Lys Glu Leu Leu Ser Lys Phe Lys Lys Gly Ala Trp Leu Val Asn Thr
                245                 250                 255
Ala Arg Gly Ala Ile Cys Val Ala Glu Asp Val Ala Ala Ala Leu Glu
             260                 265                 270
Ser Gly Gln Leu Arg Gly Tyr Gly Gly Asp Val Trp Phe Pro Gln Pro
        275                 280                 285
Ala Pro Lys Asp His Pro Trp Arg Asp Met Arg Asn Lys Tyr Gly Ala
    290                 295                 300
Gly Asn Ala Met Thr Pro His Tyr Ser Gly Thr Thr Leu Asp Ala Gln
305                 310                 315                 320
Thr Arg Tyr Ala Glu Gly Thr Lys Asn Ile Leu Glu Ser Phe Phe Thr
                325                 330                 335
Gly Lys Phe Asp Tyr Arg Pro Gln Asp Ile Ile Leu Leu Asn Gly Glu
            340                 345                 350
Tyr Val Thr Lys Ala Tyr Gly Lys His Asp Lys Lys
        355                 360
<210>14
<211>549
<212>PRT
<213>肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400>14
Met Ser Gln Phe Phe Phe Asn Gln Arg Ala Ser Leu Val Asn Asp Val
1               5                   10                  15
Ile Glu Gly Thr Ile Ile Ala Ser Pro Trp Asn Asn Leu Ala Arg Leu
            20                  25                  30
Glu Ser Asp Pro Ala Ile Arg Val Val Val Arg Arg Asp Leu Asn Lys
        35                  40                  45
Asn Asn Val Ala Val Ile Ser Gly Gly Gly Ala Gly His Glu Pro Ala
    50                  55                  60
His Val Gly Phe Ile Gly Lys Gly Met Leu Thr Ala Ala Val Cys Gly
65                  70                  75                  80
Asp Leu Phe Ala Ser Pro Ser Val Asp Ala Val Leu Thr Ala Ile Gln
                85                  90                  95
Ala Val Thr Gly Glu Ala Gly Cys Leu Leu Ile Val Lys Asn Tyr Thr
            100                 105                 110
Gly Asp Arg Leu Asn Phe Gly Leu Ala Ala Glu Lys Ala Arg Arg Leu
        115                 120                 125
Gly Tyr Asn Val Glu Met Leu Ile Val Gly Asp Asp Ile Ser Leu Pro
    130                 135                 140
Asp Asn Lys Gln Pro Arg Gly Ile Ala Gly Thr Ile Leu Val His Lys
145                 150                 155                 160
Val Ala Gly Tyr Phe Ala Glu Arg Gly Phe Asn Leu Ala Thr Val Leu
                165                 170                 175
Arg Glu Ala Gln Tyr Ala Ala Ser His Thr Ala Ser Ile Gly Val Ala
            180                 185                 190
Leu Ala Ser Cys His Leu Pro Gln Glu Ala Asp Ser Ala Pro Arg His
        195                 200                 205
Gln Ala Gly His Ala Glu Leu Gly Met Gly Ile His Gly Glu Pro Gly
    210                 215                 220
Ala Ser Thr Ile Ala Thr Gln Asn Ser Ala Glu Ile Val Asn Leu Met
225                 230                 235                 240
Val Glu Lys Leu Thr Ala Ala Leu Pro Glu Thr Gly Arg Leu Ala Val
                245                 250                 255
Met Leu Asn Asn Leu Gly Gly Val Ser Val Ala Glu Met Ala Ile Leu
            260                 265                 270
Thr Arg Glu Leu Ala Asn Thr Pro Leu Gln Ala Arg Ile Asp Trp Leu
        275                 280                 285
Ile Gly Pro Ala Ser Leu Val Thr Ala Leu Asp Met Lys Gly Phe Ser
    290                 295                 300
Leu Thr Ala Ile Val Leu Glu Glu Ser Ile Glu Lys Ala Leu Leu Ser
305                 310                 315                 320
Asp Val Glu Thr Ala Ser Trp Gln Lys Pro Val Gln Pro Arg Thr Ile
                325                 330                 335
Asn Ala Val Pro Ser Thr Leu Asp Ser Ala Arg Val Asp Phe Thr Pro
            340                 345                 350
Ser Ala Asn Pro Gln Val Gly Asp Tyr Val Ala Gln Val Thr Gly Ala
        355                 360                 365
Leu Ile Asp Leu Glu Glu His Leu Asn Ala Leu Asp Ala Lys Val Gly
    370                 375                 380
Asp Gly Asp Thr Gly Ser Thr Phe Ala Ala Gly Ala Arg Glu Ile Ala
385                 390                 395                 400
Glu Arg Leu Glu Arg Gln Gln Leu Pro Leu Asn Asp Leu Pro Thr Leu
                405                 410                 415
Phe Ala Leu Ile Gly Glu Arg Leu Thr Val Val Met Gly Gly Ser Ser
            420                 425                 430
Gly Val Leu Met Ser Ile Phe Phe Thr Ala Ala Gly Gln Lys Leu Gly
        435                 440                 445
Gln Gly Ala Ser Val Ala Glu Ala Leu Asn Ala Gly Leu Glu Gln Met
    450                 455                 460
Lys Phe Tyr Gly Gly Ala Asp Glu Gly Asp Arg Thr Met Ile Asp Ala
465                 470                 475                 480
Leu Gln Pro Ala Leu Ala Ala Leu Leu Ala Glu Pro Glu Asn Leu Gln
                485                 490                 495
Ala Ala Phe Ala Ala Ala Gln Ala Gly Ala Asp Arg Thr Cys Gln Ser
            500                 505                 510
Ser Lys Ala Gly Ala Gly Arg Ala Ser Tyr Leu Asn Ser Asp Ser Leu
        515                 520                 525
Leu Gly Asn Met Asp Pro Gly Ala His Ala Val Ala Met Val Phe Lys
    530                 535                 540
Ala Leu Ala Glu Arg
545
<210>15
<211>584
<212>PRT
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>15
Met Ser Ala Lys Ser Phe Glu Val Thr Asp Pro Val Asn Ser Ser Leu
1               5                   10                  15
Lys Gly Phe Ala Leu Ala Asn Pro Ser Ile Thr Leu Val Pro Glu Glu
            20                  25                  30
Lys Ile Leu Phe Arg Lys Thr Asp Ser Asp Lys Ile Ala Leu Ile Ser
        35                  40                  45
Gly Gly Gly Ser Gly His Glu Pro Thr His Ala Gly Phe Ile Gly Lys
    50                  55                  60
Gly Met Leu Ser Gly Ala Val ValGly Glu Ile Phe Ala Ser Pro Ser
65                  70                  75                  80
Thr Lys Gln Ile Leu Asn Ala Ile Arg Leu Val Asn Glu Asn Ala Ser
                85                  90                  95
Gly Val Leu Leu Ile Val Lys Asn Tyr Thr Gly Asp Val Leu His Phe
            100                 105                 110
Gly Leu Ser Ala Glu Arg Ala Arg Ala Leu Gly Ile Asn Cys Arg Val
        115                 120                 125
Ala Val Ile Gly Asp Asp Val Ala Val Gly Arg Glu Lys Gly Gly Met
    130                 135                 140
Val Gly Arg Arg Ala Leu Ala Gly Thr Val Leu Val His Lys Ile Val
145                 150                 155                 160
Gly Ala Phe Ala Glu Glu Tyr Ser Ser Lys Tyr Gly Leu Asp Gly Thr
                165                 170                 175
Ala Lys Val Ala Lys Ile Ile Asn Asp Asn Leu Val Thr Ile Gly Ser
            180                 185                 190
Ser Leu Asp His Cys Lys Val Pro Gly Arg Lys Phe Glu Ser Glu Leu
        195                 200                 205
Asn Glu Lys Gln Met Glu Leu Gly Met Gly Ile His Asn Glu Pro Gly
    210                 215                 220
Val Lys Val Leu Asp Pro Ile Pro Ser Thr Glu Asp Leu Ile Ser Lys
225                 230                 235                 240
Tyr Met Leu Pro Lys Leu Leu Asp Pro Asn Asp Lys Asp Arg Ala Phe
                245                 250                 255
Val Lys Phe Asp Glu Asp Asp Glu Val Val Leu Leu Val Asn Asn Leu
            260                 265                 270
Gly Gly Val Ser Asn Phe Val Ile Ser Ser Ile Thr Ser Lys Thr Thr
        275                 280                 285
Asp Phe Leu Lys Glu Asn Tyr Asn Ile Thr Pro Val Gln Thr Ile Ala
    290                 295                 300
Gly Thr Leu Met Thr Ser Phe Asn Gly Asn Gly Phe Ser Ile Thr Leu
305                 310                 315                 320
Leu Asn Ala Thr Lys Ala Thr Lys Ala Leu Gln Ser Asp Phe Glu Glu
                325                 330                 335
Ile Lys Ser Val Leu Asp Leu Leu Asn Ala Phe Thr Asn Ala Pro Gly
            340                 345                 350
Trp Pro Ile Ala Asp Phe Glu Lys Thr Ser Ala Pro Ser Val Asn Asp
        355                 360                 365
Asp Leu Leu His Asn Glu Val Thr Ala Lys Ala Val Gly Thr Tyr Asp
    370                 375                 380
Phe Asp Lys Phe Ala Glu Trp Met Lys Ser Gly Ala Glu Gln Val Ile
385                 390                 395                 400
Lys Ser Glu Pro His Ile Thr Glu Leu Asp Asn Gln Val Gly Asp Gly
                405                 410                 415
Asp Cys Gly Tyr Thr Leu Val Ala Gly Val Lys Gly Ile Thr Glu Asn
            420                 425                 430
Leu Asp Lys Leu Ser Lys Asp Ser Leu Ser Gln Ala Val Ala Gln Ile
        435                 440                 445
Ser Asp Phe Ile Glu Gly Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
    450                 455                 460
Ser Ile Leu Leu Ser Gly Phe Ser His Gly Leu Ile Gln Val Cys Lys
465                 470                 475                 480
Ser Lys Asp Glu Pro Val Thr Lys Glu Ile ValAla Lys Ser Leu Gly
                485                 490                 495
Ile Ala Leu Asp Thr Leu Tyr Lys Tyr Thr Lys Ala Arg Lys Gly Ser
            500                 505                 510
Ser Thr Met Ile Asp Ala Leu Glu Pro Phe Val Lys Glu Phe Thr Ala
        515                 520                 525
Ser Lys Asp Phe Asn Lys Ala Val Lys Ala Ala Glu Glu Gly Ala Lys
    530                 535                 540
Ser Thr Ala Thr Phe Glu Ala Lys Phe Gly Arg Ala Ser Tyr Val Gly
545                 550                 555                 560
Asp Ser Ser Gln Val Glu Asp Pro Gly Ala Val Gly Leu Cys Glu Phe
                565                 570                 575
Leu Lys Gly Val Gln Ser Ala Leu
            580
<210>16
<211>591
<212>PRT
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>16
Met Ser His Lys Gln Phe Lys Ser Asp Gly Asn Ile Val Thr Pro Tyr
1               5                   10                  15
Leu Leu Gly Leu Ala Arg Ser Asn Pro Gly Leu Thr Val Ile Lys His
            20                  25                  30
Asp Arg Val Val Phe Arg Thr Ala Ser Ala Pro Asn Ser Gly Asn Pro
        35                  40                  45
Pro Lys Val Ser Leu Val Ser Gly Gly Gly Ser Gly His Glu Pro Thr
    50                  55                  60
His Ala Gly Phe Val Gly Glu Gly Ala Leu Asp Ala Ile Ala Ala Gly
65                  70                  75                  80
Ala Ile Phe Ala Ser Pro Ser Thr Lys Gln Ile Tyr Ser Ala Ile Lys
                85                  90                  95
Ala Val Glu Ser Pro Lys Gly Thr Leu Ile Ile Val Lys Asn Tyr Thr
            100                 105                 110
Gly Asp Ile Ile His Phe Gly Leu Ala Ala Glu Arg Ala Lys Ala Ala
        115                 120                 125
Gly Met Lys Val Glu Leu Val Ala Val Gly Asp Asp Val Ser Val Gly
    130                 135                 140
Lys Lys Lys Gly Ser Leu Val Gly Arg Arg Gly Leu Gly Ala Thr Val
145                 150                 155                 160
Leu Val His Lys Ile Ala Gly Ala Ala Ala Ser His Gly Leu Glu Leu
                165                 170                 175
Ala Glu Val Ala Glu Val Ala Gln Ser Val Val Asp Asn Ser Val Thr
            180                 185                 190
Ile Ala Ala Ser Leu Asp His Cys Thr Val Pro Gly His Lys Pro Glu
        195                 200                 205
Ala Ile Leu Gly Glu Asn Glu Tyr Glu Ile Gly Met Gly Ile His Asn
    210                 215                 220
Glu Ser Gly Thr Tyr Lys Ser Ser Pro Leu Pro Ser Ile Ser Glu Leu
225                 230                 235                 240
Val Ser Gln Met Leu Pro Leu Leu Leu Asp Glu Asp Glu Asp Arg Ser
                245                 250                 255
Tyr Val Lys Phe Glu Pro Lys Glu Asp Val Val Leu Met Val Asn Asn
            260                 265                 270
Met Gly Gly Met Ser Asn Leu Glu Leu Gly Tyr Ala Ala Glu Val Ile
        275                 280                 285
Ser Glu Gln Leu Ile Asp Lys Tyr Gln Ile Val Pro Lys Arg Thr Ile
    290                 295                 300
Thr Gly Ala Phe Ile Thr Ala Leu Asn Gly Pro Gly Phe Gly Ile Thr
305                 310                 315                 320
Leu Met Asn Ala Ser Lys Ala Gly Gly Asp Ile Leu Lys Tyr Phe Asp
                325                 330                 335
Tyr Pro Thr Thr Ala Ser Gly Trp Asn Gln Met Tyr His Ser Ala Lys
            340                 345                 350
Asp Trp Glu Val Leu Ala Lys Gly Gln Val Pro Thr Ala Pro Ser Leu
        355                 360                 365
Lys Thr Leu Arg Asn Glu Lys Gly Ser Gly Val Lys Ala Asp Tyr Asp
    370                 375                 380
Thr Phe Ala Lys Ile Leu Leu Ala Gly Ile Ala Lys Ile Asn Glu Val
385                 390                 395                 400
Glu Pro Lys Val Thr Trp Tyr Asp Thr Ile Ala Gly Asp Gly Asp Cys
                405                 410                 415
Gly Thr Thr Leu Val Ser Gly Gly Glu Ala Leu Glu Glu Ala Ile Lys
            420                 425                 430
Asn His Thr Leu Arg Leu Glu Asp Ala Ala Leu Gly Ile Glu Asp Ile
        435                 440                 445
Ala Tyr Met Val Glu Asp Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
    450                 455                 460
Ser Ile Tyr Leu Ser Ala Leu Ala Gln Gly Val Arg Asp Ser Gly Asp
465                 470                 475                 480
Lys Glu Leu Thr Ala Glu Thr Phe Lys Lys Ala Ser Asn Val Ala Leu
                485                 490                 495
Asp Ala Leu Tyr Lys Tyr Thr Arg Ala Arg Pro Gly Tyr Arg Thr Leu
            500                 505                 510
Ile Asp Ala Leu Gln Pro Phe Val Glu Ala Leu Lys Ala Gly Lys Gly
        515                 520                 525
Pro Arg Ala Ala Ala Gln Ala Ala Tyr Asp Gly Ala Glu Lys Thr Arg
    530                 535                 540
Lys Met Asp Ala Leu Val Gly Arg Ala Ser Tyr Val Ala Lys Glu Glu
545                 550                 555                 560
Leu Arg Lys Leu Asp Ser Glu Gly Gly Leu Pro Asp Pro Gly Ala Val
                565                 570                 575
Gly Leu Ala Ala Leu Leu Asp Gly Phe Val Thr Ala Ala Gly Tyr
            580                 585                 590
<210>17
<211>2253
<212>DNA
<213>pGV772
<400>17
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac     60
atcagcagga cgcactgacc gaattcatta aagaggagaa aggtaccggg ccccccctcg    120
aggtcgacgg tatcgataag cttgatatcg aattcctgca gcccggggga tcccatggta    180
cgcgtgctag aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt    240
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgc cctagaccta    300
ggcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca    360
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac    420
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac    480
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg    540
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac    600
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat    660
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag    720
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac    780
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt    840
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt    900
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc    960
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga   1020
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac   1080
gaaaactcac gttaagggat tttggtcatg actagtgctt ggattctcac caataaaaaa   1140
cgcccggcgg caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg   1200
atctatcaac aggagtccaa gcgagctctc gaaccccaga gtcccgctca gaagaactcg   1260
tcaagaaggc gatagaaggc gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg   1320
aggaagcggt cagcccattc gccgccaagc tcttcagcaa tatcacgggt agccaacgct   1380
atgtcctgat agcggtccgc cacacccagc cggccacagt cgatgaatcc agaaaagcgg   1440
ccattttcca ccatgatatt cggcaagcag gcatcgccat gggtcacgac gagatcctcg   1500
ccgtcgggca tgcgcgcctt gagcctggcg aacagttcgg ctggcgcgag cccctgatgc   1560
tcttcgtcca gatcatcctg atcgacaaga ccggcttcca tccgagtacg tgctcgctcg   1620
atgcgatgtt tcgcttggtg gtcgaatggg caggtagccg gatcaagcgt atgcagccgc   1680
cgcattgcat cagccatgat ggatactttc tcggcaggag caaggtgaga tgacaggaga   1740
tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt gacaacgtcg   1800
agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc   1860
tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc   1920
gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc ccagtcatag   1980
ccgaatagcc tctccaccca agcggccgga gaacctgcgt gcaatccatc ttgttcaatc   2040
atgcgaaacg atcctcatcc tgtctcttga tcagatcttg atcccctgcg ccatcagatc   2100
cttggcggca agaaagccat ccagtttact ttgcagggct tcccaacctt accagagggc   2160
gccccagctg gcaattccga cgtctaagaa accattatta tcatgacatt aacctataaa   2220
aataggcgta tcacgaggcc ctttcgtctt cac                                2253
<210>18
<211>3068
<212>DNA
<213>pGV1010
<400>18
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa   1080
gaggagaaag gtaccatgtc agttttcgtt tcaggtgcta acgggttcat tgcccaacac   1140
attgtcgatc tcctgttgaa ggaagactat aaggtcatcg gttctgccag aagtcaagaa   1200
aaggccgaga atttaacgga ggcctttggt aacaacccaa aattctccat ggaagttgtc   1260
ccagacatat ctaagctgga cgcatttgac catgttttcc aaaagcacgg caaggatatc   1320
aagatagttc tacatacggc ctctccattc tgctttgata tcactgacag tgaacgcgat   1380
ttattaattc ctgctgtgaa cggtgttaag ggaattctcc actcaattaa aaaatacgcc   1440
gctgattctg tagaacgtgt agttctcacc tcttcttatg cagctgtgtt cgatatggca   1500
aaagaaaacg ataagtcttt aacatttaac gaagaatcct ggaacccagc tacctgggag   1560
agttgccaaa gtgacccagt taacgcctac tgtggttcta agaagtttgc tgaaaaagca   1620
gcttgggaat ttctagagga gaatagagac tctgtaaaat tcgaattaac tgccgttaac   1680
ccagtttacg tttttggtcc gcaaatgttt gacaaagatg tgaaaaaaca cttgaacaca   1740
tcttgcgaac tcgtcaacag cttgatgcat ttatcaccag aggacaagat accggaacta   1800
tttggtggat acattgatgt tcgtgatgtt gcaaaggctc atttagttgc cttccaaaag   1860
agggaaacaa ttggtcaaag actaatcgta tcggaggcca gatttactat gcaggatgtt   1920
ctcgatatcc ttaacgaaga cttccctgtt ctaaaaggca atattccagt ggggaaacca   1980
ggttctggtg ctacccataa cacccttggt gctactcttg ataataaaaa gagtaagaaa   2040
ttgttaggtt tcaagttcag gaacttgaaa gagaccattg acgacactgc ctcccaaatt   2100
ttaaaatttg agggcagaat ataaggatcc catggtacgc gtgctagagg catcaaataa   2160
aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg   2220
ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc ggcgagcggt   2280
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa   2340
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc   2400
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag   2460
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt   2520
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg   2580
aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg   2640
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg   2700
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac   2760
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg   2820
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt   2880
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg   2940
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc   3000
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt   3060
ggtcatga                                                            3068
<210>19
<211>3231
<212>DNA
<213>pGV1035
<400>19
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcttatt   1080
atttaggagg agtaaaacat gagagatgta gtaatagtaa gtgctgtaag aactgcaata   1140
ggagcatatg gaaaaacatt aaaggatgta cctgcaacag agttaggagc tatagtaata   1200
aaggaagctg taagaagagc taatataaat ccaaatgaga ttaatgaagt tatttttgga   1260
aatgtacttc aagctggatt aggccaaaac ccagcaagac aagcagcagt aaaagcagga   1320
ttacctttag aaacacctgc gtttacaatc aataaggttt gtggttcagg tttaagatct   1380
ataagtttag cagctcaaat tataaaagct ggagatgctg ataccattgt agtaggtggt   1440
atggaaaata tgtctagatc accatatttg attaacaatc agagatgggg tcaaagaatg   1500
ggagatagtg aattagttga tgaaatgata aaggatggtt tgtgggatgc atttaatgga   1560
tatcatatgg gagtaactgc agaaaatatt gcagaacaat ggaatataac aagagaagag   1620
caagatgaat tttcacttat gtcacaacaa aaagctgaaa aagccattaa aaatggagaa    1680
tttaaggatg aaatagttcc tgtattaata aagactaaaa aaggtgaaat agtctttgat    1740
caagatgaat ttcctagatt cggaaacact attgaagcat taagaaaact taaacctatt    1800
ttcaaggaaa atggtactgt tacagcaggt aatgcatccg gattaaatga tggagctgca    1860
gcactagtaa taatgagcgc tgataaagct aacgctctcg gaataaaacc acttgctaag    1920
attacttctt acggatcata tggggtagat ccatcaataa tgggatatgg agctttttat    1980
gcaactaaag ctgccttaga taaaattaat ttaaaacctg aagacttaga tttaattgaa    2040
gctaacgagg catatgcttc tcaaagtata gcagtaacta gagatttaaa tttagatatg    2100
agtaaagtta atgttaatgg tggagctata gcacttggac atccaatagg tgcatctggt    2160
gcacgtattt tagtaacatt actatacgct atgcaaaaaa gagattcaaa aaaaggtctt    2220
gctactctat gtattggtgg aggtcaggga acagctctcg tagttgaaag agactaagga    2280
tccgatccga tcccatggta cgcgtgctag aggcatcaaa taaaacgaaa ggctcagtcg    2340
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct gagtaggaca    2400
aatccgccgc cctagaccta ggcgttcggc tgcggcgagc ggtatcagct cactcaaagg    2460
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag    2520
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc    2580
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag    2640
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga    2700
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc    2760
aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg    2820
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt    2880
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca    2940
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca    3000
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag    3060
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca    3120
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg    3180
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg a             3231
<210>20
<211>2908
<212>DNA
<213>pGV1037
<400>20
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgga attcattgat   1080
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggtgcaggt   1140
actatgggtt caggaattgc tcaggcattt gcagctaaag gatttgaagt agtattaaga   1200
gatattaaag atgaatttgt tgatagagga ttagatttta tcaataaaaa tctttctaaa   1260
ttagttaaaa aaggaaagat agaagaagct actaaagttg aaatcttaac tagaatttcc   1320
ggaacagttg accttaatat ggcagctgat tgcgatttag ttatagaagc agctgttgaa   1380
agaatggata ttaaaaagca gatttttgct gacttagaca atatatgcaa gccagaaaca   1440
attcttgcat caaatacatc atcactttca ataacagaag tggcatcagc aactaaaaga   1500
cctgataagg ttataggtat gcatttcttt aatccagctc ctgttatgaa gcttgtagag   1560
gtaataagag gaatagctac atcacaagaa acttttgatg cagttaaaga gacatctata   1620
gcaataggaa aagatcctgt agaagtagca gaagcaccag gatttgttgt aaatagaata   1680
ttaataccaa tgattaatga agcagttggt atattagcag aaggaatagc ttcagtagaa   1740
gacatagata aagctatgaa acttggagct aatcacccaa tgggaccatt agaattaggt   1800
gattttatag gtcttgatat atgtcttgct ataatggatg ttttatactc agaaactgga   1860
gattctaagt atagaccaca tacattactt aagaagtatg taagagcagg atggcttgga   1920
agaaaatcag gaaaaggttt ctacgattat tcaaaataag gatccgatcc catggtacgc   1980
gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat   2040
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc   2100
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa   2160
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt   2220
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa   2280
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt   2340
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg   2400
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc   2460
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc   2520
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta   2580
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct   2640
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc    2700
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa    2760
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa    2820
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa    2880
aactcacgtt aagggatttt ggtcatga                                       2908
<210>21
<211>3285
<212>DNA
<213>pGV1039
<400>21
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt  tagggaaata ggccaggttttcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcgctcaa   1080
ttacacaacg gaggtataat aatgggcaaa gaaagtagtt ttagctgtgc atgtcgtaca   1140
gccatcggaa caatgggtgg atctcttagc acaattcctg cagtagattt aggtgctatc   1200
gttatcaaag aggctcttaa ccgcgcaggt gttaaacctg aagatgttga tcacgtatac   1260
atgggatgcg ttattcaggc aggacaggga cagaacgttg ctcgtcaggc ttctatcaag   1320
gctggtcttc ctgtagaagt acctgcagtt acaactaacg ttgtatgtgg ttcaggtctt   1380
aactgtgtta accaggcagc tcagatgatc atggctggag atgctgatat cgttgttgcc   1440
ggtggtatgg aaaacatgtc acttgcacca tttgcacttc ctaatggccg ttacggatat   1500
cgtatgatgt ggccaagcca gagccagggt ggtcttgtag acactatggt taaggatgct   1560
ctttgggatg ctttcaatga ttatcatatg atccagacag cagacaacat ctgcacagag   1620
tggggtctta cacgtgaaga gctcgatgag tttgcagcta agagccagaa caaggcttgt   1680
gcagcaatcg aagctggcgc attcaaggat gagatcgttc ctgtagagat caagaagaag   1740
aaagagacag ttatcttcga tacagatgaa ggcccaagac agggtgttac acctgaatct    1800
ctttcaaagc ttcgtcctat caacaaggat ggattcgtta cagctggtaa cgcttcaggt    1860
atcaacgacg gtgctgcagc actcgtagtt atgtctgaag agaaggctaa ggagctcggc    1920
gttaagccta tggctacatt cgtagctgga gcacttgctg gtgttcgtcc tgaagttatg    1980
ggtatcggtc ctgtagcagc tactcagaag gctatgaaga aggctggtat cgagaacgta    2040
tctgagttcg atatcatcga ggctaacgaa gcattcgcag ctcagtctgt agcagttggt    2100
aaggatcttg gaatcgacgt ccacaagcag ctcaatccta acggtggtgc tatcgctctt    2160
ggacacccag ttggagcttc aggtgctcgt atccttgtta cacttcttca cgagatgcag    2220
aagaaagacg ctaagaaggg tcttgctaca ctttgcatcg gtggcggtat gggatgcgct    2280
actatcgttg agaagtacga ataattaaac tttcagaggg tgtgaaggtc atataagatc    2340
aggatcccat ggtacgcgtg ctagaggcat caaataaaac gaaaggctca gtcgaaagac    2400
tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg    2460
ccgccctaga cctaggcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa    2520
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc    2580
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc    2640
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat    2700
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc    2760
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct    2820
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg    2880
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc    2940
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga    3000
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa    3060
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta    3120
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc    3180
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg    3240
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catga                    3285
<210>22
<211>2877
<212>DNA
<213>pGV1040
<400>22
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcccacac   1080
cctcttaata ctgctaataa ttggaggacg aatcaatgag ttttgtttta tatgaacaga   1140
aagataagat cgctgttgta actatcaacc gtccggaagc acttaatgct cttaactcag   1200
cagttctcga tgagcttaat gaagttctcg ataacgttga tcttaataca gttagagcac   1260
tcgttcttac cggtgctgga gataagtctt ttgtagctgg tgctgatatt ggagagatgt   1320
ccacacttac aaaggctgaa ggtgaagctt ttggtaagaa gggtaacgat gtattccgta   1380
agcttgagac acttcctatc cctgtaattg cagctgttaa cggctttgca cttggcggcg   1440
gatgtgagat ctctatgagc tgcgatatcc gtatctgctc agacaacgct atgttcggtc   1500
agcctgaagt tggtcttgga attactcctg gattcggcgg aacacagaga cttgcaagaa   1560
cagttggtgt tggtatggct aaacagctta tctacacagc tcgtaatatc aaagctgacg   1620
aagcacttcg tatcggcctt gtaaacgctg tatacactca ggaagagctt cttcctgcag   1680
ctgagaagct tgcaacaaca atcgctggta acgctcctat agctgttcgt gcttgtaaga   1740
aagctatcaa cgatggtctt cagactgata tcgacagcgc acttgtaatc gaagaaaagc   1800
tctttggttc atgcttcgag tcagaagatc aggtagaagg aatggctaac ttccttcgta   1860
agaaagatga tcctaagaag gttaagcacg tagatttcaa gaatgcttaa tatcgatctt   1920
tgatgtgata ttcggatccc atggtacgcg tgctagaggc atcaaataaa acgaaaggct   1980
cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt   2040
aggacaaatc cgccgcccta gacctaggcg ttcggctgcg gcgagcggta tcagctcact   2100
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag   2160
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata   2220
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc   2280
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg   2340
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc   2400
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg   2460
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc   2520
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga   2580
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg   2640
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa   2700
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg   2760
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt    2820
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatga       2877
<210>23
<211>2994
<212>DNA
<213>pGV1041
<400>23
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attctacaag   1080
gtgagtatta cagtcaaata atcggggatt aaatagacat atatcattta acggaaaata   1140
atagataaaa tatatctaag gaggatttac aatgaaagta gctgtaattg gtgcaggaac   1200
aatgggttct ggtattgcac aggcattcgc acagtgtgac gctgttgaga cagtttatct   1260
ttgcgatatc aagcaggagt tcgctgatgg cggtaagagc aagatcgaga agaatcttgg   1320
acgtcttgtt aagaaggaaa agatgactca ggaagctgct gatgcaatcg tagcaaaggt   1380
taagacaggt cttaacacaa tcgctacaga tcctgatctc gtagttgagg ctgcacttga   1440
agttatggat atcaagaaag cttgcttcaa ggaacttcag gagaacatcg ttaagaatcc   1500
tgattgtatc tatgcttcaa acacatcatc tctttcaatc acagagatcg gtgcaggtct   1560
taagactcct atcatcggaa tgcacttgtt caacccagct cctgttatga agctcatcga   1620
ggttatctca ggcgctaaca cacctaagga gacaacagag aaggttatcg agatctccaa   1680
gactcttggt aagacacctg tacaggttaa cgaggctcct ggattcgttg ttaaccgtat   1740
tcttattcca cttatcaacg aaggtatctt cgtatattca gaaggaattt ctgatatcga   1800
aggcatcgat acagctatga agcttggatg taaccatcct atgggacccc ttgaactggg   1860
tgactatgta ggtcttgata tcgttcttgc tatcatggat gtactttaca atgagactaa   1920
ggattccaag tatcgtgcat gcggactcct tcgtaagatg gttcgtgcag gtcaccttgg    1980
cgttaagtca ggaatcggtt tctacaagta caacgaagac agaacaaaga ctcctgttga    2040
caagctttaa ggatcccatg gtacgcgtgc tagaggcatc aaataaaacg aaaggctcag    2100
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg    2160
acaaatccgc cgccctagac ctaggcgttc ggctgcggcg agcggtatca gctcactcaa    2220
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa    2280
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc    2340
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga    2400
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc    2460
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt    2520
ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct    2580
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg    2640
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta    2700
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct    2760
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa    2820
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt    2880
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta    2940
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga          2994
<210>24
<211>2855
<212>DNA
<213>pGV1049
<400>24
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcattaaag    1080
aggagaaagg taccaaaata agcaagtttg aaggaggtcc ttagaatgga attaaaaaat    1140
gttattcttg aaaaagaagg gcatttagct attgttacaa tcaatagacc aaaggcatta    1200
aatgcattga attcagaaac actaaaagat ttaaatgttg ttttagatga tttagaagca    1260
gacaacaatg tgtatgcagt tatagttaca ggtgctggtg agaaatcttt tgttgctgga    1320
gcagatattt cagaaatgaa agatcttaat gaagaacaag gtaaagaatt tggtatttta    1380
ggaaacaatg tcttcagaag attagaaaaa ttggataagc cagttatcgc agctatatca    1440
ggatttgctc ttggtggtgg atgtgaactt gctatgtcat gtgacataag aatagcttca    1500
gttaaagcta aatttggtca accagaagca ggacttggaa taactccagg atttggtgga    1560
actcaaagat tagctagaat tgtagggcca ggaaaagcta aagaattaat ttatacttgt    1620
gaccttataa atgcagaaga agcttataga ataggtttag ttaataaagt agttgaatta    1680
gaaaaattga tggaagaagc aaaagcaatg gctaacaaga ttgcagctaa tgctccaaaa    1740
gcagttgcat attgtaaaga tgctatagac agaggaatgc aagttgatat agatgcagct    1800
atattaatag aagcagaaga ctttggaaag tgctttgcaa cagaagatca aacagaagga    1860
atgactgcgt tcttagaaag aagagcagaa aagaattttc aaaataaata aggatcccat    1920
ggtacgcgtg ctagaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc    1980
gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgccctaga    2040
cctaggcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc    2100
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag    2160
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca    2220
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca    2280
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg    2340
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag    2400
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt    2460
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca    2520
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg    2580
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt    2640
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc    2700
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg    2760
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg    2820
gaacgaaaac tcacgttaag ggattttggt catga                               2855
<210>25
<211>2891
<212>DNA
<213>pGV1050
<400>25
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaaaagat   1080
ttagaggagg aataattcat gaaaaagatt tttgtacttg gagcaggaac aatgggtgct   1140
ggtatcgttc aagcattcgc tcaaaaaggt tgtgaagtaa ttgtaagaga cataaaggaa   1200
gaatttgttg acagaggaat agctggaatc actaaaggat tagaaaagca agttgctaaa   1260
ggaaaaatgt ctgaagaaga taaagaagct atactttcaa gaatttcagg aacaactgat   1320
atgaaattag ctgctgactg tgatttagta gttgaagctg caatcgaaaa catgaaaatt   1380
aagaaggaaa tcttcgctga attagatgga atttgtaagc cagaagcgat tttagcttca   1440
aacacttcat ctttatcaat tactgaagtt gcttcagcta caaagagacc tgataaagtt   1500
atcggaatgc atttctttaa tccagctcca gtaatgaagc ttgttgaaat tattaaagga   1560
atagctactt ctcaagaaac ttttgatgct gttaaggaat tatcagttgc tattggaaaa   1620
gaaccagtag aagttgcaga agctccagga ttcgttgtaa acagaatatt aatcccaatg   1680
attaacgaag cttcatttat cctacaagaa ggaatagctt cagttgaaga tattgataca   1740
gctatgaaat atggtgctaa ccatccaatg ggacctttag ctttaggaga tcttattgga   1800
ttagacgttt gcttagctat catggatgtt ttattcactg aaacaggtga taacaagtac   1860
agagctagca gcatattaag aaaatatgtt agagctggat ggcttggaag aaaatcagga   1920
aaaggattct atgattattc taaataagga tcccatggta cgcgtgctag aggcatcaaa   1980
taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga   2040
acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc   2100
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg   2160
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct   2220
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca   2280
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct   2340
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc    2400
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt    2460
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc    2520
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc    2580
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg    2640
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc    2700
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag    2760
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga    2820
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat    2880
tttggtcatg a                                                         2891
<210>26
<211>5125
<212>DNA
<213>pGV1052
<400>26
aattctaaac taactatacg ctaaggagag tggaacatca tggattttaa cttaacagat     60
attcagcaag acttcctgaa gctggcacac gactttggtg aaaagaaact ggcccctact    120
gttaccgaac gcgaccacaa aggtatctac gataaagaac tgattgacga actgctgtct    180
ctgggtatca ccggcgcata cttcgaagaa aaatacggcg gtagcggtga cgacggtggc    240
gatgtactgt cttatatcct ggccgtagaa gaactggcga aatacgacgc tggtgttgct    300
atcactctgt ctgccaccgt aagcctgtgt gcgaatccga tttggcagtt tggtactgag    360
gctcagaaag aaaagtttct ggttccactg gtcgaaggta ctaaactggg tgcgtttggt    420
ctgaccgaac cgaacgcggg cactgatgcg agcggccagc aaactattgc tactaaaaac    480
gatgacggca cgtacaccct gaacggtagc aaaatcttca tcaccaacgg tggcgctgcc    540
gatatctaca tcgtatttgc gatgaccgac aaaagcaagg gtaaccatgg catcaccgcg    600
ttcatcctgg aagatggcac tccgggtttc acctacggca aaaaggaaga taaaatgggt    660
atccacacct ctcagactat ggaactggtt ttccaggacg ttaaggtccc ggccgagaac    720
atgctgggcg aagaaggcaa aggcttcaag attgcaatga tgaccctgga cggcggtcgc    780
attggcgttg cggcccaggc actgggcatc gcagaggcag cgctggccga cgctgttgaa    840
tacagcaaac agcgtgttca gtttggcaaa cctctgtgca aattccaatc cattagcttt    900
aagctggccg atatgaaaat gcagatcgaa gccgcacgca acctggtata taaagctgca    960
tgcaagaaac aagaaggtaa accgttcacc gtagacgctg cgatcgcgaa acgtgtagcc   1020
agcgatgtgg caatgcgcgt gactaccgaa gcagttcaga ttttcggtgg ctatggttac   1080
tctgaagaat acccggtggc tcgccacatg cgcgacgcaa aaatcactca gatctacgag   1140
ggtacgaacg aagtgcagct gatggtcacc ggcggtgctc tgttaagtta attaaagttt   1200
atgctcggcc tgccctttgc tgggcccgtt acataaaaaa agattttagg aggcaaaacg   1260
taaatggaaa tattggtatg tgtcaaacaa gtgccggata ctgcagaagt caaaattgat   1320
ccggttaaac acaccgtgat tcgtgcgggt gtgccgaata tcttcaaccc gttcgaccaa   1380
aacgcgctgg aagcggcgct ggcgctgaag gacgcggata aagacgttaa gattactctg   1440
ctgtctatgg gcccggacca ggcaaaagat gttctgcgtg aaggcctggc catgggcgct    1500
gatgacgcgt acctgctgtc cgatcgtaaa ctgggtggct ccgacactct ggccaccggt    1560
tatgctctgg cccaggctat taagaaactg gctgcggaca agggtattga gcaattcgac    1620
atcatcctgt gtggtaagca agcgattgac ggtgataccg ctcaggtagg tccacagatc    1680
gcttgtgagc tgggcatccc gcagatcact tatgctcgtg acatcaaggt tgagggcgat    1740
aaggttactg tgcagcagga aaacgaagag ggttacatcg tgaccgaagc gcagttcccg    1800
gttctgatca ccgcggttaa agacctgaac gaacctcgtt tcccgaccat ccgtggcacc    1860
atgaaggcga agcgtcgtga aatcccgaac ctggacgcag ctgcagttgc cgcggacgac    1920
gcgcagatcg gcctgtccgg ttctccgacc aaagtacgca aaattttcac cccaccgcag    1980
cgttccggcg gtctggtact gaaagtggaa gacgacaacg aacaggccat tgtcgaccag    2040
gttatggaaa aactggttgc ccagaaaatc atttaatcta aggaggaaca gtgaaaatgg    2100
atttagcaga atacaaaggc atctacgtga tcgcagagca gttcgaaggt aaactgcgtg    2160
acgtttcttt cgaactgctg ggtcaagcgc gcatcctggc ggacacgatc ggcgacgaag    2220
taggcgcaat cctgattggc aaagatgtaa aaccactggc gcaggaactg atcgcgcatg    2280
gtgctcataa agtgtacgtc tatgacgacc cgcagctgga acattacaac acgactgcct    2340
atgccaaagt gatttgcgac ttctttcatg aagagaaacc aaacgttttc ctggttggtg    2400
caactaacat cggtcgtgac ctgggtccac gtgtagcgaa cagcctgaaa accggtctga    2460
ctgcggattg tacccagctg ggtgttgatg atgataagaa aaccatcgtt tggacccgtc    2520
cggcactggg cggcaacatc atggcggaaa ttatctgtcc agataaccgc ccgcagatgg    2580
gcactgtgcg tcctcatgtc ttcaaaaagc cggaagccga cccgagcgca actggtgaag    2640
tcattgaaaa gaaagcgaac ctgtctgacg ctgatttcat gactaagttc gtagaactga    2700
tcaaactggg tggtgaaggc gttaaaatcg aggatgccga tgttattgtt gctggtggcc    2760
gtggcatgaa tagcgaagag ccttttaaaa ccggtatcct gaaagagtgc gcggacgtac    2820
tgggcggtgc tgtcggtgcc agccgtgccg ccgtggacgc gggctggatc gacgctctgc    2880
accaggtcgg ccagactggc aaaaccgttg gtccgaaaat ctacattgct tgtgcgatta    2940
gcggtgctat ccagccgctg gcaggcatga cgggctctga ttgtattatc gcaattaaca    3000
aagatgaaga cgcgcctatt ttcaaggtgt gcgactatgg cattgtgggc gatgtgttca    3060
aagtgctgcc actgctgact gaggcgatca agaaacagaa aggcattgca taaggatccc    3120
atggtacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt    3180
tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgcccta    3240
gacctaggcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta    3300
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc    3360
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag    3420
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac    3480
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc    3540
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt    3600
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc    3660
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga    3720
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta    3780
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta    3840
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga    3900
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg    3960
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag    4020
tggaacgaaa actcacgtta agggattttg gtcatgacta gtgcttggat tctcaccaat    4080
aaaaaacgcc cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctgaggtcat    4140
tactggatct atcaacagga gtccaagcga gctcgatatc aaattacgcc ccgccctgcc    4200
actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga    4260
cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt    4320
tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac    4380
tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag    4440
ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact    4500
gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga    4560
aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca    4620
tacgaaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa    4680
acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct    4740
ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt    4800
gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc    4860
ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa    4920
agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccagatatcg acgtctaaga    4980
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct    5040
tcacctcgag aaatgtgagc ggataacaat tgacattgtg agcggataac aagatactga    5100
gcacatcagc aggacgcact gaccg                                          5125
<210>27
<211>2982
<212>DNA
<213>pGV1054
<400>27
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat    1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa    1080
gaggagaaag gtaccaagaa ttatttaaag cttattatgc caaaatactt atatagtatt    1140
ttggtgtaaa tgcattgata gtttctttaa atttagggag gtctgtttaa tgaaaaaggt    1200
atgtgttata ggcgcgggaa ccatgggtag cggtattgcc caggcatttg ctgcaaaagg    1260
tttcgaagtg gttctgcgtg atatcaagga cgagtttgtc gatcgcggct tagacttcat    1320
taataaaaac ctgtctaaac tggtaaagaa agggaaaatc gaagaggcga cgaaggtgga    1380
aattttaact cggatcagtg gaacagttga tctgaatatg gccgctgact gcgatctggt    1440
cattgaagcg gccgtagagc gtatggatat caaaaaacaa atttttgcag acttagataa    1500
catctgtaag ccggaaacca ttctggcttc aaatacgtcc tcgctgagca tcactgaggt    1560
ggcgtctgcc acaaaacgcc cagacaaagt tattggcatg catttcttta accctgcacc    1620
ggtcatgaag ttagtggaag taatccgtgg gattgctacc agtcaggaaa cgttcgatgc    1680
ggttaaagag acctcaatcg ccattggaaa agacccagtg gaagtcgcag aggcgcctgg    1740
ctttgttgta aatcgcattc tgatcccgat gattaacgaa gctgtgggaa tcctggccga    1800
aggaattgca tccgtcgagg atatcgacaa ggcgatgaaa ttaggcgcta atcacccgat    1860
gggtccactg gaactgggcg acttcattgg tctggatatc tgcttagcca ttatggacgt    1920
tctgtattcg gagactgggg atagcaaata ccggcctcat acactgttaa agaaatatgt    1980
gcgtgcagga tggctgggcc gcaaatctgg taagggtttc tacgattatt caaaataagg    2040
atcccatggt acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg    2100
gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg    2160
ccctagacct aggcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac    2220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa    2280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg    2340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa    2400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc    2460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac    2520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac    2580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg    2640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt    2700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga    2760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct    2820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga    2880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg    2940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat ga                       2982
<210>28
<211>5125
<212>DNA
<213>pGV1088
<400>28
aattctaaac taactatacg ctaaggagag tggaacatca tggattttaa cttaacagat     60
attcagcaag acttcctgaa gctggcacac gactttggtg aaaagaaact ggcccctact    120
gttaccgaac gcgaccacaa aggtatctac gataaagaac tgattgacga actgctgtct    180
ctgggtatca ccggcgcata cttcgaagaa aaatacggcg gtagcggtga cgacggtggc    240
gatgtactgt cttatatcct ggccgtagaa gaactggcga aatacgacgc tggtgttgct    300
atcactctgt ctgccaccgt aagcctgtgt gcgaatccga tttggcagtt tggtactgag    360
gctcagaaag aaaagtttct ggttccactg gtcgaaggta ctaaactggg tgcgtttggt    420
ctgaccgaac cgaacgcggg cactgatgcg agcggccagc aaactattgc tactaaaaac    480
gatgacggca cgtacaccct gaacggtagc aaaatcttca tcaccaacgg tggcgctgcc    540
gatatctaca tcgtatttgc gatgaccgac aaaagcaagg gtaaccatgg catcaccgcg    600
ttcatcctgg aagatggcac tccgggtttc acctacggca aaaaggaaga taaaatgggt    660
atccacacct ctcagactat ggaactggtt ttccaggacg ttaaggtccc ggccgagaac    720
atgctgggcg aagaaggcaa aggcttcaag attgcaatga tgaccctgga cggcggtcgc    780
attggcgttg cggcccaggc actgggcatc gcagaggcag cgctggccga cgctgttgaa    840
tacagcaaac agcgtgttca gtttggcaaa cctctgtgca aattccaatc cattagcttt    900
aagctggccg atatgaaaat gcagatcgaa gccgcacgca acctggtata taaagctgca    960
tgcaagaaac aagaaggtaa accgttcacc gtagacgctg cgatcgcgaa acgtgtagcc   1020
agcgatgtgg caatgcgcgt gactaccgaa gcagttcaga ttttcggtgg ctatggttac   1080
tctgaagaat acccggtggc tcgccacatg cgcgacgcaa aaatcactca gatctacgag   1140
ggtacgaacg aagtgcagct gatggtcacc ggcggtgctc tgttaagtta attaaagttt   1200
atgctcggcc tgccctttgc tgggcccgtt acataaaaaa agattttagg aggcaaaacg   1260
taaatggaaa tattggtatg tgtcaaacaa gtgccggata ctgcagaagt caaaattgat   1320
ccggttaaac acaccgtgat tcgtgcgggt gtgccgaata tcttcaaccc gttcgaccaa   1380
aacgcgctgg aagcggcgct ggcgctgaag gacgcggata aagacgttaa gattactctg   1440
ctgtctatgg gcccggacca ggcaaaagat gttctgcgtg aaggcctggc catgggcgct   1500
gatgacgcgt acctgctgtc cgatcgtaaa ctgggtggct ccgacactct ggccaccggt   1560
tatgctctgg cccaggctat taagaaactg gctgcggaca agggtattga gcaattcgac   1620
atcatcctgt gtggtaagca agcgattgac ggtgataccg ctcaggtagg tccacagatc   1680
gcttgtgagc tgggcatccc gcagatcact tatgctcgtg acatcaaggt tgagggcgat   1740
aaggttactg tgcagcagga aaacgaagag ggttacatcg tgaccgaagc gcagttcccg   1800
gttctgatca ccgcggttaa agacctgaac gaacctcgtt tcccgaccat ccgtggcacc   1860
atgaaggcga agcgtcgtga aatcccgaac ctggacgcag ctgcagttgc cgcggacgac    1920
gcgcagatcg gcctgtccgg ttctccgacc aaagtacgca aaattttcac cccaccgcag    1980
cgttccggcg gtctggtact gaaagtggaa gacgacaacg aacaggccat tgtcgaccag    2040
gttatggaaa aactggttgc ccagaaaatc atttaatcta aggaggaaca gtgaaaatgg    2100
atttagcaga atacaaaggc atctacgtga tcgcagagca gttcgaaggt aaactgcgtg    2160
acgtttcttt cgaactgctg ggtcaagcgc gcatcctggc ggacacgatc ggcgacgaag    2220
taggcgcaat cctgattggc aaagatgtaa aaccactggc gcaggaactg atcgcgcatg    2280
gtgctcataa agtgtacgtc tatgacgacc cgcagctgga acattacaac acgactgcct    2340
atgccaaagt gatttgcgac ttctttcatg aagagaaacc aaacgttttc ctggttggtg    2400
caactaacat cggtcgtgac ctgggtccac gtgtagcgaa cagcctgaaa accggtctga    2460
ctgcggattg tacccagctg ggtgttgatg atgataagaa aaccatcgtt tggacccgtc    2520
cggcactggg cggcaacatc atggcggaaa ttatctgtcc agataaccgc ccgcagatgg    2580
gcactgtgcg tcctcatgtc ttcaaaaagc cggaagccga cccgagcgca actggtgaag    2640
tcattgaaaa gaaagcgaac ctgtctgacg ctgatttcat gactaagttc gtagaactga    2700
tcaaactggg tggtgaaggc gttaaaatcg aggatgccga tgttattgtt gctggtggcc    2760
gtggcatgaa tagcgaagag ccttttaaaa ccggtatcct gaaagagtgc gcggacgtac    2820
tgggcggtgc tgtcggtgcc agccgtgccg ccgtggacgc gggctggatc gacgctctgc    2880
accaggtcgg ccagactggc aaaaccgttg gtccgaaaat ctacattgct tgtgcgatta    2940
gcggtgctat ccagccgctg gcaggcatga cgggctctga ttgtattatc gcaattaaca    3000
aagatgaaga cgcgcctatt ttcaaggtgt gcgactatgg cattgtgggc gatgtgttca    3060
aagtgctgcc actgctgact gaggcgatca agaaacagaa aggcattgca taaggatccc    3120
atggtacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt    3180
tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgcccta    3240
gacctaggcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta    3300
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc    3360
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag    3420
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac    3480
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc    3540
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt    3600
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc    3660
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga    3720
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta    3780
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta    3840
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga    3900
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg    3960
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag    4020
tggaacgaaa actcacgtta agggattttg gtcatgacta gtgcttggat tctcaccaat    4080
aaaaaacgcc cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctgaggtcat    4140
tactggatct atcaacagga gtccaagcga gctcgatatc aaattacgcc ccgccctgcc    4200
actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga    4260
cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt    4320
tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac    4380
tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag    4440
ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact    4500
gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga    4560
aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca    4620
tacgaaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa    4680
acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct    4740
ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt    4800
gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc    4860
ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa    4920
agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccagatatcg acgtctaaga    4980
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct    5040
tcacctcgag aaatgtgagc ggataacaat tgacattgtg agcggataac aagatactga    5100
gcacatcagc aggacgcact gaccg                                          5125
<210>29
<211>2836
<212>DNA
<213>pGV1094
<400>29
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcctatc    1080
tatttttgaa gccttcaatt tttcttttct ctatgaaagc tgtcattgca tccttttgat    1140
cctctgttga aaagcattct ccaaatgctt ctgattcaaa tgctaaagca gtatcaatat    1200
cacactgcat tcctctatta atagcctgtt tgcttaactt aacagctact ggagcattgc    1260
tcacaatttt gtttgcaatt tcttttgctg tattcattaa ttcactaggt tctactacct    1320
tatttacaag tccgattctt aatgcttcat ctgcctttat attttgtgca gtaaatataa    1380
gctgctttgc catgcccatt ccaactaatc ttgaaagtct ttgtgtacca ccaaaaccag    1440
gtgttattcc gagacctact tctggttgac caaatcttgc gttgcttgaa gctattctta    1500
tatcacaaga catagctatt tcgcatccgc ctcctaaagc aaaaccatta acagctgcta    1560
ttacaggctt ttcaagaagt tctaatcttc taaacacttt atttccaagt atcccgaatt    1620
ttctaccttc aatggtattc atttccttca tctcagaaat atctgctcct gctacaaatg    1680
atttttctcc tgctccagtt aaaattactg caagtacttc gctatcattt tcaatttcac    1740
ctataacata atccatttct tttagtgtat cactatttaa cgcatttaat gctttaggtc    1800
tgttaatggt aactacagca actttacctt ccttttcaag gatgacattg tttagttcca    1860
tgactaatcc tcctaaaata ttggatccga tccgatccca tggtacgcgt gctagaggca    1920
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc    1980
ggtgaacgct ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg    2040
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac    2100
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg    2160
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca    2220
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc    2280
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc    2340
ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag    2400
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc    2460
ttatccggta actatcgtct  tgagtccaac ccggtaagacacgacttatc gccactggca    2520
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg    2580
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg    2640
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct    2700
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa    2760
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa    2820
gggattttgg tcatga                                                    2836
<210>30
<211>2018
<212>DNA
<213>pGV1111
<400>30
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac     240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat     300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagaattgtg agcggataac aattgacatt    1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcggatccc    1080
atggtacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt    1140
tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgcccta    1200
gacctagggc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt    1260
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc    1320
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga    1380
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata    1440
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac    1500
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg    1560
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc    1620
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag    1680
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt    1740
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt    1800
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg    1860
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac    1920
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca    1980
gtggaacgaa aactcacgtt aagggatttt ggtcatga                            2018
<210>31
<211>3258
<212>DNA
<213>pGV1113
<400>31
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac     240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat     300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acaattgaca    1020
ttgtgagcgg ataacaagat actgagcaca tcagcaggac gcactgaccg aattcattaa    1080
agaggagaaa ggtaccatgg ccatgttcac cactaccgcc aaggttattc agccgaaaat    1140
ccgtggtttt atctgtacga ccacccaccc gattggctgt gaaaaacgcg tgcaggaaga    1200
aattgcttac gcacgtgcac atccaccgac cagcccgggt ccgaaacgtg tcctggtcat    1260
cggctgttcc actggctacg gcctgtctac tcgtatcacc gcagctttcg gctatcaggc    1320
ggctactctg ggcgtgttcc tggctggtcc gccgactaaa ggtcgcccgg ctgcggccgg    1380
ttggtataac accgtagctt tcgaaaaagc ggccctggaa gccggtctgt atgcccgctc    1440
cctgaacggt gacgcttttg actctactac caaagcacgc accgtggaag ctatcaaacg    1500
tgacctgggc accgttgacc tggtggttta tagcattgca gctccgaaac gtaccgatcc    1560
ggctaccggc gtgctgcaca aagcgtgtct gaaaccgatc ggtgcgacct acaccaaccg    1620
tacggtaaat actgacaaag ctgaagttac ggacgtgtcc atcgaaccgg cgagcccaga    1680
agaaattgca gacactgtga aagtaatggg tggcgaagac tgggaactgt ggattcaggc    1740
tctgtctgaa gccggcgttc tggcagaagg cgcgaaaacc gtcgcatact cttatatcgg    1800
tccggagatg acctggccgg tgtactggtc cggcaccatt ggtgaagcca aaaaggatgt    1860
tgaaaaagcc gctaaacgta ttacccagca gtacggctgt ccggcatacc cggttgtggc    1920
aaaagcactg gtgacgcagg catcctccgc gatcccggtc gtcccgctgt atatttgtct    1980
gctgtaccgt gtaatgaaag aaaaaggcac tcacgaaggt tgcatcgaac aaatggtgcg    2040
tctgctgacc acgaaactgt acccggaaaa cggtgccccg atcgttgatg aagcgggccg    2100
tgttcgtgtg gacgattggg aaatggcaga agacgttcag caagccgtta aagacctgtg    2160
gagccaggtg agcacggcaa acctgaaaga tatttccgac ttcgccggtt accaaaccga    2220
gttcctgcgc ctgtttggtt ttggtatcga tggcgtggac tatgaccagc cggttgacgt    2280
agaggcagac ctgccgagcg cagctcagca gtaaggatcc catggtacgc gtgctagagg    2340
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg    2400
tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc    2460
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    2520
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    2580
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct    2640
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa    2700
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc    2760
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt    2820
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg    2880
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg    2940
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct    3000
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc    3060
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg    3120
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc    3180
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt    3240
aagggatttt ggtcatga                                                  3258
<210>32
<211>3233
<212>DNA
<213>pGV1117
<400>32
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa   1080
gaggagaaag gtaccatgat cattaaaccg aaagttcgtg gcttcatttg taccaccact   1140
catccggttg gctgtgaagc taatgtacgc cgccagatcg cgtataccaa agcaaaaggc    1200
actatcgaaa acggccctaa gaaagtgctg gtgattggtg cgagcaccgg ttacggtctg    1260
gcgtcccgca ttgcagcggc gttcggtagc ggcgccgcga ccctgggtgt tttcttcgaa    1320
aaagcgggct ccgaaactaa aaccgcgacc gcaggttggt acaactctgc cgcgtttgac    1380
aaagccgcca aagaggctgg cctgtatgcg aaatctatta acggtgacgc gttcagcaac    1440
gaatgccgtg ctaaagtgat cgaactgatc aaacaggatc tgggccaaat tgatctggtt    1500
gtttattctc tggcctcccc ggttcgtaaa ctgccggata ccggcgaagt tgtgcgcagc    1560
gctctgaaac ctattggtga agtgtacacc acgaccgcaa ttgatactaa taaggaccag    1620
attatcaccg caaccgtcga gccggccaac gaggaagaga tccagaatac catcactgtg    1680
atgggcggtc aagactggga actgtggatg gcagcactgc gcgacgcagg tgttctggca    1740
gacggtgcaa agagcgtcgc ttactcttac atcggcactg acctgacttg gccgatctac    1800
tggcatggca ccctgggtcg cgcgaaagag gatctggatc gcgcagcggc agcgatccgc    1860
ggtgatctgg ccggtaaggg cggtactgcg cacgttgccg ttctgaaatc cgtggtcacc    1920
caggcatctt ctgcaatccc ggtgatgccg ctgtatattt ctatggcctt taaaatcatg    1980
aaagagaagg gtatccacga aggctgtatg gagcaagtgg accgcatgat gcgtactcgc    2040
ctgtacgcgg cggacatggc actggatgac caggcgcgta tccgtatgga cgattgggaa    2100
ctgcgtgaag atgttcagca gacttgccgt gatctgtggc cgtccattac ctccgaaaac    2160
ctgtgcgagc tgaccgatta cactggttac aaacaggaat ttctgcgtct gttcggtttc    2220
ggtctggaag aagtagacta cgatgcagac gttaacccgg acgttaaatt tgatgttgtc    2280
gaactgtgag gatcccatgg tacgcgtgct agaggcatca aataaaacga aaggctcagt    2340
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga    2400
caaatccgcc gccctagacc taggcgttcg gctgcggcga gcggtatcag ctcactcaaa    2460
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa    2520
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct    2580
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac    2640
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc    2700
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc    2760
tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg    2820
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga    2880
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag    2940
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta    3000
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag    3060
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg    3120
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac    3180
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tga           3233
<210>33
<211>2908
<212>DNA
<213>pGV1154
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgga attcattgat   1080
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggtgcaggt   1140
actatgggtt caggaattgc tcaggcattt gcagctaaag gatttgaagt agtattaaga   1200
gatattaaag atgaatttgt tgatagagga ttagatttta tcaataaaaa tctttctaaa   1260
ttagttaaaa aaggaaagat agaagaagct actaaagttg aaatcttaac tagaatttcc   1320
ggaacagttg accttaatat ggcagctgat tgcgatttag ttatagaagc agctgttgaa   1380
agaatggata ttaaaaagca gatttttgct gacttagaca atatatgcaa gccagaaaca   1440
attcttgcat caaatacatc atcactttca ataacagaag tggcatcagc aactaaaaga   1500
cctgataagg ttataggtat gcatttcttt aatccagctc ctgttatgaa gcttgtagag   1560
gtaataagag gaatagctac atcacaagaa acttttgatg cagttaaaga gacatctata   1620
gcaataggaa aagatcctgt agaagtagca gaagcaccag gatttgttgt aaatagaata   1680
ttaataccaa tgattaatga agcagttggt atattagcag aaggaatagc ttcagtagaa   1740
gacatagata aagctatgaa acttggagct aatcacccaa tgggaccatt agaattaggt   1800
gattttatag gtcttgatat atgtcttgct ataatggatg ttttatactc agaaactgga   1860
gattctaagt atagaccaca tacattactt aagaagtatg taagagcagg atggcttgga   1920
agaaaatcag gaaaaggttt ctacgattat tcaaaataag gatccgatcc catggtacgc   1980
gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat   2040
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc   2100
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa   2160
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt   2220
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa    2280
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt    2340
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg    2400
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc    2460
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc    2520
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta    2580
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct    2640
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc    2700
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa    2760
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa    2820
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa    2880
aactcacgtt aagggatttt ggtcatga                                       2908
<210>34
<211>3278
<212>DNA
<213>pGV1188
<400>34
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaattgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaacaata   1080
aaaaccgtat caaaatttag gaggttagtt agaatgaaag aagttgtaat agctagcgcg   1140
gtgcgtaccg ccattggctc ttatggtaaa agtctgaagg atgttccggc agtcgactta   1200
ggggctacgg cgatcaaaga agccgtaaaa aaggcaggaa ttaaaccaga ggatgtgaat   1260
gaagttatcc tgggcaacgt cctgcaggct ggtttagggc aaaatcctgc gcgccaggcc   1320
tcatttaaag caggactgcc ggtagagatt ccagctatga ctatcaacaa ggtgtgcggc    1380
tccggtctgc ggacagtttc gttagcggcc caaattatca aagcaggcga cgctgatgtc    1440
attatcgcgg gtgggatgga aaatatgagc cgtgcccctt acctggcaaa caatgcgcgc    1500
tggggatatc gtatgggcaa cgctaaattc gtggacgaaa tgattaccga tggtctgtgg    1560
gatgccttta atgactacca tatgggcatc acggcagaga acattgcgga acgctggaat    1620
atctctcggg aggaacagga tgagttcgct ttagccagtc agaagaaagc agaggaagcg    1680
attaaatcag gtcaatttaa ggacgagatc gtaccggttg tgattaaagg gcgtaaagga    1740
gaaactgtcg ttgatacaga cgaacacccg cgcttcggct ccaccattga gggtctggct    1800
aagctgaaac cagcctttaa aaaggatggg acggtaaccg caggcaacgc gtcgggttta    1860
aatgattgtg ccgcagtgct ggtcatcatg agcgcggaaa aagctaaaga gctgggagtt    1920
aagcctctgg ccaaaattgt gtcttatggc agtgcgggtg tagacccggc tatcatgggg    1980
tacggcccgt tctatgcaac taaagccgcg attgaaaagg ctggttggac agtcgatgaa    2040
ttagacctga tcgagtcaaa cgaagcattt gccgcgcagt ccctggctgt tgcaaaagat    2100
ttaaaattcg atatgaataa ggtgaacgta aatggaggcg ccattgcgct gggtcatcca    2160
atcggggctt cgggagcacg tattctggtt acgttagtgc acgccatgca aaaacgcgac    2220
gcgaaaaagg gcctggctac cctgtgcatc ggtgggggcc agggtactgc aatattgcta    2280
gaaaagtgct agacttaatt aacaataatc gatgggccca aggtacctaa gcttggatcc    2340
catggtacgc gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct    2400
ttcgttttat ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct    2460
agacctaggc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt    2520
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc    2580
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga    2640
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata    2700
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac    2760
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg    2820
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc    2880
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag    2940
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt    3000
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt    3060
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg    3120
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac    3180
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca    3240
gtggaacgaa aactcacgtt aagggatttt ggtcatga                            3278
<210>35
<211>2863
<212>DNA
<213>pGV1189
<400>35
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat     120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct     180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac     240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat     300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagaattgtg agcggataac attgacattg    1020
tgagcggata acaagatact gagcacatca gcaggacgca ctgaccgaat tcagtattaa    1080
ttaacaataa tcgatatatt ttaggaggat tagtcatgga actaaacaat gtcatcctgg    1140
aaaaagaggg caaggtggcg gttgtcacca ttaatcgtcc gaaagcctta aacgcactga    1200
atagcgatac gctgaaagaa atggactatg taatcggtga gattgaaaac gattctgaag    1260
tgttagctgt tatcctgact ggggcgggag agaagagttt tgtcgccggc gcagacattt    1320
cagaaatgaa agagatgaat acaatcgaag gtcgcaaatt cgggattctg ggaaacaagg    1380
tatttcggcg tttagaactg ctggagaaac cagtgatcgc tgcggttaat ggcttcgcct    1440
taggtggcgg ttgcgaaatt gcaatgtcct gtgatatccg cattgcttcg agcaacgcgc    1500
gttttgggca gcctgaggtc ggactgggca tcacaccggg tttcggcggt acgcaacgcc    1560
tgtctcggtt agtggggatg ggaatggcca aacagctgat ttttactgca caaaatatca    1620
aggctgacga agcgctgcgt attggcctgg taaacaaagt tgtggaacca agtgagttaa    1680
tgaatacagc caaagaaatc gcaaacaaga ttgtctcaaa tgcgcctgtt gctgtaaaac    1740
tgtccaaaca ggccattaac cgcggtatgc agtgcgatat cgacaccgca ctggcgttcg    1800
agtcggaagc ttttggggaa tgtttcagca cggaggacca aaaggatgcc atgaccgcat    1860
ttattgaaaa acgtaaaatt gaaggcttca aaaatagata ggataggtac ctaagcttgg    1920
atcccatggt acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg    1980
gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg    2040
ccctagacct agggcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata    2100
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa    2160
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct    2220
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa    2280
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg    2340
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca    2400
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa    2460
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg    2520
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg    2580
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg    2640
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc    2700
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag    2760
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac    2820
gctcagtgga acgaaaactc acgttaaggg attttggtca tga                      2863
<210>36
<211>7813
<212>DNA
<213>pGV1190
<400>36
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac     60
atcagcagga cgcactgacc gaattcacaa taaaaaccgt atcaaaattt aggaggttag    120
ttagaatgaa agaagttgta atagctagcg cggtgcgtac cgccattggc tcttatggta    180
aaagtctgaa ggatgttccg gcagtcgact taggggctac ggcgatcaaa gaagccgtaa    240
aaaaggcagg aattaaacca gaggatgtga atgaagttat cctgggcaac gtcctgcagg    300
ctggtttagg gcaaaatcct gcgcgccagg cctcatttaa agcaggactg ccggtagaga    360
ttccagctat gactatcaac aaggtgtgcg gctccggtct gcggacagtt tcgttagcgg    420
cccaaattat caaagcaggc gacgctgatg tcattatcgc gggtgggatg gaaaatatga    480
gccgtgcccc ttacctggca aacaatgcgc gctggggata tcgtatgggc aacgctaaat    540
tcgtggacga aatgattacc gatggtctgt gggatgcctt taatgactac catatgggca    600
tcacggcaga gaacattgcg gaacgctgga atatctctcg ggaggaacag gatgagttcg    660
ctttagccag tcagaagaaa gcagaggaag cgattaaatc aggtcaattt aaggacgaga    720
tcgtaccggt tgtgattaaa gggcgtaaag gagaaactgt cgttgataca gacgaacacc    780
cgcgcttcgg ctccaccatt gagggtctgg ctaagctgaa accagccttt aaaaaggatg    840
ggacggtaac cgcaggcaac gcgtcgggtt taaatgattg tgccgcagtg ctggtcatca    900
tgagcgcgga aaaagctaaa gagctgggag ttaagcctct ggccaaaatt gtgtcttatg    960
gcagtgcggg tgtagacccg gctatcatgg ggtacggccc gttctatgca actaaagccg   1020
cgattgaaaa ggctggttgg acagtcgatg aattagacct gatcgagtca aacgaagcat   1080
ttgccgcgca gtccctggct gttgcaaaag atttaaaatt cgatatgaat aaggtgaacg   1140
taaatggagg cgccattgcg ctgggtcatc caatcggggc ttcgggagca cgtattctgg   1200
ttacgttagt gcacgccatg caaaaacgcg acgcgaaaaa gggcctggct accctgtgca   1260
tcggtggggg ccagggtact gcaatattgc tagaaaagtg ctagacttaa ttaaatttta   1320
taaaggagtg tatataaatg aaagttacaa atcaaaaaga actaaaacaa aagctaaatg   1380
aattgagaga agcgcaaaag aagtttgcaa cctatactca agagcaagtt gataaaattt   1440
ttaaacaatg tgccatagcc gcagctaaag aaagaataaa cttagctaaa ttagcagtag    1500
aagaaacagg aataggtctt gtagaagata aaattataaa aaatcatttt gcagcagaat    1560
atatatacaa taaatataaa aatgaaaaaa cttgtggcat aatagaccat gacgattctt    1620
taggcataac aaaggttgct gaaccaattg gaattgttgc agccatagtt cctactacta    1680
atccaacttc cacagcaatt ttcaaatcat taatttcttt aaaaacaaga aacgcaatat    1740
tcttttcacc acatccacgt gcaaaaaaat ctacaattgc tgcagcaaaa ttaattttag    1800
atgcagctgt taaagcagga gcacctaaaa atataatagg ctggatagat gagccatcaa    1860
tagaactttc tcaagatttg atgagtgaag ctgatataat attagcaaca ggaggtcctt    1920
caatggttaa agcggcctat tcatctggaa aacctgcaat tggtgttgga gcaggaaata    1980
caccagcaat aatagatgag agtgcagata tagatatggc agtaagctcc ataattttat    2040
caaagactta tgacaatgga gtaatatgcg cttctgaaca atcaatatta gttatgaatt    2100
caatatacga aaaagttaaa gaggaatttg taaaacgagg atcatatata ctcaatcaaa    2160
atgaaatagc taaaataaaa gaaactatgt ttaaaaatgg agctattaat gctgacatag    2220
ttggaaaatc tgcttatata attgctaaaa tggcaggaat tgaagttcct caaactacaa    2280
agatacttat aggcgaagta caatctgttg aaaaaagcga gctgttctca catgaaaaac    2340
tatcaccagt acttgcaatg tataaagtta aggattttga tgaagctcta aaaaaggcac    2400
aaaggctaat agaattaggt ggaagtggac acacgtcatc tttatatata gattcacaaa    2460
acaataagga taaagttaaa gaatttggat tagcaatgaa aacttcaagg acatttatta    2520
acatgccttc ttcacaggga gcaagcggag atttatacaa ttttgcgata gcaccatcat    2580
ttactcttgg atgcggcact tggggaggaa actctgtatc gcaaaatgta gagcctaaac    2640
atttattaaa tattaaaagt gttgctgaaa gaagggaaaa tatgctttgg tttaaagtgc    2700
cacaaaaaat atattttaaa tatggatgtc ttagatttgc attaaaagaa ttaaaagata    2760
tgaataagaa aagagccttt atagtaacag ataaagatct ttttaaactt ggatatgtta    2820
ataaaataac aaaggtacta gatgagatag atattaaata cagtatattt acagatatta    2880
aatctgatcc aactattgat tcagtaaaaa aaggtgctaa agaaatgctt aactttgaac    2940
ctgatactat aatctctatt ggtggtggat cgccaatgga tgcagcaaag gttatgcact    3000
tgttatatga atatccagaa gcagaaattg aaaatctagc tataaacttt atggatataa    3060
gaaagagaat atgcaatttc cctaaattag gtacaaaggc gatttcagta gctattccta    3120
caactgctgg taccggttca gaggcaacac cttttgcagt tataactaat gatgaaacag    3180
gaatgaaata ccctttaact tcttatgaat tgaccccaaa catggcaata atagatactg    3240
aattaatgtt aaatatgcct agaaaattaa cagcagcaac tggaatagat gcattagttc    3300
atgctataga agcatatgtt tcggttatgg ctacggatta tactgatgaa ttagccttaa    3360
gagcaataaa aatgatattt aaatatttgc ctagagccta taaaaatggg actaacgaca    3420
ttgaagcaag agaaaaaatg gcacatgcct ctaatattgc ggggatggca tttgcaaatg    3480
ctttcttagg tgtatgccat tcaatggctc ataaacttgg ggcaatgcat cacgttccac    3540
atggaattgc ttgtgctgta ttaatagaag aagttattaa atataacgct acagactgtc    3600
caacaaagca aacagcattc cctcaatata aatctcctaa tgctaagaga aaatatgctg    3660
aaattgcaga gtatttgaat ttaaagggta ctagcgatac cgaaaaggta acagccttaa    3720
tagaagctat ttcaaagtta aagatagatt tgagtattcc acaaaatata agtgccgctg    3780
gaataaataa aaaagatttt tataatacgc tagataaaat gtcagagctt gcttttgatg    3840
accaatgtac aacagctaat cctaggtatc cacttataag tgaacttaag gatatctata    3900
taaaatcatt ttaaatcgat atattttagg aggattagtc atggaactaa acaatgtcat    3960
cctggaaaaa gagggcaagg tggcggttgt caccattaat cgtccgaaag ccttaaacgc    4020
actgaatagc gatacgctga aagaaatgga ctatgtaatc ggtgagattg aaaacgattc    4080
tgaagtgtta gctgttatcc tgactggggc gggagagaag agttttgtcg ccggcgcaga    4140
catttcagaa atgaaagaga tgaatacaat cgaaggtcgc aaattcggga ttctgggaaa    4200
caaggtattt cggcgtttag aactgctgga gaaaccagtg atcgctgcgg ttaatggctt    4260
cgccttaggt ggcggttgcg aaattgcaat gtcctgtgat atccgcattg cttcgagcaa    4320
cgcgcgtttt gggcagcctg aggtcggact gggcatcaca ccgggtttcg gcggtacgca    4380
acgcctgtct cggttagtgg ggatgggaat ggccaaacag ctgattttta ctgcacaaaa    4440
tatcaaggct gacgaagcgc tgcgtattgg cctggtaaac aaagttgtgg aaccaagtga    4500
gttaatgaat acagccaaag aaatcgcaaa caagattgtc tcaaatgcgc ctgttgctgt    4560
aaaactgtcc aaacaggcca ttaaccgcgg tatgcagtgc gatatcgaca ccgcactggc    4620
gttcgagtcg gaagcttttg gggaatgttt cagcacggag gaccaaaagg atgccatgac    4680
cgcatttatt gaaaaacgta aaattgaagg cttcaaaaat agataggata ggtaccaaga    4740
attatttaaa gcttattatg ccaaaatact tatatagtat tttggtgtaa atgcattgat    4800
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggcgcggga    4860
accatgggta gcggtattgc ccaggcattt gctgcaaaag gtttcgaagt ggttctgcgt    4920
gatatcaagg acgagtttgt cgatcgcggc ttagacttca ttaataaaaa cctgtctaaa    4980
ctggtaaaga aagggaaaat cgaagaggcg acgaaggtgg aaattttaac tcggatcagt    5040
ggaacagttg atctgaatat ggccgctgac tgcgatctgg tcattgaagc ggccgtagag    5100
cgtatggata tcaaaaaaca aatttttgca gacttagata acatctgtaa gccggaaacc    5160
attctggctt caaatacgtc ctcgctgagc atcactgagg tggcgtctgc cacaaaacgc    5220
ccagacaaag ttattggcat gcatttcttt aaccctgcac cggtcatgaa gttagtggaa    5280
gtaatccgtg ggattgctac cagtcaggaa acgttcgatg cggttaaaga gacctcaatc    5340
gccattggaa aagacccagt ggaagtcgca gaggcgcctg gctttgttgt aaatcgcatt    5400
ctgatcccga tgattaacga agctgtggga atcctggccg aaggaattgc atccgtcgag    5460
gatatcgaca aggcgatgaa attaggcgct aatcacccga tgggtccact ggaactgggc    5520
gacttcattg gtctggatat ctgcttagcc attatggacg ttctgtattc ggagactggg    5580
gatagcaaat accggcctca tacactgtta aagaaatatg tgcgtgcagg atggctgggc    5640
cgcaaatctg gtaagggttt ctacgattat tcaaaataag gatcccatgg tacgcgtgct    5700
agaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt    5760
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gccctagacc taggggatat    5820
attccgcttc ctcgctcact gactcgctac gctcggtcgt tcgactgcgg cgagcggaaa    5880
tggcttacga acggggcgga gatttcctgg aagatgccag gaagatactt aacagggaag    5940
tgagagggcc gcggcaaagc cgtttttcca taggctccgc ccccctgaca agcatcacga    6000
aatctgacgc tcaaatcagt ggtggcgaaa cccgacagga ctataaagat accaggcgtt    6060
tccccctggc ggctccctcg tgcgctctcc tgttcctgcc tttcggttta ccggtgtcat    6120
tccgctgtta tggccgcgtt tgtctcattc cacgcctgac actcagttcc gggtaggcag    6180
ttcgctccaa gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat    6240
ccggtaacta tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag    6300
ccactggtaa ttgatttaga ggagttagtc ttgaagtcat gcgccggtta aggctaaact    6360
gaaaggacaa gttttggtga ctgcgctcct ccaagccagt tacctcggtt caaagagttg    6420
gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa    6480
gagattacgc gcagaccaaa acgatctcaa gaagatcatc ttattaatca gataaaatat    6540
ttctagattt cagtgcaatt tatctcttca aatgtagcac ctgaagtcag ccccatacga    6600
tataagttgt tactagtgct tggattctca ccaataaaaa acgcccggcg gcaaccgagc    6660
gttctgaaca aatccagatg gagttctgag gtcattactg gatctatcaa caggagtcca    6720
agcgagctcg taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc    6780
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac    6840
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc    6900
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg    6960
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag    7020
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc    7080
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac    7140
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag    7200
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac    7260
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg    7320
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc    7380
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact    7440
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg    7500
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa    7560
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt    7620
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg    7680
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga    7740
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc    7800
ctttcgtctt cac                                                       7813
<210>37
<211>7814
<212>DNA
<213>pGV1191
<400>37
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac     60
atcagcagga cgcactgacc gaattcacaa taaaaaccgt atcaaaattt aggaggttag    120
ttagaatgaa agaagttgta atagctagcg cggtgcgtac cgccattggc tcttatggta    180
aaagtctgaa ggatgttccg gcagtcgact taggggctac ggcgatcaaa gaagccgtaa    240
aaaaggcagg aattaaacca gaggatgtga atgaagttat cctgggcaac gtcctgcagg    300
ctggtttagg gcaaaatcct gcgcgccagg cctcatttaa agcaggactg ccggtagaga    360
ttccagctat gactatcaac aaggtgtgcg gctccggtct gcggacagtt tcgttagcgg    420
cccaaattat caaagcaggc gacgctgatg tcattatcgc gggtgggatg gaaaatatga    480
gccgtgcccc ttacctggca aacaatgcgc gctggggata tcgtatgggc aacgctaaat    540
tcgtggacga aatgattacc gatggtctgt gggatgcctt taatgactac catatgggca    600
tcacggcaga gaacattgcg gaacgctgga atatctctcg ggaggaacag gatgagttcg    660
ctttagccag tcagaagaaa gcagaggaag cgattaaatc aggtcaattt aaggacgaga    720
tcgtaccggt tgtgattaaa gggcgtaaag gagaaactgt cgttgataca gacgaacacc    780
cgcgcttcgg ctccaccatt gagggtctgg ctaagctgaa accagccttt aaaaaggatg    840
ggacggtaac cgcaggcaac gcgtcgggtt taaatgattg tgccgcagtg ctggtcatca    900
tgagcgcgga aaaagctaaa gagctgggag ttaagcctct ggccaaaatt gtgtcttatg    960
gcagtgcggg tgtagacccg gctatcatgg ggtacggccc gttctatgca actaaagccg   1020
cgattgaaaa ggctggttgg acagtcgatg aattagacct gatcgagtca aacgaagcat   1080
ttgccgcgca gtccctggct gttgcaaaag atttaaaatt cgatatgaat aaggtgaacg   1140
taaatggagg cgccattgcg ctgggtcatc caatcggggc ttcgggagca cgtattctgg   1200
ttacgttagt gcacgccatg caaaaacgcg acgcgaaaaa gggcctggct accctgtgca   1260
tcggtggggg ccagggtact gcaatattgc tagaaaagtg ctagacttaa ttaaaatttt   1320
ataaaggagt gtatataaat gaaagttaca aatcaaaaag aactgaaaca gaagttaaat   1380
gagctgcgtg aggcgcaaaa aaaatttgcc acctatacgc aggaacaagt ggataagatt   1440
ttcaaacagt gcgcaatcgc tgcggccaaa gaacgcatta acctggcaaa gttagctgtt   1500
gaagagactg gcatcggtct ggtcgaggac aaaattatca aaaatcattt tgcggccgag   1560
tacatttata acaagtacaa aaacgagaaa acctgtggga tcattgacca cgatgatagc   1620
ctgggaatca caaaggtagc agaaccgatt ggcatcgtgg ctgcgattgt tccaacgact   1680
aatcctacat ctaccgccat cttcaaaagt ttaatttcac tgaaaacgcg gaatgcaatc   1740
tttttctccc cgcatccacg tgctaagaaa tcgaccattg cggccgcaaa actgatttta   1800
gacgcggctg tcaaggccgg tgcacctaaa aacatcattg ggtggatcga cgaaccgagc   1860
attgaactgt ctcaggatct gatgagtgag gcggacatca ttttagctac tggaggcccg   1920
tcaatggtaa aagccgcata ttcctcgggt aagccagcga tcggcgtggg tgctgggaat   1980
actcctgcca ttatcgacga aagcgcagac attgatatgg cggtttctag tatcattctg   2040
tcaaaaacgt acgacaacgg agtcatctgc gcctccgaac agtcgattct ggtgatgaat   2100
agcatctatg agaaagtaaa ggaagagttt gttaaacgcg gctcttacat tctgaaccag   2160
aatgaaattg caaaaatcaa ggaaaccatg ttcaaaaacg gtgcgattaa tgctgatatc   2220
gtgggcaaaa gtgcctatat tatcgcgaag atggctggta ttgaggtccc gcaaactaca   2280
aaaatcttaa ttggggaagt tcagtcagta gaaaaatccg agctgtttag ccacgaaaag   2340
ctgtcgccgg tgttagcaat gtataaagtc aaagatttcg acgaggccct gaagaaagcg   2400
cagcgtctga tcgaattagg aggctctggt cataccagtt cactgtacat tgatagccaa    2460
aacaataaag acaaggttaa agaatttggg ctggctatga aaacgtcccg cacctttatc    2520
aacatgccat cgtctcaggg cgcaagtggt gatttatata atttcgccat tgcgcctagc    2580
tttactctgg gatgtggcac atggggtggg aactcagtgt cccaaaatgt agagccgaag    2640
catctgctga acatcaaatc ggtcgctgaa cggcgtgaga atatgttatg gttcaaagtt    2700
ccacagaaga tttactttaa atatggctgc ctgcgcttcg cactgaaaga attaaaggat    2760
atgaacaaaa aacgtgcctt tatcgtgacg gacaaggatc tgttcaaact gggttacgta    2820
aataaaatta ccaaggtttt agacgaaatt gatatcaaat attctatttt tactgacatc    2880
aaaagcgatc cgacaattga tagtgtgaag aaaggagcga aagagatgct gaacttcgaa    2940
cctgacacga tcatttcaat cggcggtggg tccccgatgg atgctgcaaa ggtcatgcat    3000
ctgttatacg agtatccaga agccgaaatt gagaatctgg cgatcaactt tatggacatt    3060
cgcaaacgga tctgtaattt tccgaaactg ggaaccaagg ctattagcgt tgcaatccct    3120
actacggccg gcaccggttc ggaagcgaca ccgttcgctg tgattaccaa cgatgagact    3180
gggatgaaat atccactgac atcttacgaa ttaacgccga atatggcaat cattgatacc    3240
gaactgatgc tgaacatgcc tcgtaaatta actgccgcga cgggcattga cgcactggta    3300
cacgccatcg aggcgtatgt cagtgttatg gcaaccgatt acacagacga actggcgtta    3360
cgcgctatta agatgatctt taaatatctg ccacgtgcct acaaaaatgg tactaacgat    3420
attgaagcgc gcgagaagat ggctcatgca tcaaatatcg ccggaatggc gttcgctaac    3480
gcatttctgg gcgtgtgcca cagcatggcc cataaattag gtgcgatgca ccatgtaccg    3540
catgggattg cttgtgcagt cctgatcgaa gaggttatta aatataatgc cacggactgc    3600
cctaccaagc agacagcgtt cccgcaatac aaatccccaa acgctaaacg gaagtatgca    3660
gaaatcgccg aatatctgaa tctgaaaggc acttcggata cggagaaagt gaccgcgtta    3720
attgaagcta tctctaagct gaaaattgat ctgagtatcc cgcagaacat ttcagcagcc    3780
ggtattaata aaaaggactt ttacaacacc ttagataaaa tgagcgagct ggcgttcgac    3840
gatcaatgta caactgctaa tcctcgttat ccgctgatct ccgaattaaa agatatctat    3900
ataaaatcat tttaaatcga tatattttag gaggattagt catggaacta aacaatgtca    3960
tcctggaaaa agagggcaag gtggcggttg tcaccattaa tcgtccgaaa gccttaaacg    4020
cactgaatag cgatacgctg aaagaaatgg actatgtaat cggtgagatt gaaaacgatt    4080
ctgaagtgtt agctgttatc ctgactgggg cgggagagaa gagttttgtc gccggcgcag    4140
acatttcaga aatgaaagag atgaatacaa tcgaaggtcg caaattcggg attctgggaa    4200
acaaggtatt tcggcgttta gaactgctgg agaaaccagt gatcgctgcg gttaatggct    4260
tcgccttagg tggcggttgc gaaattgcaa tgtcctgtga tatccgcatt gcttcgagca    4320
acgcgcgttt tgggcagcct gaggtcggac tgggcatcac accgggtttc ggcggtacgc    4380
aacgcctgtc tcggttagtg gggatgggaa tggccaaaca gctgattttt actgcacaaa    4440
atatcaaggc tgacgaagcg ctgcgtattg gcctggtaaa caaagttgtg gaaccaagtg    4500
agttaatgaa tacagccaaa gaaatcgcaa acaagattgt ctcaaatgcg cctgttgctg    4560
taaaactgtc caaacaggcc attaaccgcg gtatgcagtg cgatatcgac accgcactgg    4620
cgttcgagtc ggaagctttt ggggaatgtt tcagcacgga ggaccaaaag gatgccatga    4680
ccgcatttat tgaaaaacgt aaaattgaag gcttcaaaaa tagataggat aggtaccaag    4740
aattatttaa agcttattat gccaaaatac ttatatagta ttttggtgta aatgcattga    4800
tagtttcttt aaatttaggg aggtctgttt aatgaaaaag gtatgtgtta taggcgcggg    4860
aaccatgggt agcggtattg cccaggcatt tgctgcaaaa ggtttcgaag tggttctgcg    4920
tgatatcaag gacgagtttg tcgatcgcgg cttagacttc attaataaaa acctgtctaa    4980
actggtaaag aaagggaaaa tcgaagaggc gacgaaggtg gaaattttaa ctcggatcag    5040
tggaacagtt gatctgaata tggccgctga ctgcgatctg gtcattgaag cggccgtaga    5100
gcgtatggat atcaaaaaac aaatttttgc agacttagat aacatctgta agccggaaac    5160
cattctggct tcaaatacgt cctcgctgag catcactgag gtggcgtctg ccacaaaacg    5220
cccagacaaa gttattggca tgcatttctt taaccctgca ccggtcatga agttagtgga    5280
agtaatccgt gggattgcta ccagtcagga aacgttcgat gcggttaaag agacctcaat    5340
cgccattgga aaagacccag tggaagtcgc agaggcgcct ggctttgttg taaatcgcat    5400
tctgatcccg atgattaacg aagctgtggg aatcctggcc gaaggaattg catccgtcga    5460
ggatatcgac aaggcgatga aattaggcgc taatcacccg atgggtccac tggaactggg    5520
cgacttcatt ggtctggata tctgcttagc cattatggac gttctgtatt cggagactgg    5580
ggatagcaaa taccggcctc atacactgtt aaagaaatat gtgcgtgcag gatggctggg    5640
ccgcaaatct ggtaagggtt tctacgatta ttcaaaataa ggatcccatg gtacgcgtgc    5700
tagaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt    5760
tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc cgccctagac ctaggggata    5820
tattccgctt cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa    5880
atggcttacg aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa    5940
gtgagagggc cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg    6000
aaatctgacg ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt    6060
ttccccctgg cggctccctc gtgcgctctc ctgttcctgc ctttcggttt accggtgtca    6120
ttccgctgtt atggccgcgt ttgtctcatt ccacgcctga cactcagttc cgggtaggca    6180
gttcgctcca agctggactg tatgcacgaa ccccccgttc agtccgaccg ctgcgcctta    6240
tccggtaact atcgtcttga gtccaacccg gaaagacatg caaaagcacc actggcagca    6300
gccactggta attgatttag aggagttagt cttgaagtca tgcgccggtt aaggctaaac    6360
tgaaaggaca agttttggtg actgcgctcc tccaagccag ttacctcggt tcaaagagtt    6420
ggtagctcag agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt tttcagagca    6480
agagattacg cgcagaccaa aacgatctca agaagatcat cttattaatc agataaaata    6540
tttctagatt tcagtgcaat ttatctcttc aaatgtagca cctgaagtca gccccatacg    6600
atataagttg ttactagtgc ttggattctc accaataaaa aacgcccggc ggcaaccgag    6660
cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc    6720
aagcgagctc gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct    6780
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta    6840
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct    6900
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg    6960
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa    7020
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt    7080
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta    7140
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca    7200
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta    7260
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct    7320
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg    7380
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac    7440
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact    7500
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa    7560
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt    7620
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat    7680
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg    7740
acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc    7800
cctttcgtct tcac                                                      7814
<210>38
<211>3126
<212>DNA
<213>pGV1248
<400>38
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaggagga   1080
atttaaaatg aagatcgttt tagtcttata tgatgctggt aaacacgctg ccgatgaaga    1140
aaaattatac ggttgtactg aaaacaaatt aggtattgcc aattggttga aagatcaagg    1200
acatgaatta atcaccacgt ctgataaaga aggcggaaac agtgtgttgg atcaacatat    1260
accagatgcc gatattatca ttacaactcc tttccatcct gcttatatca ctaaggaaag    1320
aatcgacaag gctaaaaaat tgaaattagt tgttgtcgct ggtgtcggtt ctgatcatat    1380
tgatttggat tatatcaacc aaaccggtaa gaaaatctcc gttttggaag ttaccggttc    1440
taatgttgtc tctgttgcag aacacgttgt catgaccatg cttgtcttgg ttagaaattt    1500
tgttccagct cacgaacaaa tcattaacca cgattgggag gttgctgcta tcgctaagga    1560
tgcttacgat atcgaaggta aaactatcgc caccattggt gccggtagaa ttggttacag    1620
agtcttggaa agattagtcc cattcaatcc taaagaatta ttatactacg attatcaagc    1680
tttaccaaaa gatgctgaag aaaaagttgg tgctagaagg gttgaaaata ttgaagaatt    1740
ggttgcccaa gctgatatag ttacagttaa tgctccatta cacgctggta caaaaggttt    1800
aattaacaag gaattattgt ctaaattcaa gaaaggtgct tggttagtca atactgcaag    1860
aggtgccatt tgtgttgccg aagatgttgc tgcagcttta gaatctggtc aattaagagg    1920
ttatggtggt gatgtttggt tcccacaacc agctccaaaa gatcacccat ggagagatat    1980
gagaaacaaa tatggtgctg gtaacgccat gactcctcat tactctggta ctactttaga    2040
tgctcaaact agatacgctc aaggtactaa aaatatcttg gagtcattct ttactggtaa    2100
gtttgattac agaccacaag atatcatctt attaaacggt gaatacgtta ccaaagctta    2160
cggtaaacac gataagaaat aaggatccca tggtacgcgt gctagaggca tcaaataaaa    2220
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct    2280
ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg cgagcggtat    2340
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga    2400
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt    2460
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt    2520
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc    2580
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa    2640
gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct    2700
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta    2760
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg    2820
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc    2880
ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta    2940
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg    3000
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt    3060
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg    3120
tcatga                                                               3126
<210>39
<211>2106
<212>DNA
<213>pGV1252
<400>39
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtacctt aacgatcggt   1140
tggcgcctta ggattcccgg gagatcccca tggtacgcgt gctagaggca tcaaataaaa   1200
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct   1260
ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg cgagcggtat   1320
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga   1380
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt   1440
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt   1500
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc   1560
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa   1620
gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct   1680
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta   1740
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg   1800
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc   1860
ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta   1920
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg   1980
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt   2040
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg   2100
tcatga                                                              2106
<210>40
<211>3311
<212>DNA
<213>pGV1272
<400>40
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaattgt gagcggataa caattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attctgagga   1080
gaagtcgact tggaagcggc cgcttaggat ccttgaggag attggtacca tggccatgtt   1140
caccactacc gccaaggtta ttcagccgaa aatccgtggt tttatctgta cgaccaccca   1200
cccgattggc tgtgaaaaac gcgtgcagga agaaattgct tacgcacgtg cacatccacc   1260
gaccagcccg ggtccgaaac gtgtcctggt catcggctgt tccactggct acggcctgtc   1320
tactcgtatc accgcagctt tcggctatca ggcggctact ctgggcgtgt tcctggctgg   1380
tccgccgact aaaggtcgcc cggctgcggc cggttggtat aacaccgtag ctttcgaaaa   1440
agcggccctg gaagccggtc tgtatgcccg ctccctgaac ggtgacgctt ttgactctac   1500
taccaaagca cgcaccgtgg aagctatcaa acgtgacctg ggcaccgttg acctggtggt   1560
ttatagcatt gcagctccga aacgtaccga tccggctacc ggcgtgctgc acaaagcgtg   1620
tctgaaaccg atcggtgcga cctacaccaa ccgtacggta aatactgaca aagctgaagt   1680
tacggacgtg tccatcgaac cggcgagccc agaagaaatt gcagacactg tgaaagtaat   1740
gggtggcgaa gactgggaac tgtggattca ggctctgtct gaagccggcg ttctggcaga   1800
aggcgcgaaa accgtcgcat actcttatat cggtccggag atgacctggc cggtgtactg   1860
gtccggcacc attggtgaag ccaaaaagga tgttgaaaaa gccgctaaac gtattaccca   1920
gcagtacggc tgtccggcat acccggttgt ggcaaaagca ctggtgacgc aggcatcctc   1980
cgcgatcccg gtcgtcccgc tgtatatttg tctgctgtac cgtgtaatga aagaaaaagg   2040
cactcacgaa ggttgcatcg aacaaatggt gcgtctgctg accacgaaac tgtacccgga    2100
aaacggtgcc ccgatcgttg atgaagcggg ccgtgttcgt gtggacgatt gggaaatggc    2160
agaagacgtt cagcaagccg ttaaagacct gtggagccag gtgagcacgg caaacctgaa    2220
agatatttcc gacttcgccg gttaccaaac cgagttcctg cgcctgtttg gttttggtat    2280
cgatggcgtg gactatgacc agccggttga cgtagaggca gacctgccga gcgcagctca    2340
gcagtaaggc gccttaggat tcccgggaga tcccatggta cgcgtgctag aggcatcaaa    2400
taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga    2460
acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc    2520
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg    2580
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct    2640
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca    2700
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct    2760
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc    2820
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt    2880
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc    2940
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc    3000
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg    3060
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc    3120
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag    3180
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga    3240
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat    3300
tttggtcatg a                                                         3311
<210>41
<211>3620
<212>DNA
<213>pGV1278
<400>41
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac     60
atcagcagga cgcactgacc gaattcatta aagaggagaa aggtaccatg agtactgaaa    120
tcaaaactca ggtcgtggta cttggggcag gccccgcagg ttactccgct gccttccgtt    180
gcgctgattt aggtctggaa accgtaatcg tagaacgtta caacaccctt ggcggtgttt    240
gcctgaacgt cggctgtatc ccttctaaag tactgctgca cgtagcaaaa gttatcgaag    300
aagccaaagc gctggctgaa cacggtatcg tcttcggcga accgaaaacc gatatcgaca    360
agattcgtac ctggaaagag aaagtgatca atcagctgac cggtggtctg gctggtatgg    420
cgaaaggccg caaagtcaaa gtggtcaacg gtctgggtaa attcaccggg gctaacaccc    480
tggaagttga aggtgagaac ggcaaaaccg tgatcaactt cgacaacgcg atcattgcag    540
cgggttctcg cccgatccaa ctgccgttta ttccgcatga agatccgcgt atctgggact    600
ccactgacgc gctggaactg aaagaagtac cagaacgcct gctggtaatg ggtggcggta    660
tcatcggtct ggaaatgggc accgtttacc acgcgctggg ttcacagatt gacgtggttg    720
aaatgttcga ccaggttatc ccggcagctg acaaagacat cgttaaagtc ttcaccaagc     780
gtatcagcaa gaaattcaac ctgatgctgg aaaccaaagt taccgccgtt gaagcgaaag     840
aagacggcat ttatgtgacg atggaaggca aaaaagcacc cgctgaaccg cagcgttacg     900
acgccgtgct ggtagcgatt ggtcgtgtgc cgaacggtaa aaacctcgac gcaggcaaag     960
caggcgtgga agttgacgac cgtggtttca tccgcgttga caaacagctg cgtaccaacg    1020
taccgcacat ctttgctatc ggcgatatcg tcggtcaacc gatgctggca cacaaaggtg    1080
ttcacgaagg tcacgttgcc gctgaagtta tcgccggtaa gaaacactac ttcgatccga    1140
aagttatccc gtccatcgcc tataccgaac cagaagttgc atgggtgggt ctgactgaga    1200
aagaagcgaa agagaaaggc atcagctatg aaaccgccac cttcccgtgg gctgcttctg    1260
gtcgtgctat cgcttccgac tgcgcagacg gtatgaccaa gctgattttc gacaaagaat    1320
ctcaccgtgt gatcggtggt gcgattgtcg gtactaacgg cggcgagctg ctgggtgaaa    1380
tcggcctggc aatcgaaatg ggttgtgatg ctgaagacat cgcactgacc atccacgcgc    1440
acccgactct gcacgagtct gtgggcctgg cggcagaagt gttcgaaggt agcattaccg    1500
acctgccgaa cccgaaagcg aagaagaagt aattggatcc catggtacgc gtgctagagg    1560
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg    1620
tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc    1680
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    1740
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    1800
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct    1860
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa    1920
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc    1980
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt    2040
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg    2100
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg    2160
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct    2220
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc    2280
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg    2340
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc    2400
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt    2460
aagggatttt ggtcatgact agtgcttgga ttctcaccaa taaaaaacgc ccggcggcaa    2520
ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc tatcaacagg    2580
agtccaagcg agctctcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat    2640
agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag    2700
cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc    2760
ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca    2820
tgatattcgg caagcaggca tcgccatggg tcacgacgag atcctcgccg tcgggcatgc    2880
gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat    2940
catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg    3000
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag    3060
ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca    3120
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc    3180
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca    3240
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga    3300
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct    3360
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc    3420
ctcatcctgt ctcttgatca gatcttgatc ccctgcgcca tcagatcctt ggcggcaaga    3480
aagccatcca gtttactttg cagggcttcc caaccttacc agagggcgcc ccagctggca    3540
attccgacgt ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca    3600
cgaggccctt tcgtcttcac                                                3620
<210>42
<211>3620
<212>DNA
<213>pGV1279
<400>42
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac     60
atcagcagga cgcactgacc gaattcatta aagaggagaa aggtaccatg agtactgaaa    120
tcaaaactca ggtcgtggta cttggggcag gccccgcagg ttactccgct gccttccgtt    180
gcgctgattt aggtctggaa accgtaatcg tagaacgtta caacaccctt ggcggtgttt    240
gcctgaacgt cggctgtatc ccttctaaag cactgctgca cgtagcaaaa gttatcgaag    300
aagccaaagc gctggctgaa cacggtatcg tcttcggcga accgaaaacc gatatcgaca    360
agattcgtac ctggaaagag aaagtgatca atcagctgac cggtggtctg gctggtatgg    420
cgaaaggccg caaagtcaaa gtggtcaacg gtctgggtaa attcaccggg gctaacaccc    480
tggaagttga aggtgagaac ggcaaaaccg tgatcaactt cgacaacgcg atcattgcag    540
cgggttctcg cccgatccaa ctgccgttta ttccgcatga agatccgcgt atctgggact    600
ccactgacgc gctggaactg aaagaagtac cagaacgcct gctggtaatg ggtggcggta    660
tcatcggtct ggaaatgggc accgtttacc acgcgctggg ttcacagatt gacgtggttg    720
aaatgttcga ccaggttatc ccggcagctg acaaagacat cgttaaagtc ttcaccaagc    780
gtatcagcaa gaaattcaac ctgatgctgg aaaccaaagt taccgccgtt gaagcgaaag    840
aagacggcat ttatgtgacg atggaaggca aaaaagcacc cgctgaaccg cagcgttacg    900
acgccgtgct ggtagcgatt ggtcgtgtgc cgaacggtaa aaacctcgac gcaggcaaag    960
caggcgtgga agttgacgac cgtggtttca tccgcgttga caaacagctg cgtaccaacg   1020
taccgcacat ctttgctatc ggcgatatcg tcggtcaacc gatgctggca cacaaaggtg   1080
ttcacgaagg tcacgttgcc gctgaagtta tcgccggtaa gaaacactac ttcgatccga   1140
aagttatccc gtccatcgcc tataccgaac cagaagttgc atgggtgggt ctgactgaga   1200
aagaagcgaa agagaaaggc atcagctatg aaaccgccac cttcccgtgg gctgcttctg   1260
gtcgtgctat cgcttccgac tgcgcagacg gtatgaccaa gctgattttc gacaaagaat   1320
ctcaccgtgt gatcggtggt gcgattgtcg gtactaacgg cggcgagctg ctgggtgaaa   1380
tcggcctggc aatcgaaatg ggttgtgatg ctgaagacat cgcactgacc atccacgcgc    1440
acccgactct gcacgagtct gtgggcctgg cggcagaagt gttcgaaggt agcattaccg    1500
acctgccgaa cccgaaagcg aagaagaagt aattggatcc catggtacgc gtgctagagg    1560
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg    1620
tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc    1680
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata    1740
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg    1800
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct    1860
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa    1920
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc    1980
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt    2040
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg    2100
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg    2160
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct    2220
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc    2280
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg    2340
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc    2400
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt    2460
aagggatttt ggtcatgact agtgcttgga ttctcaccaa taaaaaacgc ccggcggcaa    2520
ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc tatcaacagg    2580
agtccaagcg agctctcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat    2640
agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag    2700
cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc    2760
ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca    2820
tgatattcgg caagcaggca tcgccatggg tcacgacgag atcctcgccg tcgggcatgc    2880
gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat    2940
catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg    3000
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag    3060
ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca    3120
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc    3180
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca    3240
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga    3300
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct    3360
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc    3420
ctcatcctgt ctcttgatca gatcttgatc ccctgcgcca tcagatcctt ggcggcaaga    3480
aagccatcca gtttactttg cagggcttcc caaccttacc agagggcgcc ccagctggca    3540
attccgacgt ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca    3600
cgaggccctt tcgtcttcac                                               3620
<210>43
<211>4244
<212>DNA
<213>pGV1281
<400>43
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat   1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa   1080
gaggagaaag gtaccatggc catgttcacc actaccgcca aggttattca gccgaaaatc   1140
cgtggtttta tctgtacgac cacccacccg attggctgtg aaaaacgcgt gcaggaagaa   1200
attgcttacg cacgtgcaca tccaccgacc agcccgggtc cgaaacgtgt cctggtcatc   1260
ggctgttcca ctggctacgg cctgtctact cgtatcaccg cagctttcgg ctatcaggcg   1320
gctactctgg gcgtgttcct ggctggtccg ccgactaaag gtcgcccggc tgcggccggt   1380
tggtataaca ccgtagcttt cgaaaaagcg gccctggaag ccggtctgta tgcccgctcc   1440
ctgaacggtg acgcttttga ctctactacc aaagcacgca ccgtggaagc tatcaaacgt   1500
gacctgggca ccgttgacct ggtggtttat agcattgcag ctccgaaacg taccgatccg   1560
gctaccggcg tgctgcacaa agcgtgtctg aaaccgatcg gtgcgaccta caccaaccgt   1620
acggtaaata ctgacaaagc tgaagttacg gacgtgtcca tcgaaccggc gagcccagaa   1680
gaaattgcag acactgtgaa agtaatgggt ggcgaagact gggaactgtg gattcaggct   1740
ctgtctgaag ccggcgttct ggcagaaggc gcgaaaaccg tcgcatactc ttatatcggt   1800
ccggagatga cctggccggt gtactggtcc ggcaccattg gtgaagccaa aaaggatgtt   1860
gaaaaagccg ctaaacgtat tacccagcag tacggctgtc cggcataccc ggttgtggca   1920
aaagcactgg tgacgcaggc atcctccgcg atcccggtcg tcccgctgta tatttgtctg   1980
ctgtaccgtg taatgaaaga aaaaggcact cacgaaggtt gcatcgaaca aatggtgcgt    2040
ctgctgacca cgaaactgta cccggaaaac ggtgccccga tcgttgatga agcgggccgt    2100
gttcgtgtgg acgattggga aatggcagaa gacgttcagc aagccgttaa agacctgtgg    2160
agccaggtga gcacggcaaa cctgaaagat atttccgact tcgccggtta ccaaaccgag    2220
ttcctgcgcc tgtttggttt tggtatcgat ggcgtggact atgaccagcc ggttgacgta    2280
gaggcagacc tgccgagcgc agctcagcag taaggatcca ggaggaattt aaaatgaaga    2340
tcgttttagt cttatatgat gctggtaaac acgctgccga tgaagaaaaa ttatacggtt    2400
gtactgaaaa caaattaggt attgccaatt ggttgaaaga tcaaggacat gaattaatca    2460
ccacgtctga taaagaaggc ggaaacagtg tgttggatca acatatacca gatgccgata    2520
ttatcattac aactcctttc catcctgctt atatcactaa ggaaagaatc gacaaggcta    2580
aaaaattgaa attagttgtt gtcgctggtg tcggttctga tcatattgat ttggattata    2640
tcaaccaaac cggtaagaaa atctccgttt tggaagttac cggttctaat gttgtctctg    2700
ttgcagaaca cgttgtcatg accatgcttg tcttggttag aaattttgtt ccagctcacg    2760
aacaaatcat taaccacgat tgggaggttg ctgctatcgc taaggatgct tacgatatcg    2820
aaggtaaaac tatcgccacc attggtgccg gtagaattgg ttacagagtc ttggaaagat    2880
tagtcccatt caatcctaaa gaattattat actacgatta tcaagcttta ccaaaagatg    2940
ctgaagaaaa agttggtgct agaagggttg aaaatattga agaattggtt gcccaagctg    3000
atatagttac agttaatgct ccattacacg ctggtacaaa aggtttaatt aacaaggaat    3060
tattgtctaa attcaagaaa ggtgcttggt tagtcaatac tgcaagaggt gccatttgtg    3120
ttgccgaaga tgttgctgca gctttagaat ctggtcaatt aagaggttat ggtggtgatg    3180
tttggttccc acaaccagct ccaaaagatc acccatggag agatatgaga aacaaatatg    3240
gtgctggtaa cgccatgact cctcattact ctggtactac tttagatgct caaactagat    3300
acgctcaagg tactaaaaat atcttggagt cattctttac tggtaagttt gattacagac    3360
cacaagatat catcttatta aacggtgaat acgttaccaa agcttacggt aaacacgata    3420
agaaataacc tagggcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat    3480
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca    3540
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc    3600
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata    3660
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc    3720
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc    3780
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga    3840
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc    3900
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag    3960
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag    4020
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag    4080
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca    4140
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga    4200
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga                     4244
<210>44
<211>1395
<212>DNA
<213>合成的
<400>44
atgaatcgtt ccgcaatcgg cgtctcctct atggtgggta acctggtttt ctctgttatc    60
tccgttaaac gtgagatcac gggccagtct ggtactttcc gtgcccgtcc gccagccatc   120
ggctgcttcc tgtacaacgc acgcgatttc tccgatttcc gcccgtctcc gccgtttcgt   180
caggaagtat ctatgatcat caaacctcgc gttcgtggct tcatctgcgt taccacccac   240
ccagttggct gtgaggcgaa cgttaaagaa cagatcgact acgttacgag ccacggcccg   300
attgcaaacg gtccgaaaaa ggtactggta attggtgcga gcaccggtta cggcctggcc   360
gctcgcatca gcgccgcttt cggtagcggc gcagacactc tgggtgtttt cttcgaacgt   420
gcaggtagcg aaaccaagcc gggcaccgcg ggttggtaca actccgccgc cttcgaaaaa   480
ttcgctgcgg aaaagggcct gtacgctcgt tccatcaatg gcgatgcgtt cagcgacaaa   540
gtaaaacagg tgaccatcga caccattaag caggacctgg gtaaggtgga cctggttgtt   600
tattctctgg ctgcgccacg ccgtacccat ccgaagacgg gtgaaaccat ctccagcacc   660
ctgaagcctg tgggtaaagc ggttactttc cgcggcctgg atacggacaa agaggttatc   720
cgcgaagtat ccctggaacc ggcaacccaa gaagagattg acggcaccgt ggcagttatg   780
ggcggcgagg attggcagat gtggatcgac gctctggatg aggcaggcgt actggccgac   840
ggcgctaaaa ctaccgcttt cacttacctg ggtgaacaga tcacccatga catctattgg   900
aacggcagca ttggcgaagc taaaaaggac ctggacaaga aagtgctgag cattcgcgac   960
aagctggccg cgcacggcgg cgatgctcgc gtaagcgtcc tgaaagcagt cgtgacccaa  1020
gcgtcttctg caatcccgat gatgccgctg tatctgagcc tgctgttcaa agtgatgaag  1080
gagactggca ctcatgaagg ttgtatcgaa caggtgtacg gcctgctgaa agacagcctg  1140
tatggtgcta ctccacacgt agacgaagag ggccgtctgc gtgctgacta taaagaactg  1200
gacccgcagg tacaagataa agtggtagct atgtgggata aagttaccaa cgaaaatctg  1260
tacgaaatga ctgacttcgc gggttacaaa accgaatttc tgcgcctgtt cggctttgaa  1320
atcgcaggtg ttgattatga tgccgacgtt aatcctgatg ttaagattcc gggcattatt  1380
gatactacgg tttga                                                   1395
<210>45
<211>1221
<212>DNA
<213>合成的
<400>45
atgatcgtcc agccgaaagt tcgcggtttt atctgcacta ccgcacaccc agaaggctgc    60
gcgcgtcacg ttggtgagtg gatcaattat gctaagcagg agccttccct gaccggcggt    120
ccgcagaaag tactgattat cggtgcgagc acgggctttg gtctggcgtc tcgtatcgtg    180
gctgccttcg gtgcgggtgc taaaacgatt ggtgtgtttt tcgaacgtcc ggcttctggc    240
aaacgcaccg cgtcccctgg ttggtacaat actgcagcgt tcgagaagac cgctctggcg    300
gctggcctgt acgcgaaatc tatcaacggc gacgcgttca gcgacgaaat taaacagcaa    360
accatcgacc tgatccagaa agattggcag ggcggtgttg acctggtaat ttactctatc   420
gcgagcccgc gtcgcgtaca cccgcgtact ggtgaaatct tcaactctgt cctgaaacct   480
attggtcaga cctaccacaa caaaactgtg gacgtaatga ccggcgaagt ttccccggta   540
tctattgagc cggcaacgga aaaggaaatc cgcgacactg aagcggtaat gggtggcgac   600
gactgggcgc tgtggatcaa cgcgctgttc aaatacaact gcctggccga aggcgtcaaa   660
accgttgcgt tcacctatat tggtccggaa ctgacccacg cggtatatcg taacggcact   720
atcggccgtg cgaaactgca cctggaaaag actgctcgcg aactggatac ccagctggag   780
agcgcgctgt ctggtcaggc tctgatttct gttaacaaag ccctggtgac ccaggcttcc   840
gcagctatcc cggtagttcc gctgtatatc tccctgctgt ataaaatcat gaaagagaaa   900
aacatccacg agggttgcat cgagcagatg tggcgtctgt ttaaggagcg cctgtactct   960
aaccagaaca tccctactga ctccgaaggc cgcatccgta ttgatgactg ggaaatgcgc  1020
gaagacgtac aagcggaaat caaacgtctg tgggaatcca tcaacaccgg taacgttgaa  1080
actgtctctg atatcgctgg ctatcgtgag gacttctata aactgttcgg tttcggtctg  1140
aacggtatcg actacgaacg tggcgttgaa attgaaaagg ctatcccgtc catcactgtt  1200
actcctgaaa acccggaata a                                            1221
<210>46
<211>1179
<212>DNA
<213>合成的
<400>46
atgatcatta aaccgaaggt gcgtggcttt atctgcacta ctgctcatcc ggtcggctgt    60
gcagagaatg ttcaacagca gatcgactac gtagcagccc agaacgcccc gtctagcggc   120
ccgaaaaatg tactggtcat cggttgcagc aacggttacg gtctggcgtc ccgcatcacc   180
agcgcattcg gctttggtgc gaacaccctg ggcgtcatgt tcgaaaaaga accgaccgaa   240
cgccgtccgg catctgccgg ttggtataac acccgtgcgc tggagaaagc ggctcaggaa   300
aaaggtctgt acgcgcaatc tctgaatgtg gatgcgttct ccgatgaagc taaaaccgca   360
gtaatcgagg ctgtgaaagc taacatgggt aaaattgatc tggtcgttta cagcctgggt   420
gcaccgcgtc gtaaagatcc ggaaaccggc actgtctact ccagcacgct gaaacctatt   480
ggcaaagctg tgacccgtaa aaacctgaac actgacaccc gtgaggtagg tgaagtgact   540
ctggaaccag cgaccgaaga agaaattttc aacacggtga aagtaatggg cggtgaagac   600
tgggaacgct ggatgaccgc tctggacgac gctggcgtgc tggcagacgg cgttaaaact   660
accgcgtata cctacattgg taaagagctg acctggccga tctacggcgg tgcgaccatc   720
ggcaaggcta aagaagatct ggatcgcgca tccgttgcta ttaacaagaa actggcagac   780
aaatatcagg gtgttagcta cgtcgcagtg ctgaaagcgc tggtaactca gtcttcttcc   840
gccatcccag taatgccgct gtacatttct gctctgtatc gtgttatgaa ggaagaaggc   900
acgcacgaag gctgcatcga gcagatcacg ggcctgtttt tcgaccagct gttctctgaa   960
aacgccctga acctggatga taccggccgt atccgcatgg aagataacga actgaaagcg  1020
tctgtacagg agaaagttgc tgcgatctgg gaacaggtta acacggaaaa tctggacgag  1080
ctgaccgact tcaaaggtta ccaggaagaa tttttcaaac tgttcggttt cggcttcgaa  1140
ggtgttgatt acgacgcaga cgtagatcca gtggtgtga                         1179
<210>47
<211>1203
<212>DNA
<213>合成的
<400>47
atgattatca aaccgaaaac gcgtggcttt atctgcacta ccacccaccc ggttggttgt    60
gaagccaacg ttctggaaca aatcaacacc actaaagcca aaggcccgat caccaatggt   120
ccaaaaaaag ttctggttat tggcagctcc agcggttacg gtctgtcttc ccgtatcgct   180
gcggcgtttg gttccggtgc agcgaccctg ggtgtattct tcgaaaaacc gggcaccgag   240
aagaaacctg gcaccgctgg ttggtataac agcgctgctt tcgataaatt cgctaaggca   300
gatggcctgt actctaaatc tattaacggt gacgcgttct cccacgaagc caaacagaaa   360
gcgatcgacc tgatcaaagc ggatctgggc caaattgaca tggttgtgta ctctctggct   420
tctccggttc gtaaactgcc ggattccggc gaactgattc gttctagcct gaaaccaatc   480
ggcgaaactt acaccgctac tgctgttgac acgaacaaag acctgatcat tgaaacgagc   540
gttgaaccag cgagcgaaca ggaaatccaa gatactgtaa ccgtaatggg cggtgaagac   600
tgggaactgt ggctggccgc gctgagcgat gctggtgtcc tggcggatgg ctgcaaaacc   660
gttgcgtact cttacattgg tacggaactg acctggccga tctactggca cggcgctctg   720
ggcaaggcaa aaatggacct ggaccgtgcc gcaaaagcgc tggacgaaaa actgagcacg   780
accggtggct ctgcaaatgt ggctgtgctg aaatctgtag tgacccaggc gtcctccgct   840
atcccggtga tgccgctgta catcgccatg gtattcaaaa agatgcgcga agaaggtctg   900
cacgaaggct gcatggaaca gatcaaccgt atgttcgcgg aacgtctgta ccgtgaagat   960
ggtcaggctc cgcaggtcga tgatgcaaat cgtctgcgcc tggacgattg ggaactgcgc  1020
gaggagatcc agcagcactg ccgtgatctg tggccgtctg tgactactga gaacctgagc  1080
gagctgaccg actaccgtga atataaagat gagttcctga aactgttcgg tttcggcgtt  1140
gaaggtgtag attacgacgc cgacgttaac ccggaagtaa acttcgacgt agaacagttc  1200
taa                                                                1203
<210>48
<211>1194
<212>DNA
<213>合成的
<400>48
atgatcgtaa agcctatggt tcgtaacaat atttgcctga acgctcatcc gcagggttgc    60
aagaaaggtg tcgaggatca gattgaatac accaagaaac gtattaccgc tgaagttaaa   120
gcaggtgcta aagcgccgaa aaacgtgctg gttctgggct gttccaacgg ctacggcctg   180
gcgtctcgca tcactgctgc gtttggttat ggtgcggcta ctatcggtgt ttcttttgaa   240
aaagcgggct ccgaaaccaa atatggcacc ccaggttggt acaacaacct ggcgttcgat   300
gaagcggcta aacgcgaggg cctgtactct gtgactatcg acggtgacgc cttcagcgat   360
gaaatcaaag cacaggttat cgaggaagcc aaaaagaaag gcattaagtt tgacctgatt   420
gtgtactctc tggctagccc ggtgcgtacc gatccggata ccggcatcat gcacaaatcc   480
gtcctgaaac cgttcggcaa aactttcacc ggtaaaacgg tagatccgtt cactggtgag   540
ctgaaagaaa tctctgccga gccagctaac gatgaagagg cagctgctac tgtcaaagtc   600
atgggtggtg aagattggga acgttggatc aaacagctgt ctaaagaagg tctgctggag   660
gaaggctgca ttaccctggc atactcctac attggtccag aggccactca ggcgctgtat   720
cgtaaaggta ctatcggtaa agctaaagaa cacctggaag ctacggctca ccgtctgaac   780
aaagaaaacc cgtccatccg tgcattcgtt tccgtcaaca agggcctggt cacccgtgca   840
tccgcagtta tcccggtcat ccctctgtat ctggcttccc tgttcaaggt tatgaaggaa   900
aaaggtaacc atgagggttg tatcgaacag atcacccgtc tgtacgccga acgtctgtac   960
cgcaaggatg gcaccatccc ggttgatgag gaaaaccgca ttcgtatcga cgactgggaa  1020
ctggaagaag atgttcaaaa agctgtgtct gcgctgatgg aaaaagtgac cggcgaaaat  1080
gcggaatccc tgacggacct ggcgggctat cgtcatgact ttctggcgtc caacggtttt  1140
gatgttgagg gcatcaacta tgaagcggaa gtagagcgtt ttgaccgcat ttaa        1194
<210>49
<211>1386
<212>DNA
<213>合成的
<400>49
atgcgtctgc tgttcgaagc agttcacgcg cgtaagcgtt ggcatcgtac tgcgccggct    60
gccgcattca ctcgttttca caccgctgca tgcgtgactc atcaggcagt ttcccgtgct   120
ccacacgccc tgcgttgtcg ccagcacctg gcagatcagg agtccacgct gatcattcac   180
ccgaaagtac gtggtttcat ctgcacgacc actcaccctc tgggttgcga acgtaacgtc   240
ctggaacaga tcgcggctac tcgtgctcgc ggtgttcgta acgatggtcc gaagaaagtt   300
ctggtgatcg gcgcgtctag cggttacggt ctggccagcc gcattaccgc cgcattcggt   360
ttcggtgcgg ataccctggg tgttttcttc gaaaaaccgg gtactgcctc taaagctggc   420
acggcgggtt ggtacaactc cgcagcattc gacaagcacg caaaagcggc tggtctgtac   480
tctaaatcta tcaatggtga tgcgttcagc gatgcggcgc gtgcacaggt gatcgaactg   540
atcaaaactg agatgggtgg tcaagttgac ctggttgttt actctctggc ctccccggta   600
cgtaaactgc cgggctctgg tgaagttaaa cgttctgcgc tgaagccaat cggccagacc   660
tacaccgcaa cggcgatcga caccaacaag gacactatca tccaggcttc cattgaacct   720
gcttctgcgc aggaaatcga ggataccatc accgtgatgg gcggccaaga ctgggaactg   780
tggatcgacg cactggaagg tgcaggcgta ctggcagatg gcgctcgttc tgtagcgttc   840
tcctatatcg gcaccgaaat cacttggccg atctactggc atggcgcact gggcaaagca   900
aaagtggacc tggaccgtac cgctcaacgt ctgaatgccc gtctggcaaa acacggtggt   960
ggcgcaaacg tggcagttct gaagagcgta gtgacccaag cttctgccgc tattccggtt  1020
atgccgctgt acatttccat ggtgtataaa atcatgaaag aaaaaggtct gcatgagggt  1080
actatcgaac agctggatcg cctgtttcgt gaacgtctgt accgccagga cggtcagccg  1140
gcagaagtag atgaagttga tgaacagaac cgtctgcgcc tggacgattg ggaactgcgc  1200
gacgatgtac aggacgcctg caaggctctg tggccgcagg taactactga aaatctgttc  1260
gagctgaccg attacgcggg ctacaaacat gagttcctga aactgtttgg cttcggccgt  1320
accgacgttg attacgatgc ggatgttgca actgacgtgg ctttcgattg tatcgaactg  1380
gcctga                                                             1386
<210>50
<211>1200
<212>DNA
<213>合成的
<400>50
atgatcatta aaccgcgtgt tcgtggcttt atctgtgtta ccgctcatcc gaccggctgc    60
gaagcgaacg tcaaaaagca gatcgactac gttaccactg aaggcccgat cgctaacggc   120
cctaaacgcg ttctggtaat tggcgcttct accggttacg gcctggcggc acgtatcacc   180
gccgcgtttg gttgcggcgc tgacaccctg ggtgtgttct tcgaacgtcc gggtgaagaa   240
ggcaaaccgg gcacttctgg ctggtacaac tccgcagcgt ttcacaaatt tgccgctcag   300
aaaggtctgt acgcaaaatc tatcaacggc gacgctttca gcgacgaaat caaacagctg   360
accattgacg cgatcaaaca ggacctgggc caggtagatc aggtgatcta ctccctggcc   420
tctccgcgtc gcacccaccc taaaaccggt gaagtattca attccgccct gaagccgatc   480
ggtaacgcag taaacctgcg cggcctggat accgacaagg aggtgatcaa agaaagcgtg   540
ctgcagccgg caacccagtc tgaaattgac tccactgttg cggtgatggg tggcgaagat   600
tggcagatgt ggatcgacgc gctgctggat gcaggcgtac tggcagaagg cgctcagact   660
accgcgttca cgtacctggg cgaaaagatc acccatgaca tttattggaa cggttccatt   720
ggcgctgcca aaaaggacct ggatcagaaa gttctggcta tccgtgaatc cctggctgct   780
cacggtggtg gcgatgcacg tgtctccgtg ctgaaagcag tcgtcaccca ggcgtcctcc   840
gcgattccaa tgatgccgct gtatctgagc ctgctgttta aagtcatgaa ggaaaaaggc   900
acccacgagg gctgcattga acaggtgtac tctctgtata aagattctct gtgtggtgat   960
agcccacata tggaccagga aggtcgtctg cgtgctgact ataaagagct ggacccggaa  1020
gtgcagaacc aggttcagca gctgtgggat caagttacta acgacaacat ttaccagctg  1080
acggatttcg taggctacaa atctgagttt ctgaacctgt tcggtttcgg tatcgacggt  1140
gtggactatg atgccgatgt caacccggat gtaaagattc cgaacctgat ccaaggttaa  1200
<210>51
<211>1188
<212>DNA
<213>合成的
<400>51
atggttattt ctcctaaggt tcgcggcttt atttgcacta atgcgcaccc ggttggttgt    60
gcgaaaagcg tggaaaacca gatcgcttac gttaaagcgc agggtctgtc tgctgaggcg   120
gcagatgcac cgaaaaacgt gctggttctg ggctgttcca ccggctatgg tctggcgtct   180
cgtatcactg cgtcctttgg ctatggtgcc aacactgtag gcgtttgttt cgaaaaagct   240
ccgacggaac gcaaaaccgg tactgcgggt tggtataaca cggcggcgtt ccacagcgaa   300
gcaaaagccg caggcgttca ggcccatacc ctgaatggcg acgcattctc caacgaactg   360
aaagcacaga ccatcgaaac cctgaagaac accatcggta aagttgacct ggtggtgtac   420
tctctggcgt ccccgcgtcg taccgacccg gaaactggtg aagtgtataa gagcaccctg   480
aaaccggttg gtcaggcata tgagaccaag acctacgaca ctgacaaaga tctgatccac   540
acggtggctc tggaaccggc ttctcaggat gaaattgata acaccatcaa agtgatgggt   600
ggtgaagact gggaactgtg gatcaaagcg ctggcggaag cggatctgct ggcggagggt   660
gctaaaacca ccgcttacac ctacatcggc aaaaagctga cctggccgat ctacggctcc   720
gccactatcg gcaaagcaaa agaagacctg gatcgcgctg ccaccgcgat caacaccacc   780
tacgcaaacc tgaacgttga tgctcacgta tctagcctga aagccctggt gacccaagcc   840
tcttccgcta tcccggtcat gcctctgtat atcagcctga tttacaaagt tatgaaagaa   900
gagggcactc acgaaggttg tatcgaacag atcgttggtc tgtttactca gtgcctgctg   960
aacgacggcg cgactctgga tgaagttaac cgttatcgta tggatggtaa agaaactaac  1020
gacgccactc aggctaaaat tgaagagctg tggcaccagg tgacccagga caactttcac  1080
gaactgtccg actacgctgg ttataacgct gatttcctga acctgtttgg ttttggcatc  1140
gaaggtgttg attacgaagc ggacgttgat ccgcaggtgt cctggtaa               1188
<210>52
<211>1198
<212>DNA
<213>合成的
<400>52
ggtaccatga ttattgaacc taagatgcgt ggctttattt gtctgacctc ccacccgacg    60
ggttgtgaac agaacgttat caaccagatc aactacgtga aaagcaaagg cgttattaat   120
ggcccgaaga aagttctggt tattggcgca tccactggct tcggcctggc gtctcgtatc   180
acttctgctt tcggtagcaa tgctgcgacg atcggtgtct tcttcgaaaa accggcgcag   240
gagggtaaac cgggctctcc gggctggtat aacaccgtag ctttccagaa tgaggccaaa   300
aaggctggca tttacgctaa aagcatcaac ggtgatgcct tttccactga agtaaagcag   360
aaaaccatcg acctgattaa agctgatctg ggtcaagtgg acctggttat ctacagcctg   420
gcaagccctg ttcgtaccaa cccggtaacc ggtgtaaccc accgctctgt actgaaaccg   480
attggtggtg cgttctctaa caaaactgtt gacttccata ccggcaacgt aagcaccgtt   540
accatcgaac cagcgaacga agaagatgtt accaacaccg tcgctgttat gggtggtgag   600
gattggggca tgtggatgga cgcgatgctg gaagcaggcg ttctggccga aggcgcaact   660
acggttgcat attcctacat cggtccggct ctgaccgaag cggtgtatcg taagggcact   720
atcggccgtg cgaaagacca cctggaggca tctgctgcaa ccattactga taaactgaaa   780
tctgttaaag gtaaagccta cgtgtctgtg aacaaagcgc tggtcaccca ggcttccagc   840
gcaattccgg ttattccgct gtacatctct ctgctgtaca aggttatgaa agcagagggc   900
attcacgaag gttgtatcga acagattcag cgtctgtacg ctgaccgtct gtacacgggc   960
aaagctatcc caacggacga gcagggccgt atccgtatcg acgattggga aatgcgtgaa  1020
gatgtccagg cgaacgttgc agcactgtgg gaacaagtta cttctgaaaa cgtttccgac  1080
atctctgacc tgaaaggtta taagaacgac tttctgaacc tgttcggttt cgcggttaac  1140
aaagttgatt atctggctga cgtgaacgaa aacgttacga tcgaaggtct ggtatgag    1198
<210>53
<211>1203
<212>DNA
<213>合成的
atgatcatta aacctcgtat ccgtggcttt atctgcacca cgactcaccc ggtaggttgc     60
gaagctaacg tcaaagaaca aatcgcatac actaaagctc agggcccgat caaaaacgcc    120
cctaaacgtg ttctggttgt tggtgcctcc tccggttatg gtctgtcttc tcgtatcgcg    180
gcagcgtttg gcggcggtgc ttccaccatc ggcgtgttct tcgaaaagga aggcaccgaa    240
aagaaacctg gtactgctgg cttctacaac gctgcggcgt tcgaaaaact ggcgcgtgaa    300
gagggcctgt acgccaagag cctgaacggc gatgcattct ccaacgaggc gaaacagaaa    360
accattgaac tgatcaaaga agacctgggt caaattgata tggtggttta cagcctggca    420
tccccggtgc gcaaaatgcc ggaaaccggt gaactggtgc gcagcgcact gaaaccgatt    480
ggtgagactt atacctctac cgcggtcgat acgaataagg atgtgatcat tgaagcgagc    540
gttgaaccgg cgaccgaaga ggaaatcaaa gataccgtga ctgtaatggg tggtgaggat    600
tgggaactgt ggatcaatgc gctgagcgat gcaggcgtgc tggctgaagg ttgcaaaact    660
gttgcttata gctacattgg caccgaactg acctggccta tctactggga cggtgcactg    720
ggtaaagcta aaatggatct ggatcgtgca gccaaagcac tgaacgacaa actggcggca    780
accggtggct ctgcgaatgt cgctgttctg aaatccgttg taacccaagc ttcctccgca    840
atcccggtta tgccgctgta tatcgcaatg gtgttcaaga aaatgcgcga agaaggtgta    900
cacgaaggct gcatggaaca gatttaccgt atgttctctc agcgtctgta caaggaagac    960
ggctctgctg ccgaggttga tgaaatgaac cgtctgcgtc tggacgattg ggagctgcgc   1020
gacgacattc agcagcactg ccgtgaactg tggccgcaga ttaccaccga aaatctgaaa   1080
gaactgaccg attacgttga atataaggaa gagttcctga aactgttcgg tttcggtgtt   1140
gagggcgttg attacgaagc agacgtgaac ccggctgtgg aagccgattt catccagatc   1200
taa                                                                 1203
<210>54
<211>3487
<212>DNA
<213>pGV1340
<400>54
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag    1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gaatcgttcc    1140
gcaatcggcg tctcctctat ggtgggtaac ctggttttct ctgttatctc cgttaaacgt    1200
gagatcacgg gccagtctgg tactttccgt gcccgtccgc cagccatcgg ctgcttcctg    1260
tacaacgcac gcgatttctc cgatttccgc ccgtctccgc cgtttcgtca ggaagtatct    1320
atgatcatca aacctcgcgt tcgtggcttc atctgcgtta ccacccaccc agttggctgt    1380
gaggcgaacg ttaaagaaca gatcgactac gttacgagcc acggcccgat tgcaaacggt    1440
ccgaaaaagg tactggtaat tggtgcgagc accggttacg gcctggccgc tcgcatcagc    1500
gccgctttcg gtagcggcgc agacactctg ggtgttttct tcgaacgtgc aggtagcgaa    1560
accaagccgg gcaccgcggg ttggtacaac tccgccgcct tcgaaaaatt cgctgcggaa    1620
aagggcctgt acgctcgttc catcaatggc gatgcgttca gcgacaaagt aaaacaggtg    1680
accatcgaca ccattaagca ggacctgggt aaggtggacc tggttgttta ttctctggct    1740
gcgccacgcc gtacccatcc gaagacgggt gaaaccatct ccagcaccct gaagcctgtg    1800
ggtaaagcgg ttactttccg cggcctggat acggacaaag aggttatccg cgaagtatcc    1860
ctggaaccgg caacccaaga agagattgac ggcaccgtgg cagttatggg cggcgaggat    1920
tggcagatgt ggatcgacgc tctggatgag gcaggcgtac tggccgacgg cgctaaaact    1980
accgctttca cttacctggg tgaacagatc acccatgaca tctattggaa cggcagcatt    2040
ggcgaagcta aaaaggacct ggacaagaaa gtgctgagca ttcgcgacaa gctggccgcg    2100
cacggcggcg atgctcgcgt aagcgtcctg aaagcagtcg tgacccaagc gtcttctgca    2160
atcccgatga tgccgctgta tctgagcctg ctgttcaaag tgatgaagga gactggcact    2220
catgaaggtt gtatcgaaca ggtgtacggc ctgctgaaag acagcctgta tggtgctact    2280
ccacacgtag acgaagaggg ccgtctgcgt gctgactata aagaactgga cccgcaggta    2340
caagataaag tggtagctat gtgggataaa gttaccaacg aaaatctgta cgaaatgact    2400
gacttcgcgg gttacaaaac cgaatttctg cgcctgttcg gctttgaaat cgcaggtgtt    2460
gattatgatg ccgacgttaa tcctgatgtt aagattccgg gcattattga tactacggtt    2520
tgaggcgcct taggattccc gggagatccc atggtacgcg tgctagaggc atcaaataaa    2580
acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc    2640
tctcctgagt aggacaaatc cgccgcccta gacctaggcg ttcggctgcg gcgagcggta    2700
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag    2760
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg    2820
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg    2880
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg    2940
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga    3000
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc    3060
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt    3120
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact    3180
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg    3240
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt    3300
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt    3360
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct    3420
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg    3480
gtcatga                                                              3487
<210>55
<211>3313
<212>DNA
<213>pGV1341
<400>55
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcgtccag   1140
ccgaaagttc gcggttttat ctgcactacc gcacacccag aaggctgcgc gcgtcacgtt   1200
ggtgagtgga tcaattatgc taagcaggag ccttccctga ccggcggtcc gcagaaagta   1260
ctgattatcg gtgcgagcac gggctttggt ctggcgtctc gtatcgtggc tgccttcggt   1320
gcgggtgcta aaacgattgg tgtgtttttc gaacgtccgg cttctggcaa acgcaccgcg   1380
tcccctggtt ggtacaatac tgcagcgttc gagaagaccg ctctggcggc tggcctgtac   1440
gcgaaatcta tcaacggcga cgcgttcagc gacgaaatta aacagcaaac catcgacctg   1500
atccagaaag attggcaggg cggtgttgac ctggtaattt actctatcgc gagcccgcgt    1560
cgcgtacacc cgcgtactgg tgaaatcttc aactctgtcc tgaaacctat tggtcagacc    1620
taccacaaca aaactgtgga cgtaatgacc ggcgaagttt ccccggtatc tattgagccg    1680
gcaacggaaa aggaaatccg cgacactgaa gcggtaatgg gtggcgacga ctgggcgctg    1740
tggatcaacg cgctgttcaa atacaactgc ctggccgaag gcgtcaaaac cgttgcgttc    1800
acctatattg gtccggaact gacccacgcg gtatatcgta acggcactat cggccgtgcg    1860
aaactgcacc tggaaaagac tgctcgcgaa ctggataccc agctggagag cgcgctgtct    1920
ggtcaggctc tgatttctgt taacaaagcc ctggtgaccc aggcttccgc agctatcccg    1980
gtagttccgc tgtatatctc cctgctgtat aaaatcatga aagagaaaaa catccacgag    2040
ggttgcatcg agcagatgtg gcgtctgttt aaggagcgcc tgtactctaa ccagaacatc    2100
cctactgact ccgaaggccg catccgtatt gatgactggg aaatgcgcga agacgtacaa    2160
gcggaaatca aacgtctgtg ggaatccatc aacaccggta acgttgaaac tgtctctgat    2220
atcgctggct atcgtgagga cttctataaa ctgttcggtt tcggtctgaa cggtatcgac    2280
tacgaacgtg gcgttgaaat tgaaaaggct atcccgtcca tcactgttac tcctgaaaac    2340
ccggaataag gcgccttagg attcccggga gatcccatgg tacgcgtgct agaggcatca    2400
aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt    2460
gaacgctctc ctgagtagga caaatccgcc gccctagacc taggcgttcg gctgcggcga    2520
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca    2580
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg    2640
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt    2700
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc    2760
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct    2820
tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc    2880
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta    2940
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca    3000
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag    3060
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag    3120
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt    3180
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa    3240
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg    3300
attttggtca tga                                                       3313
<210>56
<211>3271
<212>DNA
<213>pGV1342
<400>56
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcattaaa   1140
ccgaaggtgc gtggctttat ctgcactact gctcatccgg tcggctgtgc agagaatgtt   1200
caacagcaga tcgactacgt agcagcccag aacgccccgt ctagcggccc gaaaaatgta   1260
ctggtcatcg gttgcagcaa cggttacggt ctggcgtccc gcatcaccag cgcattcggc   1320
tttggtgcga acaccctggg cgtcatgttc gaaaaagaac cgaccgaacg ccgtccggca   1380
tctgccggtt ggtataacac ccgtgcgctg gagaaagcgg ctcaggaaaa aggtctgtac   1440
gcgcaatctc tgaatgtgga tgcgttctcc gatgaagcta aaaccgcagt aatcgaggct   1500
gtgaaagcta acatgggtaa aattgatctg gtcgtttaca gcctgggtgc accgcgtcgt   1560
aaagatccgg aaaccggcac tgtctactcc agcacgctga aacctattgg caaagctgtg   1620
acccgtaaaa acctgaacac tgacacccgt gaggtaggtg aagtgactct ggaaccagcg   1680
accgaagaag aaattttcaa cacggtgaaa gtaatgggcg gtgaagactg ggaacgctgg   1740
atgaccgctc tggacgacgc tggcgtgctg gcagacggcg ttaaaactac cgcgtatacc   1800
tacattggta aagagctgac ctggccgatc tacggcggtg cgaccatcgg caaggctaaa   1860
gaagatctgg atcgcgcatc cgttgctatt aacaagaaac tggcagacaa atatcagggt   1920
gttagctacg tcgcagtgct gaaagcgctg gtaactcagt cttcttccgc catcccagta   1980
atgccgctgt acatttctgc tctgtatcgt gttatgaagg aagaaggcac gcacgaaggc   2040
tgcatcgagc agatcacggg cctgtttttc gaccagctgt tctctgaaaa cgccctgaac   2100
ctggatgata ccggccgtat ccgcatggaa gataacgaac tgaaagcgtc tgtacaggag   2160
aaagttgctg cgatctggga acaggttaac acggaaaatc tggacgagct gaccgacttc   2220
aaaggttacc aggaagaatt tttcaaactg ttcggtttcg gcttcgaagg tgttgattac   2280
gacgcagacg tagatccagt ggtgtgaggc gccttaggat tcccgggaga tcccatggta   2340
cgcgtgctag aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt   2400
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgc cctagaccta   2460
ggcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca    2520
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac    2580
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac    2640
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg    2700
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac    2760
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat    2820
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag    2880
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac    2940
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt    3000
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt    3060
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc    3120
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga    3180
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac    3240
gaaaactcac gttaagggat tttggtcatg a                                   3271
<210>57
<211>3295
<212>DNA
<213>pGV1343
<400>57
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gattatcaaa   1140
ccgaaaacgc gtggctttat ctgcactacc acccacccgg ttggttgtga agccaacgtt   1200
ctggaacaaa tcaacaccac taaagccaaa ggcccgatca ccaatggtcc aaaaaaagtt    1260
ctggttattg gcagctccag cggttacggt ctgtcttccc gtatcgctgc ggcgtttggt    1320
tccggtgcag cgaccctggg tgtattcttc gaaaaaccgg gcaccgagaa gaaacctggc    1380
accgctggtt ggtataacag cgctgctttc gataaattcg ctaaggcaga tggcctgtac    1440
tctaaatcta ttaacggtga cgcgttctcc cacgaagcca aacagaaagc gatcgacctg    1500
atcaaagcgg atctgggcca aattgacatg gttgtgtact ctctggcttc tccggttcgt    1560
aaactgccgg attccggcga actgattcgt tctagcctga aaccaatcgg cgaaacttac    1620
accgctactg ctgttgacac gaacaaagac ctgatcattg aaacgagcgt tgaaccagcg    1680
agcgaacagg aaatccaaga tactgtaacc gtaatgggcg gtgaagactg ggaactgtgg    1740
ctggccgcgc tgagcgatgc tggtgtcctg gcggatggct gcaaaaccgt tgcgtactct    1800
tacattggta cggaactgac ctggccgatc tactggcacg gcgctctggg caaggcaaaa    1860
atggacctgg accgtgccgc aaaagcgctg gacgaaaaac tgagcacgac cggtggctct    1920
gcaaatgtgg ctgtgctgaa atctgtagtg acccaggcgt cctccgctat cccggtgatg    1980
ccgctgtaca tcgccatggt attcaaaaag atgcgcgaag aaggtctgca cgaaggctgc    2040
atggaacaga tcaaccgtat gttcgcggaa cgtctgtacc gtgaagatgg tcaggctccg    2100
caggtcgatg atgcaaatcg tctgcgcctg gacgattggg aactgcgcga ggagatccag    2160
cagcactgcc gtgatctgtg gccgtctgtg actactgaga acctgagcga gctgaccgac    2220
taccgtgaat ataaagatga gttcctgaaa ctgttcggtt tcggcgttga aggtgtagat    2280
tacgacgccg acgttaaccc ggaagtaaac ttcgacgtag aacagttcta aggcgcctta    2340
ggattcccgg gagatcccat ggtacgcgtg ctagaggcat caaataaaac gaaaggctca    2400
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag    2460
gacaaatccg ccgccctaga cctaggcgtt cggctgcggc gagcggtatc agctcactca    2520
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca    2580
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg    2640
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg    2700
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt    2760
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt    2820
tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc    2880
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt    2940
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt    3000
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc    3060
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa    3120
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt    3180
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct    3240
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catga         3295
<210>58
<211>3286
<212>DNA
<213>pGV1344
<400>58
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa      60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat     120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct     180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac     240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat     300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa     360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc     420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga     480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag    1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcgtaaag    1140
cctatggttc gtaacaatat ttgcctgaac gctcatccgc agggttgcaa gaaaggtgtc    1200
gaggatcaga ttgaatacac caagaaacgt attaccgctg aagttaaagc aggtgctaaa    1260
gcgccgaaaa acgtgctggt tctgggctgt tccaacggct acggcctggc gtctcgcatc    1320
actgctgcgt ttggttatgg tgcggctact atcggtgttt cttttgaaaa agcgggctcc    1380
gaaaccaaat atggcacccc aggttggtac aacaacctgg cgttcgatga agcggctaaa    1440
cgcgagggcc tgtactctgt gactatcgac ggtgacgcct tcagcgatga aatcaaagca    1500
caggttatcg aggaagccaa aaagaaaggc attaagtttg acctgattgt gtactctctg    1560
gctagcccgg tgcgtaccga tccggatacc ggcatcatgc acaaatccgt cctgaaaccg    1620
ttcggcaaaa ctttcaccgg taaaacggta gatccgttca ctggtgagct gaaagaaatc    1680
tctgccgagc cagctaacga tgaagaggca gctgctactg tcaaagtcat gggtggtgaa    1740
gattgggaac gttggatcaa acagctgtct aaagaaggtc tgctggagga aggctgcatt    1800
accctggcat actcctacat tggtccagag gccactcagg cgctgtatcg taaaggtact    1860
atcggtaaag ctaaagaaca cctggaagct acggctcacc gtctgaacaa agaaaacccg    1920
tccatccgtg cattcgtttc cgtcaacaag ggcctggtca cccgtgcatc cgcagttatc    1980
ccggtcatcc ctctgtatct ggcttccctg ttcaaggtta tgaaggaaaa aggtaaccat    2040
gagggttgta tcgaacagat cacccgtctg tacgccgaac gtctgtaccg caaggatggc    2100
accatcccgg ttgatgagga aaaccgcatt cgtatcgacg actgggaact ggaagaagat    2160
gttcaaaaag ctgtgtctgc gctgatggaa aaagtgaccg gcgaaaatgc ggaatccctg    2220
acggacctgg cgggctatcg tcatgacttt ctggcgtcca acggttttga tgttgagggc    2280
atcaactatg aagcggaagt agagcgtttt gaccgcattt aaggcgcctt aggattcccg    2340
ggagatccca tggtacgcgt gctagaggca tcaaataaaa cgaaaggctc agtcgaaaga    2400
ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc    2460
gccgccctag acctaggcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta    2520
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag    2580
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc    2640
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta    2700
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg    2760
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc    2820
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac    2880
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac    2940
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg    3000
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga    3060
aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt    3120
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag    3180
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct    3240
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatga                   3286
<210>59
<211>3479
<212>DNA
<213>pGV1345
<400>59
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag    1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gcgtctgctg    1140
ttcgaagcag ttcacgcgcg taagcgttgg catcgtactg cgccggctgc cgcattcact    1200
cgttttcaca ccgctgcatg cgtgactcat caggcagttt cccgtgctcc acacgccctg    1260
cgttgtcgcc agcacctggc agatcaggag tccacgctga tcattcaccc gaaagtacgt    1320
ggtttcatct gcacgaccac tcaccctctg ggttgcgaac gtaacgtcct ggaacagatc    1380
gcggctactc gtgctcgcgg tgttcgtaac gatggtccga agaaagttct ggtgatcggc    1440
gcgtctagcg gttacggtct ggccagccgc attaccgccg cattcggttt cggtgcggat    1500
accctgggtg ttttcttcga aaaaccgggt actgcctcta aagctggcac ggcgggttgg    1560
tacaactccg cagcattcga caagcacgca aaagcggctg gtctgtactc taaatctatc    1620
aatggtgatg cgttcagcga tgcggcgcgt gcacaggtga tcgaactgat caaaactgag    1680
atgggtggtc aagttgacct ggttgtttac tctctggcct ccccggtacg taaactgccg    1740
ggctctggtg aagttaaacg ttctgcgctg aagccaatcg gccagaccta caccgcaacg    1800
gcgatcgaca ccaacaagga cactatcatc caggcttcca ttgaacctgc ttctgcgcag    1860
gaaatcgagg ataccatcac cgtgatgggc ggccaagact gggaactgtg gatcgacgca    1920
ctggaaggtg caggcgtact ggcagatggc gctcgttctg tagcgttctc ctatatcggc    1980
accgaaatca cttggccgat ctactggcat ggcgcactgg gcaaagcaaa agtggacctg    2040
gaccgtaccg ctcaacgtct gaatgcccgt ctggcaaaac acggtggtgg cgcaaacgtg    2100
gcagttctga agagcgtagt gacccaagct tctgccgcta ttccggttat gccgctgtac    2160
atttccatgg tgtataaaat catgaaagaa aaaggtctgc atgagggtac tatcgaacag    2220
ctggatcgcc tgtttcgtga acgtctgtac cgccaggacg gtcagccggc agaagtagat    2280
gaagttgatg aacagaaccg tctgcgcctg gacgattggg aactgcgcga cgatgtacag    2340
gacgcctgca aggctctgtg gccgcaggta actactgaaa atctgttcga gctgaccgat    2400
tacgcgggct acaaacatga gttcctgaaa ctgtttggct tcggccgtac cgacgttgat    2460
tacgatgcgg atgttgcaac tgacgtggct ttcgattgta tcgaactggc ctgaggcgcc    2520
ttaggattcc cgggagatcc ccatggtacg cgtgctagag gcatcaaata aaacgaaagg    2580
ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga    2640
gtaggacaaa tccgccgccc tagacctagg cgttcggctg cggcgagcgg tatcagctca    2700
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg    2760
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca    2820
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa    2880
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc    2940
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc    3000
gctttctcaa tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct    3060
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg    3120
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag    3180
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta    3240
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg    3300
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt    3360
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt    3420
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatga     3479
<210>60
<211>3292
<212>DNA
<213>pGV1346
<400>60
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcattaaa   1140
ccgcgtgttc gtggctttat ctgtgttacc gctcatccga ccggctgcga agcgaacgtc   1200
aaaaagcaga tcgactacgt taccactgaa ggcccgatcg ctaacggccc taaacgcgtt   1260
ctggtaattg gcgcttctac cggttacggc ctggcggcac gtatcaccgc cgcgtttggt   1320
tgcggcgctg acaccctggg tgtgttcttc gaacgtccgg gtgaagaagg caaaccgggc   1380
acttctggct ggtacaactc cgcagcgttt cacaaatttg ccgctcagaa aggtctgtac   1440
gcaaaatcta tcaacggcga cgctttcagc gacgaaatca aacagctgac cattgacgcg   1500
atcaaacagg acctgggcca ggtagatcag gtgatctact ccctggcctc tccgcgtcgc   1560
acccacccta aaaccggtga agtattcaat tccgccctga agccgatcgg taacgcagta   1620
aacctgcgcg gcctggatac cgacaaggag gtgatcaaag aaagcgtgct gcagccggca   1680
acccagtctg aaattgactc cactgttgcg gtgatgggtg gcgaagattg gcagatgtgg   1740
atcgacgcgc tgctggatgc aggcgtactg gcagaaggcg ctcagactac cgcgttcacg    1800
tacctgggcg aaaagatcac ccatgacatt tattggaacg gttccattgg cgctgccaaa    1860
aaggacctgg atcagaaagt tctggctatc cgtgaatccc tggctgctca cggtggtggc    1920
gatgcacgtg tctccgtgct gaaagcagtc gtcacccagg cgtcctccgc gattccaatg    1980
atgccgctgt atctgagcct gctgtttaaa gtcatgaagg aaaaaggcac ccacgagggc    2040
tgcattgaac aggtgtactc tctgtataaa gattctctgt gtggtgatag cccacatatg    2100
gaccaggaag gtcgtctgcg tgctgactat aaagagctgg acccggaagt gcagaaccag    2160
gttcagcagc tgtgggatca agttactaac gacaacattt accagctgac ggatttcgta    2220
ggctacaaat ctgagtttct gaacctgttc ggtttcggta tcgacggtgt ggactatgat    2280
gccgatgtca acccggatgt aaagattccg aacctgatcc aaggttaagg cgccttagga    2340
ttcccgggag atcccatggt acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc    2400
gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac    2460
aaatccgccg ccctagacct aggcgttcgg ctgcggcgag cggtatcagc tcactcaaag    2520
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa    2580
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc    2640
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca    2700
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg    2760
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct    2820
caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt    2880
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag    2940
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc    3000
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac    3060
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga    3120
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc    3180
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg    3240
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat ga            3292
<210>61
<211>3280
<212>DNA
<213>pGV1347
<400>61
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac     540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag     600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc     660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc     720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt     780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag     840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt     900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg     960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt    1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag    1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat ggttatttct    1140
cctaaggttc gcggctttat ttgcactaat gcgcacccgg ttggttgtgc gaaaagcgtg    1200
gaaaaccaga tcgcttacgt taaagcgcag ggtctgtctg ctgaggcggc agatgcaccg    1260
aaaaacgtgc tggttctggg ctgttccacc ggctatggtc tggcgtctcg tatcactgcg    1320
tcctttggct atggtgccaa cactgtaggc gtttgtttcg aaaaagctcc gacggaacgc    1380
aaaaccggta ctgcgggttg gtataacacg gcggcgttcc acagcgaagc aaaagccgca    1440
ggcgttcagg cccataccct gaatggcgac gcattctcca acgaactgaa agcacagacc    1500
atcgaaaccc tgaagaacac catcggtaaa gttgacctgg tggtgtactc tctggcgtcc    1560
ccgcgtcgta ccgacccgga aactggtgaa gtgtataaga gcaccctgaa accggttggt    1620
caggcatatg agaccaagac ctacgacact gacaaagatc tgatccacac ggtggctctg    1680
gaaccggctt ctcaggatga aattgataac accatcaaag tgatgggtgg tgaagactgg    1740
gaactgtgga tcaaagcgct ggcggaagcg gatctgctgg cggagggtgc taaaaccacc    1800
gcttacacct acatcggcaa aaagctgacc tggccgatct acggctccgc cactatcggc    1860
aaagcaaaag aagacctgga tcgcgctgcc accgcgatca acaccaccta cgcaaacctg    1920
aacgttgatg ctcacgtatc tagcctgaaa gccctggtga cccaagcctc ttccgctatc    1980
ccggtcatgc ctctgtatat cagcctgatt tacaaagtta tgaaagaaga gggcactcac    2040
gaaggttgta tcgaacagat cgttggtctg tttactcagt gcctgctgaa cgacggcgcg    2100
actctggatg aagttaaccg ttatcgtatg gatggtaaag aaactaacga cgccactcag    2160
gctaaaattg aagagctgtg gcaccaggtg acccaggaca actttcacga actgtccgac    2220
tacgctggtt ataacgctga tttcctgaac ctgtttggtt ttggcatcga aggtgttgat    2280
tacgaagcgg acgttgatcc gcaggtgtcc tggtaaggcg ccttaggatt cccgggagat    2340
cccatggtac gcgtgctaga ggcatcaaat aaaacgaaag gctcagtcga aagactgggc    2400
ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccgcc    2460
ctagacctag gcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg    2520
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag    2580
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac    2640
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga    2700
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt    2760
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc    2820
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc    2880
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta    2940
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat    3000
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca    3060
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct    3120
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt    3180
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct    3240
cagtggaacg aaaactcacg ttaagggatt ttggtcatga                          3280
<210>62
<211>3283
<212>DNA
<213>pGV1348
<400>62
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gattattgaa   1140
cctaagatgc gtggctttat ttgtctgacc tcccacccga cgggttgtga acagaacgtt   1200
atcaaccaga tcaactacgt gaaaagcaaa ggcgttatta atggcccgaa gaaagttctg   1260
gttattggcg catccactgg cttcggcctg gcgtctcgta tcacttctgc tttcggtagc   1320
aatgctgcga cgatcggtgt cttcttcgaa aaaccggcgc aggagggtaa accgggctct   1380
ccgggctggt ataacaccgt agctttccag aatgaggcca aaaaggctgg catttacgct   1440
aaaagcatca acggtgatgc cttttccact gaagtaaagc agaaaaccat cgacctgatt    1500
aaagctgatc tgggtcaagt ggacctggtt atctacagcc tggcaagccc tgttcgtacc    1560
aacccggtaa ccggtgtaac ccaccgctct gtactgaaac cgattggtgg tgcgttctct    1620
aacaaaactg ttgacttcca taccggcaac gtaagcaccg ttaccatcga accagcgaac    1680
gaagaagatg ttaccaacac cgtcgctgtt atgggtggtg aggattgggg catgtggatg    1740
gacgcgatgc tggaagcagg cgttctggcc gaaggcgcaa ctacggttgc atattcctac    1800
atcggtccgg ctctgaccga agcggtgtat cgtaagggca ctatcggccg tgcgaaagac    1860
cacctggagg catctgctgc aaccattact gataaactga aatctgttaa aggtaaagcc    1920
tacgtgtctg tgaacaaagc gctggtcacc caggcttcca gcgcaattcc ggttattccg    1980
ctgtacatct ctctgctgta caaggttatg aaagcagagg gcattcacga aggttgtatc    2040
gaacagattc agcgtctgta cgctgaccgt ctgtacacgg gcaaagctat cccaacggac    2100
gagcagggcc gtatccgtat cgacgattgg gaaatgcgtg aagatgtcca ggcgaacgtt    2160
gcagcactgt gggaacaagt tacttctgaa aacgtttccg acatctctga cctgaaaggt    2220
tataagaacg actttctgaa cctgttcggt ttcgcggtta acaaagttga ttatctggct    2280
gacgtgaacg aaaacgttac gatcgaaggt ctggtatgag gcgccttagg attcccggga    2340
gatcccatgg tacgcgtgct agaggcatca aataaaacga aaggctcagt cgaaagactg    2400
ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc    2460
gccctagacc taggcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata    2520
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa    2580
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct    2640
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa    2700
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg    2760
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca    2820
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa    2880
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg    2940
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg    3000
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg    3060
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc    3120
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag    3180
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac    3240
gctcagtgga acgaaaactc acgttaaggg attttggtca tga                      3283
<210>63
<211>3295
<212>DNA
<213>pGV1349
<400>63
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt   1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag   1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcattaaa   1140
cctcgtatcc gtggctttat ctgcaccacg actcacccgg taggttgcga agctaacgtc   1200
aaagaacaaa tcgcatacac taaagctcag ggcccgatca aaaacgcccc taaacgtgtt   1260
ctggttgttg gtgcctcctc cggttatggt ctgtcttctc gtatcgcggc agcgtttggc   1320
ggcggtgctt ccaccatcgg cgtgttcttc gaaaaggaag gcaccgaaaa gaaacctggt   1380
actgctggct tctacaacgc tgcggcgttc gaaaaactgg cgcgtgaaga gggcctgtac   1440
gccaagagcc tgaacggcga tgcattctcc aacgaggcga aacagaaaac cattgaactg   1500
atcaaagaag acctgggtca aattgatatg gtggtttaca gcctggcatc cccggtgcgc   1560
aaaatgccgg aaaccggtga actggtgcgc agcgcactga aaccgattgg tgagacttat   1620
acctctaccg cggtcgatac gaataaggat gtgatcattg aagcgagcgt tgaaccggcg   1680
accgaagagg aaatcaaaga taccgtgact gtaatgggtg gtgaggattg ggaactgtgg   1740
atcaatgcgc tgagcgatgc aggcgtgctg gctgaaggtt gcaaaactgt tgcttatagc   1800
tacattggca ccgaactgac ctggcctatc tactgggacg gtgcactggg taaagctaaa   1860
atggatctgg atcgtgcagc caaagcactg aacgacaaac tggcggcaac cggtggctct   1920
gcgaatgtcg ctgttctgaa atccgttgta acccaagctt cctccgcaat cccggttatg   1980
ccgctgtata tcgcaatggt gttcaagaaa atgcgcgaag aaggtgtaca cgaaggctgc   2040
atggaacaga tttaccgtat gttctctcag cgtctgtaca aggaagacgg ctctgctgcc   2100
gaggttgatg aaatgaaccg tctgcgtctg gacgattggg agctgcgcga cgacattcag   2160
cagcactgcc gtgaactgtg gccgcagatt accaccgaaa atctgaaaga actgaccgat   2220
tacgttgaat ataaggaaga gttcctgaaa ctgttcggtt tcggtgttga gggcgttgat   2280
tacgaagcag acgtgaaccc ggctgtggaa gccgatttca tccagatcta aggcgcctta   2340
ggattcccgg gagatcccat ggtacgcgtg ctagaggcat caaataaaac gaaaggctca   2400
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag   2460
gacaaatccg ccgccctaga cctaggcgtt cggctgcggc gagcggtatc agctcactca    2520
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca    2580
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg    2640
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg    2700
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt    2760
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt    2820
tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc    2880
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt    2940
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt    3000
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc    3060
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa    3120
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt    3180
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct    3240
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catga         3295
<210>64
<211>3234
<212>DNA
<213>pGV1563
<400>64
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa     60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat    120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct    180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac    240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat    300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa    360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc    420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga    480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac    540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag    600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc    660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc    720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt    780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag    840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt    900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg    960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acaattgaca   1020
ttgtgagcgg ataacaagat actgagcaca tcagcaggac gcactgaccg aattcattaa   1080
agaggagaaa ggtaccatga tcgtaaagcc tatggttcgt aacaatattt gcctgaacgc   1140
tcatccgcag ggttgcaaga aaggtgtcga ggatcagatt gaatacacca agaaacgtat   1200
taccgctgaa gttaaagcag gtgctaaagc gccgaaaaac gtgctggttc tgggctgttc    1260
caacggctac ggcctggcgt ctcgcatcac tgctgcgttt ggttatggtg cggctactat    1320
cggtgtttct tttgaaaaag cgggctccga aaccaaatat ggcaccccag gttggtacaa    1380
caacctggcg ttcgatgaag cggctaaacg cgagggcctg tactctgtga ctatcgacgg    1440
tgacgccttc agcgatgaaa tcaaagcaca ggttatcgag gaagccaaaa agaaaggcat    1500
taagtttgac ctgattgtgt actctctggc tagcccggtg cgtaccgatc cggataccgg    1560
catcatgcac aaatccgtcc tgaaaccgtt cggcaaaact ttcaccggta aaacggtaga    1620
tccgttcact ggtgagctga aagaaatctc tgccgagcca gctaacgatg aagaggcagc    1680
tgctactgtc aaagtcatgg gtggtgaaga ttgggaacgt tggatcaaac agctgtctaa    1740
agaaggtctg ctggaggaag gctgcattac cctggcatac tcctacattg gtccagaggc    1800
cactcaggcg ctgtatcgta aaggtactat cggtaaagct aaagaacacc tggaagctac    1860
ggctcaccgt ctgaacaaag aaaacccgtc catccgtgca ttcgtttccg tcaacaaggg    1920
cctggtcacc cgtgcatccg cagttatccc ggtcatccct ctgtatctgg cttccctgtt    1980
caaggttatg aaggaaaaag gtaaccatga gggttgtatc gaacagatca cccgtctgta    2040
cgccgaacgt ctgtaccgca aggatggcac catcccggtt gatgaggaaa accgcattcg    2100
tatcgacgac tgggaactgg aagaagatgt tcaaaaagct gtgtctgcgc tgatggaaaa    2160
agtgaccggc gaaaatgcgg aatccctgac ggacctggcg ggctatcgtc atgactttct    2220
ggcgtccaac ggttttgatg ttgagggcat caactatgaa gcggaagtag agcgttttga    2280
ccgcatttaa ggatcccatg gtacgcgtgc tagaggcatc aaataaaacg aaaggctcag    2340
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg    2400
acaaatccgc cgccctagac ctaggcgttc ggctgcggcg agcggtatca gctcactcaa    2460
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa    2520
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc    2580
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga    2640
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc    2700
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt    2760
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct    2820
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg    2880
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta    2940
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct    3000
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa    3060
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt    3120
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta    3180
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga          3234
<210>65
<211>5241
<212>DNA
<213>pGV1563
taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt      60
cgtcttcacc tcgagaattg tgagcggata acaattgaca ttgtgagcgg ataacaagat     120
actgagcaca tcagcaggac gcactgaccg aattcattaa agaggagaaa ggtaccatgt     180
ctcaattctt ttttaatcaa cgcacccatc tcgtgagcga cgtcatcgac ggtacgatta     240
tcgccagccc gtggaataac ctggcgcgtc tggaaagcga tccggccatt cgcatcgtgg     300
tccgtcgtga cctcaacaaa aataacgtgg cggtaatttc cggcggtggt tcagggcacg     360
aacccgcgca cgttgggttt atcggtaaag gcatgctaac cgctgcggtt tgcggcgacg     420
ttttcgcttc cccgagcgtg gatgcggtac tgaccgccat ccaggcggta accggtgagg     480
cgggctgttt attgatcgtg aaaaattaca ccggtgaccg tcttaatttc ggtctcgccg     540
ccgagaaagc ccgtcgcctt ggttacaacg ttgaaatgct gattgttggc gacgacatct     600
ccctgcctga taacaaacac ccacgcggca ttgcgggaac catcctggtg cataaaatcg     660
caggctattt tgccgaacgc ggctacaacc tcgccaccgt cctgcgtgaa gcgcagtacg     720
cggccaataa caccttcagc ctgggcgttg cgctttccag ctgtcatctg ccgcaagaag     780
ccgacgccgc cccgcgtcat catccgggcc acgcggaact gggcatgggc attcacggcg     840
aaccaggcgc atcggttatc gacacccaga acagtgcgca ggtggtgaac ctgatggtgg     900
ataagctgat ggcagccctg cctgaaaccg gccgtctggc ggtgatgatt aacaatcttg     960
gcggcgtttc tgttgccgaa atggccatca ttacccgcga actggccagc agcccgctgc    1020
acccacgtat cgactggctg attggcccgg cctcactggt caccgctctg gatatgaaaa    1080
gcttttcact gacggccatc gtgctggaag aaagcatcga aaaagcgtta ctcaccgagg    1140
tggaaaccag caactggccg acgccggtcc cgccgcgtga aatcagttgt gtaccatcat    1200
ctcagcgtag cgcacgcgtg gaattccagc cttcggcgaa cgccatggtg gccgggattg    1260
tggaacttgt caccacaacc ctttccgatc tggagactca tcttaatgcg ctggacgcca    1320
aagtcggcga tggcgatacc ggttcgacct ttgccgctgg cgcgcgtgaa attgccagtc    1380
tgttgcatcg ccagcagttg ccgctggata accttgccac gctgttcgcg ctgattggcg    1440
aacgtctgac cgtagtgatg ggtggttcca gcggtgtgct gatgtctatt ttctttaccg    1500
ctgcggggca gaaactggaa cagggagcta gcgttgccga atccctgaat acgggactgg    1560
cgcagatgaa gttctacggc ggcgcagacg aaggcgatcg caccatgatt gatgcgctgc    1620
aaccagccct gacttcgctg ctcacgcagc cgcaaaatct gcaggccgca ttcgacgccg    1680
cgcaagcggg agccgaacga acctgtttgt cgagcaaagc caatgccggt cgcgcatcgt    1740
atctcagcag cgaaagcctg ctcggaaata tggaccccgg cgcgcacgcc gtagcgatgg    1800
tgtttaaagc gctagcggag agtgagctgg gctaatctag aggcatcaaa taaaacgaaa    1860
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct    1920
gagtaggaca aatccgccgc cctagaccta gggtacgggt tttgctgccc gcaaacgggc    1980
tgttctggtg ttgctagttt gttatcagaa tcgcagatcc ggcttcaggt ttgccggctg    2040
aaagcgctat ttcttccaga attgccatga ttttttcccc acgggaggcg tcactggctc    2100
ccgtgttgtc ggcagctttg attcgataag cagcatcgcc tgtttcaggc tgtctatgtg    2160
tgactgttga gctgtaacaa gttgtctcag gtgttcaatt tcatgttcta gttgctttgt    2220
tttactggtt tcacctgttc tattaggtgt tacatgctgt tcatctgtta cattgtcgat    2280
ctgttcatgg tgaacagctt taaatgcacc aaaaactcgt aaaagctctg atgtatctat    2340
cttttttaca ccgttttcat ctgtgcatat ggacagtttt ccctttgata tctaacggtg    2400
aacagttgtt ctacttttgt ttgttagtct tgatgcttca ctgatagata caagagccat    2460
aagaacctca gatccttccg tatttagcca gtatgttctc tagtgtggtt cgttgttttt    2520
gcgtgagcca tgagaacgaa ccattgagat catgcttact ttgcatgtca ctcaaaaatt    2580
ttgcctcaaa actggtgagc tgaatttttg cagttaaagc atcgtgtagt gtttttctta    2640
gtccgttacg taggtaggaa tctgatgtaa tggttgttgg tattttgtca ccattcattt    2700
ttatctggtt gttctcaagt tcggttacga gatccatttg tctatctagt tcaacttgga    2760
aaatcaacgt atcagtcggg cggcctcgct tatcaaccac caatttcata ttgctgtaag    2820
tgtttaaatc tttacttatt ggtttcaaaa cccattggtt aagcctttta aactcatggt    2880
agttattttc aagcattaac atgaacttaa attcatcaag gctaatctct atatttgcct    2940
tgtgagtttt cttttgtgtt agttctttta ataaccactc ataaatcctc atagagtatt    3000
tgttttcaaa agacttaaca tgttccagat tatattttat gaattttttt aactggaaaa    3060
gataaggcaa tatctcttca ctaaaaacta attctaattt ttcgcttgag aacttggcat    3120
agtttgtcca ctggaaaatc tcaaagcctt taaccaaagg attcctgatt tccacagttc    3180
tcgtcatcag ctctctggtt gctttagcta atacaccata agcattttcc ctactgatgt    3240
tcatcatctg agcgtattgg ttataagtga acgataccgt ccgttctttc cttgtagggt    3300
tttcaatcgt ggggttgagt agtgccacac agcataaaat tagcttggtt tcatgctccg    3360
ttaagtcata gcgactaatc gctagttcat ttgctttgaa aacaactaat tcagacatac    3420
atctcaattg gtctaggtga ttttaatcac tataccaatt gagatgggct agtcaatgat    3480
aattactagt ccttttcccg ggagatctgg gtatctgtaa attctgctag acctttgctg    3540
gaaaacttgt aaattctgct agaccctctg taaattccgc tagacctttg tgtgtttttt    3600
ttgtttatat tcaagtggtt ataatttata gaataaagaa agaataaaaa aagataaaaa    3660
gaatagatcc cagccctgtg tataactcac tactttagtc agttccgcag tattacaaaa    3720
ggatgtcgca aacgctgttt gctcctctac aaaacagacc ttaaaaccct aaaggcttaa    3780
gtagcaccct cgcaagctcg ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg    3840
cacctgagtc gctgtctttt tcgtgacatt cagttcgctg cgctcacggc tctggcagtg    3900
aatgggggta aatggcacta caggcgcctt ttatggattc atgcaaggaa actacccata    3960
atacaagaaa agcccgtcac gggcttctca gggcgtttta tggcgggtct gctatgtggt    4020
gctatctgac tttttgctgt tcagcagttc ctgccctctg attttccagt ctgaccactt    4080
cggattatcc cgtgacaggt cattcagact ggctaatgca cccagtaagg cagcggtatc    4140
atcaacaggc ttacccgtct tactgtccct agtgcttgga ttctcaccaa taaaaaacgc    4200
ccggcggcaa ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc    4260
tatcaacagg agtccaagcg agctctcgaa ccccagagtc ccgctcagaa gaactcgtca    4320
agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg    4380
aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg    4440
tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca    4500
ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcctcgccg    4560
tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct    4620
tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg    4680
cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc    4740
attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc    4800
tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc    4860
acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc    4920
agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct    4980
gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg    5040
aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg    5100
cgaaacgatc ctcatcctgt ctcttgatca gatcttgatc ccctgcgcca tcagatcctt    5160
ggcggcaaga aagccatcca gtttactttg cagggcttcc caaccttacc agagggcgcc    5220
ccagctggca attccgacgt c                                              5241
<210>66
<211>2302
<212>DNA
<213>pGV1569
<400>66
ctcgagagct tactccccat ccccctgttg acaattaatc atcggctcgt ataatgtgtg     60
gaattgtgag cggataacaa ttgaattcat taaagaggag aaagtcgaca ttatgcggcc    120
gcggatccat aaggaggatt aattaagact tcccgggtga tcccatggta cgcgtgctag    180
aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt    240
ttgtcggtga acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc    300
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg    360
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg    420
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac    480
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg    540
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct    600
ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg    660
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct    720
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac    780
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt    840
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc    900
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca    960
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat   1020
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac   1080
gttaagggat tttggtcatg actagtgctt ggattctcac caataaaaaa cgcccggcgg   1140
caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg atctatcaac   1200
aggagtccaa gcgagctcgt aaacttggtc tgacagttac caatgcttaa tcagtgaggc   1260
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta    1320
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga    1380
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg    1440
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc    1500
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat    1560
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag    1620
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat    1680
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa    1740
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa    1800
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga    1860
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg    1920
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc    1980
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg    2040
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact    2100
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat    2160
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt    2220
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat    2280
cacgaggccc tttcgtcttc ac                                             2302
<210>67
<211>3384
<212>DNA
<213>pGV1582
<400>67
ctcgagagct tactccccat ccccctgttg acaattaatc atcggctcgt ataatgtgtg     60
gaattgtgag cggataacaa ttgaattcat taaagaggag aaagtcgaca tgaagatcgt    120
tttagtctta tatgatgctg gtaaacacgc tgccgatgaa gaaaaattat acggttgtac    180
tgaaaacaaa ttaggtattg ccaattggtt gaaagatcaa ggacatgaat taatcaccac    240
gtctgataaa gaaggcggaa acagtgtgtt ggatcaacat ataccagatg ccgatattat    300
cattacaact cctttccatc ctgcttatat cactaaggaa agaatcgaca aggctaaaaa    360
attgaaatta gttgttgtcg ctggtgtcgg ttctgatcat attgatttgg attatatcaa    420
ccaaaccggt aagaaaatct ccgttttgga agttaccggt tctaatgttg tctctgttgc    480
agaacacgtt gtcatgacca tgcttgtctt ggttagaaat tttgttccag ctcacgaaca    540
aatcattaac cacgattggg aggttgctgc tatcgctaag gatgcttacg atatcgaagg    600
taaaactatc gccaccattg gtgccggtag aattggttac agagtcttgg aaagattagt    660
cccattcaat cctaaagaat tattatacta cgattatcaa gctttaccaa aagatgctga    720
agaaaaagtt ggtgctagaa gggttgaaaa tattgaagaa ttggttgccc aagctgatat    780
agttacagtt aatgctccat tacacgctgg tacaaaaggt ttaattaaca aggaattatt    840
gtctaaattc aagaaaggtg cttggttagt caatactgca agaggtgcca tttgtgttgc    900
cgaagatgtt gctgcagctt tagaatctgg tcaattaaga ggttatggtg gtgatgtttg    960
gttcccacaa ccagctccaa aagatcaccc atggagagat atgagaaaca aatatggtgc    1020
tggtaacgcc atgactcctc attactctgg tactacttta gatgctcaaa ctagatacgc    1080
tcaaggtact aaaaatatct tggagtcatt ctttactggt aagtttgatt acagaccaca    1140
agatatcatc ttattaaacg gtgaatacgt taccaaagct tacggtaaac acgataagaa    1200
ataaggatcc ataaggagga ttaattaaga cttcccgggt gatcccatgg tacgcgtgct    1260
agaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt    1320
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gccctagacc taggcgttcg    1380
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    1440
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    1500
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg    1560
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc    1620
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc    1680
ctttctccct tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc    1740
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg    1800
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc    1860
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga    1920
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc    1980
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac    2040
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg    2100
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc    2160
acgttaaggg attttggtca tgactagtgc ttggattctc accaataaaa aacgcccggc    2220
ggcaaccgag cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca    2280
acaggagtcc aagcgagctc gtaaacttgg tctgacagtt accaatgctt aatcagtgag    2340
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg    2400
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga    2460
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag    2520
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa    2580
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc    2640
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca    2700
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg    2760
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat    2820
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc    2880
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg    2940
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg    3000
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt    3060
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca    3120
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata    3180
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac    3240
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa    3300
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt    3360
atcacgaggc cctttcgtct tcac                                           3384
<210>68
<211>4570
<212>DNA
<213>pGV1583
<400>68
ctcgagagct tactccccat ccccctgttg acaattaatc atcggctcgt ataatgtgtg     60
gaattgtgag cggataacaa ttgaattcat taaagaggag aaagtcgaca tgaagatcgt    120
tttagtctta tatgatgctg gtaaacacgc tgccgatgaa gaaaaattat acggttgtac    180
tgaaaacaaa ttaggtattg ccaattggtt gaaagatcaa ggacatgaat taatcaccac    240
gtctgataaa gaaggcggaa acagtgtgtt ggatcaacat ataccagatg ccgatattat    300
cattacaact cctttccatc ctgcttatat cactaaggaa agaatcgaca aggctaaaaa    360
attgaaatta gttgttgtcg ctggtgtcgg ttctgatcat attgatttgg attatatcaa    420
ccaaaccggt aagaaaatct ccgttttgga agttaccggt tctaatgttg tctctgttgc    480
agaacacgtt gtcatgacca tgcttgtctt ggttagaaat tttgttccag ctcacgaaca    540
aatcattaac cacgattggg aggttgctgc tatcgctaag gatgcttacg atatcgaagg    600
taaaactatc gccaccattg gtgccggtag aattggttac agagtcttgg aaagattagt    660
cccattcaat cctaaagaat tattatacta cgattatcaa gctttaccaa aagatgctga    720
agaaaaagtt ggtgctagaa gggttgaaaa tattgaagaa ttggttgccc aagctgatat    780
agttacagtt aatgctccat tacacgctgg tacaaaaggt ttaattaaca aggaattatt    840
gtctaaattc aagaaaggtg cttggttagt caatactgca agaggtgcca tttgtgttgc    900
cgaagatgtt gctgcagctt tagaatctgg tcaattaaga ggttatggtg gtgatgtttg    960
gttcccacaa ccagctccaa aagatcaccc atggagagat atgagaaaca aatatggtgc   1020
tggtaacgcc atgactcctc attactctgg tactacttta gatgctcaaa ctagatacgc   1080
tcaaggtact aaaaatatct tggagtcatt ctttactggt aagtttgatt acagaccaca   1140
agatatcatc ttattaaacg gtgaatacgt taccaaagct tacggtaaac acgataagaa   1200
ataaggatcc ataaggagga ttaattaaat gatcgtaaag cctatggttc gtaacaatat   1260
ttgcctgaac gctcatccgc agggttgcaa gaaaggtgtc gaggatcaga ttgaatacac   1320
caagaaacgt attaccgctg aagttaaagc aggtgctaaa gcgccgaaaa acgtgctggt   1380
tctgggctgt tccaacggct acggcctggc gtctcgcatc actgctgcgt ttggttatgg   1440
tgcggctact atcggtgttt cttttgaaaa agcgggctcc gaaaccaaat atggcacccc   1500
aggttggtac aacaacctgg cgttcgatga agcggctaaa cgcgagggcc tgtactctgt   1560
gactatcgac ggtgacgcct tcagcgatga aatcaaagca caggttatcg aggaagccaa   1620
aaagaaaggc attaagtttg acctgattgt gtactctctg gctagcccgg tgcgtaccga   1680
tccggatacc ggcatcatgc acaaatccgt cctgaaaccg ttcggcaaaa ctttcaccgg   1740
taaaacggta gatccgttca ctggtgagct gaaagaaatc tctgccgagc cagctaacga   1800
tgaagaggca gctgctactg tcaaagtcat gggtggtgaa gattgggaac gttggatcaa    1860
acagctgtct aaagaaggtc tgctggagga aggctgcatt accctggcat actcctacat    1920
tggtccagag gccactcagg cgctgtatcg taaaggtact atcggtaaag ctaaagaaca    1980
cctggaagct acggctcacc gtctgaacaa agaaaacccg tccatccgtg cattcgtttc    2040
cgtcaacaag ggcctggtca cccgtgcatc cgcagttatc ccggtcatcc ctctgtatct    2100
ggcttccctg ttcaaggtta tgaaggaaaa aggtaaccat gagggttgta tcgaacagat    2160
cacccgtctg tacgccgaac gtctgtaccg caaggatggc accatcccgg ttgatgagga    2220
aaaccgcatt cgtatcgacg actgggaact ggaagaagat gttcaaaaag ctgtgtctgc    2280
gctgatggaa aaagtgaccg gcgaaaatgc ggaatccctg acggacctgg cgggctatcg    2340
tcatgacttt ctggcgtcca acggttttga tgttgagggc atcaactatg aagcggaagt    2400
agagcgtttt gaccgcattc ccgggtgatc ccatggtacg cgtgctagag gcatcaaata    2460
aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac    2520
gctctcctga gtaggacaaa tccgccgccc tagacctagg cgttcggctg cggcgagcgg    2580
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa    2640
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg    2700
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga    2760
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg    2820
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg    2880
gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg taggtcgttc    2940
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg    3000
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca    3060
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt    3120
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag    3180
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg    3240
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc    3300
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt    3360
tggtcatgac tagtgcttgg attctcacca ataaaaaacg cccggcggca accgagcgtt    3420
ctgaacaaat ccagatggag ttctgaggtc attactggat ctatcaacag gagtccaagc    3480
gagctcgtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc    3540
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat    3600
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc    3660
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc    3720
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag    3780
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg    3840
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg    3900
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag    3960
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt    4020
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga    4080
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc    4140
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc    4200
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc    4260
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc    4320
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca    4380
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat    4440
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt    4500
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt    4560
tcgtcttcac                                                           4570
<210>69
<211>35
<212>DNA
<213>Cac_thlF
<400>69
aattgaattc ttattattta ggaggagtaa aacat                                35
<210>70
<211>35
<212>DNA
<213>Cac_thlR
<400>70
aattggatcc ttagtctctt tcaactacga gagct                                35
<210>71
<211>35
<212>DNA
<213>Cac_aadF
<400>71
aattgaattc atattttaga aagaagtgta tattt                                35
<210>72
<211>42
<212>DNA
<213>Cac_aadR
<400>72
aattacgcgt ttaaggttgt tttttaaaac aatttatata ca                        42
<210>73
<211>36
<212>DNA
<213>Cac_bdhF
<400>73
aattgaattc attagatgct tgtattaaaa taataa                               36
<210>74
<211>36
<212>DNA
<213>Cac_bdhR
<400>74
aattggatcc ttacacagat tttttgaata tttgta                               36
<210>75
<211>35
<212>DNA
<213>Cac_hbdF
<400>75
aattgaattc attgatagtt tctttaaatt taggg                                35
<210>76
<211>35
<212>DNA
<213>Cac_hbdR
<400>76
aattggatcc ttattttgaa taatcgtaga aacct                                35
<210>77
<211>35
<212>DNA
<213>Cac_crtF
<400>77
aattgaattc ctatctattt ttgaagcctt caatt                                35
<210>78
<211>36
<212>DNA
<213>Cac_crtR
<400>78
aattggatcc aatattttag gaggattagt catgga                               36
<210>79
<211>37
<212>DNA
<213>Cac_bcdF
<400>79
aattggtacc ttaattatta gcagctttaa cttgagc                              37
<210>80
<211>40
<212>DNA
<213>Cac_bcdR
<400>80
aattggatcc aaaattgaag gcttcaaaaa tagataggag                           40
<210>81
<211>44
<212>DNA
<213>Cac_adhF
<400>81
aattgtcgac attttataaa ggagtgtata taaatgaaag ttac                      44
<210>82
<211>36
<212>DNA
<213>Cac_adhR
<400>82
ttaatctaga ttaaaatgat tttatataga tatcct                               36
<210>83
<211>20
<212>DNA
<213>glpDchk_F
<400>83
ccgtgggtga aacagttctt                                                20
<210>84
<211>20
<212>DNA
<213>glpDchk_R
<400>84
cgtaagtgcg agcgtaatga                                                20
<210>85
<211>20
<212>DNA
<213>glpKchk_F
<400>85
aaagctccac gctggtagaa                                                20
<210>86
<211>20
<212>DNA
<213>glpKchk_R
<400>86
gtcacgcgtc tgataagcaa                                                20

Claims (44)

1.一种能够以理论产率的至少5%的产率生成正丁醇的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性途径的异源酶,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;
工程化改造微生物以灭活一种或多种途径的天然酶,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一;和
工程化改造微生物以活化至少NADH生成酶和NADH生成途径之一,从而平衡所述NADH依赖性异源途径。
2.权利要求1的重组微生物,其中所述一种或多种天然途径是NADH依赖性途径。
3.权利要求1的重组微生物,其中所述异源酶选自下组:厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶、乙酰-CoA-乙酰基转移酶(硫解酶)、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶和正丁醇脱氢酶。
4.权利要求3的重组微生物,其中所述天然酶包含催化乙酰-CoA转化成乙醇的醇脱氢酶,且所述重组微生物能够以理论产率的至少30%的产率生成正丁醇。
5.权利要求4的重组微生物,其中所述NADH生成酶是NADH依赖性甲酸脱氢酶。
6.权利要求4的重组微生物,其中所述NADH生成酶是在厌氧条件下有活性的丙酮酸脱氢酶。
7.权利要求4的重组微生物,其中所述NADH生成途径是用于将甘油转化成丙酮酸的途径,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
8.权利要求1的重组微生物,其中所述天然酶选自下组:D-乳酸脱氢酶、丙酮酸甲酸裂合酶、乙醛/醇脱氢酶、磷酸乙酰转移酶、乙酸激酶A、延胡索酸还原酶、丙酮酸氧化酶和甲基乙二醛合酶。
9.权利要求4的重组微生物,其中所述天然酶进一步包含乳酸脱氢酶,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
10.权利要求9的重组微生物,其中所述天然酶进一步包含延胡索酸还原酶,且所述重组微生物能够以理论产率的至少55%的产率生成正丁醇。
11.权利要求10的重组微生物,其中所述天然酶进一步包含甲基乙二醛合酶,且所述重组微生物能够以理论产率的至少60%的产率生成正丁醇。
12.权利要求11的重组微生物,其中所述天然酶进一步包含乙酸激酶,且所述重组微生物能够以理论产率的至少65%的产率生成正丁醇。
13.权利要求12的重组微生物,其中所述NADH生成酶是在厌氧条件下有活性的丙酮酸脱氢酶,且所述重组微生物能够以理论产率的至少73%的产率生成正丁醇。
14.一种能够以理论产率的至少2%的产率生成正丁醇的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性途径的异源酶,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;和
工程化改造微生物以灭活一种或多种途径的天然酶,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
15.权利要求14的重组微生物,其中所述一种或多种天然途径是NADH依赖性途径。
16.权利要求14的重组微生物,其中所述异源酶选自下组:厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶、乙酰-CoA-乙酰基转移酶(硫解酶)、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶和正丁醇脱氢酶。
17.权利要求16的重组微生物,其中所述天然酶包含催化乙酰-CoA转化成乙醇的醇脱氢酶,且所述重组微生物能够以理论产率的至少5%的产率生成正丁醇。
18.权利要求17的重组微生物,其中所述天然酶进一步包含乳酸脱氢酶,且所述重组微生物能够以理论产率的至少7%的产率生成正丁醇。
19.权利要求18的重组微生物,其中所述天然酶进一步包含延胡索酸还原酶,且所述重组微生物能够以理论产率的至少20%的产率生成正丁醇。
20.权利要求19的重组微生物,其中所述天然酶进一步包含甲基乙二醛合酶,且所述重组微生物能够以理论产率的至少25%的产率生成正丁醇。
21.权利要求19的重组微生物,其中所述天然酶进一步包含乙酸激酶,且所述重组微生物能够以理论产率的至少25%的产率生成正丁醇。
22.一种表达用于将碳源转化成正丁醇的异源途径的重组微生物,该异源途径包含以下底物变成产物的转化:
乙酰-CoA变成乙酰乙酰-CoA,乙酰乙酰-CoA变成羟基丁酰-CoA,羟基丁酰-CoA变成巴豆酰-CoA,巴豆酰-CoA变成丁酰-CoA,丁酰-CoA变成丁醛,和丁醛变成正丁醇,
该重组微生物被工程化改造以灭活一种或多种天然途径,该途径用于将底物转化成产物,其中所述底物是丙酮酸或乙酰CoA,
该重组微生物被进一步工程化改造以活化至少厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶和用于将甘油转化成丙酮酸的异源途径之一,且
该重组微生物能够以理论产率的至少5%的产率生成正丁醇。
23.权利要求22的重组微生物,其中所述一种或多种天然途径是NADH依赖性途径。
24.权利要求25的重组微生物,其中所述被灭活的途径包含至少乙酰CoA转化成乙醇、丙酮酸转化成乳酸、丙酮酸转化成琥珀酸和二羟基丙酮磷酸转化成甲基乙二醛、乙酰-CoA转化成乙酸和丙酮酸转化成乙酸之一。
25.权利要求22的重组微生物,其中所述一种或多种天然途径包含乙酰-CoA转化成乙醇,且所述重组微生物能够以理论产率的至少30%的产率生成正丁醇。
26.权利要求25的重组微生物,其中所述NADH生成途径是用于将甘油转化成丙酮酸的途径,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
27.权利要求25的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成乳酸,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
28.权利要求27的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成琥珀酸,且所述重组微生物能够以理论产率的至少55%的产率生成正丁醇。
29.权利要求28的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成甲基乙二醛,且所述重组微生物能够以理论产率的至少60%的产率生成正丁醇。
30.权利要求29的重组微生物,其中所述被灭活的途径进一步包含乙酰-CoA转化成乙酸,且所述重组微生物能够以理论产率的至少65%的产率生成正丁醇。
31.权利要求20的重组微生物,其中所述NADH生成酶是在厌氧条件下有活性的丙酮酸脱氢酶,且所述重组微生物能够以理论产率的至少73%的产率生成正丁醇。
32.一种表达用于将碳源转化成正丁醇的异源途径的重组微生物,该异源途径包含以下底物变成产物的转化:
乙酰-CoA变成乙酰乙酰-CoA;乙酰乙酰-CoA变成羟基丁酰-CoA;羟基丁酰-CoA变成巴豆酰-CoA;巴豆酰-CoA变成丁酰-CoA;丁酰-CoA变成丁醛,和丁醛变成正丁醇,
该重组微生物被工程化改造以灭活一种或多种天然途径,该途径用于将底物转化成产物,其中所述底物是丙酮酸或乙酰CoA,
该重组微生物能够以理论产率的至少2%的产率生成正丁醇。
33.权利要求32的重组微生物,其中所述被灭活的途径包含至少乙酰-CoA转化成乙醇,丙酮酸转化成乳酸,丙酮酸转化成琥珀酸和丙酮酸转化成甲基乙二醛,乙酰-CoA转化成乙酸和丙酮酸转化成乙酸之一。
34.权利要求32的重组微生物,其中所述一种或多种天然途径包含乙酰-CoA转化成乙醇,且所述重组微生物能够以理论产率的至少5%的产率生成正丁醇。
35.权利要求34的重组微生物,其中所述一种或多种天然途径进一步包含丙酮酸转化成乳酸,且所述重组微生物能够以理论产率的至少7%的产率生成正丁醇。
36.权利要求35的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成琥珀酸,且所述重组微生物能够以理论产率的至少20%的产率生成正丁醇。
37.权利要求36的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成甲基乙二醛,且所述重组微生物能够以理论产率的至少25%的产率生成正丁醇。
38.权利要求36的重组微生物,其中所述被灭活的途径进一步包含乙酰-CoA转化成乙酸,且所述重组微生物能够以理论产率的至少35%的产率生成正丁醇。
39.一种用于生产正丁醇的方法,该方法包括
提供依照权利要求1的重组微生物,
使该重组微生物接触碳源,接触的时间和条件足以容许正丁醇生成,直至生成了可回收量的正丁醇,和
回收可回收量的正丁醇。
40.依照权利要求39的方法,其中在需氧条件下培养所述微生物,且其中在厌氧条件下进行生物催化。
41.依照权利要求32的方法,其中培养微生物的pH控制为pH5-7,且其中培养温度控制为25-37℃。
42.一种能够以理论产率的至少5%的产率生成丁酸的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成丁酸;和
工程化改造微生物以灭活天然途径,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
43.能够以理论产率的至少5%的产率生成丁酸和正丁醇混合物的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成丁酸;
工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;和
工程化改造微生物以灭活天然途径,该途径将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
44.权利要求43的重组微生物,其中所述重组微生物是通过如下可获得的:进一步工程化改造微生物以活化至少NADH生成酶和NADH生成途径之一,从而平衡所述NADH依赖性异源途径。
CN200780050853A 2006-12-01 2007-12-03 用于生产正丁醇的工程化改造的微生物及相关方法 Pending CN101627109A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US86832606P 2006-12-01 2006-12-01
US60/868,326 2006-12-01
US60/890,329 2007-02-16
US60/905,550 2007-03-06
US60/940,877 2007-05-30
US60/945,576 2007-06-21

Publications (1)

Publication Number Publication Date
CN101627109A true CN101627109A (zh) 2010-01-13

Family

ID=41522321

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200780050853A Pending CN101627109A (zh) 2006-12-01 2007-12-03 用于生产正丁醇的工程化改造的微生物及相关方法

Country Status (1)

Country Link
CN (1) CN101627109A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102618569A (zh) * 2012-03-15 2012-08-01 南京工业大学 产丁醇基因工程菌的构建、菌株及其应用
CN108004260A (zh) * 2016-10-28 2018-05-08 深圳华大基因研究院 调节动物肠道菌群结构的方法
CN110452827A (zh) * 2019-07-24 2019-11-15 上海中溶科技有限公司 一种具有脱毒功能的基因重组酿酒酵母及构建方法及其应用
CN113736717A (zh) * 2021-11-03 2021-12-03 广东省科学院生态环境与土壤研究所 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102618569A (zh) * 2012-03-15 2012-08-01 南京工业大学 产丁醇基因工程菌的构建、菌株及其应用
CN108004260A (zh) * 2016-10-28 2018-05-08 深圳华大基因研究院 调节动物肠道菌群结构的方法
CN108004260B (zh) * 2016-10-28 2021-07-06 深圳华大生命科学研究院 调节动物肠道菌群结构的方法
CN110452827A (zh) * 2019-07-24 2019-11-15 上海中溶科技有限公司 一种具有脱毒功能的基因重组酿酒酵母及构建方法及其应用
CN110452827B (zh) * 2019-07-24 2020-07-31 中溶科技股份有限公司 一种具有脱毒功能的基因重组酿酒酵母及构建方法及其应用
CN113736717A (zh) * 2021-11-03 2021-12-03 广东省科学院生态环境与土壤研究所 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用
CN113736717B (zh) * 2021-11-03 2022-02-11 广东省科学院生态环境与土壤研究所 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用

Similar Documents

Publication Publication Date Title
AU2021203937B2 (en) Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
BRPI0719748A2 (pt) Microrganismo modificados por engenharia para produzir n-butanol e métodos relacionados
RU2763170C2 (ru) Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом
AU2023270322A1 (en) Compositions and methods for modifying genomes
DK2576605T3 (en) PREPARATION OF METABOLITES
KR102092422B1 (ko) 유전자 조작된 미생물로부터 뮤콘산의 생산
DK2087105T3 (da) Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer
KR20180081527A (ko) 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구
KR102593668B1 (ko) 유도 기질 부재 하의 사상 진균 세포에서의 단백질 생산
KR101633477B1 (ko) 개선된 단백질 발현계
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
IL236992A (en) Genetically modified cyanobacteria that produce ethanol
KR20140099224A (ko) 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법
EP2181195A2 (de) Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20130138760A (ko) 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포
CN109996874A (zh) 10-甲基硬脂酸的异源性产生
KR20190003939A (ko) 유전자 조작된 미생물로부터 개선된 뮤콘산 생산
KR102303832B1 (ko) 내산성을 갖는 효모 세포, 상기 효모 세포를 제조하는 방법 및 이의 용도
US20110059485A1 (en) Plasmids from Thermophilic Organisms, Vectors Derived Therefrom, and Uses Thereof
CN109843909B (zh) 利用替代的葡萄糖转运蛋白产生鼠李糖脂的细胞和方法
CN115698297A (zh) 多模块生物合成酶基因组合文库的制备方法
CN115927299A (zh) 增加双链rna产生的方法和组合物
CN101627109A (zh) 用于生产正丁醇的工程化改造的微生物及相关方法
KR102287346B1 (ko) Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100113