CN101627109A - 用于生产正丁醇的工程化改造的微生物及相关方法 - Google Patents
用于生产正丁醇的工程化改造的微生物及相关方法 Download PDFInfo
- Publication number
- CN101627109A CN101627109A CN200780050853A CN200780050853A CN101627109A CN 101627109 A CN101627109 A CN 101627109A CN 200780050853 A CN200780050853 A CN 200780050853A CN 200780050853 A CN200780050853 A CN 200780050853A CN 101627109 A CN101627109 A CN 101627109A
- Authority
- CN
- China
- Prior art keywords
- recombinant microorganism
- approach
- propyl carbinol
- coa
- nadh
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
表达NADH依赖性途径中将碳源转化成正丁醇、其代谢中间产物和/或衍生物的至少一种异源酶且能够以高产率生成正丁醇、其代谢中间产物和/或衍生物的重组微生物及相关方法。工程化改造以灭活与NADH依赖性异源途径竞争的一种或多种途径的天然酶和/或在NADH生成和消耗方面平衡NADH依赖性异源途径的重组微生物。
Description
相关申请的交叉引用
本申请要求2006年12月1日提交的美国临时申请流水号60/868,326、2007年5月30日提交的美国临时申请流水号60/940,877、2007年2月16日提交的美国临时申请流水号60/890,329、2007年3月6日提交的美国临时申请流水号60/905,550和2007年6月21日提交的美国临时申请流水号60/945,576的优先权,所有这些申请通过提述以其整体并入本文。
发明领域
本公开内容涉及工程化改造的微生物。具体而言,它涉及用于生产生物燃料诸如正丁醇、其代谢中间产物和/或其衍生物的工程化改造的微生物。
发明背景
从生物质衍生的糖变成正丁醇的碳水化合物生物转化是已知的,而且已经大规模实施了大约100年。它的历史可以回溯到路易斯·巴斯德(LouisPasteur),他在1861年观察到某些细菌生成正丁醇。在1912,钱恩·魏茨曼(ChaimWeizmann)发现了一种称作丙酮丁醇梭菌(Clostridium acetobutylicum)的微生物,它能够将淀粉发酵成丙酮、正丁醇和乙醇(因此称作ABE发酵)。此过程基于在梭菌属的厌氧性革兰氏阳性细菌中找到的一套独特的代谢途径(见图1),它们也提供副产物诸如丙酮和乙醇的生成。
最近来自中东的石油供应的不稳定性,加上在美国易于获得可再生的、基于农业的生物质的供应,已经重新刺激了对在梭菌中生产正丁醇的兴趣,而且已经推动了在其它微生物中生产丁醇的尝试。
已经产生了梭菌属的工程化改造菌株,它们优化了自经过处理的生物质废物生产正丁醇。另外,已经开发了新的正丁醇生产工艺,它们利用多种梭菌属菌株,优化了碳水化合物变成丁酸的转化或外源丁酸变成正丁醇的后续转化。
能够生成可检测量的丁醇的其它微生物诸如大肠杆菌或大肠埃希氏菌(E.coli)的工程化改造菌株的生成也已有报道。
发明概述
本文中公开了能以大于理论产率的70%的高产率提供正丁醇的重组微生物。
具体而言,本文中所公开的重组微生物被工程化改造以活化用于生成正丁醇的异源途径,将碳流指向正丁醇,和可能地在NADH生成和消耗方面平衡所述异源途径以使可获得的产率最大化。
依照一个实施方案,描述了能够以理论产率的至少5%的产率生成正丁醇的重组微生物。具体而言,该重组微生物是通过如下可获得的:工程化改造微生物以活化用于NADH依赖性途径中的异源酶,该途径通过生成一种或多种代谢中间产物而将碳源转化正丁醇;工程化改造微生物以灭活一种或多种途径的天然酶,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一;和工程化改造微生物以活化至少NADH生成酶和NADH生成途径之一以平衡所述NADH依赖性异源途径。
依照另一个实施方案,描述了能够以理论产率的至少2%的产率生成正丁醇的重组微生物。该重组微生物是通过如下可获得的:工程化改造微生物以活化NADH依赖性途径的异源酶,该途径通过生成一种或多种代谢中间产物而将碳源转化正丁醇;和工程化改造微生物以灭活一种或多种途径的天然酶,该途径将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
依照又一个实施方案,描述了表达用于将碳源转化成正丁醇的异源途径的重组微生物。该异源途径包含以下底物变成产物的转化:乙酰-CoA变成乙酰乙酰-CoA;乙酰乙酰-CoA变成羟基丁酰-CoA;羟基丁酰-CoA变成巴豆酰-CoA;巴豆酰-CoA变成丁酰-CoA;丁酰-CoA变成丁醛;和丁醛变成正丁醇。重组微生物被工程化改造以灭活一种或多种用于将底物转化成产物的天然途径,其中所述底物是丙酮酸或乙酰CoA。重组微生物被进一步工程化改造以活化至少厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶和用于将甘油转化成丙酮酸的异源途径之一。重组微生物能够以理论产率的至少5%的产率生成正丁醇。
依照另一个实施方案方面,描述了表达用于将碳源转化成正丁醇的异源途径的重组微生物。该异源途径包含以下底物变成产物的转化:乙酰-CoA变成乙酰乙酰-CoA;乙酰乙酰-CoA变成羟基丁酰-CoA;羟基丁酰-CoA变成巴豆酰-CoA;巴豆酰-CoA变成丁酰-CoA;丁酰-CoA变成丁醛;和丁醛变成正丁醇。重组微生物被工程化改造以灭活一种或多种用于将底物转化成产物的天然途径,其中所述底物是丙酮酸或乙酰CoA。重组微生物能够以理论产率的至少XX%的产率生成正丁醇。
本文中所描述的重组微生物能以高产率生成正丁醇,同时副产物的生成最小化,这对于在梭菌属中生产正丁醇的现有技术体系是有利的。
本文中所描述的重组微生物能以比在梭菌属以外的微生物中生产正丁醇的现有技术体系显著更高的产率生成正丁醇。
依照另一个实施方案,描述了用于生产正丁醇的方法,包括提供本文中所描述的重组微生物,并使该重组微生物接触碳源,接触的时间和条件足以容许正丁醇生成,直至生成了可回收数量的正丁醇。该方法还可包括回收可回收量的正丁醇。
依照另一个实施方案,描述了能够以理论产率的至少5%的产率生成丁酸的重组微生物。该重组微生物是通过如下可获得的:工程化改造微生物以活化NADH依赖性异源途径,该途径通过生成一种或多种代谢中间产物而将碳源转化成丁酸;和工程化改造微生物以灭活天然途径,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
依照另一个实施方案,描述了能够以理论产率的至少5%的产率生成丁酸和正丁醇的混合物的重组微生物。该重组微生物是通过如下可获得的:工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成丁酸;工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;工程化改造微生物以灭活天然途径,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一;和/或工程化微生物以活化至少NADH生成酶和NADH生成途径之一以平衡所述NADH依赖性异源途径。
附图和下文描述阐明了本公开内容的一个或多个实施方案的详情。根据说明书和附图,及根据权利要求书,其它特征、目标和优点会是显而易见的。
附图简述
并入本说明书并形成本说明书一部分的附图图示了本公开内容的一个或多个实施方案,并且与详述一起用于解释本公开内容的原理和实施。
图1图示了丙酮丁醇梭菌中葡萄糖转化成酸和溶剂所牵涉的代谢途径。己糖(例如葡萄糖)和戊糖被转化成丙酮酸、ATP和NADH。随后,丙酮酸-铁氧还蛋白氧化还原酶将丙酮酸氧化性脱羧成乙酰-CoA。只含铁的氢化酶(aniron-only hydrogenase)将此步骤中所生成的还原当量转化成氢。乙酰-CoA是分支点中间产物,通向有机酸(乙酸和丁酸)和溶剂(丙酮、正丁醇和乙醇)的生成。
图2图示了微生物中生成正丁醇的化学途径。在理想条件下,此途径每代谢1分子葡萄糖就生成1分子正丁醇(最大值)。所描绘的正丁醇生成途径在NADH生成和消耗方面是平衡的,即每代谢1个葡萄糖就生成和消耗4个NADH。
图3图示了大肠杆菌中的混合酸发酵,其产物包括琥珀酸、乳酸、乙酸、乙醇、甲酸、二氧化碳和氢气。加框的酶已经被删除或灭活,在一种或多种大肠杆菌菌株中依照本公开内容或是单一的或是各式各样组合的。
图4图示了用于在大肠杆菌中生成厌氧活性丙酮酸脱氢酶的代谢工程化改造策略。在此策略中,加框的酶被删除/灭活,而且在基本培养基和诸如葡萄糖的碳源上厌氧培养细胞。在那些条件下,唯一生长的细胞是那些生成丙酮酸脱氢酶的细胞,因为它们能够经粗体所示途径平衡NADH生成和消耗。
图5描绘了5614bp的EcoRI-BamHI限制性片段,其显示了来自丙酮丁醇梭菌的作为单一转录物合成的thl、adh、crt和hbd基因(seq tach,其是自质粒pGV1191表达的)。
图6描绘了3027bp的EcoRI-BamHI限制性片段,其显示了来自丙酮丁醇梭菌的作为单一转录物合成的bcd、etfA和etfB基因(seq Cbab,其是自pGV1088表达的)。
图7描绘了3128bp的限制性片段,其显示了来自埃氏巨球形菌(M.elsdenii)的作为单一转录物合成的bcd、etfA和etfB基因(seq Mbab,其是自pGV1052表达的)。
图8描绘了Seq tach-pZA11(=pGV1191)质粒,其含有插入在载体MCS中的EcoRI和BamHI位点处和改良噬菌体λtetO启动子(PL-tet)下游的thl、adhE2、crt和hbd ORF-该质粒还携带p15A复制起点和氨苄青霉素抗性基因。
图9描绘了Seq Cbab-pZE32(=pGV1088)质粒,其含有插入在载体MCS中的EcoRI和BamHI位点处和改良噬菌体λLacO启动子(PL-lac)下游的bcd、etfA和etfB ORF-该质粒还携带ColE1复制起点和氯霉素抗性基因。
图10显示了包括GEVO1005(大肠杆菌W3110)、GEVO922(大肠杆菌W3110(ΔglpK,ΔglpD))和GEVO926(大肠杆菌W3110(ΔglpK,ΔglpD,进化的))的培养皿。GEVO926在板上标有“GO2XKO-I”。
图11显示了示意图,图示了在非生长条件下遵循厌氧生物转化本文中所描述的重组微生物(GEVO927)消耗的甘油的量,与相应的野生型微生物(GEVO1005,pGV1010)所消耗的量比较。
图12显示了示意图,图示了遵循厌氧的、非生长的生物催化本文中所描述的重组微生物(GEVO927)生成的3-羟基丁酸乙酯的量,与相应的野生型微生物(GEVO1005,pGV1010)所生成的量比较。
图13显示了示意图,图示了遵循厌氧的、非生长的生物催化本文中所描述的微生物(GEVO1005,pGV1010)在甘油消耗方面的碳平衡和观察到的乙酸量。
图14显示了示意图,图示了遵循厌氧的、非生长的生物催化本文中所描述的重组微生物(GEVO927)在甘油消耗方面的碳平衡和观察到的乙酸量。
图15显示了使用利用来自纤细眼虫(Euglena gracilis)(pGV1191,pGV1113)和嗜水气单胞菌(pGV1191,pGV1117)的TER表达正丁醇生成途径的大肠杆菌菌株的发酵中随时间的正丁醇形成,与表达不含有TER酶的正丁醇生成途径的大肠杆菌(pGV1191)比较。实验是使用一式两份生物学复制品(two biologicalreplicates)进行的。
图16显示了示意图,图示了用本文中所公开的表达不同TER同系物(homologue)的重组微生物进行的正丁醇发酵(pGV1340;pGV1344;pGV1345;pGV1346;pGV1347;pGV1348;pGV1349;pGV1272(对照))。pGV1344含有编码齿垢密螺旋体(Treponema denticola)TER的基因。pGV1272含有编码纤细眼虫TER的基因。实验是使用一式两份生物学复制品进行的。
图17显示了示意图,图示了用含有所示表达不同TER同系物的质粒的重组微生物进行的正丁醇发酵(pGV1341;pGV1342;pGV1343;pGV1272(对照))。pGV1272含有编码纤细眼虫TER的基因。实验是使用一式两份生物学复制品进行的。
图18显示了示意图,图示了本文中所描述的重组微生物(菌株A:GEVO1083,pGV1191,pGV1113;菌株B:GEVO1121,pGV1191,pGV1113)在厌氧瓶发酵期间的乳酸生成。实验是使用一式两份生物学复制品进行的。
图19显示了示意图,图示了被工程化改造以灭活乙酸发酵性途径的依照本文中所描述的实施方案的重组微生物的正丁醇生成(菌株1137:GEVO1137,pGV1190,pGV1113;菌株1083:GEVO1083,pGV1190,pGV1113)。实验是使用一式两份生物学复制品进行的。
图20A显示了示意图,图示了依照本公开内容的实施方案的重组微生物(菌株1:GEVO1083,pGV1113,pGV1190;菌株2:GEVO1083,pGV1281,pGV1190)的正丁醇生成。实验是使用一式两份生物学复制品进行的。
图20B显示了示意图,图示了依照本公开内容的实施方案的重组微生物的葡萄糖消耗(矩形:GEVO1083,pGV1113,pGV1190;三角形:GEVO1083,pGV1281,pGV1190)。实验是使用一式两份生物学复制品进行的。
图21A显示了示意图,图示了用依照本文中所公开的实施方案的重组微生物进行的发酵,其是厌氧的,没有中和或补料(圆形:GEVO768,pGV1191,pGV1113;三角形:GEVO768)。实验是使用一式两份生物学复制品进行的。
图21B显示了示意图,图示了用图21A的重组微生物进行的发酵,其中在整个发酵过程中每8个小时补料葡萄糖和中和发酵液,且其中以需氧生长阶段和厌氧生物催化阶段实施发酵(圆形:GEVO768,pGV1191,pGV1113;三角形:GEVO768)。实验是使用一式两份生物学复制品进行的。
图22A显示了示意图,图示了用依照本文中所公开的实施方案的重组微生物(GEVO1083,pGV1190,pGV1113)在从需氧到厌氧培养条件的不同转换(transition)下进行的发酵期间的正丁醇生成。发酵罐1(F1)具有2小时转换,发酵罐2(F2)具有6小时转换,发酵罐3(F3)具有12小时转换,而在发酵罐4中,转换是以细胞消耗停止供氧后发酵罐中剩下的氧所用时间进行的。
图22B显示了示意图,图示了用依照本文中所公开的实施方案的重组微生物(GEVO1083,pGV1190,pGV1113)在从需氧到厌氧培养条件的不同转换下进行的发酵期间的生成。发酵罐1(F1)具有2小时转换,发酵罐2(F2)具有6小时转换,发酵罐3(F3)具有12小时转换,而在发酵罐4中,转换是以细胞消耗停止供氧后发酵罐中剩下的氧所用时间进行的。
图23A显示了示意图,图示了依照本公开内容的实施方案的重组微生物的葡萄糖消耗(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图23B显示了示意图,图示了依照本公开内容的实施方案的重组微生物甲酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图23C显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙醇生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图23D显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图24A显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乳酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图24B显示了示意图,图示了依照本公开内容的实施方案的重组微生物的琥珀酸生成(矩形:GEVO1034,pGV1248;三角形:GEVO1034,pGV1111)。实验是使用一式两份生物学复制品进行的。
图25A显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙醇生成(矩形:GEVO992,pGV1278;三角形:GEVO992,pGV1279;圆形:GEVO992,pGV772)。实验是使用一式两份生物学复制品进行的。
图25B显示了示意图,图示了依照本公开内容的实施方案的重组微生物的乙酸生成(矩形:GEVO992,pGV1278;三角形:GEVO992,pGV1279;圆形:GEVO992,pGV772)。实验是使用一式两份生物学复制品进行的。
图26显示了示意图,图示了野生型大肠杆菌和自质粒pGV1563表达DHA激酶的大肠杆菌GEVO926中的甘油代谢。
图27显示了微生物中用以生成正丁醇与丁酸的混合物的化学途径。所描绘的正丁醇生成途径在NADH生成和消耗方面是平衡的,即每代谢1个葡萄糖就生成和消耗(4)个NADH。
发明详述
描述了被工程化改造以以高产率将碳源转化成正丁醇的重组微生物。具体而言,描述了能够代谢碳源用于以理论产率的至少5%的产率生成正丁醇的重组微生物。
如本文中所使用的,术语“微生物”包括原核的和真核的微生物物种,其来自古细菌、细菌和真核生物范畴,后一种包括酵母和丝状真菌、原生动物、藻类、或高等原生生物。术语“细胞”和“微生物细胞”可以与术语“微生物”互换使用。在一个优选的实施方案中,微生物是大肠杆菌或酵母(诸如粟酒裂殖糖酵母(S.pombe)或酿酒酵母或啤酒糖酵母(S.cerevisiae))。
“细菌”或“真细菌”指原核生物体的一个范畴。细菌包括至少11个不同的组,如下:(1)革兰氏阳性(Gram+)细菌,其中有两个主要的分部:(a)高G+C组(放线菌属(Actinomycetes)、分支杆菌属(Mycobacteria)、微球菌属(Micrococcus)等),(b)低G+C组(芽孢杆菌属(Bacillus)、梭菌属(Clostridia)、乳杆菌属(Lactobacillus)、葡萄球菌属(Staphylococci)、链球菌属(Streptococci)、支原体属(Mycoplasmas));(2)变形细菌(Proteobacteria),例如,紫色光合的和非光合的革兰氏阴性细菌(包括最“普通的”革兰氏阴性细菌);(3)蓝细菌属(Cyanobacteria),例如,生氧光养生物;(4)螺旋体属(Spirochetes)及相关物种;(5)浮霉状菌属(Planctomyces);(6)拟杆菌属(Bacteroides)、黄杆菌属(Flavobacteria);(7)衣原体属(Chlamydia);(8)绿色硫磺细菌;(9)绿色非硫磺细菌(也称作厌氧光养生物);(10)抗放射性微球菌及亲属;(11)栖热袍菌属(Thermotoga)和嗜热栖热腔菌(Thermosipho thermophiles)。
“革兰氏阴性细菌”包括球菌、非肠的(nonenteric)杆状菌和肠的杆状菌。革兰氏阴性细菌的属包括,例如,奈瑟氏菌属(Neisseria)、螺菌属(Spirillum)、巴斯德氏菌属(Pasteurella)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、弗朗西丝氏菌属(Francisella)、嗜血杆菌属(Haemophilus)、博德特氏菌属(Bordetella)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、克雷伯氏菌属(Klebsiella)、变形菌属(Proteus)、假单胞菌属(Pseudomonas)、拟杆菌(Bacteroides)、醋杆菌属(Acetobacter)、气杆菌属(Aerobacter)、土壤杆菌属(Agrobacterium)、固氮菌属(Azotobacter)、粘球菌属(Myxococcus)、螺菌属(Spirilla)、沙雷氏菌属(Serratia)、弧菌属(Vibrio)、根瘤菌属(Rhizobium)、衣原体属(Chlamydia)、立克次氏体属(Rickettsia)、密螺旋体属(Treponema)和梭杆菌属(Fusobacterium)。
“革兰氏阳性”细菌包括球菌、不形成孢子的杆状菌和形成孢子的杆状菌。革兰氏阳性细菌的属包括,例如,放线菌属(Actinomyces)、芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、丹毒丝菌属(Erysipelothrix)、乳杆菌属(Lactobacillus)、利斯特氏菌属(Listeria)、分支杆菌属(Mycobacterium)、诺卡氏菌属(Nocardia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。
术语“碳源”一般指适合用作原核细胞或简单的真核细胞的生长的碳来源的底物或化合物。碳源可以是各种形式,包括,但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽等。这些包括,例如,各种单糖诸如葡萄糖、寡糖、多糖、纤维素材料、饱和的或不饱和的脂肪酸、琥珀酸、乳酸、乙醇等,或其混合物。碳源还可以是光合作用的产物,包括,但不限于葡萄糖。术语“碳源”可以与术语“能源(energy source)”互换使用,因为在化能有机营养代谢中,碳源既用作分解代谢期间的电子供体又用作细胞生长期间的碳来源。
充当用于生成正丁醇产物的合适起始材料的碳源包括,但不限于,生物质水解产物、葡萄糖、淀粉、纤维素、半纤维素、木糖、木质素、右旋糖、果糖、半乳糖、玉米、液化玉米粉、玉米浆(玉米湿磨工艺的副产品,其含有浸泡期间自玉米浸出的营养物)、糖蜜、木质纤维素和麦芽糖。光合生物体能另外生成碳源,作为光合作用的产物。在一个优选的实施方案中,碳源可选自生物质水解产物和葡萄糖。葡萄糖、右旋糖和淀粉可以来自内源的或外源的来源。
应当注意,可以用其它更加易得的和/或便宜的碳源替代葡萄糖,这对宿主微生物的改动是较为微小的。例如,在某些实施方案中,使用其它可再生的和经济上可行的底物可能是优选的。这些包括:农业废物、基于淀粉的包装材料、玉米纤维水解产物、大豆糖蜜、水果加工业废物和乳清渗透物等。
五碳糖只被能够加工这些糖的微生物菌株用作碳源,例如大肠杆菌B。在一些实施方案中,可以使用甘油(glycerol)(一种三碳碳水化合物)作为生物转化的碳源。在其它实施方案中,可以使用甘油(glycerin)或通过水解来自植物和动物脂肪和油的甘油三酸酯得到的不纯的甘油作为碳源,只要任何杂质不会对宿主微生物产生不利影响。
如本文中所使用的,术语“产率”指摩尔产率。例如,若1摩尔葡萄糖被转化成1摩尔正丁醇,则产率等于100%。具体而言,术语“产率”定义为每摩尔碳源单体得到的产物摩尔数,而且可以表述为%。除非另有说明,产率表述为理论产率的%。“理论产率”定义为根据用于生成产物的代谢途径的化学计量的规定,每摩尔指定底物能生成的产物最大摩尔数。例如,葡萄糖变成正丁醇的一种典型转化的理论产率为100%。因此,葡萄糖变成正丁醇的产率为95%会表述为理论产率的95%或95%理论产率。例如,甘油变成正丁醇的一种典型转化的理论产率为50%。因此,甘油变成正丁醇的产率为45%会表述为理论产率的90%或90%理论产率。
本文中所公开的微生物是使用遗传工程技术被工程化改造的,以提供利用异源表达的酶来以高产率生成正丁醇的微生物,具体而言,产率为理论产率的至少5%。
术语“酶”,如本文中所使用的,指任何催化或促进一种或多种化学或生物化学反应的物质,其通常包括完全或部分由多肽构成的酶,但是可以包括由不同分子(包括多核苷酸)构成的酶。
术语“多核苷酸”在本文中可以与术语“核酸”互换使用,指由两个或更多个单体(包括核苷酸、核苷或其类似物)构成的有机聚合物,包括但不限于单链的或双链的、有义的或反义的任何长度脱氧核糖核酸(DNA)及适当时单链的或双链的、有义的或反义的任何长度核糖核酸(RNA),包括siRNA。术语“核苷酸”指数种由核糖或脱氧核糖与嘌呤或嘧啶碱基及与磷酸基团相连接而组成的化合物之任一,其是核酸的基本结构单元。术语“核苷”指由嘌呤或嘧啶碱基与脱氧核糖或核糖相组合而组成的化合物(像鸟苷或腺苷),其尤其见于核酸。术语“核苷酸类似物”或“核苷类似物”分别指其中一个或多个单独的原子被不同的原子或被不同的官能团替换的核苷酸或核苷。因而,术语多核苷酸包括任何长度的核酸、DNA、RNA、其类似物和片段。三个或更多个核苷酸的多核苷酸称作核苷酸寡聚物或寡核苷酸。
术语“蛋白质”或“多肽”,如本文中所使用的,指由两个或更多个氨基酸单体和/或其类似物构成的有机聚合物。如本文中所使用的,术语“氨基酸”或“氨基酸单体”指任何天然的和/或合成的氨基酸,包括甘氨酸和D或L两种光学异构体。术语“氨基酸类似物”指其中一个或多个单独的原子被不同的原子或不同的官能团替换的氨基酸。因而,术语多肽包括任何长度的氨基酸聚合物,包括全长蛋白质,和肽以及其类似物和片段。三个或更多个氨基酸的多肽称作蛋白质寡聚物或寡肽。
术语“异源”或“外源”,如本文中关于分子(尤其是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体以外的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。
另一方面,术语“天然”或“内源”,如本文中关于分子(尤其是酶和多核苷酸)所使用的,指在它们起源的或在自然界中发现它们的生物体中表达的分子,无关乎表达水平,其可以低于、等于或高于该分子在天然微生物中的表达水平。
在某些实施方案中,天然的、未工程化改造的微生物不能够将碳源转化成正丁醇或一种或多种其代谢中间产物,因为,例如,此类野生型宿主缺乏正丁醇生成途径中所需要的一种或多种酶。
在某些实施方案中,天然的、未工程化改造的微生物只能够以小于理论产率的0.1%的产率将微量的碳源转化成正丁醇。
例如,微生物诸如大肠杆菌或酵母属菌种(Saccharomyces sp.)一般不具有将糖诸如葡萄糖转化成正丁醇的代谢途径,但是有可能将来自生成正丁醇的菌株(例如梭菌)的正丁醇生成途径转移入细菌的或真核的异源宿主中,诸如大肠杆菌或酵母属菌种,并使用所得重组微生物来生产正丁醇。
微生物,一般而言,作为宿主是合适的,如果它们拥有内在特性,诸如溶剂抗性,这会容许它们在含有溶剂的环境中代谢碳源。
术语“宿主”、“宿主细胞”和“重组宿主细胞”在本文中可以互换使用,不仅指特定的受试细胞而且指这样的细胞的后代或潜在后代。因为在后续世代中由于突变或环境影响可能发生某些修饰,所以这样的后代事实上与亲本细胞可能不是同样的,但是仍然包括在如本文中所使用的该术语的范围内。
对于生产正丁醇有用的宿主可以是真核的或原核的微生物。虽然大肠杆菌是优选的宿主之一,但是其它宿主包括酵母菌株诸如糖酵母属菌株,其能耐受对大肠杆菌有毒的正丁醇水平。
在某些实施方案中,其它合适的真核宿主微生物包括,但不限于,毕赤氏酵母属(Pichia)、Hangeul、耶氏酵母属(Yarrowia)、曲霉属(Aspergillus)、克鲁维酵母属(Kluyveromyces)、管囊酵母属(Pachysolen)、红酵母属(Rhodotorula)、
接合糖酵母属(Zygosaccharomyces)、Galactomyces、裂殖糖酵母属(Schizosaccharomyces)、青霉属(Penicillhim)、球拟酵母属(Torulaspora)、德巴利氏酵母属(Debaryomyces)、威尔氏酵母属(Williopsis)、德克酵母属(Dekkera)、克勒克氏酵母属(Kloeckera)、梅奇酵母属(Metschnikowia)和假丝酵母属(Candida)物种。
在另一个优选的实施方案中,宿主是细菌宿主。在一个更加优选的实施方案中,宿主包括节杆菌属(Arthrobacter)、芽孢杆菌属(Bacillus)、短杆菌属(Brevibacterium)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、葡萄糖杆菌属(Gluconobacter)、诺卡氏菌属(Nocardia)、假单胞菌属(Pseudomonas)、红球菌属(Rhodococcus)、链霉菌属(Streptomyces)、黄单胞菌属(Xanthomonas)。在一个更加优选的实施方案中,此类宿主是大肠杆菌或假单胞菌属。在一个甚至更加优选的实施方案中,此类宿主是大肠杆菌(诸如大肠杆菌W3110或大肠杆菌B)、食油假单胞菌(Pseudomonas oleovorans)、荧光假单胞菌(Pseudomonas fluorescens)、或恶臭假单胞菌(Pseudomonas putida)。
在某些实施方案中,本文中所公开的重组微生物对生长培养基中的某些水平的正丁醇有抗性,使得它能够在含至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.2%、1.5%、1.8%、2%、3%、4%、5%、6%、7%、8%或更多正丁醇的培养基中以与该微生物在不含正丁醇的培养基中生长的速率基本上相同的速率生长。如本文中所使用的,“基本上相同”指野生型生长速率的至少约80%、90%、100%、110%、或120%。
具体而言,本文中所公开的重组微生物被工程化改造以活化(尤其是表达)能在正丁醇生产中使用的异源酶。具体而言,在某些实施方案中,该重组微生物被工程化改造以活化催化乙酰-CoA转化成正丁醇的异源酶。
术语“活化”,如本文中关于生物学活性分子(诸如酶)所使用的,指微生物的基因组和/或蛋白质组中提高该微生物中的生物学活性分子的生物学活性的任何修饰。例示性的活化包括但不限于导致分子从生物学无活性形式变成生物学有活性形式及从生物学有活性形式变成生物学更有活性形式的转化的修饰,及导致生物学活性分子在微生物中表达的修饰,其中该生物学活性分子先前不表达。例如,生物学活性分子的活化可以如下来实施,即在微生物中表达编码生物学活性分子的天然的或异源的多核苷酸,在微生物中表达编码生物学活性分子的合成途径中所牵涉的酶的天然的或异源的多核苷酸,在微生物中表达增强生物学活性分子的表达的天然的或异源的分子。
在一些实施方案中,重组微生物可表达一种或多种编码赋予正丁醇生成能力的酶的异源基因。例如,本文中所公开的重组微生物可表达编码以下一项或多项的异源基因:厌氧活性丙酮酸脱氢酶(Pdh)、NADH依赖性甲酸脱氢酶(Fdh)、乙酰-CoA-乙酰基转移酶(硫解酶)、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶、正丁醇脱氢酶、双功能丁醛/正丁醇脱氢酶。此类异源DNA序列优选得自异源微生物(诸如丙酮丁醇梭菌或拜氏梭菌(Clostridium beijerinckii)),而且可以使用常规分子生物学技术导入适宜宿主中。这些异源DNA序列使得重组微生物能够生成正丁醇,至少以比野生型对应(counterpart)微生物所生成的量更大的量生成正丁醇或其代谢中间产物。
在某些实施方案中,本文中所公开的重组微生物表达异源硫解酶或乙酰-CoA-乙酰基转移酶,诸如由来自梭菌属的thl基因所编码的。
硫解酶(E.C.2.3.1.19)或乙酰-CoA乙酰基转移酶是催化乙酰基缩合到乙酰-CoA分子上的酶。该酶在丙酮丁醇梭菌由基因thl编码(GenBank登录号U08465,蛋白质ID AAA82724.1),在其它酶中,该酶在大肠杆菌中在其用于丙酮生成的天然启动子下过表达(Bermejo等,Appl.Environ.Mirobiol.64:1079-1085,1998)。同源酶也已经鉴定,而且本领域技术人员通过实施针对上述蛋白质序列的BLAST搜索能容易地鉴定。这些同系物也能充当异源表达的正丁醇途径中的合适硫解酶。仅举几例,这些同源酶包括,但不限于那些来自以下各项的:丙酮丁醇梭菌(例如,蛋白质TD AAC26026.1),巴氏梭菌(C.pasteurianum)(例如,蛋白质ID ABA18857.1),拜氏梭菌(例如,蛋白质IDEAP59904.1或EAP59331.1),产气荚膜梭菌(Clostridium perfringens)(例如,蛋白质ID ABG86544.1,ABG83108.1),艰难梭菌(Clostridium difficile)(例如,蛋白质ID CAJ67900.1或ZP_01231975.1),热解糖热厌氧杆菌(Thermoanaerobacterium thermosaccharolyticum)(例如,蛋白质IDCAB07500.1),腾冲热厌氧杆菌(Thermoanaerobacter tengcongensis)(例如,AAM23825.1),生氢氧化碳嗜热菌(Carboxydothermus hydrogenoformans)(例如,蛋白质ID ABB 13995.1),Desulfotomaculum reducens MI-1(例如,蛋白质ID EAR45123.1),热带假丝酵母(Candida tropicalis)(例如,蛋白质IDBAA02716.1或BAA02715.1),酿酒酵母(例如,蛋白质ID AAA62378.1或CAA30788.1),芽孢杆菌属菌种,埃氏巨球形菌(Megasphaera elsdenii)或溶纤维丁酸弧菌(Butyrivibrio fibrisolvens)等。另外,内源大肠杆菌硫解酶在异源表达的正丁醇途径中也可以是有活性的。大肠杆菌合成两种不同的3-酮酰-CoA硫解酶。一种是fadA基因的产物,另一种是atoB基因的产物。
根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约65%、70%、80%或90%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适硫解酶同系物。此类同系物包括(但不限于):拜氏梭菌NCIMB 8052(ZP_00909576.1或ZP_00909989.1),丙酮丁醇梭菌ATCC 824(NP_149242.1),破伤风梭菌(Clostridium tetani)E88(NP_781017.1),产气荚膜梭菌菌株13(NP_563111.1),产气荚膜梭菌SM101(YP_699470.1),巴氏梭菌(ABA18857.1),热解糖热厌氧杆菌(CAB04793.1),艰难梭菌QCD-32g58(ZP_01231975.1),艰难梭菌630(CAJ67900.1)等。
在某些实施方案中,本文中所公开的重组微生物表达异源3-羟基丁酰-CoA脱氢酶,诸如由来自梭菌属的hbd基因所编码的。
3-羟基丁酰-CoA脱氢酶(BHBD)是催化乙酰乙酰-CoA转化成3-羟基丁酰-CoA的酶。此酶存在生成3-羟基丁酰-CoA的(S)或(R)异构体的不同变体。在其它基因中,携带含有BHBD(hbd)的丙酮丁醇梭菌ATCC 824基因的大肠杆菌-丙酮丁醇梭菌穿梭载体的大肠杆菌已经显示出功能性过表达此酶。许多同源酶也已经鉴定。本领域技术人员通过例如实施针对上述丙酮丁醇梭菌BHBD的BLAST搜索能容易地鉴定别的同源酶。所有这些同源酶能充当异源表达的正丁醇途径中的BHBD。这些同源酶包括,但不限于以下各项:克氏梭菌(Clostridium kluyveri)表达此酶的两种不同形式(Miller等,J.Bacteriol.138:99-104,1979)。解纤维丁酸弧菌含有bhbd基因,其组织在其丁酸途径剩余部分的相同基因座内(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,Current Microbiology 47:203-207,2003)。编码短链酰基-CoA脱氢酶(SCAD)的基因克隆自埃氏巨球形菌并在大肠杆菌中表达。能测定体外活性(Becker等,Biochemistry 32:10736-10742,1993)。在大肠杆菌中鉴定了其它同系物(fadB),其中它是脂肪酸氧化途径的一部分(Pawar等,J.Biol.Chem.256:3894-3899,1981),还有其它梭菌属菌株诸如克氏梭菌(Hillmer等,FEBS Lett.21:351-354,1972;Madan等,Eur.J.BioChem.32:51-56,1973),拜氏梭菌,热解糖梭菌(C.thermosaccharolyticum),破伤风梭菌。
在某些实施方案中,其中表达BHBD,选择与上游硫解酶或下游巴豆酸酶起源相同的生物体的酶可能是有益的。这可避免在表达来自不同生物体的酶时对该途径中邻近蛋白质之间的潜在蛋白质-蛋白质相互作用的破坏。
在某些实施方案中,本文中所公开的重组微生物表达异源巴豆酸酶,诸如由来自梭菌属的crt基因所编码的。
巴豆酸酶或烯酰-CoA水合酶是催化顺式和反式烯酰-CoA底物可逆水合成相应的β-羟酰CoA衍生物的酶。在丙酮丁醇梭菌中,丁酸代谢的这个步骤由crt基因所编码的EC 4.2.1.55来催化(GenBank蛋白质编号AAA95967,Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52)。来自丙酮丁醇梭菌的巴豆酸酶(Crt)已经纯化至均质并表征(Waterson等,J.Biol.Chem.247:5266-5271,1972)。它在天然的和变性的状态都表现为均质的蛋白质。该酶表现出作为四聚体发挥功能,亚基分子量为28.2kDa和261个残基(Waterson等报道了分子量为40kDa和长度为370个残基)。纯化的酶在缓冲溶液中在4℃保存时或在冷冻时丧失活性(Waterson等,J.Biol Chem.247:5266-5271,1972)。该酶的最适pH为pH 8.4(Schomburg等,Nucleic Acids Res.32:D431-433,2004)。与具有广泛底物特异性的哺乳动物巴豆酸酶不同,细菌的酶只水合巴豆酰-CoA和己烯酰-CoA。为巴豆酰-CoA得到了Vmax和Km值为6.5×106摩尔每分每摩尔和3×10-5M。该酶在巴豆酰-CoA浓度高于7×105M时受到抑制(Waterson等,J.Biol.Chem.247:5252-5257,1972;Waterson等,J.Biol.Chem.247:5258-5265,1972)。
已经解析出了巴豆酸酶家族的许多酶的结构(Engel等,J.Mol.Biol.275:847-859,1998)。crt基因在大肠杆菌中高表达,而且展现出比在丙酮丁醇梭菌中所看到的更高的比活(187.5U/mg胜过128.6U/mg)(Boynton等,J.Bacteriol.178:3015-3024,1996)。真核生物和原核生物中编码了巴豆酸酶的许多不同同系物,它们作为丁酸代谢、脂肪酸合成、β-氧化和其它相关途径的一部分发挥作用(Kanehisa,Novartis Found Symp.247:91-101,2002;讨论01-3,19-28,244-52;Schomburg等,Nucleic Acids Res.32:D431-433,2003)。这些酶中许多已经被深入研究。来自牛肝的烯酰-CoA水合酶得到了极度深入的研究和彻底的表征(Waterson等,J.Biol Chem.247:5252-5257,1972)。生成了来自细菌的巴豆酸酶的20种最亲近直向同系物的ClustalW比对。同系物的序列同一性的变化范围为40-85%。可得到来自丙酮丁醇梭菌的Crt的蛋白质序列和crt的DNA序列(见下文,通过提述将所有序列并入本文)。巴豆酸酶(Crt)蛋白质序列(GenBank登录号AAA95967)显示于SEQ ID NO:2。
根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约55%、65%、75%或85%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适Crt同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_782956.1),产气荚膜梭菌SM101(YP_699562.1),产气荚膜梭菌菌株13(NP_563217.1),拜氏梭菌NCIMB 8052(ZP_00909698.1或ZP_00910124.1),沃氏共养单胞菌沃氏亚种(Syntrophomonas wolfei subsp.wolfei)菌株Goettingen(YP_754604.1),Desulfotomaculum reducens MI-1(ZP_01147473.1或ZP_01149651.1),热解糖热厌氧杆菌(CAB07495.1),生氢氧化碳嗜热菌Z-2901(YP_360429.1)等。
在梭菌中进行的研究证明了编码巴豆酸酶的crt基因是作为更大的BCS操纵子的一部分编码的。然而,对溶纤维丁酸弧菌(一种来自瘤胃的生成丁酸的细菌)的研究显示了略有不同的排列。虽然I型溶纤维丁酸弧菌具有作为操纵子的部分而簇集和排列的thl、crt、hbd、bcd、etfA和etfB基因,II型菌株具有类似的簇但缺少crt基因(Asanuma等,Curr.Microbiol 51:91-94,2005;Asanuma等,Curr.MicroBiol.47:203-207,2003)。既然该蛋白质在大肠杆菌中充分表达且彻底表征,那么丙酮丁醇梭菌酶是异源表达的正丁醇途径所优选的酶。其它可能的靶物是来自聚核梭杆菌文氏亚种(Fusobacterium nucleatum subsp.Vincentii)(Q7P3U9-Q7P3U9_FUSNV)、艰难梭菌(P45361-CRT_CLODI)、巴氏梭菌(P81357-CRT_CLOPA)和马尔他布鲁氏菌(Brucella melitensis)(Q8YDG2-Q8YDG2_BRUME)的同源基因。
在某些实施方案中,本文中所公开的重组微生物表达异源丁酰-CoA脱氢酶和必要时相应的电子传递蛋白,诸如由来自梭菌属的bcd、etfA和etfB基因所编码的。
丙酮丁醇梭菌丁酰-CoA脱氢酶(Bcd)是催化巴豆酰-CoA中的碳-碳双键还原以产生丁酰-CoA的酶。此反应偶联NADH的氧化。然而,该酶需要两种电子传递蛋白,即etfA和etfB(Bennett等,Ferns Microbiology Reviews 17:241-249,1995)。
丙酮丁醇梭菌ATCC 824的编码酶β-羟基丁酰-辅酶A(CoA)脱氢酶、巴豆酸酶和丁酰-CoA脱氢酶的基因在BCS操纵子上簇集,其GenBank登录号为U17110。
丁酰-CoA脱氢酶(Bcd)蛋白质序列(GenBank登录号AAA95968.1)显示于SEQ ID NO:3。
根据NCBI的BLAST的计算,共享至少约55%、60%、65%、70%、75%或80%序列同一性,或至少约70%、80%、85%或90%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适Bcd同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_782955.1或NP_781376.1),产气荚膜梭菌菌株13(NP_563216.1),拜氏梭菌(AF494018_2),拜氏梭菌NCMB 8052(ZP_00910125.1或ZP_00909697.1),热解糖热厌氧杆菌(CAB07496.1),腾冲热厌氧杆菌MB4(NP_622217.1)等。
电子传递黄素蛋白(EtfA)的α-亚基蛋白质序列(GenBank登录号AAA95970.1)显示于SEQ ID NO.4)。
电子传递黄素蛋白(EtfB)的β-亚基蛋白质序列(GenBank登录号AAA95969.1)显示于SEQ ID NO:5。
3-羟基丁酰-CoA脱氢酶(Hbd)蛋白质序列(GenBank登录号AAA95971.1)显示于SEQ ID NO:6。
根据NCBI的BLAST的计算,共享至少约45%、50%、55%、60%、65%或70%序列同一性,或至少约60%、70%、80%或90%序列同源性的同系物是能在本文中所描述的重组微生物中使用的合适Hbd同系物。此类同系物包括(但不限于):丙酮丁醇梭菌ATCC 824(NP_349314.1),破伤风梭菌E88(NP_782952.1),产气荚膜梭菌SM101(YP_699558.1),产气荚膜梭菌菌株13(NP_563213.1),糖丁酸梭菌(Clostridium saccharobutylicum)(AAA23208.1),拜氏梭菌NCIMB 8052(ZP_00910128.1),拜氏梭菌(AF494018_5),腾冲热厌氧杆菌MB4(NP_622220.1),热解糖热厌氧杆菌(CAB04792.1),Alkaliphilusmetalliredigenes QYMF(ZP_00802337.1)等。
Bcd对丁酰-CoA的Km为5。丙酮丁醇梭菌bcd和编码相应ETF的基因已经克隆入大肠杆菌-丙酮丁醇梭菌穿梭载体中。在用此质粒转化的丙酮丁醇梭菌ATCC 824中检测到升高的Bcd活性(Boynton等,Journal of Bacteriology 178:3015-3024,1996)。丙酮丁醇梭菌P262 Bcd对丁酰-CoA的Km为大约6μM(DiezGonzalez等,Current Microbiology 34:162-166,1997)。Bcd的同系物和相关ETF已经在生成丁酸的厌氧生物埃氏巨球形菌(Williamson等,Biochemical Journal 218:521-529,1984)、埃氏消化链球菌(Peptostreptococcuselsdenii)(Engel等,Biochemical Journal 125:879,1971)、布氏共养生孢菌(Syntrophospora bryanti)(Dong等,Antonie Van Leeuwenhoek InternationalJournal of General arid Molecular Microbiology 67:345-350,1995)和溃蚀密螺旋体(Treponema phagedemes)(George等,Journal of Bacteriology 152:1049-1059,1982)中鉴定。埃氏巨球形菌Bcd的结构已经解析(Djordjevic等,Biochemistry 34:2163-2171,1995)。丙酮丁醇梭菌ATCC 824 Bcd的BLAST搜索在极其多个物种中鉴定了大量同源序列,本文中上文列举了同系物中的一些。任何编码这些同系物的基因都可用于本发明。注意到,在一种微生物(诸如大肠杆菌)中异源表达这些基因时可产生表达和/或电子传递组织,但是在另一种微生物中则不然。另外,一种同源酶可在给定微生物中具有表达和/或电子传递组织,但是其它同源酶则可不然。不同的、大体等同的基因的可得性在工程化改造重组微生物时提供了更多设计选择。
一种早已在大肠杆菌中克隆和表达的有前途的bcd来自埃氏巨球形菌,而且所表达的酶的体外活性能测定(Becker等,Biochemistry 32:10736-10742,1993)。O′Neill等报道了etfA和eftB基因在大肠杆菌中的克隆和异源表达及所编码的来自埃氏巨球形菌的蛋白质的功能表征(O′Neill等,J.Biol.Chem.273:21015-21024,1998)。用ETF测定法测量了活性,该测定法将NADH氧化与巴豆酰-CoA经Bcd的还原偶联起来。含Bcd的重组ETF在ETF测定法中的活性与如Whitfield和Mayhew所报道的天然酶活性类似。因此,利用埃氏巨球形菌Bcd及其ETF蛋白提供了合成丁酰-CoA的解决方案。埃氏巨球形菌Bcd在重组表达时的Km测量为5μM,而在天然宿主中表达时为14μM(DuPlessis等,Biochemistry 37:10469-77,1998)。埃氏巨球形菌Bcd表现出在极低浓度受到乙酰乙酸抑制(Ki为0.1uM)(Vanberkel等,Eur.J.Biochem.178:197-207,1988)。在两个生成丁酸的解纤维丁酸弧菌的菌株中鉴定了含有thl、crt、hbd、bcd、etfA和etfB的基因簇。与丙酮丁醇梭菌相比,这些蛋白质的氨基酸序列相似性是高的(Asanuma等,Current Microbiology 51:91-94,2005;Asanuma等,CurrentMicrobiology 47:203-207,2003)。在哺乳动物系统中,在线粒体中找到了牵涉短链脂肪酸氧化的类似的酶。
在某些实施方案中,本文中所公开的重组微生物表达异源“反式-2-烯酰-CoA还原酶”或“TER”。
反式-2-烯酰-CoA还原酶或TER是能够催化巴豆酰-CoA转化成丁酰-CoA的蛋白质。在某些实施方案中,重组微生物表达与来自梭菌属和其它细菌物种的Bcd/EtfA/EtfB催化相同反应的TER。来自纤细眼虫的线粒体TER已有描述,而且衍生自许多物种的许多TER蛋白和具有TER活性的蛋白质已经鉴定,形成TER蛋白质家族(美国专利申请2007/0022497,Cirpus等;Hoffmeister等,J.Biol.Chem.280:4329-4338,2005,通过提述将它们完整并入本文)。纤细眼虫基因的截短cDNA已经在大肠杆菌中功能性表达。此cDNA或来自其它微生物的同系物的基因能与正丁醇途径基因thl、crt、adhE2和hbd一起表达,用以在大肠杆菌、酿酒酵母或其它宿主中生成正丁醇。
TER蛋白还可通过本领域技术人员知道的生物信息学方法来鉴定,诸如BLAST。TER蛋白的例子包括,但不限于,来自以下物种的TER:
眼虫属(Euglena spp.),包括但不限于纤细眼虫;气单胞菌属(Aeromonasspp.),包括但不限于嗜水气单胞菌(A.hydrophila);冷单胞菌属(Psychromonasspp.),包括但不限于深海冷单胞菌(P.ingrahamii);发光杆菌属(Photobacteriumspp.),包括但不限于深海发光杆菌(P.profundum);弧菌属(Vibrio spp.),包括但不限于V angustum、霍乱弧菌(V.cholerae)、解藻朊酸弧菌(V.alginolyticus)、副溶血弧菌(V.parahaemolyticus)、创伤弧菌(V.vulnificus)、费氏弧菌(V.fischeri)、灿烂弧菌(V.splendidus);希瓦氏菌属(Shewanella spp.),包括但不限于S.amazonensis,S.woodyi,S.frigidimarina,S.paeleana,S.baltica,反硝化希瓦氏菌(S.denitrificans);海洋螺菌属(Oceanospirillum spp.);黄单胞菌属(Xanthomonas spp.),包括但不限于稻黄单胞菌(X.oryzae)、田野黄单胞菌(X.campestris);色盐杆菌属(Chromohalobacter spp.),包括但不限于需盐色盐杆菌(C.salexigens);Idiomarina spp.,包括但不限于I.baltica;交替假单胞菌属(Pseudoalteromonas spp.),包括但不限于大西洋交替假单胞菌(P.atlantica);交替单胞菌属(Alteromonas spp.);Saccharophagus spp.,包括但不限于S.degradans,S.marine gamma proteobacterium,S.alpha proteobacterium,假单胞菌属(Pseudomonas spp.),包括但不限于铜绿假单胞菌(P.aeruginosa)、恶臭假单胞菌(P.putida)、荧光假单胞菌(P.fluorescens);伯克霍尔德菌属(Burkholderia spp.),包括但不限于B.phytofirmans,新洋葱伯克霍尔德氏菌(B.cenocepacia),洋葱伯克霍尔德氏菌(B.cepacia),B.ambifaria,越南伯克霍尔德氏菌(B.vietnamensis),B.multivorans,B.dolosa;甲基杆菌属(Methylbacillusspp.),包括但不限于M.flageliatus;寡养单胞菌属(Stenotrophomonas spp.),包括但不限于嗜麦芽糖寡养单胞菌(S.maltophilia);聚集杆菌属(Congregibacterspp.),包括但不限于C.litoralis;沙雷氏菌属(Serratia spp.),包括但不限于变形斑沙雷氏菌(S.proteamaadans);海洋单胞菌(Marinomonas spp.);Xytella spp.,包括但不限于X.fastidiosa;Reinekea spp.;科尔韦尔氏菌属(Colwellia spp.),包括但不限于C.psychrerythraea;耶尔森氏菌属(Yersinia spp.),包括但不限于鼠疫耶尔森氏菌(Y.pestis)、假结核耶尔森氏菌(Y.pseudotuberculosis);甲基菌属(Methylobacillus spp.),包括但不限于M.flageliatus;噬纤维菌菌属(Cytophagaspp.),包括但不限于哈氏噬纤维菌(C.hutchinsonii);黄杆菌属(Flavobacteriumspp.),包括但不限于F.johnsoniae;微颤菌属(Microscilla spp.),包括但不限于M.marina;极地杆菌属(Polaribacter spp.),包括但不限于P.irgensii;梭菌属,包括但不限于丙酮丁醇梭菌、拜氏梭菌、解纤维梭菌;柯克斯体属(Coxiellaspp.),包括但不限于贝氏柯克斯体(C.burnetii)。
在前述之外,术语“反式-2-烯酰-CoA还原酶”或“TER”指能够催化巴豆酰-CoA转化成丁酰-CoA且根据使用缺省参数的NCBI BLAST的计算,与SEQ ID NO:7所示截短的纤细眼虫TER或SEQ ID NO:8所示全长的嗜水气单胞菌TER之任一或二者共享至少约40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大序列同一性,或至少约50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更大序列相似性的蛋白质。
如本文中所使用的,“序列同一性”指所比对的序列中同一位置中完全相同核苷酸或氨基酸的存在。“序列相似性”考虑到了大致匹配,而且只在依照“差异”或“相同性”的一些量度对此类替代打分时有意义,在所述度量中保守的或高度可能的替代被赋以比非保守的或不大可能的替代更有利得分。
使用TER代替Bcd/EtfA/EtfB的另一个优点是TER在单体形式是有活性的,而且蛋白质表达和酶自身都对氧不敏感。
如本文中所使用的,“反式-2-烯酰-CoA还原酶(TER)同系物”指来自其它生物体(例如,属于眼虫或气单胞菌类(phylum))的酶同源多肽,其具有与上文所定义的相同的TER本质特征,但是共享小于40%的序列同一性和50%的序列相似性标准,如上文所讨论的。突变涵盖一个或多个氨基酸残基的替代、添加、删除、倒位或插入。这容许需氧生长和正丁醇过程的表达阶段期间的酶表达,能潜在容许更加高效的生物燃料生成过程。
在某些实施方案中,本文中所公开的重组微生物表达异源丁醛脱氢酶/正丁醇脱氢酶,诸如由来自梭菌属的bdhA/bdhB、aad或adhE2基因所编码的。
丁醛脱氢酶(BYDH)是催化丁酰-CoA NADH依赖性还原成丁醛的酶。丁醛进一步被正丁醇脱氢酶(BDH)还原成正丁醇。此还原也伴有NADH氧化。丙酮丁醇梭菌含有已经显示出将丁酰-CoA转化成正丁醇的数种酶的基因。
这些酶之一由aad编码(Nair等,J.Bacteriol.176:871-885,1994)。此基因在丙酮丁醇梭菌菌株DSM 792中称作adhE。该酶是sol操纵子的一部分,而且它编码功能性BYDH/BDH(Fischer等,Journal of Bacteriology 175:6959-6969,1993;Nair等,J.Bacteriol 176:871-885,1994)。此蛋白质的蛋白质序列(GenBank登录号AAD04638.1)显示于SEQ ID NO:9。
aad的基因产物在大肠杆菌中功能性表达。然而,在需氧条件下,所得活性保持很低,指示氧敏感性。根据对丁醛的活性相对于对乙醛的活性为超过100倍高,Aad的主要作用在正丁醇的形成中而非乙醇(Nair等,Journal ofBacteriology 176:5843-5846,1994)。
根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括(但不限于):破伤风梭菌E88(NP_781989.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC13124(YP_697219.1),产气荚膜梭菌SM101(YP_699787.1),拜氏梭菌NCIMB8052(ZP_00910108.1),丙酮丁醇梭菌ATCC 824(NP_149199.1),艰难梭菌630(CAJ69859.1),艰难梭菌QCD-32g58(ZP_01229976.1),热纤维梭菌(Clostridiumthermocellum)ATCC 27405(ZP_00504828.1)等。
另外两种NADH依赖性正丁醇脱氢酶(BDH I,BDH II)已经纯化,而且它们的基因(bdhA,bdhB)已经克隆。BDH I的GenBank登录号是AAA23206.1,而蛋白质序列显示于SEQ ID NO:10。
BDH II的GenBank登录号是AAA23207.1,而蛋白质序列显示于SEQ IDNO:11。
这些基因在染色体上是相邻的,但是由它们自己的启动子转录(Walter等,Gene 134:107-111,1993)。BDH I利用NADPH作为辅因子,而BDH II利用NADH。然而,注意到相对辅因子偏爱是pH依赖性的。在自质粒表达bdhA后在大肠杆菌裂解物(lysate)中观察到BDH I活性(Petersen等,Journal ofBacteriology 173:1831-1834,1991)。BDH II据报道具有对丁醛的活性是对乙醛的活性的46倍高,而且在逆方向的活性低50倍。BDH I对丁醛的活性只为对乙醛的活性约2倍高(Welch等,Archives of Biochemistry和Biophysics 273:309-318,1989)。如此,在一个实施方案中,在异源表达的正丁醇途径中使用BDH II或BDH II同系物。另外,这些酶在5.5的相对较低pH更有活性,在选择合适的宿主和/或工艺条件时可考虑此性状。
虽然上文所述基因在产溶剂的条件下转录,一种不同的基因,adhE2在产醇的条件下转录(Fontaine等,J.Bacteriol.184:821-830,2002,GenBank登录号AF321779)。这些条件在相对中性的pH存在。该酶已经在大肠杆菌的厌氧培养中过表达,且具有高NADH依赖性BYDH和BDH活性。在某些实施方案中,此酶是优选的酶。此酶的蛋白质序列(GenBank登录号AAK09379.1)显示于SEQ ID NO:1。
根据NCBI的BLAST的计算,共享至少约50%、55%、60%或65%序列同一性,或至少约70%、75%或80%序列同源性的同系物是能在本文中所公开的重组微生物中使用的合适同系物。此类同系物包括(但不限于):产气荚膜梭菌SM101(YP_699787.1),产气荚膜梭菌菌株13(NP_563447.1),产气荚膜梭菌ATCC 13124(YP_697219.1),破伤风梭菌E88(NP_781989.1),拜氏梭菌NCIMB8052(ZP_00910108.1),艰难梭菌QCD-32g58(ZP_01229976.1),艰难梭菌630(CAJ69859.1),丙酮丁醇梭菌ATCC 824(NP_149325.1),热纤维梭菌ATCC27405(ZP_00504828.1)等。
在某些实施方案中,可以使用与任何上述多肽至少约70%、80%、90%、95%、99%同一的,或共享至少约60%、70%、80%、90%、95%序列同源性(相似的)的任何同源酶代替这些野生型多肽。这些共享必需序列同一性或相似性的酶可以是来自不同生物体的野生型酶,或者可以是人工的/重组的酶。
在某些实施方案中,可以使用编码具有与任何上述酶相同活性的酶的任何基因代替编码上述酶的基因。这些酶可以是来自不同生物体的野生型酶,或者可以是人工的、重组的、或工程化改造的酶。
另外,由于遗传密码的内在简并性,也可以使用编码基本上相同的或功能上等同的氨基酸序列的其它核酸序列来克隆和表达编码此类酶的多核苷酸。本领域技术人员会理解,修饰编码序列以增强其在特定宿主中的表达会是有利的。在一种物种中最常被利用的密码子称作最佳密码子(optimalcodon),而不太经常利用的密码子归为罕见或低使用率密码子。可以替代密码子以反映宿主优选的密码子选择,即有时称作“密码子优化”或“控制物种密码子偏好”的过程。提供了为植物中的表达而优化核苷酸序列的方法学,例如,美国专利No.6,015,891及其中引用的参考文献。
在某些实施方案中,本文中所公开的重组微生物具有一种或多种来自产溶剂的梭菌属,诸如丙酮丁醇梭菌或拜氏梭菌的异源DNA序列。例示性的丙酮丁醇梭菌是菌株ATCC824,而例示性的拜氏梭菌是菌株NCIMB 8052。
基因的表达可以通过常规分子生物学手段来实现。例如,异源基因可以在诱导型启动子或组成性启动子的控制下。异源基因可以整合入宿主微生物的染色体中,或者作为能稳定传递(“遗传”)给子细胞的染色体外遗传元件存在。此类染色体外遗传元件(诸如质粒、BAC、YAC等)可以另外含有确保此类遗传元件在子细胞中的存在的选择标志。
在某些实施方案中,本文中所公开的重组微生物还可生成正丁醇生成途径的一种或多种代谢中间产物,诸如乙酰乙酰-CoA、羟基丁酰-CoA、巴豆酰-CoA、丁酰-CoA、或丁醛,和/或其衍生物,诸如丁酸。
在一些实施方案中,本文中所描述的为生成正丁醇而被工程化改造以活化一种或多种上文所述异源酶的重组微生物经异源途径生成正丁醇。
如本文中所使用的,术语“途径”指包括一种或多种受酶控制的、将底物转化成产物的化学反应的生物学过程。因而,用于将碳源转化成正丁醇的途径是包括一种或多种受酶控制的、将碳源转化成正丁醇的反应的生物学过程。“异源途径”指其中至少一种或多种化学反应之至少一种由至少一种异源酶催化的途径。另一方面,“天然途径”指其中一种或多种化学反应由天然酶催化的途径。
在某些实施方案中,本文中所公开的重组微生物被工程化改造以活化正丁醇生成异源途径(在本文中也称作正丁醇途径),其包含:(1)2个乙酰-CoA转化成乙酰乙酰-CoA,(2)乙酰乙酰-CoA转化成羟基丁酰-CoA,(3)羟基丁酰-CoA转化成巴豆酰-CoA,(4)巴豆酰-CoA转化成丁酰-CoA,(5)丁醛转化成正丁醇(见图2例示性图解)。
2个乙酰-CoA转化成乙酰乙酰-CoA可通过在重组微生物中表达编码乙酰-CoA-乙酰基转移酶(硫解酶)或Thl的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性硫解酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的thl,或来自巴氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB 8052或菌株BA101)、热带假丝酵母、芽孢杆菌属、埃氏巨球形菌、或解纤维丁酸弧菌的编码同源酶的基因,或选自fadA或atoB的大肠杆菌硫解酶基因编码。
乙酰乙酰-CoA转化成羟基丁酰-CoA可通过在重组微生物中表达编码羟基丁酰-CoA脱氢酶Hbd的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性Hbd由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的hbd,或来自克氏梭菌、拜氏梭菌(具体而言来自菌株NCIMB 8052或菌株BA101)、热解糖梭菌、破伤风梭菌、解纤维丁酸弧菌、埃氏巨球形菌、或大肠杆菌(fadB)的编码同源酶的基因编码。
羟基丁酰-CoA转化成巴豆酰-CoA可通过在重组微生物中表达编码巴豆酸酶或Crt的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性crt由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的crt,或来自溶纤维丁酸弧菌、聚核梭杆菌文氏亚种、艰难梭菌、巴氏梭菌、或马尔他布鲁氏菌的编码同源酶的基因编码。
巴豆酰-CoA转化成丁酰-CoA可通过在重组微生物中表达编码丁酰-CoA脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁酰-CoA脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC 824)的bcd/etfA/etfB,或来自埃氏巨球形菌、埃氏消化链球菌、布氏共养生孢菌、溃蚀密螺旋体、解纤维丁酸弧菌的编码同源酶的基因,或哺乳动物线粒体Bcd同系物编码。
丁醛转化成正丁醇可通过在重组微生物中表达编码丁醛脱氢酶或正丁醇脱氢酶的天然或异源基因来实施。在本文中所公开的重组微生物中合适的例示性丁醛脱氢酶/正丁醇脱氢酶由来自丙酮丁醇梭菌(具体而言来自菌株ATCC824)的bdhA、bdhB、aad、或adhE2,或来自拜氏梭菌(具体而言来自菌株NCIMB8052或菌株BA101)的编码ADH-1、ADH-2、或ADH-3的基因编码。
在某些实施方案中,自乙酰-CoA至正丁醇的代谢途径的酶是(i)硫解酶(Thl),(ii)羟基丁酰-CoA脱氢酶(Hbd),(iii)巴豆酸酶(Crt),(iv)至少一种醇脱氢酶(AdhE2),或正丁醇脱氢酶(Aad)或丁醛脱氢酶(Ald)加之单功能正丁醇脱氢酶(BdhA/BdhB),和(v)反式-2-烯酰-CoA还原酶(TER)(图2)。在某些实施方案中,Thl、Hbd、Crt、AdhE2、Ald、BdhA/BdhB和Aad来自梭菌属。在某些实施方案中,梭菌属是丙酮丁醇梭菌。在某些实施方案中,TER来自纤细眼虫或来自嗜水气单胞菌。
表达异源正丁醇途径的重组微生物以很低的产率生成正丁醇,因为大部分碳被天然途径所代谢。表达异源正丁醇途径的微生物的正丁醇产率可限于低于2%的水平。如实施例19中所例示的,表达质粒pGV1191和pGV1113上的正丁醇途径的野生型大肠杆菌W3110以理论产率的约1.4%的产率将葡萄糖转化成正丁醇。
为了提供高正丁醇产率,包括用于正丁醇生成的活化的酶的重组微生物被进一步工程化改造以将源自碳源代谢的碳流指向正丁醇。具体而言,将碳流指向正丁醇可通过灭活与正丁醇生成竞争的代谢途径来实施。
关于正丁醇生成的“竞争性途径”指如下的将底物转化成产物的途径,其中至少一种底物是正丁醇生成中的代谢中间产物。在某些实施方案中,竞争性途径也能消耗NADH(在NADH消耗方面竞争)。与正丁醇生成竞争的例示性途径是通向不想要的发酵副产物且可能利用或消耗NADH的内源发酵途径。
术语“灭活的”或“灭活”,如本文中关于途径所使用的,指示一个途径,其中任何控制该途径中反应的酶无生物学活性,这包括但不限于通过删除一种或多种编码途径的酶的基因来实施酶的灭活。术语“活化的”或“活化”,如本文中关于途径所使用的,指示一个途径,其中任何控制该途径中反应的酶有生物学活性。因而,若至少一种控制途径中反应的酶被灭活,使得受所述酶控制的反应不发生,则该途径被灭活。相反,若所有控制途径中反应的所有酶被活化,则该途径被活化。
在某些实施方案中,竞争性代谢途径的灭活是通过灭活竞争性代谢途径中牵涉将底物转化成产物的酶来实施的。被灭活的酶可优选催化用于正丁醇生成的代谢中间产物的转化,或者可催化竞争性途径的代谢中间产物的转化。在某些实施方案中,该酶还消耗NADH,并因此也与正丁醇生成还在NADH消耗方面竞争。
术语“灭活”,如本文中关于生物学活性分子(诸如酶)所使用的,指微生物基因组和/和蛋白质组中防止或降低微生物中生物学活性分子的生物学活性的任何修饰。例示性的灭活包括但不限于导致分子从生物学有活性形式变成生物学无活性形式及从生物学有活性形式变成生物学较低或降低的活性形式的转化的修饰,及导致生物学活性分子完全或部分删除的任何修饰。例如,生物学活性分子的灭活可通过删除或突变微生物中编码该生物学活性分子的天然或异源多核苷酸,通过删除或突变微生物中编码酶(该酶牵涉生物学活性分子的合成途径)的天然或异源多核苷酸,通过活化微生物中抑制该生物学活性分子表达的其它天然或异源分子来实施。
具体而言,在一些实施方案中,生物学活性分子(诸如酶)的灭活可通过自重组微生物的基因组删除一个或多个编码酶的内源基因来实施。
因而,在某些实施方案中,灭活是通过自微生物基因组删除编码酶的基因来实施的,该酶牵涉与正丁醇生成竞争的途径,使得碳/NADH对于一种或多种用于生成正丁醇或其代谢中间产物的多肽是可得的。
在某些实施方案中,编码这些酶的基因的删除改善正丁醇产率,因为更多的碳和/或NADH变得对于一种或多种用于生成正丁醇或其代谢中间产物的多肽是可得的。
在某些实施方案中,自重组微生物的基因组删除的DNA序列编码选自下组的酶:D-乳酸脱氢酶,丙酮酸甲酸裂合酶,乙醛/醇脱氢酶,磷酸乙酰转移酶,乙酸激酶A,延胡索酸还原酶,丙酮酸氧化酶,和甲基乙二醛合酶。
具体而言,若微生物是大肠杆菌,则自基因组删除的DNA序列可以选自下组:ldhA pflB,pflDC,adhE,pta,ackA,frd,poxB和mgsA。
为大肠杆菌例示了被删除或敲除以生成本文中所公开的微生物的基因。本领域技术人员能容易地通过常规分子生物学技术(诸如序列同源性搜索、基于同源序列的克隆等)鉴定在其它微生物中编码与正丁醇生成途径竞争碳和/或NADH的酶的相应同源基因。一旦鉴定,可以依照完善建立的分子生物学方法在这些宿主生物体中删除或敲除靶基因。
在一个实施方案中,感兴趣基因的删除是依照同源重组的原理发生的。依照此实施方案,含有包含至少一种标志基因的模块的整合盒任一侧翼均为与靶定整合位点末端的DNA片段同源的DNA片段。通过适宜方法用该盒转化宿主微生物后,侧翼序列之间的同源重组可导致标志物替换介于染色体上与整合盒侧翼序列对应的两个位点之间的染色体区域。重组酶可推动同源重组事件,该重组酶可以是对宿主微生物而言天然的,或者是过表达的。
酶D-乳酸脱氢酶、丙酮酸甲酸裂合酶、乙醛/醇脱氢酶、磷酸乙酰转移酶、乙酸激酶A、延胡索酸还原酶、丙酮酸氧化酶和/或甲基乙二醛合酶可能是生成琥珀酸、乳酸、乙酸、乙醇、甲酸、二氧化碳和/或氢气的某些竞争性内源途径所要求的。
具体而言,酶D-乳酸脱氢酶(在大肠杆菌中由ldhA编码)将NADH的氧化与丙酮酸还原成D-乳酸偶联起来。先前已经显示ldhA的删除可消除发酵液中D-乳酸的形成(Causey,T.B.等,2003,Proc.Natl.Acad.Sci.100,825-32)。
酶丙酮酸甲酸裂合酶(在大肠杆菌中由pflB编码)将丙酮酸氧化成乙酰-CoA和甲酸。已经证明pflB的删除对于乙酸(Causey,T.B.等,2003,Proc.Natl.Acad.Sci.100,825-32)、丙酮酸(Causey,T.B.等,2004,Proc.Natl.Acad.Sci.101,2235-40)和乳酸(Zhou,S.,2005,Biotechnol.Lett.27,1891-96)的过度生成是重要的。甲酸能被甲酸氢裂合酶复合物进一步氧化成CO2和氢,但是在不存在pflB的情况中此复合物的删除应当不是必须的。pflDC是pflB的同系物,而且能通过突变来活化。如上文所指出的,对于正丁醇的厌氧发酵,丙酮酸甲酸裂合酶可能不需要删除。若宿主中没有早就可得的,则可提供(异源)NADH依赖性甲酸脱氢酶,来实现与NADH生成偶联的丙酮酸转化成乙酰-CoA。
酶乙醛/醇脱氢酶(在大肠杆菌由adhE编码)牵涉乙酰-CoA转化成乙醛脱氢酶和醇脱氢酶。具体而言,在需氧条件下,丙酮酸也被转化成乙酰-CoA,乙醛脱氢酶和醇脱氢酶,但是此反应是由多酶丙酮酸脱氢酶复合物催化的,产生CO2和1个当量的NADH。乙酰-CoA给TCA循环提供燃料,但是也能被乙醛脱氢酶和醇脱氢酶(二者均由基因adhE编码)氧化成乙醛和乙醇。这些反应每一个都与1个当量的NADH的还原偶联。
酶磷酸乙酰转移酶(在大肠杆菌中由pta编码)和乙酸激酶A(在大肠杆菌中由ackA编码)牵涉经乙酰磷酸将乙酰-CoA转化成乙酸的途径。ackA的删除先前已经用于指引代谢流远离乙酸生成(Underwood,S.A.等,2002,Appl.Environ.Microbiol,68,6263-72;Zhou,S.D.等,2003,Appl.Environ.Mirobiol,69,399-407),但是pta的删除应当实现相同的结果。
酶延胡索酸还原酶(在大肠杆菌中由frd编码)牵涉将丙酮酸转化成琥珀酸的途径。具体而言,在厌氧条件下,磷酸烯醇丙酮酸能经草酰乙酸、苹果酸和延胡索酸被还原成琥珀酸,导致2个当量的NADH被氧化成NAD+。每一种牵涉那些转化的酶可被灭活以消除此途径。例如,由延胡索酸还原酶催化的最终反应将延胡索酸转化成琥珀酸。此反应的电子供体是还原型甲萘醌,而且每一个所传递的电子导致两个质子的易位。已经证明了frd的删除对于还原型丙酮酸产物的生成是有用的。
酶丙酮酸氧化酶(在大肠杆菌中由poxB编码)前述将丙酮酸转化成乙酸的途径。此酶不需要NADH。然而,在丙酮酸脱羧时,丙酮酸氧化酶将电子自丙酮酸转移至泛醌以形成泛醇。由于此电子传递至醌池,丙酮酸氧化酶间接地提高了微生物对氧的需求。自微生物消除丙酮酸氧化酶会防止氧被此途径消耗。
酶甲基乙二醛合酶(MGS,在大肠杆菌中由mgsA编码)牵涉将丙酮酸转化成乳酸的途径。已经发现了即使在ldhA基因被灭活时,仍然生成显著的残余乳酸量。大部分残余乳酸可归于糖酵解途径的甲基乙二醛旁路。具体而言,甲基乙二醛旁路的第一步由甲基乙二醛合酶(MGS)(E.C.4.2.99.11)催化,其在大肠杆菌中由mgsA基因编码,或者称作yccG。通过数据库搜索在流感嗜血菌(Haemophilus influenzae)(D6411169)、枯草芽孢杆菌(Bacillus subtilis)(P42980)、流产布鲁氏菌(Brucella abortus)(BAU21919_2)和集胞蓝细菌属(Synechocystis)(SYCSLLLH_17)(等,Molecular Microbiology 27:553-562,1998)中鉴定出mgsA的同系物。MGS催化二羟基丙酮磷酸(DHAP)变成甲基乙二醛和正磷酸的表观不可逆转化。甲基乙二醛合酶已经在多种生物体中鉴定出,包括嗜糖假单胞菌(Pseudomonas saccarophila)、杜氏假单胞菌(Pseudomonas doudoroffi)、破伤风形梭菌(Clostridium tetanomorphum)、巴氏梭菌、巨大脱硫弧菌(Desulfovibrio gigas)和普通变形菌(Proteus vulgaris)(参见Saadat等,Biochemistry 37:10074-10086,1998;等,MolecularMicrobiology 27:553-562,1998)。甲基乙二醛在毫摩尔浓度是极度细胞毒性的。在大肠杆菌中,酶乙二醛酶I和II是用于通过催化甲基乙二醛变成D(-)-乳酸的谷胱甘肽依赖性转化而使甲基乙二醛解毒的主要酶。D(-)-乳酸能经连接有黄素的脱氢酶转化成丙酮酸。
基因fnr的表达与大肠杆菌中的一系列活性相关。与通过fnr表达的活性有关的途径通常与氧气利用有关,即随氧气的消减而下调,而且以相反的方式,发酵的备选厌氧途径被Fnr上调。那些途径的指示可见于ChrystalaConstantinidou等,“A Reassessment of the FNR Regulon and TranscriptomicAnalysis of the Effects of Nitrate,Nitrite,NarXL,and NarQP as Escherichia coliKl2 Adapts from Aerobic to Anaerobic Growth”,J.Biol.Chem.2006,281:4802-4815;Kirsty Salmon等,“Global Gene Expression Profiling inEscherichia coli Kl2-The Effects Of Oxygen Availability And FNR”,J.Biol.Chem.2003,278(32):29837-55;及Kirsty A.Salmon等,“Global Gene ExpressionProfiling in Escherichia coli Kl2-the Effects of Oxygen Availability and ArcA”,J.Biol.Chem.2005,280(15):15084-15096,通过提述将它们完整并入本申请。
通过所述酶中的一些催化的途径和转化示意性地图示于图3的例示性示意图。
鉴于上文,特别是通过所述酶的灭活而被灭活的途径,本文中公开了被工程化改造以活化用于正丁醇生成的一种或多种异源酶的重组微生物,该重组微生物被进一步工程化改造以灭活竞争性代谢途径,其包括(1)丙酮酸转化成乳酸,(2)乙酰-CoA转化成乙酸,(3)乙酰-CoA转化成乙醛,(4)丙酮酸转化成琥珀酸,和(5)丙酮酸转化成乙酸,和(6)任何与fnr基因在微生物中的表达有关的代谢途径。上文途径的示意图图示于图3。
具体而言,丙酮酸转化成乳酸的删除可通过灭活竞争酶D-乳酸脱氢酶和/或甲基乙二醛合酶,具体而言通过灭活微生物中编码D-乳酸脱氢酶的基因和/和微生物中编码甲基乙二醛合酶的基因来实施。
乙酰-CoA转化成乙酸的删除可通过灭活竞争酶乙醛/醇脱氢酶,具体而言通过灭活微生物中编码乙醛/醇脱氢酶的基因来实施。
乙酰-CoA转化成乙醛的删除可通过灭活竞争酶磷酸乙酰转移酶和/或竞争酶乙酸激酶A,具体而言通过灭活微生物中编码磷酸乙酰转移酶和/或乙酸激酶A的基因来实施。
丙酮酸转化成琥珀酸的删除可通过灭活竞争酶延胡索酸还原酶,具体而言通过灭活微生物中编码延胡索酸还原酶的基因来实施。
丙酮酸转化成乙酸的删除可通过灭活竞争酶丙酮酸氧化酶,具体而言通过灭活微生物中编码丙酮酸氧化酶的基因来实施。
任何与fnr基因有关的途径的删除可通过灭活微生物中的相关基因来实施。
在一些实施方案中,重组微生物被工程化改造以灭活这些途径之一。在一些实施方案中,重组微生物被工程化改造以灭活上文途径中的一些或全部。如此,涵盖并非全部的这些途径在所有实施方案中消除。这些途径中的一种或多种可保持大体的或部分的完整。另外,这些途径中的一种或多种可有条件地灭活,诸如通过使用诱导型启动子来指导这些途径中一种或多种关键酶的表达,或通过使用这些途径中的一种或多种关键酶的温度敏感性突变。尽管通常不是必须的,有可能使同一途径中的所有酶失能(disable)。
在一些实施方案中,乳酸脱氢酶的灭活及相关的丙酮酸转化成乳酸的灭活能提高正丁醇产率至约2%。例如,GEVO1082(大肠杆菌W3110,ΔldhA)的正丁醇产率预期为理论产率的约2%,其比没有消除任何竞争性途径的菌株高40%。然而,此菌株主要生成乙醇。在消除乙醇生成和进一步提高正丁醇产率的尝试中,可消除编码将乙酰-CoA转化成乙醇的醇脱氢酶的基因。
在一些实施方案中,醇脱氢酶的灭活和及相关的乙酰-CoA转化成乙醇的灭活能提高正丁醇产率至约6%。例如,GEVO1054(大肠杆菌W3110,ΔadhE)的正丁醇产率预期为理论产率的约5-5.6%。
在一些实施方案中,乳酸脱氢酶的灭活及相关的丙酮酸转化成乳酸的灭活和醇脱氢酶的灭活及相关的乙酰-CoA转化成乙醇的灭活可降低乳酸和乙醇的生成且可提高正丁醇产率至约7%。例如,GEVO1084(大肠杆菌W3110,ΔldhA,ΔadhE)的正丁醇产率预期为理论产率的约7%。
在一些实施方案中,乳酸脱氢酶、醇脱氢酶和延胡索酸还原酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇和丙酮酸转化成琥珀酸的灭活可降低乳酸、乙醇和琥珀酸的生成且可提高正丁醇产率至约21%。如实施例17中所例示的,GEVO1083(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd)的正丁醇产率可以为理论产率的约20-22.4%。
在一些实施方案中,乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和甲基乙二醛合酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、丙酮酸转化成琥珀酸和丙酮酸转化成甲基乙二醛的灭活可降低乳酸、乙醇和琥珀酸的生成和提高正丁醇产率至约21%。如实施例16中所例示的,GEVO1121(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd,ΔmgsA)的正丁醇产率可以比GEVO1083(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd)高约19%,如此可预期给出至少多至理论产率的25%的产率。
在一些实施方案中,乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和乙酸激酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、丙酮酸转化成琥珀酸和乙酰-CoA转化成乙酸的灭活可降低乳酸、乙醇、琥珀酸和乙酸的生成且可提高正丁醇产率至约25%。如实施例17中所例示的,GEVO1121(大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd,ΔackA)的正丁醇产率为理论产率的约25%。
在某些实施方案中,本文中所公开的重组微生物中正丁醇的生成通过NADH依赖性途径发生,即其中底物转化成产物需要由NAD(P)H在所述途径内一些催化步骤途径所提供的还原当量或由所述途径内一些或一种酶或生物学活性分子所提供的还原当量。
具体而言,在其中正丁醇生成途径包括乙酰-CoA转化成正丁醇的实施方案中(见例如正丁醇途径,图2),将2分子的乙酰-CoA转化成1分子的正丁醇需要4分子的NADH。然而,在厌氧条件下将葡萄糖转化成乙酰-CoA期间,只生成2分子的NADH。
只给需要4分子NADH的正丁醇途径提供2分子NADH的微生物是不平衡的,如此,不能以大于理论产率的50%的产率生成正丁醇。因此,可以工程化改造微生物以提高自1摩尔葡萄糖生成的NADH摩尔数。优选的是,自1摩尔葡萄糖生成4摩尔NADH。
因而,在一些实施方案中,为了提供高正丁醇产率,将表达正丁醇生成的异源酶的重组微生物进一步工程化改造以在正丁醇生成方面平衡NADH生成和消耗,即,所生成的NADH分子的总数目(例如,糖酵解期间和丙酮酸转化成乙酰-CoA期间所生成的)等于正丁醇生成途径所消耗的NADH分子的总数目,如此不剩下多余的NADH也没有NADH不足。
因而,在那些实施方案中,将碳源转化成正丁醇在NADH生成和消耗方面是平衡的。碳源氧化反应期间所生成的NADH等于被利用来将乙酰-CoA转化成正丁醇的NADH。只有在这些条件下,所有的NADH才得到再循环。在没有再循环的情况中,NADH/NAD+比变得不平衡且会引起生物体最终死亡,除非有备选代谢途径可用来维持平衡。
具体而言,在某些实施方案中,重组微生物被工程化改造,使得正丁醇的生成通过发酵异源途径来发生,其中未工程化改造的微生物不能够经平衡的发酵来生成正丁醇,因为该微生物未生成足够的NADH来将乙酰-CoA转化成正丁醇。
如此,在某些实施方案中,如果必须或想要,在正丁醇生成的培养条件下,优选的是,在厌氧条件下,活化丙酮酸脱氢酶。在某些实施方案中,丙酮酸脱氢酶被工程化改造以在厌氧条件下有活性。或者,可以在微生物中表达来自在厌氧条件下利用该酶的异源宿主的丙酮酸脱氢酶。
在另一个实施方案中,甲酸氢裂合酶被NADH依赖性甲酸脱氢酶替换。
在又一个实施方案中,微生物被工程化改造以经工程化改造的生成足够NADH来将乙酰-CoA转化成正丁醇的代谢途径利用甘油作为碳源。
例如,在大肠杆菌宿主微生物中,在NADH生成方面平衡如图2所描绘的正丁醇生成途径,因为总共生成了4个NADH分子,然后通过途径酶消耗了总共4个NADH分子。这可以以数种方式来实现。在一个实施方案中,宿主可在厌氧条件下功能性表达天然丙酮酸脱氢酶。在另一个实施方案中,来自其它生物体的丙酮酸脱氢酶也可在厌氧条件下用于此目的。可以将由这些大肠杆菌或异源基因编码的多肽置于诱导型启动子的控制之下以实现功能性表达。
在某些实施方案中,本文中所公开的重组微生物包括活化的NADH依赖性甲酸脱氢酶,其在厌氧或微需氧条件下有活性。
NADH依赖性甲酸脱氢酶(Fdh;EC 1.2.1.2)催化甲酸氧化成CO2及同时的NAD+还原成NADH。Fdh能依照本公开内容用于提高宿主微生物内NADH的胞内可得性,而且可用于在NADH方面平衡正丁醇生成途径。具体而言,可以在宿主微生物中活化(特别是过表达)生物学活性NADH依赖性Fdh。在存在这些新导入的甲酸脱氢酶途径的情况中,当1摩尔甲酸被转化成二氧化碳时会形成1摩尔NADH。在某些实施方案中,在天然微生物中,甲酸脱氢酶将甲酸转化成CO2和H2,不牵涉辅因子。
在某些实施方案中,诸如在其中微生物是大肠杆菌的实施方案中,宿主利用内源丙酮酸-甲酸-裂合酶(在大肠杆菌中由pfl编码)来在厌氧条件下将丙酮酸转化成乙酰-CoA,此反应不生成NADH,因为丙酮酸-甲酸-裂合酶不是NADH依赖性的。在此情形下,可以在微生物中活化NADH依赖性甲酸脱氢酶,使得在厌氧或微需氧条件下类似地实现与内源非NADH依赖性丙酮酸-甲酸-裂合酶组合的下列反应化学计量(Berrios-Rivera,SJ.等,2002,Metabol.Eng.2002,217-29):
丙酮酸+NAD+→乙酰-CoA+NADH+CO2
具体而言,可活化异源NADH依赖性甲酸脱氢酶,使得丙酮酸的转化导致相同的净化学计量:对于每摩尔的丙酮酸,形成1摩尔的二氧化碳,产生必需当量的NADH。这容许细胞保持还原能力,其在其它情况中在天然途径中会因释放甲酸或氢而丧失。
在本文中所描述的重组微生物中合适的例示性fdh包括博伊丁氏假丝酵母(Candida boidinii)的NADH依赖性Fdh1(GenBank登录号AF004096),来自Candida methylica(GenBank登录号CAA57036)、拟南芥(Arabidopsis thaliana)(GenBank登录号AAF19436)、假单胞菌101(GenBank登录号P33160)和金黄色葡萄球菌(Staphylococcus aureus)(GenBankAccession NO:BAB94016)的fdh。
另外的在本文中所描述的重组微生物中合适的例示性fdh包含下列微生物的天然fdh:Saccharomyces servazzii,巴扬氏糖酵母(Saccharomyces bayanus),鲁氏接合糖酵母(Zygosaccharomyces rouxii),微小糖酵母(Saccharomycesexiguus),克鲁维酵母(Saccharomyces kluyveri),乳酸克鲁维酵母(Kluyveromyceslactis),耐热克鲁维酵母(Kluyveromyces thermotolerans),马克思克鲁维酵母(Kluyveromyces marxianus),汉逊氏德巴利氏酵母(Debaryomyces hansenii),Pichia sorbitophila,安格斯毕赤酵母(pichia angusta),热带假丝酵母和解脂肪耶氏酵母(Yarrowia lipolytica)。
fdh的活化可以使用数种办法在宿主中实施。例如,在具有降低的丙酮酸-甲酸-裂合酶活性的菌株中表达来自博伊丁氏假丝酵母的Fdh(SEQ ID NO:13)提高乙醇生成(见图23B),这指明了每摩尔葡萄糖消耗至少3摩尔NADH的胞内NADH利用度。另外,每摩尔葡萄糖消耗高达4摩尔NADH的Fdh依赖性利用度已有记载(Berrios-Rivera等,Metabol.Eng.4,217,2007;US 2003/0175903A1;实施例8)。
如此,NADH依赖性甲酸脱氢酶的过表达预期将可用于正丁醇途径的NADH的摩尔数提高至2.5、3、3.5、4,而且因此实现平衡微生物中的正丁醇途径。如实施例21中所例示的,自pGV1248表达Fdh的大肠杆菌菌株GEVO1034生成约3摩尔NADH每摩尔葡萄糖。如果正丁醇生成途径能与内源发酵途径竞争的话,那么表达Fdh的微生物中正丁醇生成途径的表达预期导致大于1.4%的正丁醇产率。如实施例24中所例示的,自pGV1191和pGV1583表达NADH依赖性Fdh和正丁醇生成途径的GEVO768(大肠杆菌W3110)以比自质粒pGV1191和pGV1435表达正丁醇生成途径的对照菌株GEVO768高30%(理论产率的2%)的产率生成正丁醇。
在某些实施方案中,本文中所公开的重组微生物包括在厌氧或微需氧条件下有活性的丙酮酸脱氢酶(Pdh)。丙酮酸脱氢酶或NADH依赖性甲酸脱氢酶对于重组微生物而言可以是异源的,即编码这些酶的编码序列是异源的,或者转录调节区是异源的(包括人工的),或者所编码的多肽包含使得酶对某些代谢中间产物或底物的反馈抑制有抗性的序列变化。
酶丙酮酸脱氢酶(Pdh)催化丙酮酸转化成乙酰-CoA,同时(with)生成二氧化碳。在催化此反应的同时,Pdh生成1个NADH并消耗1个ATP。此酶通常在需氧条件下表达,其中ATP是丰富的,且NADH可容易地被呼吸途径中的酶NADH脱氢酶消耗,导致相对较低的NADH/NAD+比。在厌氧条件下,当不需要另外的NADH时,和当NADH/NAD+比相对较高时,丙酮酸甲酸裂合酶被细胞用来将丙酮酸转化成乙酰-CoA和甲酸。在此情况中,由Pdh反应释放的电子维持在甲酸中,甲酸或是被分泌或是被甲酸氢裂合酶转化成二氧化碳和氢气。为了平衡大肠杆菌中的正丁醇生成途径,丙酮酸转化成乙酰-CoA必须在厌氧条件下生成一个NADH。
直到最近,才广泛接受了Pdh在厌氧条件下不发挥功能,但是数份最近的报告证明了情况并非如此(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57;Vernuri,G.N.等,2002,Applied and Environmental Microbiology,68,1715-27)。此外,其它微生物诸如粪肠球菌(Enterococcus faecalis)即使在厌氧条件下也展现出Pdh复合物的高体内活性,前提是生长条件使得稳态NADH/NAD+比足够低(Snoep,J.L.等,1991,Fems Microbiology Letters,81,63-66)。代替调节Pdh表达和功能的氧,已经显示了Pdh受到NADH/NAD+比的调节(de Graef,M.等,1999,Journal of Bacteriology,181,2351-57)。来自大肠杆菌的Pdh一般通过提高NADH水平(NADH水平与变成厌氧代谢的转换有关)来灭活,但是如果备选电子受体对于细胞降低NADH水平是可利用的,那么可使用Pdh。如果在大肠杆菌中表达的正丁醇途径消耗NADH快得足以在细胞内部维持低NADH/NAD+水平,那么内源Pdh可维持足以平衡该途径的活性,尤其是在丙酮酸甲酸裂合酶的基因被敲除的情况中。
如此,在一些实施方案中,重组微生物表达正丁醇生成途径中的功能性内源Pdh。优选的是,在那些实施方案中,酶丙酮酸甲酸裂合酶也是被灭活的。或者,可使用进化策略来提高Pdh在厌氧条件下的活性。这种策略依赖于利用具有所有发酵途径但消除了乙醇生成的工程化改造的大肠杆菌变体(图4)。此菌株在厌氧条件下以葡萄糖为生。在这些条件下,葡萄糖发酵成乙醇只在由功能性表达的Pdh提供另外的NADH当量的情况中才是有可能的。可使用这种方法生成在厌氧条件下具有升高的活性的Pdh,并在本文中所公开的重组微生物中使用。
在其中天然Pdh在厌氧条件下没有驱动正丁醇生成的活性的实施方案中(例如在大肠杆菌中),可表达来自另一种生物体的Pdh。例如,来自粪肠球菌的Pdh与来自大肠杆菌的Pdh类似,但是在低得多的NADH/NAD+水平被灭活。另外,有些生物体诸如枯草芽孢杆菌和几乎所有乳酸细菌菌株使用厌氧代谢中的Pdh。这些Pdh酶能在本文中所公开的重组微生物中平衡正丁醇途径。
在厌氧条件下发挥功能的Pdh的表达预期提高每摩尔葡萄糖的NADH摩尔数。如前文所描述的Pdh进化可提高其在厌氧条件下的活性,这通过提高的自葡萄糖生成的乙醇对乙酸比可观察到。如实施例22中所例示的,乙醇对乙酸比可自0.8提高至1.1,指明了Pdh展现出升高的在厌氧条件下的活性。Kim等记载了Pdh使得在大肠杆菌中消耗每摩尔葡萄糖可得到多达4摩尔NADH(Kim Y.等,Appl.Enviromn.Microbiol.,2007,73,1766-1771)。如此,厌氧活性Pdh的利用预期将可用于正丁醇途径的NADH的摩尔数提高至2.5、3、3.5、4,且因此预期实现平衡微生物中的正丁醇途径。如果正丁醇生成途径能与内源发酵途径竞争的话,那么在表达在厌氧条件下有功能的Pdh的微生物中表达正丁醇生成途径预期导致大于1.4%的正丁醇产率。
在某些实施方案中,比葡萄糖更还原的(more reduced)碳源可被用于平衡正丁醇途径。具体而言,所述碳源可以是甘油,其一般通过其转化成糖酵解中间产物甘油醛-3-磷酸而代谢(Lin,E.C.C.,1976,Annu.Rev.Microbiol.,30,535-78)。每个甘油转化成乙酰-CoA可实现高达2分子的NADH的产率,如此为乙酰-CoA转化成正丁醇提供足够的NADH。
在某些实施方案中,重组微生物被工程化改造以活化用于将甘油转化成丙酮酸的异源途径。
具体而言,在一些实施方案中,要被转化成正丁醇的碳源包含甘油,而且甘油降解途径被活化以避免甘油-3-磷酸脱氢酶催化的步骤,其使电子流入醌池。甘油降解途径可通过灭活编码甘油激酶和甘油-3-磷酸脱氢酶的基因来活化(Jin,R.Z.等,1983,Journal of Molecular Evolution,19,429-36)。该途径通过表达可来自弗氏柠檬酸杆菌(Citrobacter freundii)、酿酒酵母或其它生物体的DHA激酶而变得更加高效(图26)。DHA激酶避免磷酸转移酶系统(PTS)对DHA的磷酸化,该磷酸化要求DHA扩散到细胞外并在被磷酸化的同时通过PTS再次进入(图26)。
在一些实施方案中,本文中所公开的重组微生物被工程化改造以补足甘油脱氢酶的进化增强的表达或过表达,其中天然微生物不会经中间产物二羟基丙酮(DHA)来代谢甘油。具体而言,在某些实施方案中,宿主生物体具有经中间产物DHA转化甘油的天然途径,其中转化经DHA变成二羟基丙酮-磷酸(DHAP)的PEP依赖性PTS转化进行。通过重组表达可溶性DHA激酶(例如弗氏柠檬酸杆菌、肺炎克雷伯氏菌(Klebsiella pneumonia)、或酿酒酵母的DHA激酶),可克服天然DHA利用途径需要PEP和DHA扩散至细胞膜的限制,使得DHAP对于细胞是更加高效可得的。从此,DHAP代谢的后续代谢物,诸如可被细胞利用来进行生物转化(它们是天然或重组表达的酶)的丙酮酸和乙酰-CoA和NAD(P)H当量对于细胞也可以是更加高效可得的。
在一个实施方案中,通过本领域技术人员公知的方法利用适合于获得完整基因的线性双链DNA的聚合酶链式反应和引物克隆来自弗氏柠檬酸杆菌、肺炎克雷伯氏菌或酿酒酵母的编码DHA激酶的基因。
来自弗氏柠檬酸杆菌的编码DHA激酶的基因的序列(GenBank登录号DQ473522.1)显示于SEQ ID NO:12。肺炎克雷伯氏菌基因组上编码DHA激酶的基因的序列显示于SEQ ID NO:14。酿酒酵母基因组上编码DHA激酶的基因Dak1的序列显示于SEQ ID NO:15。酿酒酵母基因组上编码DHA激酶的基因Dak2的序列显示于SEQ ID NO:16。
在一个实施方案中,在不删除宿主生物体的野生型DHA操纵子的情况中使用编码DHA激酶的基因。在一个备选的实施方案中,宿主生物体的野生型DHA操纵子被删除。在一个实施方案中,DHA激酶自质粒过表达,该质粒具有适合于给定菌株所要求的表达水平的多个启动子和抗生素抗性基因之一。
在一个实施方案中,编码DHA激酶的基因整合入染色体中。使基因整合入染色体中的方法是本领域已知的。依照此实施方案,通过使用标准分子生物学技术,将DHA激酶的弗氏柠檬酸杆菌、肺炎克雷伯氏菌或酿酒酵母基因插入微生物基因组。
插入染色体中的编码DHA激酶的基因的存在和完整性可使用被置换基因相邻的和外部的以及与编码DHA激酶的基因的内部序列互补的引物通过PCR来验证,使得预期大小的PCR产物证实染色体DNA中预期变化和插入基因的存在。以这种方式,可验证内部序列以及修饰的边缘的完整性。
在经中间产物甘油-3-磷酸代谢甘油的野生型大肠杆菌和其它细菌中,二羟基丙酮(DHA)的代谢依赖于与磷酸转移系统(PTS)的蛋白质相互作用的DHA调节子的蛋白质对其的磷酸化(图26)。
PTS系统将DHA磷酸化成DHAP(二羟基丙酮磷酸)。DHAP是糖酵解的中间产物,而且因为它对于甘油代谢途径是共同的,所以它连接甘油代谢与中心细菌代谢。PTS系统是膜结合的。因此,由可溶性甘油脱氢酶(诸如大肠杆菌甘油脱氢酶,由gldA编码)形成的DHA必须扩散至膜,之后它才能被转化成DHAP,此时它可进入中心代谢,随后产生另外的NADH和ATP以及乙酰-CoA,所有这些都可被重组生物催化酶或途径所利用。
PTS介导的磷酸化需要PEP,即磷酸烯醇丙酮酸。PEP将其高能磷酰基团供给PTS的酶I和然后供给本领域称作HPr的酶,二者都定位在细胞质中。然而,特异性结合DHA的蛋白质是PTS的规范(canonical)酶II的同系物,其由亚基IIA、IIB和IIC组成,其中IIC定位在细胞膜中。一般而言,这些IIA、B和C蛋白可以是单体或共价连接在一起。IIA和IIB是亲水性的,而IIC是六或八区段的跨膜蛋白质。磷酰基团据信自P-HPr转移至IIA,然后转移至IIB,而且最终转移到随后磷酸化的糖上,其中IIC从未被磷酸化。
在弗氏柠檬酸杆菌和肺炎克雷伯氏菌中都类似的DHA利用途径牵涉单一ATP依赖性酶,其在细胞质中是可溶的,而且携带与PTS的酶II的一些相似性。在具有基于PTS的DHA利用途径的微生物(诸如大肠杆菌和其它细菌)中的重组表达可减轻先前记录的一种或多种限制,诸如对PEP的需要和DHA扩散至膜(即使DHA是在细胞质内形成的)。
举例而言,在一个实施方案中,从甘油到丙酮酸的途径的反应如下:
甘油→二羟基丙酮+NADH(1)
二羟基丙酮→二羟基丙酮-磷酸+ADP(2)
二羟基丙酮-磷酸→丙酮酸+NADH+2ATP(3)
其中净反应如下:
甘油+2NAD++2H++1ADP→丙酮酸+1ATP+2NADH(4)
在一个实施方案中,NADH依赖性甘油脱氢酶GldA酶催化反应(1),而自弗氏柠檬酸杆菌或自肺炎克雷伯氏菌衍生的酶DHA激酶催化反应(2)(见图26)。
在一个实施方案中,自宿主微生物的基因组删除基因glpK(编码甘油激酶)和glpD(编码G3P脱氢酶),而gldA(编码NADH连接的甘油脱氢酶)和PEP(磷酸烯醇丙酮酸)依赖性二羟基丙酮(DHA)激酶作为甘油降解的活性途径出现。在一个实施方案中,宿主生物体经如下转化途径来代谢甘油,该转化途径经DHA变成DHAP的PEP依赖性PTS(磷酸转移系统)转化进行。在这些宿主中,通过重组表达弗氏柠檬酸杆菌、肺炎克雷伯氏菌或酿酒酵母的可溶性DHA激酶,可克服天然DHA利用途径需要PEP和DHA扩散至细胞膜的限制。DHAP可由此对于细胞是更加高效可得的。从此,DHAP代谢的后续代谢物,诸如可被细胞利用来进行生物催化(它们是天然或异源表达的酶)的乙酰-CoA和NAD(P)H当量对于细胞也可以是更加高度可得的。
如本文中所描述的功能性甘油利用途径的表达预期提高每摩尔甘油的NADH摩尔数。具体而言,每摩尔甘油的NADH摩尔数可提高至高达每摩尔甘油2摩尔NADH。如此,如本文中所描述的功能性甘油利用途径的表达预期将正丁醇途径可得的NADH摩尔数提高至1.25、1.5、1.75、2,并由此实现平衡微生物中的正丁醇途径。如实施例4中所例示的,GEVO926生成约2摩尔NADH每摩尔甘油。如果正丁醇生成途径能与内源发酵途径竞争的话,正丁醇生成途径在表达如上文所描述的功能性甘油利用途径的微生物中的表达可导致大于1.4%的正丁醇产率。
在某些实施方案中,本文中所描述的表达用于正丁醇生成的异源酶(特别是正丁醇生成的NADH依赖性异源途径,诸如正丁醇途径)的重组微生物被进一步工程化改造以灭活竞争性代谢途径和在正丁醇生成方面平衡微生物中的NADH生成和消耗。
具体而言,在一些实施方案中,在为了给正丁醇生成途径供应足够的NADH而通过活化(特别是过表达)Fdh、通过活化厌氧活性Pdh、或通过利用甘油作为碳源来工程化改造微生物之外,加上乳酸脱氢酶的灭活及相关的丙酮酸转化成乳酸的灭活预期将正丁醇产率提高至理论产率的约5%。在那些实施方案中,大部分碳可仍被转化成乙醇。具体而言,如实施例27中所例示的,GEVO1082(其被工程化改造以删除编码乳酸脱氢酶的基因)的正丁醇产率预期是理论产率的约5%。
在一些实施方案中,在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的重组微生物中,在竞争性代谢途径的灭活之外,加上NADH依赖性Fdh的活化(特别是过表达)预期进一步将正丁醇产率提高至理论产率的至少约30%,35%、40%、50%、60%、70%、80%、90%和95%,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例18中所例示的,重组微生物诸如表达Fdh且灭活了乳酸脱氢酶、醇脱氢酶和延胡索酸还原酶的GEVO1083的正丁醇产率预期为比不表达Fdh的菌株(实施例18的pGV1281)高约42%。GEVO1034中自与pGV1281类似的表达系统表达的Fdh只产生3摩尔NADH每摩尔葡萄糖,这指明了Fdh表达导致NADH利用度升高。然而,这种升高不足以容许平衡正丁醇途径,如此将预期产率限制至约35%。
在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的一些实施方案中,在竞争性代谢途径的灭活之外,加上厌氧活性Pdh的活化(特别是表达)预期进一步将正丁醇产率提高至理论产率的至少约30%、35%、40%、50%、60%、70%、80%、90%和95%,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例23中所例示的,在厌氧条件下表达Pdh且灭活了乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的重组微生物诸如GEVO1510的正丁醇产率预期为理论产率的约73%。
在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的一些实施方案中,在竞争性代谢途径的灭活之外,加上功能性Fdh的活化(特别是表达)预期将正丁醇产率进一步提高至理论产率的至少约30%、35%、40%、50%、60%、70%、80%、90%和95%,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例27中所例示的,表达Fdh且灭活了乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的重组微生物诸如GEVO1507(大肠杆菌W3110,ΔldhA,ΔadhE,Δfrd,ΔackA,ΔmgsA)的正丁醇产率预期为理论产率的约70%。
在其中醇脱氢酶及相关的乙酰-CoA转化成乙醇被灭活的一些实施方案中,在灭活竞争性代谢途径之外,加上功能性甘油利用途径的活化(特别是表达)预期将正丁醇产率提高至理论产率的至少50%、60%、70%、80%、90%和95%的水平,这取决于微生物中被灭活的竞争性代谢途径。具体而言,如实施例中所例示的,利用甘油作为碳源且灭活了乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的大肠杆菌W3110,ΔldhA,ΔadhE,Δndh,Δfrd,ΔackA,ΔmgsA)的正丁醇产率预期为理论产率的约70%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上将乙酰-CoA转化成乙醇的醇脱氢酶的灭活预期将正丁醇产率提高至理论产率的至少约40%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶的基因的GEVO1084的正丁醇产率预期为理论产率的约40%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶和醇脱氢酶的灭活及分别相关的丙酮酸转化成乳酸和乙酰-CoA转化成乙醇的灭活预期将正丁醇产率提高至理论产率的约50%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶和乳酸脱氢酶的基因的GEVO1084的正丁醇产率预期为理论产率的约50%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶和延胡索酸还原酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇和延胡索酸转化成琥珀酸的灭活预期将正丁醇产率提高中约55%。如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶和延胡索酸还原酶的基因的重组微生物诸如GEVO1508的正丁醇产率预期为理论产率的约55%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和甲基乙二醛合酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸和二羟基-丙酮磷酸转化成甲基乙二醛的灭活可将正丁醇产率提高至约60%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶、延胡索酸还原酶和甲基乙二醛合酶的基因的重组微生物诸如GEVO1509的正丁醇产率预期为理论产率的约60%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和乙酸激酶的灭活及分别相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸和乙酰-磷酸转化成乙酸的灭活预期将正丁醇产率提高至理论产率的约65%。如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶、延胡索酸还原酶和乙酸激酶的基因的重组微生物诸如GEVO1085的正丁醇产率预期为理论产率的约65%。
在一些实施方案中,在通过活化(特别是过表达)Fdh、活化厌氧活性Pdh、或利用甘油作为碳源而工程化改造微生物用以给正丁醇生成途径供应足够的NADH之外,加上乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶、乙酸激酶和甲基乙二醛合酶的灭活及相关的丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸、乙酰-磷酸转化成乙酸和二羟基-丙酮磷酸转化成甲基乙二醛的灭活可将正丁醇产率提高至约70%。具体而言,如实施例27中所例示的,工程化改造以删除编码醇脱氢酶、乳酸脱氢酶、延胡索酸还原酶、甲基乙二醛合酶和乙酸激酶的基因的重组微生物诸如GEVO1507的正丁醇产率预期为理论产率的约70%。
因而,在某些实施方案中,本文中所公开的重组微生物包括诸如以下菌株及其衍生物的重组微生物,诸如GEVO788,GEVO789,GEVO800,GEVO801,GEVO802,GEVO803,GEVO804,GEVO805,GEVO817,GEVO818,GEVO821,GEVO822,GEVO1054,GEVO1084,GEVO1085,GEVO1083,GEVO1493,GEVO1494,GEVO1495,GEVO1496,GEVO1497,GEVO1498,GEVO1499,GEVO1500,GEVO1501,GEVO1502,GEVO1503,GEVO1504,GEVO1505,GEVO1507,GEVO1508,GEVO1509,GEVO1510,GEVO1511。优选的微生物包括GEVO1495和GEVO1505。实施例部分中进一步描述了那些微生物、它们的生成和用途。
在某些实施方案中,通过工程化改造正丁醇生成途径以提高其效率,能进一步提高正丁醇产率。具体而言,这在其中一种或多种异源表达的生物催化剂最初没有为了用作宿主微生物内的代谢酶而优化的实施方案中。然而,通过例如使用进化办法,通常能改善这些酶。
例如,使用上文所述含有期望的正丁醇生成途径的最高效变体的工程化改造的微生物,可以施加选择性压力以获得改善的生物催化剂。在此办法中,将正丁醇生成途径转化入合适的宿主微生物中,其中生长速率取决于该途径的效率,即,其中正丁醇途径是再氧化NADH的唯一手段。可以自此文库鉴定展现出生长速率有可检测的提高(该提高不是由于另一种发酵产物的形成)的微生物。通过经本领域技术人员知道的分析方法分析发酵液,可鉴定其它发酵产物。可反复地重复此过程。
例如,使用上文所述含有期望的正丁醇生成途径的最高效变体的工程化改造的大肠杆菌菌株,可实施定向进化以获得改善的生物催化剂。在此办法中,使用本领域技术人员知道的方法突变酶,优选正丁醇生成途径的限速酶。将突变基因的文库掺入正丁醇生成途径中,将该正丁醇生成途径转化入合适的宿主微生物,其中生长速率取决于该途径的效率,即,其中正丁醇途径是再氧化NADH的唯一手段。可以自此文库鉴定展现出生长速率有提高的微生物,该提高是由于基因内的有益突变,而不是由于另一种发酵产物的形成。通过经本领域技术人员知道的分析方法分析发酵液,可鉴定其它发酵产物。可反复地重复此过程。例如,可依照本领域技术人员知道的方法通过定向进化来优化正丁醇生成途径的酶。
葡萄糖通过异源表达的正丁醇途径的代谢是经工程化改造的细胞能生成ATP的唯一方式,而且也是它们能维持稳定的NAD+/NADH比的唯一方式。因此,生长速率取决于正丁醇形成的速率。通过连续稀释或恒化进化,可容易地实施对升高的生长速率的选择。
相同技术可用于选择具有升高的对正丁醇耐受的突变体。正丁醇对于所有微生物都是有毒物质,主要因为它破坏细胞膜。先前已经使用进化策略来工程化改造大肠杆菌以提高乙醇抗性(Yomano,L.P.等,1998,Journal ofIndustrial Microbiology&Biotechnology,20,132-38)。因此,预期能以相同方式工程化改造展示升高的正丁醇抗性的突变体。
因而,在一些实施方案中,描述了如下可获得的重组微生物,即提供工程化改造以活化用于将碳源转化成正丁醇的异源途径且具有第一生长速率的重组微生物,该第一生长速率取决于正丁醇生成,该重组微生物还能够以第一生成速率生成丁醇;鉴定异源途径中在异源途径方面限速的酶;突变所述酶;使包含突变酶的重组微生物与培养基接触,接触的时间和条件用以检测相对于第一生长速率升高的第二生长速率;并选择具有第二生长速率的重组微生物,该选定的重组微生物能够以第二生成速率生成正丁醇,该第二生成速率大于第一生成速率。
类似的过程也可用于鉴定/分离具有较高的正丁醇产率每代谢的葡萄糖的菌株。
在另一个实施方案中,微生物被工程化改造以活化在正丁醇或其衍生物的生长中用于将碳源转化成代谢中间产物的代谢途径。具体而言,在一些实施方案中,重组微生物被工程化改造以活化代谢途径丁酸。在此途径中,过表达基因来将乙酰-CoA转化成丁酰-CoA。例如,可表达编码硫解酶、羟基丁酰-CoA-脱氢酶、巴豆酸酶和丁酰-CoA脱氢酶的基因来将乙酰-CoA转化成丁酰-CoA。
然后,两种酶,即磷酸丁酰转移酶和丁酸激酶将丁酰-CoA转化成丁酸。在释放CoA的情况中,磷酸丁酰转移酶(由例如来自丙酮丁醇梭菌的基因ptb编码)将丁酰-CoA转化成丁酰-磷酸:
然后,在释放ATP的情况下,丁酸激酶(由例如来自丙酮丁醇梭菌的基因buk编码)将丁酰-磷酸去磷酸化成丁酸:
在一个实施方案中,大肠杆菌被工程化改造以将碳源转化成丁酸。在此途径中,可表达编码硫解酶、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、磷酸丁酰转移酶和丁酸激酶的基因以将乙酰-CoA转化成丁酸。
在一个实施方案中,使用酪丁酸梭菌(C.tyrobutyricum)作为宿主生物体来生成丁酸。在一个实施方案中,酪丁酸梭菌利用TER异源酶以催化巴豆酰-CoA转化成丁酰-CoA。依照此实施方案,可敲除编码牵涉竞争性乙酸形成途径的酶AK和PTA的基因ack和pta,如X.Liu和S.T.Yang,Construction andCharacterization of pta Gene Deleted Mutant of Clostridium tyrobutyricum forButyric Acid Fermentation,Biotechnol.Bioeng.,90:154-166(2005),Y.Yang,S.Basu,D.L.Tomasko,LJ.Lee,和S.T.Yang,通过提述将其完整并入本文。
既然乙酰-CoA转化成丁酸只需要2摩尔NADH,那么可使用丙酮酸甲酸裂合酶来将丙酮酸转化成乙酰-CoA。消除竞争性代谢途径可提高葡萄糖变成正丁酸的转化的产率并降低副产物的水平。
消除编码分别将丙酮酸转化成乳酸、乙酰-CoA转化成乙醇、延胡索酸转化成琥珀酸和乙酰-磷酸转化成乙酸的乳酸脱氢酶、醇脱氢酶、延胡索酸还原酶和乙酸激酶的基因可降低乳酸、乙醇、琥珀酸和乙酸的生成,而且可提高丁酸产率。
在另一个实施方案中,微生物被工程化改造以将碳源转化产物,其中产物是丁酸与正丁醇的混合物。该微生物表达乙酰-CoA转化成丁酰-CoA的基因、丁酰-CoA转化成正丁醇的基因和丁酰-CoA转化成丁酸的基因。
在一个实施方案中,为乙酰-CoA转化成丁酰-CoA而表达的基因可包括那些编码硫解酶、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶的基因,为丁酰-CoA转化成正丁醇而表达的基因可包括那些编码丁醛脱氢酶和正丁醇脱氢酶或双功能性丁醛/丁醇脱氢酶的基因,而为丁酰-CoA转化成丁酸而表达的基因可包括那些编码磷酸丁酰转移酶和丁酸激酶的基因,如图27中所示的。
此混合物的比例可取决于NADH的利用度,因为乙酰-CoA转化成正丁醇需要4分子NADH,但乙酰-CoA转化成丁酸只需要2分子NADH。因此,为了生成丁酸与正丁醇的等摩尔混合物,每个葡萄糖转化成乙酰-CoA产生3分子NADH。
本文中进一步公开了用于生产正丁醇的方法,该方法包括在合适的培养基中培养本文中所公开的重组微生物。
在某些实施方案中,该方法进一步包括自培养基分离正丁醇。例如,可以通过任何本领域公认方法自培养基分离正丁醇,诸如渗透蒸发(pervaporation)、液液萃取(liquid-liquid extraction)、或气提(gas stripping)(见下文更多详情)。
在某些实施方案中,如果微生物不使用需氧或厌氧呼吸,那么正丁醇产率最高,因为在这些情况中碳以二氧化碳的形式流失(lost)。
在某些实施方案中,微生物在厌氧条件下发酵性地生成正丁醇,使得碳不以二氧化碳的形式流失。
术语“需氧呼吸”指其中氧是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径。术语“需氧呼吸途径”在本文中与措词“需氧代谢”、“氧化性代谢”或“细胞呼吸”可互换使用。
另一方面,术语“厌氧呼吸”指其中氧不是最终电子受体且能量通常以ATP分子的形式生成的呼吸途径,其包括其中氧以外的有机或无机分子(例如硝酸、延胡索酸、二甲亚砜、含硫化合物诸如硫酸和金属氧化物)是最终电子受体的呼吸途径。措词“厌氧呼吸途径”在本文中与措词“厌氧代谢”和“厌氧呼吸”可互换使用。
“厌氧呼吸”必须与“发酵”区分开。在“发酵”中,NADH将其电子贡献给由生成NADH中携带的电子的同一代谢途径所生成的分子。例如,在大肠杆菌的发酵性途径之一中,通过糖酵解生成的NADH将其电子转移给丙酮酸,产生乳酸。
在发酵性条件下运行的微生物只能在发酵是“平衡”的情况中代谢碳源。若碳源的氧化反应期间所生成的NADH等于乙酰-CoA转化成发酵终产物所利用的NADH,则说发酵是“平衡”的。只有在这些条件下,所有NADH才是再循环的。如果没有再循环,NADH/NAD+比会变得不平衡,这导致生物体最终死亡,除非有可得的备选代谢途径来维持平衡NADH/NAD+比。依照White,2000#168,若氧化期间所生成的氢等于转移给发酵终产物的氢,则说书面发酵(written fermentation)是“平衡”的。只有在这些条件下,所有NADH和还原型铁氧还蛋白才再循环成氧化形式。重要的是要知道,发酵是否是平衡的,因为如果不是这样,那么整体书面反应是不正确的。
厌氧条件是高产率的生成正丁醇的微生物所优选的。
在一些实施方案中,用于生成本文中所公开的重组微生物的方法包括:(1)如下生成重组微生物的文库:(a)将编码能够利用NADH来转化乙酰-CoA和正丁醇生成途径的一种或多种代谢中间产物的一种或多种多肽的一种或多种异源DNA序列导入对应的野生型微生物,(b)自对应的微生物的基因组删除用于(竞争性内源)厌氧发酵的编码直接或间接消耗NADH和代谢中间产物的一种或多种酶的一种或多种内源DNA序列,其中步骤(a)和(b)以任一次序实施,(2)自步骤(1)中所生成的重组微生物选择能够厌氧生长同时生成正丁醇的一种或多种重组微生物,其中对应的野生型微生物不能够厌氧生长同时生成正丁醇。
在该方法中,将编码能够利用NADH来转化乙酰-CoA和正丁醇生成途径的一种或多种代谢中间产物的一种或多种多肽的一种或多种异源DNA序列导入预先选定的宿主微生物。在该宿主微生物,还删除编码与正丁醇生成途径竞争碳和/或NADH的一种或多种酶的一种或多种内源DNA序列以使得碳/NADH对于用于生成正丁醇或其代谢中间产物的一种或多种多肽是可得的。然后对如此生成的重组微生物施加选择压力,使得那些能够在厌氧条件下更快生长同时生成正丁醇的自群体中长出来并富集。
任选的是,可通过本领域公认手段随机诱变该重组微生物,诸如通过向培养物中添加化学诱变剂,诸如甲磺酸乙酯或N-甲基-N′-硝基-N-亚硝基胍。另外,任何通过本发明方法生成的生成正丁醇的微生物可进行额外轮次的诱变和选择,以生成更高产率的菌株。
在某些实施方案中,该方法还可包括选择耐受正丁醇的微生物菌株的步骤,该步骤在选择能够在所生成的正丁醇上存活的重组微生物之前或之后。例如,该方法可包括选择能够在含至少约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.2%、1.5%、1.8%、2%、3%、4%、5%、6%、7%、8%或更多正丁醇的培养基中以与在不含正丁醇的培养基中生长的对应的野生型微生物基本上相同的速率厌氧性生长的一种或多种重组微生物的步骤。
在某些实施方案中,用于生成正丁醇的方法包括在合适的培养基中在合适的培养条件下培养本发明的重组微生物。
合适的培养条件取决于宿主微生物的最适温度、最适pH和营养物要求,是本领域技术人员知道的。这些培养条件可以通过本领域技术人员知道的方法来控制。
例如,通常在约25℃至约40℃的温度和约pH4.0至pH8.0的pH培养大肠杆菌细胞。用于依照本发明生成正丁醇的培养基包括普通培养基,诸如LuriaBertani(LB)培养基、富含EZ的培养基和商业上相关的利用氮、矿物盐、痕量元素和所限定的碳源的便宜来源的基本培养基。
可以在需氧或厌氧条件下实施发酵,其中厌氧或微需氧条件是正丁醇生成阶段期间所优选的。
在一个实施方案中,发酵由需氧阶段和厌氧阶段组成。在需氧条件下比在厌氧条件下更加高效地生成生物质和表达途径酶。生物转化,即葡萄糖转化成正丁醇,发生在厌氧阶段期间。
生物质生成和蛋白质表达在需氧条件下更加高效,因为来自碳源的能量产率更高。这容许更高的生长收率、生长速率和蛋白质表达速率。这些优点胜过给发酵容器通气的花费。
发酵培养基中所生成的1-丁醇的量可使用本领域已知的许多方法来测定,例如,高效液相层析或气相层析。
在一些实施方案中,提供了生成正丁醇的方法,该方法包括在需氧条件或宏需氧(macroaerobic)条件下培养本公开内容的任何重组微生物一段时间,以生成细胞群(cell mass),具体而言在约1至约190g干细胞升-1的范围内、或优选在约1至约50g干细胞升-1的范围内,然后改变培养条件,改变的时间和条件用以生成一种或多种生物燃料和/或生物燃料前体,特别是其中在培养物中可检测到一种或多种生物燃料的时间和条件,并回收一种或多种生物燃料和/或生物燃料前体。在某些实施方案中,将培养条件自需氧或宏需氧条件改变成厌氧条件。在某些实施方案中,将培养条件自需氧条件改变成宏需氧条件。在某些实施方案中,将培养条件自需氧条件或宏需氧条件改变成微需氧条件。
术语培养的“需氧条件”指其中溶解在培养物的液体级分中的氧相对于空气饱和为10%或更高(要考虑由于设备可变性引起的变动)的条件。
术语培养的“微需氧条件”指其中溶解在培养物的液体级分中的氧相对于空气饱和为约0.5%至约5%(要考虑由于设备可变性引起的变动)的条件。
术语培养的“宏需氧条件”指其中溶解在培养物的液体级分中的氧相对于空气饱和为约5%至约10%(要考虑由于设备可变性引起的变动)的条件。
由于停工期、长的延滞期和产物抑制,分批反应器的生产力常常是低的。虽然使用连续培养能消除停工期和延滞期,产物抑制的问题仍然存在。通过应用新的产物清除技术,能消除此问题。在连续培养之外,也可将补料-分批技术应用于发酵过程。然而,发酵必须与合适的产物清除技术组合。另外,固定化细胞培养和细胞再循环反应器的应用已知将反应器的生产力与分批反应器相比提高40-50倍。生产力的提高导致工艺体积和反应器尺寸的降低,如此改善工艺经济性。
反应器生产力低的原因之一是生物反应器中细胞的浓度低。在分批反应器中,很少实现3g/L以上的细胞浓度。因此,通过提高反应器中的细胞浓度能改善反应器生产力。通过将细胞固定化到支持物或凝胶颗粒上能提高细胞浓度。用于提高细胞浓度的另一个选项是应用如下的膜,该膜使细胞返回反应器同时含有产物的水溶液透过膜。
下列三个分部描述了可能适合于正丁醇生成的不同反应器。
A)分批、补料-分批和无细胞连续发酵
分批工艺是用于正丁醇生产的发酵的简单方法。在培养基冷却期间,穿过表面通入氮或二氧化碳以使得培养基缺氧。接种后,用这些气体喷射(sparge)培养基以混合接种体。
补料-分批发酵是一种工业技术,其应用于高底物浓度对培养物有毒的过程。在此类情况中,以分批模式以低底物浓度(对培养物无抑制作用)和低培养基体积(通常少于发酵罐体积的一半)启动反应器。随着底物被培养物使用,通过以慢速添加浓缩的底物溶液来替换它,由此保持发酵罐中的底物浓度低于对培养物有毒的水平。在这种类型的系统中,反应器中培养物的体积随时间增加。在液体体积为反应器体积的大约75%时收获培养物。
既然正丁醇对重组微生物有毒,那么不能应用补料-分批发酵技术,除非应用新的产物回收技术之一来同时分离产物。作为底物降低或降低的产物抑制的结果,发生更多的细胞生长,而且反应器生产力得到改善。
可使用连续培养技术来改善反应器生产力和研究培养物在稳态中的生理学。在此类系统中,以分批模式启动反应器,并且容许细胞生长直至细胞处于指数期。作为防范措施,不让发酵进入稳定期,因为正丁醇的积累会杀死细胞。当细胞处于指数期的时候,给反应器连续补料培养基,并以与补料相同的流速取出产物流,如此保持反应器中的恒定体积。以这种方式运行发酵消除了停工期,如此改善反应器生产力。另外,发酵比典型的分批工艺运行长得多。
在连续培养中,可能存在一个严重的问题,即溶剂生成在一长段时间里可能不稳定,而且可能最终随时间下降,而伴随酸生成的升高。在单阶段连续系统中,可获得高反应器生产力,但是这是以与分批工艺中所实现的相比的低产物浓度为代价的。
B)固定化细胞连续反应器
高细胞浓度导致高反应器生产力。此类系统是连续的,其中在底部将进料导入管状反应器,而产物在顶部离开。这些系统常常是不混合的反应器,其中产物抑制显著降低。为了改善反应器生产力,可以通过吸附将细胞固定化到粘土砖颗粒上,并实现更高的反应器生产力,导致经济的优点。
C)膜式细胞再循环反应器
膜式细胞再循环反应器是用于改善反应器生产力的另一个选项。在此类系统中,以分批模式启动反应器并容许细胞生长。在达到稳定期之前,使发酵液穿过膜循环。膜容许产物水溶液通过,同时保留细胞。反应器进料和产物(渗透物)清除是连续的,而且在反应器中维持恒定的体积。在此类细胞再循环系统中,能实现100g/L以上的细胞浓度。然而,为了保持细胞生产性,应当自反应器取出少量放出物(bleed)(<10%稀释率)。
A)蒸馏
通过蒸馏回收正丁醇的成本是高的,因为,由于产物抑制,其在发酵液中的浓度是低的。在产物浓度低之外,正丁醇的沸点比水高(118℃)。发酵液中总溶剂的浓度通常是18-33g/L(使用淀粉或葡萄糖),其中正丁醇只有约13-18g/L。这使得通过蒸馏回收正丁醇耗能多。如果发酵液中的正丁醇浓度能从10g/L提高到40g/L,那么就能节约大量的能量。
为了降低正丁醇回收的成本,已经调查了许多回收技术,包括原位气提、液液萃取和渗透蒸发。这些技术的详情已经另有记载(参见Maddox,Biotechnol.&Genetic Eng.Revs.7:190,1989;Groot等,Process BioChem.27:61,1992;通过提述并入本文)。这些技术可应用于原位正丁醇清除,如此在正丁醇生成的同时自反应器清除正丁醇。目的是防止正丁醇的浓度超过培养物的耐受水平。随后通过浓缩(气提或渗透蒸发)或通过蒸馏(萃取)回收产物。
B)备选的经济上可行的技术
气提
气提是用于自发酵液回收正丁醇(丙酮或乙醇)的一种简单技术。穿过发酵液用氮或发酵气体(CO2和H2)鼓泡,接着使该一种或多种气体通过冷凝器。随着穿过发酵罐用气体鼓泡,它捕获(capture)溶剂(例如,正丁醇)。然后,溶剂在冷凝器中冷凝,并在接收器中收集。一旦溶剂冷凝,使气体再循环回到发酵罐以捕获更多的溶剂。继续此过程,直至发酵罐中所有的糖被培养物利用掉。在有些情况中,可使用分开的剥离器来剥离溶剂,之后将溶剂含量低的剥离器流出物再循环。气提已经成功地应用于自多种反应器清除溶剂。
为了降低底物抑制,可以将补料-分批发酵与气提整合。为此目的,可以以100g/L葡萄糖启动反应器。随着糖被培养物消耗掉,通过添加已知体积的浓缩的(500g/L)糖溶液来替换被使用掉的葡萄糖。反应器内糖的水平保持在有毒水平以下,优选小于80g/L。通过气提清除溶剂,由溶剂引起的细胞抑制得到了降低。
液液萃取
液液萃取是能用于自发酵液清除溶剂(例如,正丁醇)的另一种技术。在此工艺中,将萃取溶剂与发酵液混合。正丁醇被萃取入萃取溶剂中,并通过反萃取入另一种萃取溶剂或通过蒸馏来回收。
萃取式正丁醇发酵的一些要求是:
1.对生产生物体无毒;
2.发酵产物的分配系数高;
3.与发酵液不能混溶且不形成乳状液;
4.萃取溶剂不贵且易于获得;
5.萃取溶剂能灭菌且没有健康危害。
例如,可使用玉米油作为萃取溶剂。文献中已经报道了许多用于正丁醇的萃取溶剂。其中,油醇(oleyl alcohol)表现出达到一些上述要求。
萃取剂的毒性是萃取性发酵中的重大问题。为了避免萃取溶剂带来的毒性问题,可使用膜自细胞培养物分离萃取溶剂。例如,在连续发酵细胞再循环系统中,可以是发酵液穿过膜循环,而使细菌返回发酵罐,同时用癸醇萃取渗透物以清除正丁醇。
用于降低毒性和改善分配系数的另一种办法是混合分配系数高、毒性高的萃取剂与分配系数低、毒性低的萃取剂。所得混合物是总体分配系数高且毒性低的萃取剂。油醇可用于此目的。
渗透蒸发
渗透蒸发是基于膜的工艺,其用于通过使用选择性膜自发酵液清除溶剂。液体或溶剂穿过固体膜扩散,在后面留下营养物、糖和微生物细胞。穿过膜的溶剂的浓度取决于膜的组成和膜的选择性,其是进料溶剂浓度的函数。
例如,可以在多微孔的聚丙烯25mm厚的扁平片上支持含有油醇的液体膜。穿过膜扩散的液体显示出180的选择性,比较而言,有机硅膜的选择性为大约45。估计,如果使用此渗透蒸发膜作为正丁醇分离的预处理工艺,那么能量需求会是只有常规蒸馏所要求的10%。
为了开发具有高度选择性的稳定膜,可以在有机硅膜中包括硅质盐(一种吸附剂)。这可改善有机硅-硅质盐膜的选择性水平。该膜的工作寿命为数年。该膜可用于正丁醇模型溶液和发酵液二者。
实施例
以下实施例还举例说明了本公开内容,其是作为例示提供的,并非意图限制。
表1列举了本公开内容中所提及的(特别是以下实施例中所描述的)某些菌株。
表1:菌株
菌株 | 基因型 |
GEVO709(大肠杆菌WA837)CGSC 90266 | 大肠杆菌B,gal-151,met-100,[malB+(LamS)],hsdR11,Δ46 |
GEVO768 | 大肠杆菌W3110,attB::(Sp+lacIq+tetR+) |
大肠杆菌DH5α | 大肠杆菌F-endA1 glnV44 thi-1 recA1 relA1 gyrA96 deoR nupGΦ80dlacZΔM15Δ(lacZYA-argF)U169,hsdR17(rK -mK +),λ- |
GEVO788 | 大肠杆菌W3110,ΔldhA |
GEVO789 | 大肠杆菌WA837,ΔldhA |
GEVO800 | 大肠杆菌W3110,ΔadhE |
GEVO801 | 大肠杆菌W3110,ΔpoxB |
GEVO802 | 大肠杆菌W3110,ΔfocA-pflB |
GEVO803 | 大肠杆菌WA837,ΔadhE |
GEVO804 | 大肠杆菌WA837,ΔpoxB r |
GEVO805 | 大肠杆菌WA837,ΔfocA-pflB |
GEVO817 | 大肠杆菌W3110,ΔackA |
菌株 | 基因型 |
GEVO818 | 大肠杆菌W3110,Δfrd |
GEVO821 | 大肠杆菌WA837,ΔackA |
GEVO822 | 大肠杆菌WA837,Dfrd |
GEVO914 | 大肠杆菌W3110,Δldh,ΔpoxB,Δfrd |
GEVO916 | 大肠杆菌W3110,ΔglpD |
GEVO917 | 大肠杆菌W3110,ΔglpK |
GEVO922 | 大肠杆菌W3110,ΔglpK,ΔglpD |
GEVO926 | 大肠杆菌W3110,ΔglpD,ΔglpK* |
GEVO927 | 大肠杆菌W3110,ΔglpD,ΔglpK*,pGV1010 |
GEVO954 DSMZ 615 | 大肠杆菌B |
GEVO992 | 大肠杆菌W3110,ΔldhA,Δfrd |
GEVO1005(大肠杆菌W3110)DSMZ 5911 | 大肠杆菌F-L-rph-1 INV(rrnD,rrnE) |
GEVO1007 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA |
GEVO1034 | 大肠杆菌W3110,ΔfdhF |
GEVO1039 | 大肠杆菌W3110,Δndh,Δldh,ΔadhE,ΔfocA-pflB,Δfrd,Δfnr,attB::(Sp+lacIq+tetR+) |
GEVO1043 | 大肠杆菌W3110,Δndh,Δldh,ΔadhE,ΔfocA-pflB,ΔackA,Δfrd,Δfnr,attB::(Sp+lacIq+tetR+) |
GEVO1044 | 大肠杆菌W3110,Δndh,ΔpoxB,ΔackA,Δ(fnr-ldhA),attB::(Sp+lacIq+tetR+) |
GEVO1047 | 大肠杆菌W3110,ΔldhA,Δfrd,attB::(Sp+lacIq+tetR+) |
GEVO1054 | 大肠杆菌W3110,ΔadhE,attB::(Sp+lacIq+tetR+) |
GEVO1082 | 大肠杆菌W3110,ΔldhA,attB::(Sp+lacIq+tetR+) |
GEVO1083 | 大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+) |
GEVO1084 | 大肠杆菌W3110,ΔldhA,ΔadhE,attB::(Sp+lacIq+tetR+) |
GEVO1085 | 大肠杆菌W3110,ΔldhA,ΔadhE,Δfrd,ΔackA,attB::(Sp+lacIq+tetR+) |
GEVO1086 | 大肠杆菌W3110,ΔldhA,Δfrd,ΔackA,attB::(Sp+lacIq+tetR+) |
GEVO1121 | 大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,ΔmgsA,attB::(Sp+lacIq+tetR+) |
GEVO1137 | 大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+),ΔackA |
GEVO1200 | 大肠杆菌W3110,ΔldhA,ΔackA |
GEVO1227 | 大肠杆菌W3110,ΔlpdA |
GEVO1228 | 大肠杆菌WA837,ΔlpdA |
GEVO1229 | 大肠杆菌W3110,ΔlpdA::lpdAmut |
菌株 | 基因型 |
GEVO1230 | 大肠杆菌W3110,ΔlpdA::lpdAN |
GEVO1470 | 大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+)* |
GEVO1493 | 大肠杆菌W3110,ΔldhA |
GEVO1494 | 大肠杆菌W3110,ΔldhA,ΔackA |
GEVO1495 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE |
GEVO1496 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE,ΔfocApflB |
GEVO1497 | 大肠杆菌W3110,ΔpflDC |
GEVO1498 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE,ΔfocApflB,ΔpflDC |
GEVO1499 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔadhE,ΔfocApflB,Δfrd |
GEVO1500 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔfocApflB |
GEVO1501 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC |
GEVO1502 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC,Δfrd |
GEVO1503 | 大肠杆菌W3110,Δfnr |
GEVO1504 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC,Δfnr |
GEVO1505 | 大肠杆菌W3110,Δldh,ΔpoxB,ΔackA,ΔpflDC,Δfnr,attB::(Sp+lacIq+tetR+) |
GEVO1507 | 大肠杆菌W3110,ΔldhA,ΔadhEΔackA,ΔmgsA,ΔackA,Δfrd,attB::(Sp+lacIq+tetR+) |
GEVO1508 | 大肠杆菌W3110,Δldh,ΔadhE,Δfrd,attB::(Sp+lacIq+tetR+) |
GEVO1509 | 大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔmgsA attB::(Sp+lacIq+tetR+) |
GEVO1510 | 大肠杆菌W3110,Δldh,ΔadhE,ΔpflB,ΔpflDC,Δfrd,ΔmgsAattB::(Sp+lacIq+tetR+)* |
GEVO1511 | 大肠杆菌W3110,Δldh,ΔadhE,ΔpflB,ΔpflDC,Δfrd,ΔmgsAattB::(Sp+lacIq+tetR+) |
*进化得到的菌株
以下表2列举了本公开内容中所提及的和以下实施例中描述的实验中所使用的某些质粒。
表2:质粒
以下表3中列举了本公开内容中所提及的和此部分中描述的实验中所使用的某些引物。
表3:引物
Cac_thlF | AATTGAATTCTTATTATTTAGGAGGAGTAAAACAT(SEQ ID NO:69) |
Cac_thlR | AATTGGATCCTTAGTCTCTTTCAACTACGAGAGCT(SEQ ID NO:70) |
Cac_aadF | AATTGAATTCATATTTTAGAAAGAAGTGTATATTT(SEQ ID NO:71) |
Cac_aadR | AATTACGCGTTTAAGGTTGTTTTTTAAAACAATTTATATACA(SEQ ID NO:72) |
Cac_bdhF | AATTGAATTCATTAGATGCTTGTATTAAAATAATAA(SEQ ID NO:73) |
Cac_bdhR | AATTGGATCCTTACACAGATTTTTTGAATATTTGTA(SEQ ID NO:74) |
Cac_hbdF | AATTGAATTCATTGATAGTTTCTTTAAATTTAGGG(SEQ ID NO:75) |
Cac_hbdR | AATTGGATCCTTATTTTGAATAATCGTAGAAACCT(SEQ ID NO:76) |
Cac_crtF | AATTGAATTCCTATCTATTTTTGAAGCCTTCAATT(SEQ ID NO:77) |
Cac_crtR | AATTGGATCCAATATTTTAGGAGGATTAGTCATGGA(SEQ ID NO:78) |
Cac_bcdF | AATTGGTACCTTAATTATTAGCAGCTTTAACTTGAGC(SEQ ID NO:79) |
Cac_bcdR | AATTGGATCCAAAATTGAAGGCTTCAAAAATAGATAGGAG(SEQ ID NO:80) |
Cac_adhF | AATTGTCGACATTTTATAAAGGAGTGTATATAAATGAAAGTTAC(SEQ ID NO:81) |
Cac_adhR | TTAATCTAGATTAAAATGATTTTATATAGATATCCT(SEQ ID NO:82) |
glpDchk_F | CCGTGGGTGAAACAGTTCTT(SEQ ID NO:83) |
glpDchk_R | CGTAAGTGCGAGCGTAATGA(SEQ ID NO:84) |
glpKchk_F | AAAGCTCCACGCTGGTAGAA(SEQ ID NO:85) |
glpKchk_R | GTCACGCGTCTGATAAGCAA(SEQ ID NO:86) |
实施例1:自宿主微生物基因组消除竞争性代谢途径
此实施例例示了正丁醇生成宿主菌株的构建。宿主生物体的竞争性途径是将NADH的氧化与化合物诸如琥珀酸、乳酸、乙醇、二氧化碳和氢气的生成偶联的发酵性途径和竞争来自碳源的碳的途径诸如乙酸途径和甲酸生成。
表1中所列举的菌株是通过删除细菌基因组中的基因而获得的。基因是使用同源重组技术而删除的。使用噬菌体P1转导在各菌株间转移基因删除。通过各个基因的序贯删除来组合基因删除。
亲本菌株用于代谢工程化改造GEVO1005(大肠杆菌W3110(DSMZ 5911))和大肠杆菌B(DSMZ 613)。为了将来自大肠杆菌K12的基因组删除、插入和基因破坏转移至大肠杆菌B菌株,使用大肠杆菌WA837(CGSC 90266)作为中间宿主。在菌株构建期间,在Luria-Bertani(LB)培养基或琼脂上培养培养物(Sambrook和Russel,Molecular Cloning,A Laboratory Manual,第3版,2001,Cold Spring Harbor,New York:Cold Spring Harbor Laboratory Press)。除非另有说明,使用标准方法,诸如使用噬菌体P1的转导、PCR和测序(Miller,A shortCourse in Bacterial Genetics:A Laboratory Manual and Handbook or Escherichiacoli and Related Bacteria,1992,Cold Spring Harbor,N.Y.:Cold Spring HarborPress;Sambrook和Russel,Molecular Cloning,A Laboratory Manual,第3版,2001,Cold Spring Harbor,New York:Cold Spring Harbor Laboratory Press)。用于将基因和表达盒插入大肠杆菌染色体的DNA是通过Horton,Mol.Biotechnol.3:93-99,1995的重叠延伸法(SOE)用剪接而构建的。染色体整合和删除用适宜的标志物和通过PCR分析,或者在整合的情况中,通过测序来验证。
D-乳酸脱氢酶(由ldhA编码):删除了大肠杆菌中大多数编码乳酸脱氢酶的基因(ldhA)(删除了核苷酸11-898)。含有ldhA删除的所得菌株是:
将ldhA删除与nuoA_N和ndh删除组合。用自GEVO788制备的P1裂解物转导GEVO914,所得菌株命名为GEVO915。为了构建相应的大肠杆菌B菌株,用自GEVO789制备的P1裂解物转导GEVO916,转导后的菌株命名为GEVO917。
乙酸激酶A(由ackA编码):用删除破坏大肠杆菌中编码乙酸激酶的基因(ackA)(删除了核苷酸29-1062)。含有ackA删除的菌株为GEVO817和GEVO821。
将ackA删除与ldhA删除组合。用自GEVO817制备的P1裂解物转导GEVO1493,所得菌株命名为GEVO1494。
丙酮酸氧化酶(由poxB编码):用poxB中的删除破坏大肠杆菌中编码丙酮酸氧化酶的基因(poxB)(删除了核苷酸30-1600)。所得菌株为GEVO801和GEVO804。
将poxB删除与ldhA和ackA删除组合。用自GEVO801制备的P1裂解物转导GEVO1494,所得菌株命名为GEVO1007。
乙醛/醇脱氢酶(由adhE编码):用删除破坏大肠杆菌中编码醇脱氢酶的基因(adhE)(删除了核苷酸-308至2577)。所得菌株为GEVO800和GEVO803。
将adhE删除与ldhA、ackA和poxB删除组合。用自GEVO800制备的P1裂解物转导GEVO1007,所得菌株命名为GEVO1495。为了构建相应的大肠杆菌B菌株,用自GEVO803制备的P1裂解物转导GEVO1211,所得菌株命名为GEVO1212。
在糖酵母属中,丙酮酸脱羧酶将丙酮酸转化成乙醛。已知至少五种独立的NADH依赖性醇脱氢酶然后将乙醛还原成乙醇。它们是ADH1、ADH2、ADH3、ADH4和ADH5。
丙酮酸甲酸裂合酶(由pflB编码):通过focA和pflB删除破坏大肠杆菌中编码丙酮酸甲酸裂合酶的基因(pflB)(删除了核苷酸-69(focA)-2240(pflB))。所得菌株为GEVO802和GEVO805。
将pflB删除与ldhA、ackA、poxB和adhE删除组合。用自GEVO802制备的P1裂解物转导所得菌株GEVO1495,所得菌株命名为GEVO1496。
丙酮酸甲酸裂合酶2(由pflDC编码):通过pflDC删除破坏大肠杆菌中编码丙酮酸甲酸裂合酶2的基因(pflDC)(删除了核苷酸-69(pflD)-2240(pflC))。所得菌株为GEVO2000和GEVO2001。
将pflDC删除与ldhA、ackA、poxB、adhE和pflB删除组合。用自GEVO1497制备的P1裂解物转导所得菌株GEVO1496,所得菌株命名为GEVO1498。
延胡索酸还原酶(由frd编码):用frdABCD删除破坏大肠杆菌中编码延胡索酸还原酶的基因(frdABCD)(删除了核苷酸-86(frdA)-178(frdD))。所得菌株为GEVO818和GEVO822。
将frdABCD删除与ldhA、ackA、poxB、adhE和focA-pflB删除组合。用自GEVO818制备的P1裂解物转导GEVO1496,所得菌株命名为GEVO1499。
实施例2:工程化改造以使用还原型碳源(甘油)来平衡生成正丁醇的异源途径的重组大肠杆菌
平衡大肠杆菌中的正丁醇途径的一种方法是使用甘油作为碳源。对于甘油上的生长,备选的甘油降解途径必须是有活性的,该途径避免了甘油磷酸脱氢酶催化的步骤,该步骤使电子流入醌池。
通过灭活编码甘油激酶和甘油-3-磷酸脱氢酶的基因,能活化该备选途径。通过表达来自弗氏柠檬酸杆菌、肺炎克雷伯氏菌、酿酒酵母或其它生物体的DHA激酶,使得该途径更加高效。DHA激酶的表达避免了磷酸转移酶系统(PTS)偶联的DHA磷酸化,这要求DHA扩散到细胞外并通过pts再进入同时被磷酸化。
利用适宜获得完整基因的线性双链DNA的聚合酶链式反应和引物,自弗氏柠檬酸杆菌克隆编码DHA激酶的基因。将该基因克隆入表达质粒中,该质粒与正丁醇途径表达质粒相容。
所得构建体为pGV1563。为了表达正丁醇途径用pGV1191和pGV1113转化GEVO926(大肠杆菌W3110(F-L-rph-1INV(rrnD,rrnE)),ΔglpD,ΔglpK)(菌株A),并为了表达正丁醇途径和表达来自弗氏柠檬酸杆菌的DHA激酶用pGV1191、pGV1113和pGV1563转化GEVO926。通过正丁醇瓶发酵来比较菌株A(GEVO926,pGV1191,pGV1113)和菌株B(GEVO926,pGV1191,pGV1113,pGV1563)。
在培养基B(富含EZ的培养基,含有0.4%甘油、100mg/L Cm和200mg/LAmp和50mg/L Kan)中在管中以37℃和250rpm需氧培养菌株A和B。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用1mM IPTG和100ng/mL aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了菌株A以产率60%生成正丁醇,而菌株B以产率70%生成正丁醇。此实施例显示了删除了天然甘油降解途径的生产菌株提供足够的NADH以达到高于理论产率的50%的正丁醇产率。另外,这些结果显示了DHA激酶的表达提高这样的甘油途径删除菌株中自甘油生成正丁醇的产率。
实施例3:能够经二羟基丙酮和二羟基丙酮磷酸代谢甘油的重组大肠杆菌的生成
此实施例演示了将甘油转化成乙酰-CoA同时生成2分子NADH每分子甘油的菌株的生成。
使用菌株GEVO1005(大肠杆菌W3110(F-L-rph-1 INV(rrnD,rrnE)))作为亲本菌株。自宿主基因组删除基因glpD和glpK。通过P1转导构建双重敲除glpDglpK。所得菌株为GEVO922。
将GEVO922进行强化进化规程(enrichment evolution protocol),因为它显示出与野生型亲本菌株相比非常差的在基本甘油培养基上的生长。在此强化进化的4周过程期间,以2.4×1012个细胞开始,使用甘油作为碳源,并隔天用甘油补料。头2周隔天用甘油补料至终浓度2mM,第3周为1mM,而第4周和最后一周为0.5mM。在此过程结束时,分离到数个突变体。
与预期的基因型一致,以甘油作为唯一的碳源和能源,GEVO922,即glpDglpK双重敲除,与亲本野生型菌株相比生长缓慢。在四周强化进化之后,选择一个在基本M9甘油板上生长快速的克隆(GEVO926)用于继续研究。GEVO926在以甘油作为碳源的基本培养板上具有与野生型水平类似的生长速率(图10)。强化进化过程之后,通过PCR验证所进化的菌株中的基因删除,使用表4中所列举的PCR引物。
表4:用于验证染色体DNA变化的维持的PCR引物
CCG TGG GTGAAA CAG TTC TT | glpOchk_F | 引物与glpD基因的上游和外部结合以验证glpD的基因敲除 |
CGT AAG TGCGAG CGT AAT GA | glpOchk_R | 引物与glpD基因的下游和外部结合以验证glpD的基因敲除 |
AAA GCT CCA CGCTGG TAG AA | glpKchk_F | 引物与glpK基因的上游和外部结合以验证glpK的基因敲除 |
GTC ACG CGT CTGATA AGC AA | glpKchk_R | 引物与glpK基因的下游和外部结合以验证glpK的基因敲除 |
最后,用pGV1010,即含有氯霉素抗生素抗性遗传标志和在lac启动子控制下的编码NADPH依赖性酵母酮还原酶/脱氢酶的基因的质粒转化野生型GEVO1005和强化进化的、双重敲除的GEVO926二者。然而,由于GEVO1005是大肠杆菌K-12菌株的衍生物,因此它在染色体上只有一个lac阻抑基因,而且两种菌株中的酮还原酶的还原都是组成性的。在生物催化细胞的生长中不使用诱导物,因为显示了有和没有诱导物的情况中的表达水平是大致相同的。
实施例4:工程化改造以使用还原型碳源(甘油)来平衡生成正丁醇的异源途径的重组大肠杆菌
此实施例演示了工程化改造的微生物将1摩尔甘油转化成乙酰-CoA并产生2摩尔NADH,而且达到了使用平衡的正丁醇生成途径利用甘油来生成正丁醇在NADH方面的要求。相反,野生型、未工程化改造的和未修饰的菌株只产生1摩尔NADH。
平衡的正丁醇途径对每生成1摩尔正丁醇要求4摩尔NADH和2摩尔乙酰-CoA。途径的氧化还原平衡对于达到最高产率是至关重要的。实施例2和3中所描述的工程化改造高效生成了大肠杆菌生物催化剂,其在非生长条件下每厌氧代谢1摩尔甘油生成总共2摩尔NADH和1摩尔乙酰-CoA;相反,未工程化改造的野生型菌株在非生长条件下每厌氧生成1摩尔乙酰-CoA只生成1摩尔NADH,因此,使得它不能作为使用甘油作为碳源的正丁醇生产的高效生物催化剂工作。证实了作为实施例3的结果生成的工程化改造的大肠杆菌生成作为平衡的正丁醇生成途径的生物催化剂发挥功能所需要的代谢中间产物。
生物催化
将GEVO1005和GEVO926用pGV1010转化,并涂布在补充有50mg/mL氯霉素的LB板上,以确保细胞保留具有氯霉素抗生素抗性标志和酵母AA3酮还原酶编码基因的质粒。自单菌落在3mL M9Y+0.4%甘油中接种起始培养物的3份生物学复制品,在摇动温箱中以37℃和250rpm过夜生长。使用1.2mL每一种起始培养物作为接种体,接种120mL M9Y+0.4%甘油的培养物并以37℃和250rpm培养至稳定期。通过以4000g离心15分钟来收获细胞,在收获时测量OD600。将细胞用60mL供生物催化用的不含碳源和氮的培养基(生物催化培养基)清洗一次。此培养基不容许细胞生长。再次将培养物以4000g离心15分钟,并重悬于等于收获时OD600的10倍的生物催化培养基体积中。为了厌氧生物催化,自第一次清洗步骤起,所有工作都在在厌氧条件下实施。
在生物催化之前,在丰富培养基M9Y+0.4%甘油中进行需氧生长阶段,以促进高收获OD。凭借丰富培养基,由于酵母提取物的存在,细胞不必像在基本培养基中那样自甘油从头合成所有生物分子。然而,虽然工程化改造的菌株中已经消除了glpK,但是经GpsA酶经DHAP和NAD+可以为三酰甘油合成合成很少量的G3P。因此,glpK基因删除不阻止菌株GEVO926生成三酰甘油。
在只含甘油作为碳源的缺氧生物催化培养基中实施生物催化阶段以精确计算(account for)消耗的碳。厌氧地进行生物催化以匹配正丁醇发酵的生物催化条件和大大简化因碳需氧地经二氧化碳流失而变得复杂的碳计算。在需氧情况中,通过甘油代谢产生的NADH比该途径可能使用的NADH要多,因而正丁醇途径会是不平衡的;乙酰-CoA以CO2形式流失至TCA循环。在厌氧情况中,工程化改造的菌株GEVO926生成2摩尔NADH,因而正丁醇途径是平衡的。
使用酮还原酶反应来监测由甘油代谢生成的NADH的利用度,因为1个3-羟基丁酸乙酯分子的酶促形成需要1个NAD(P)H和乙酰乙酸乙酯。假设,NAD(P)H转氢酶容易地将NADH转化成酮还原酶优先利用的NADPH。如下实施生物催化反应。将重悬浮的细胞保存在冰上,直至准备好用于在30℃进行的厌氧生物催化。添加酮还原酶的底物乙酰乙酸乙酯至40mM浓度,并通过添加经过滤除菌的10%甘油至浓度5.5mM来启动反应。取决于实验,还与实验反应平行运行有底物但无碳源的背景反应,以监测不给料碳源时酶促反应的任何代谢物或产物。定期采集样品,至少每半小时一次。
测定法:细胞干重
将甘油消耗、产物形成和代谢物生成的速率相对于细胞干重标准化。细胞干重是通过如下测定的:每一份生物学复制品一式三份地取出10mL重悬浮细胞等分试样放入预称重的15mL锥形管中,以4000g离心15分钟,并丢弃上清液。将沉淀物在80℃烘箱中干燥,冷却,并记录细胞沉淀物的重量。
测定法:蛋白质凝胶
蛋白质凝胶证实了相似的细胞群具有丰富的和相似的酮还原酶量。
分析性层析:样品制备
自生物催化制备样品,供液相和气相层析用。具体而言,小心操作所有实验中的样品,使样品对室温和空气的暴露最小化。在采集了指定时间点的所有样品后立即将样品冷冻于-80℃。然后,将样品在微量离心机中以12000g离心15分钟,一旦自-80℃贮存取出无需在先解冻。将上清液转移至深孔、多孔板顶部的多孔过滤板(Pall AcroPrep 96 Filter Plate,0.2微米GH聚丙烯)的各个孔。凭借抽吸器和目的特异性多支管(purpose-specific manifold),使样品穿过滤器,进入下板。随后将每个样品转移至管形瓶(vial),供液相层析(LC)分析和气相层析(GC)分析用。典型地,在LC上加工样品,然后添加GC分析的内部标准品,并随后实施GC分析。
分析性层析:混合的酸代谢物、甘油、乙酰乙酸乙酯和3-羟基丁酸乙酯
的LC分析
为了测定每代谢1个甘油可得的NADH的比率,甘油和NADH依赖性转化的产物即3-羟基丁酸乙酯的定量是必需的。为了计算生成的所有NADH,还对经NADH依赖性转化生成的任何可能的其它代谢物进行定量,因为那些化合物反映了自酮还原酶转向的(diverted)NADH。这些代谢物包括琥珀酸和乳酸。定量的其它代谢物为甲酸和乙酸。乙酸是特别感兴趣的,因为它指示乙酰-CoA的利用度。
如下文表5所述实施LC分析的参数。
表5:LC分析的参数
柱: | BioRad Aminex 87H(硫酸衍生柱) |
流动相: | 0.04N H2SO4 |
温度: | 60℃柱温 |
检测器: | RID;210nm UV |
通过如下制备标准品:独立称取一式三份固体或挥发性组分入分析天平上的10mL容量瓶中,然后用HPLC级水或milliQ水补足溶液体积。3条个别绘制的曲线之间的一致确认了标准品的制备。制备好的标准品要在数天内使用,而且在各次使用之间保存于4℃。
分析性层析:乙醇的GC分析
下文表6描述了乙醇的GC分析的参数。
表6:GC分析的参数
通过如下制备用于乙醇定量的标准品:称取无水乙醇入分析天平上的10mL容量瓶中并立即给瓶盖上盖子。然后,用HPLC级水或milliQ纯化的水将瓶充至体积。制备并运行3组独立制备的稀释液以确认标准品。向每毫升制备好的样品添加50μL内部标准1-戊醇。用冷却至4°的水循环GC的样品支架(sample holder)以防止挥发物自液相蒸发掉。
然后,根据测量得到的细胞干重,将产物、代谢物和甘油消耗的原始浓度标准化成mmol/g细胞干重。
结果:厌氧生物催化-测定NADH每甘油,自速率推导
NAD(P)H依赖性产物的产率指明了工程化改造的途径生成2摩尔NADH每甘油,而野生型途径为1摩尔NADH每甘油。以下解释了指明工程化改造的菌株GEVO926可提供必需的代谢中间产物用来以甘油作为碳源生成正丁醇的两种办法中的第一种。
使用生物催化剂每消耗1个单位的甘油所形成的产物浓度作为每消耗1个甘油通过代谢可利用的NAD(P)H的指标。图11图示了通过厌氧生物催化而消耗的甘油。图12图示了随时间形成的产物量。通过线性回归计算产物形成和甘油消耗在反应的第一个小时里的速率。在该时间段期间,产物形成和甘油消耗是线性的,而碳源和底物都不构成限制。使用来自每一个菌株的那些计算的速率,评估每一个菌株的产物每甘油比。表8列出了这些比值。注意,GEVO927是工程化改造的菌株GEVO926进化得到的,其含有pGV1010质粒,自该质粒表达酮还原酶基因。将用于每一个生物催化的各个细胞悬浮液复制品每一个的产物形成和甘油消耗的速率相对于细胞干重标准化。
然后,既然本质上没有其它代谢物指示观察到NADH可得性,那么得出结论,通过甘油代谢变得可得的几乎所有NADH都被酮还原酶利用来形成3-羟基丁酸乙酯。因此,每一个菌株的形成的产物对消耗的甘油的比等于NADH每甘油比。计算工程化改造的对野生型的NADH每甘油比,以确定工程化改造菌株相对于野生型菌株的NADH利用度升高的比值。工程化改造途径(像在GEVO926中发挥功能的)确实生成与野生型途径(像在GEVO1005中发挥功能的)相比大约几乎2倍量的NAD(P)H每甘油。在没有氧可利用的情况中,工程化改造途径应当理论上比野生型途径多生成1个NADH,因为甘油被代谢成丙酮酸。FADH2连接的GlpD酶的消除导致减少1个当量,它没有流失至电子传递链。在工程化改造的菌株中,NADH依赖性甘油脱氢酶(GldA)将可利用的还原性当量自甘油转移至NADH。
每一个菌株的产物每甘油比比理论上预期的略高。这可能是略微高估所形成的产物浓度的结果。无论是归于低估所消耗的甘油还是高估所形成的产物,此系统误差在菌株对菌株比中被抵消。自速率推导得出,菌株对菌株比较指明了相对于非工程化改造的菌株GEVO1005,GEVO926中有2摩尔NADH可利用。计算比值1.74+/-0.5在预期比值2的误差范围内。
比理论预期值要高的产物每甘油比也能反映随生物催化过程给料的甘油以外的碳源,可能是悬浮液中自溶的细胞或胞内碳源的代谢。通过使用这两种菌株的比较,贡献诸如假定的贡献取消(cancel out),假设同一过程在每一种菌株中都工作(at work)的话。如果在强化进化期间,工程化改造的菌株获得了改动(adation)来使自身以这种方式不同于野生型,那么此比较会遭受该警告(be subject to that caveat)。稍后讨论两种菌株之间能使此假说无效的可能差异的进一步讨论。
图13和图14比较了GEVO1005、pGV1010和工程化改造的菌株GEVO927为生成乙酸而消耗的甘油。这显示了进化得到的菌株提供了定量的乙酸每消耗甘油的量。倘若在细胞中表达正丁醇生成途径,那么自甘油生成的乙酰-CoA可被转化正丁醇,而非乙酸。
表7:来自厌氧生物催化的参数
结果:厌氧生物催化-终点测定法
在一个独立的实验中,如上文所述实施厌氧生物催化,只是给生物催化给料有限量的甘油。通过这样做,不依赖时间地,所形成的产物的量每消耗的总甘油应当反映通过上文所述基于速率的办法计算得到的相同比率。使用在厌氧生物催化中所有甘油都被消耗掉时形成的产物的绝对量,产物每甘油比与对甘油代谢的预期变化一致。如表7中所示,相对于GEVO1005、pGV1010,工程化改造的菌株GEVO927自相同量的消耗的甘油生成NAD(P)H依赖性产物,例如3-羟基丁酸乙酯。
如果该系统的其它方面都不构成限制,而且生物催化剂可利用的底物是过量的,即使所有碳源都被消耗掉,所形成的NAD(P)H依赖性产物的量应当指示碳源代谢使之变得可利用的NADH的量。为了使底物绝不构成限制,碳源的浓度应当比供应给反应的底物的量小预期每个碳源分子的NADH当量的数目。在该情况中,不依赖时间地,如果所有碳源被消耗掉,那么所形成的产物指示给定碳源量使之变得对催化剂可利用的NAD(P)H的数量。这假设(assume)了上文描绘的条件,例如,即NAD(P)H当量没有被转向其它消耗NAD(P)H的途径。此办法预期会确认速率推导的测定的结果,而且情况确实如此。
如果碳源构成限制,那么生物催化剂形成的产物的量与通过该碳源的代谢变得对细胞可利用的NAD(P)H成比例,而不管产物形成或甘油消耗的速率。
碳平衡
碳平衡计算也确认了大部分乙醇来自非生物来源,因为把未修正的乙醇浓度包括在内会引起碳平衡计算高得不可能,就%回收的碳而言,野生型菌株高了7.4-3.5倍,而工程化改造的菌株高了4.3-2.4倍。(见图13和14)会使工程化改造的菌株GEVO926比野生型菌株产生更多的NADH每甘油的假设无效的结果会是野生型菌株通过将NADH转向生成还原型产物,像乙醇、琥珀酸和乳酸的发酵性途径而生成更多还原型代谢物的观察结果。然而,野生型的高%回收碳指示了很少的NADH被转向还原型代谢物。两种菌株之间的NADH依赖性代谢物的总量是不同的。然而,被用来形成这些代谢物的NADH的量与走向生物催化剂的量相比是小的。在厌氧代谢下,作为代谢物回收的碳应当等于以甘油形式消耗的碳。如果所有还原性当量走向生物催化剂,那么来自代谢的碳预期会作为未还原的产物即乙酸或甲酸显示出来,其可以通过甲酸脱氢酶的作用分解成CO2和H2。图13是GEVO1005,pGV1010的碳平衡的柱形图。图14是GEVO927的碳平衡的柱形图。
NADH依赖性酮还原酶生物催化剂的产物形成速率指示了通过转化所消耗的甘油而实现的NADH形成的速率,如果该系统满足某些要求的话:(1)催化剂和底物不构成限制,因此该反应在NADH方面是一级反应。这意味着就蛋白质浓度和活性而言有足够的催化剂来容易地将底物转化成产物,因为还原性辅因子因通过代谢的合成而在细胞中变得可得。如果催化剂的活性不足,那么变得可利用的NADH会走向其它利用NADH的酶,尤其是发酵途径。即使在这种情况中,两种菌株之间的代谢物谱应当在生成更多还原性当量的菌株中显示增加量的还原型发酵产物。
然而,结果指示几乎所有的NAD(P)H走向酮还原酶,因为任何可利用的NADH会以NADH依赖性酶促转化的还原型代谢物或产物的形式显示出来。通过代谢所生成的NAD(P)H不大可能被用于生物合成目的,因为蛋白质合成受到培养基中缺氮的抑制。在呼吸条件下唯一有活性的是NADH脱氢酶,因而势下降(potential sink)在厌氧条件下是不大可能的。
甘油的野生型代谢中假设会受到FAD+缺乏抑制的步骤的一个例子是在甘油的厌氧代谢下在没有外源电子受体的情况中甘油-3-磷酸变成二羟基丙酮磷酸(DHAP)的FADH2连接的脱氢。厌氧培养的大肠杆菌不代谢甘油,而且不能在没有外源电子受体(诸如延胡索酸或硝酸)的情况中生长。然而,有趣的是,此项研究中的厌氧生物催化揭示了即使不添加已知的电子受体,不知何故,野生型细胞确实消耗甘油和生成还原性当量,像NAD(P)H,正如NADPH依赖性产物和还原型代谢物的形成所反映的,指明了甘油代谢是有功能的。
注意,由于非生长培养基中细胞的氮饥饿,认为细胞蛋白质受困于(lockinto)需氧代谢机制,尽管细胞处于厌氧环境中。既然生成NADH的步骤在需要FAD+的步骤之后,那么必然可以得出结论,FAD+是G3P转化成DHAP可利用的,或者通过电子传递链的还原性当量以一些未知的方式穿梭。其它研究已经报道了其中不可能确定细胞如何在厌氧条件下发挥功能的情况,因为不能鉴定终端电子受体,但是无论如何发生生长(肺炎克雷伯氏菌基因使得能够在甘油上厌氧生长)。
表8描述了所公开的实施例中使用的培养基配方。
表8:培养基配方
实施例5:大肠杆菌为功能性表达丙酮酸脱氢酶在厌氧条件下进行的体内进化
平衡大肠杆菌中的正丁醇途径的一种方式是生成厌氧活性pdh基因产物。为了生成此类菌株,可使用将氧化还原平衡及因此的该大肠杆菌菌株的生长与Pdh的厌氧活性偶联的选择系统。例如,可构建在发酵途径中含有敲除而只保留乙醇生成途径完整的菌株,如图4中所概述的。这样的菌株不能在葡萄糖基本培养基上厌氧生长,因为不能维持氧化还原平衡。在糖酵解中每个葡萄糖生成2个NADH,而在乙醇途径中必须氧化4个NADH。导致厌氧Pdh活性的突变使代谢平衡并容许在葡萄糖上厌氧生长。
选择系统的菌株构建:GEVO1007适合于此选择系统。该菌株在葡萄糖基本培养基(M9)上生长很慢。对于在葡萄糖基本培养基上根本不生长的菌株,向这些菌株添加额外的frd和pflB敲除。另外,必须删除大肠杆菌中由pflDC编码的沉默Pfl,以避免它在选择压力下的突变活化。
丙酮酸甲酸裂合酶(由pflB编码):用自GEVO802制备的P1裂解物转导GEVO1007,所得菌株命名为GEVO1500。
丙酮酸甲酸裂合酶2(由pflDC编码):用自GEVO1497制备的P1裂解物转导GEVO1007,所得菌株命名为GEVO1501。
延胡索酸还原酶(由frd编码):用自GEVO818制备的P1裂解物转导GEVO1501,所得菌株命名为GEVO1502。为了构建相应的大肠杆菌B菌株,用自GEVO822制备的P1裂解物转导GEVO1225,转导得到的菌株命名为GEVO1226。
用于选择的菌株的表征:自LB板接种GEVO1007和GEVO1501的3mL LB培养物,并以37℃和250rpm温育过夜。使用这些培养物以5%接种第1代M9培养物(3mL)。将M9培养物以37℃和250rpm温育过日(over day)。使用需氧M9过日培养物以2%接种第2代M9过夜培养物。将管以37℃和250rpm温育。使用M9过夜培养物以2%接种第3代需氧M9培养物(3mL)。还使用M9过夜培养物以5%接种含M9培养基的厌氧管。将管以37℃和250rpm温育。在厌氧管中,GEVO1007显示出缓慢生长,在温育2天后OD达到0.2。GEVO1501在厌氧管中不生长。
将菌株GEVO1007和1501在M9板上划线,并将板在厌氧罐中于37℃厌氧温育。温育3天后无一菌株生成可见的菌落。
体内进化:通过在10ml含有葡萄糖作为唯一碳源的新鲜培养液中1∶100稀释,每天转移GEVO1007的厌氧培养物。将培养物在没有搅动的情况中于37℃温育24小时。为了富集厌氧Pdh活性,每周一次,将培养物稀释并涂布在含有葡糖酸(盐)作为唯一碳源的固体培养基上。然后将板在厌氧环境中温育。将生长最迅速的菌落刮入新鲜培养液中并如上所述处理。反复地重复此过程直至不再观察到生长速率的进一步升高。
实施例6:lpdA的定点诱变和定向进化
脱氢脂酸(Dehydrolipoate)脱氢酶(由lpdA编码)是结合NADH的Pdh多酶复合物的亚基。它的诱变能导致减轻Pdh在高NADH/NAD比(对于厌氧代谢是典型的)时的抑制的变体。为此目的,删除大肠杆菌染色体上的lpdA基因,并用突变型lpdA替换,其或是自质粒或是自染色体表达。将lpdA基因自制备自大肠杆菌W3110的基因组DNA克隆入pCRBlunt载体(Invitrogen)中并测序。使用所得质粒pCRBlpdA作为密码子55的定点诱变的模板,密码子55是NADH结合口袋的一部分。通过SOE诱变lpdA序列以生成突变A55V(Horton,见上文)。
在平行诱变中,实施PCR以生成突变A55V、I、L、F(Horton,见上文)。
通过删除基因的核苷酸107-1400来破坏大肠杆菌中编码脱氢脂酸脱氢酶的基因(lpdA)。所得菌株为GEVO1227,和GEVO1228。
为了构建用突变型lpdA替换lpdA,使用PCR引物自pCRBlpdAmut或pCRBlpdAN扩增基因。将突变型lpdA基因插入GEVO1227的基因组中。所得菌株GEVO1229含有突变型lpdA,即lpdAmut,而所得菌株GEVO1230含有突变型lpdA,即lpdAN,替换野生型lpdA基因。
实施例7:pdh表达的解除调节
PDH多酶复合物的表达在转录水平受到调节物ArcA和Fnr应答缺氧的调节。为了避免pdh基因表达在厌氧条件下的下调,自大肠杆菌基因组删除编码调节物Fnr的基因(fnr)。
转录双重调节物Fnr:
用删除来破坏大肠杆菌中编码应答调节物Fnr的基因(fnr)(删除了核苷酸-87至646),得到了菌株GEVO1503。将fnr删除与ldhA、ackA、poxB、pflB和frd删除组合。
用自GEVO1503制备的P1裂解物转导GEVO1501,所得菌株命名为GEVO1504。
正丁醇途径的表达水平的优化
通过使用诱导型启动子PLtetOI和PLlacOI来修饰合成操纵子中正丁醇途径基因的表达水平。在野生型大肠杆菌W3110中,PLtetOI是组成性的,因为细胞中不存在阻抑物tetR。由染色体lacI基因编码的阻抑物没有完全阻抑启动子PLlacOI,这限制了此启动子的调节范围。用自DH5αZ1制备的P1裂解物转导GEVO1504,所得菌株命名为GEVO1505。
实施例8:甲酸脱氢酶的异源表达
如(Berrios-Rivera等,Metabol.Eng.2002:217-229,2002)所述,用NADH依赖性Fdh替换不依赖天然辅因子的甲酸氢裂合酶。
实施例9:用于将乙酰-CoA转化成正丁醇的丙酮丁醇梭菌基因的异源表达
能用于在大肠杆菌中异源表达正丁醇发酵途径的一套基因编码硫解酶(thl)羟基丁酰-CoA脱氢酶(hbd)、巴豆酸酶(crt、丁酰-CoA脱氢酶(bcd)、电子传递蛋白(etfA和etfB)和醇脱氢酶(adhE2)。编码醇脱氢酶的基因(adhE2)可以用编码丁醛脱氢酶(bdhA/bdhB)或正丁醇脱氢酶(aad)的基因替换。
然后首先测试每一种蛋白质在大肠杆菌中的表达,并校准其活性。
每一种酶的活性测定法的校准:首先自商业上获得的丙酮丁醇梭菌ATCC824的基因组DNA个别地克隆上述基因。使用表3所列正向和反向引物,自基因组DNA PCR扩增每一种基因并使用适宜的限制酶位点个别地克隆入pZE32载体中。将基因与它们的天然核糖体结合位点一起克隆到改良的噬菌体λ(PL-lac)启动子之下(Lutz等,Nucleic Acids Res.25:1203-1210,1997)。然后在大肠杆菌细胞中表达基因并测定活性。
通过电穿孔将携带各基因的pZE32载体转化入电感受态的大肠杆菌-W3110细胞中。在50ml含有0.1mg/ml氨苄青霉素的Luria Bertani(LB)培养基中需氧地或厌氧地培养转化细胞。在对数生长中期,用0.1mM IPTG(异丙基-β-D-硫代吡喃半乳糖苷)诱导细胞。在细胞达到稳定期后,通过离心收获转化子。使用酶比活测定法监测酶的活性(Boynton等,J.Bacteriol.178(11):3015-3024,1996;Bermejo等,Applied and Environmental Microbiology 64:1079-1085,1998)。
将在需氧条件下培养的细胞重悬于含有1mM 1,4-二硫苏糖醇的50mM 4-吗啉-丙磺酸(MOPS)缓冲液(pH 7.0)。将细胞悬浮液以60%功率超声处理9-15分钟。通过于4℃以30,000g离心30分钟来清除细胞碎片。对上清液测试酶的活性。将在厌氧条件下培养的细胞重悬于不含1,4-二硫苏糖醇的缺氧MOPS缓冲液。用溶菌酶处理细胞悬浮液,然后通过在厌氧培养室内于0℃剧烈旋涡震动10分钟来破碎细胞。将样品以9000g离心20分钟,用以将裂解物与沉淀物分开。在离心期间给悬浮液紧密地盖上盖子。离心后,将上清液转移入安瓿中,并紧密密封以防止与空气接触。(Boynton等,J.Bacterol.178:3015-3024,1996)。
使用硫解反应对细胞测定硫解酶。于室温将硫解反应与借助于磷酸转乙酰酶的对乙酰-CoA的砷分解偶联。每份测定液含有67mM Tris盐酸(pH 8.0)、0.2mM未结合的CoA、0.2mM乙酰乙酰-CoA、25mM砷酸钾(pH 8.1)和2U磷酸转乙酰酶。通过添加乙酰乙酰-CoA来启动反应。监测由对乙酰-CoA键的切割引起的232nm吸光度的降低。1个单位的酶定义为催化对1μmol乙酰乙酰-CoA每分钟每mg蛋白质的硫解切割的酶量(Petersen等,Applied andEnvironmental Microbiology 57:2735-2741,1991)。
通过监测NADH的氧化速率来测定Hbd活性,其通过340nm吸光度的降低来测量,以乙酰乙酰-CoA作为底物(Boynton等,Journal of Bacteriology 178:3015-3024,1996)。在没有底物的情况中进行对照反应,用以监测背景活性。通过观察巴豆酰-CoA在263nm处特异性吸收带的吸光度的降低来分析巴豆酸酶活性(Boynton等,Journal of Bacteriology 178:3015-3024,1996)。通过将NADH的氧化与巴豆酰-CoA的还原(reduction)偶联来监测Bcd的活性。该测定法会在总体积1ml中含有30μM巴豆酰-CoA、60mM磷酸钾pH6.0和0.1mMNADH。使用NADH的340nm处吸光度的降低来确定Bcd、EtfA和EtfB的活性(Becker等,Biochemistry 32:10736-10742,1993)。通过测量在没有它们各自底物(即丁醛或丁酰-CoA)的情况中NADH的氧化速率来测定Aad、AdhE2和BdhA/B的活性。
通过Bradford的染料结合法来测量蛋白质浓度,以牛血清清蛋白(Bio-Rad)作为标准品。对于每一种酶,确定了野生型大肠杆菌中的活性的单位,其中一个单位指在1分钟里将1微摩尔底物转化成产物的酶量。
实施例10:经过密码子优化的、用于将乙酰-CoA转化成正丁醇的丙酮丁醇梭菌基因的异源表达
基因为表达宿主进行的密码子优化提高了蛋白质表达和稳定性二者(Gustafsson等,Trends Biotechnol.22:346-353,2004)。为了增强来自丙酮丁醇梭菌的基因的表达(图2),将基因为大肠杆菌进行密码子优化和商业合成。为了在大肠杆菌中表达完整途径,使用双质粒系统表达基因。thl、hbd、crt和adhE2基因作为一个转录物来表达(图5),而bcd、etfA和etfB基因作为第二个转录物来表达(图6和7)。将这两种质粒(图8和9)分开地和一起地转化入大肠杆菌细胞中并测试活性。
thl、adhE2、crt和hbd的表达:来自丙酮丁醇梭菌的thl、adh、crt和hbd基因是作为一个转录物(seq tach)合成的,每一种基因的侧翼有独特的限制酶位点(图5)。使用Codon Devices公司(Cambridge,MA)的私有密码子优化算法对基因进行密码子优化。天然核糖体结合位点位于每一种基因的上游。使用载体MCS中可利用的EcoRI和BamHI限制酶位点,将含有4种ORF的片段克隆入pZA11(Lutz等,Nucleic Acids Res.25:1203-1210,1997,图8)载体中。
此载体携带p15A复制起点、改良的噬菌体λ(PL-tet)启动子和氨苄青霉素抗性基因。将seq tach片段克隆到PL-tet启动子的下游。通过电穿孔将seqtach-pZA11质粒转化入大肠杆菌-W3110细胞中。在50ml含有0.1mg/ml氨苄青霉素的Luria Bertani(LB)培养基中于37℃需氧地或厌氧地培养转化子。在对数中期,使用100ng/ml无水四环素诱导基因表达。诱导后24小时通过以4000g离心15分钟来收获细胞。将所收获的细胞重悬于含有1mM 1,4-二硫苏糖醇的50mM 4-吗啉丙磺酸(MOPS)缓冲液(pH 7.0)。将细胞悬浮液以60%功率超声处理9-15分钟。通过于4℃以30,000g离心30分钟来清除细胞碎片。对上清液测试酶的表达和活性。
通过SDS-PAGE电泳(Sambrook,2001#172)通过比较诱导前后采集的培养物样品来监测每一种酶的表达。如上文所概述的,使用酶比活测定法来测定Crt、Thl、Hbd和AdhE2的活性。
bcd、etfA和etfB的表达:如图6和7中分别所概述的,在两个分开的构建体中合成来自丙酮丁醇梭菌的(seq Cbab)和来自埃氏巨球形菌的(seq Mbab)bcd、etfA和etfB基因。使用DNA 2.0 Inc.的私有密码子优化算法对基因进行密码子优化。核糖体结合位点和基因间区维持与天然的梭菌属操纵子相同(Boynton等,Applied and Environmental Microbiology 62:2758-2766,1996)。使用载体MCS中可利用的EcoRI和BamHI限制酶位点将这两种序列克隆入pZE32(Lutz等,Nucleic Acids Res.25:1203-1210,1997,图9)载体中。此载体携带ColEl复制起点、改良的噬菌体λ(PL-lac)启动子和氯霉素抗性基因。将seqCbab和seqMbab片段个别地克隆到PL-lac启动子的下游。
通过电穿孔将seqCbab-pZE32和seqMbab-pZE32质粒转化入大肠杆菌-W3110细胞中。在50ml含有0.05mg/ml氯霉素的Luria Bertani培养基中于37℃需氧地培养转化子。在对数中期,使用1mM IPTG(异丙基-β-D-硫代吡喃半乳糖苷)诱导基因表达。诱导后24小时通过以4000g离心15分钟来收获细胞,并重悬于不含1,4-二硫苏糖醇的缺氧MOPS缓冲液。用溶菌酶处理细胞悬浮液,然后通过在厌氧培养室内于0℃剧烈旋涡震动10分钟来破碎细胞。将样品以9000g离心20分钟,用以将裂解物与沉淀物分开。在离心期间给悬浮液紧密地盖上盖子。离心后,将上清液转移入安瓿中,并紧密密封以防止与空气接触。
通过SDS-PAGE电泳(Sambrook,2001#172)通过比较诱导前后采集的培养物样品来监测bcd、etfA和etfB的表达。通过将NADH的氧化与巴豆酰-CoA的还原偶联来监测Bcd的活性。该测定法会在总体积1ml中含有30μM巴豆酰-CoA、60mM磷酸钾pH6.0和0.1mM NADH。使用NADH的340nm处吸光度的降低来确定Bcd、EtfA和EtfB的活性(Boynton等,Applied and EnvironmentalMicrobiology 62:2758-2766,1996;O′Neill等,J.Biol.Chem.273(33):21015-21024,1998)。
完整途径的表达:通过电穿孔将seqCbab-pZE32和seqtach-pZA11转化入大肠杆菌-W3110细胞中。在250ml含有0.05mg/ml氯霉素和0.1mg/ml氨苄青霉素的Luria Bertani(LB)培养基中于37℃厌氧培养转化子。在对数中期,使用1mMIPTG(异丙基-β-D-硫代吡喃半乳糖苷)和100ng/ml无水四环素诱导基因表达。
在诱导后0、2、4、6、8、10、12和24小时,采集样品并分析多种特性。通过以4000g离心15分钟来收获2.5ml细胞,并重悬于不含1,4-二硫苏糖醇的缺氧MOPS缓冲液。用溶菌酶处理细胞悬浮液,然后通过在厌氧培养室内于0℃剧烈旋涡震动10分钟来破碎细胞。在离心期间给悬浮液紧密地盖上盖子。离心后,将上清液转移入安瓿中,并紧密密封以防止与空气接触。然后如上文所概述的对裂解物测试蛋白质表达和酶活性。通过高效液相层析依照标准规程分析反应培养基中葡萄糖和中间产物的浓度(Causey等,Proc.Natl.Acad.Sci.U.S.A.100:825-832,2003)。通过高效液相层析(HPLC)依照确立的规程(Fontaine,2002#5)测量正丁醇和其它途径中间产物的浓度。由此数据计算每消耗1分子葡萄糖所形成的正丁醇分子数的比率。在工程化改造的GEVO菌株中重复上文表达、活性和产物分析。在敲除了发酵性途径的情况中,细胞只能以有活性的正丁醇途径来生长。
实施例11:对于与丙酮丁醇梭菌同源的、用于将乙酰-CoA转化成正丁醇的基因的途径重排(shuffling)
对于催化将乙酰-CoA引向正丁醇的代谢反应的每一种酶,鉴定了来自多种生物体的数种同系物。为了评估这些备选酶和这些酶的所有组合对于正丁醇生成的合适性,可以自分开的DNA构建体表达途径酶的所有可能组合。
作为首先自两种质粒(pZE32和pZA11)表达的两个操纵子,合成正丁醇途径。自pZA11在PLtetO启动子的控制下表达基因thl、crt、adh和hbd,并且自pZE32在PlacOI启动子的控制下表达基因bcd、etfB和etfA。该文库含有上文所述同源基因的所有组合,除了总是来自同一生物体的etfA和etfB之外。将所有同源基因为了大肠杆菌表达宿主进行密码子优化。所有基因的前面是它们的天然SD和UTR序列。将质粒文库转化入GEVO1505。
从选择板上洗下来自此转化的选择板的菌落,并使用所得菌株文库接种9个以不同浓度含有诱导物无水四环素(aTc)和IPTG(0.01、0.1、1mM IPTGx1、10、100ng/ml aTc)的LB培养物。在摇动式温箱中以37℃和250rpm温育24小时后,使用这些培养物接种9个装有确定成分培养基的管,以葡萄糖作为唯一碳源。在摇动式温箱中以37℃和250rpm温育12小时后,使用培养物接种厌氧管中的100mL相同培养基和诱导物水平,起始OD为0.1。将管在摇动式温箱中以37℃和250rpm温育。
菌株的厌氧生长速率取决于正丁醇途径的功能性表达。通过连续稀释厌氧管来选择出组合途径文库中容许在厌氧条件下最快生长的成员。
实施例12:重组大肠杆菌为提高正丁醇生成速率的体内进化
通过在10ml含有葡萄糖作为唯一碳源的新鲜培养液中1∶100稀释,每天转移含有完整正丁醇途径的大肠杆菌的厌氧培养物。将培养物在没有搅动的情况中于37℃温育24小时。由于生长速率与正丁醇生成速率有关,因此通过每周一次稀释培养物并将它们涂布在含有葡萄糖作为唯一碳源的固体培养基上来实现升高的正丁醇生成速率的强化(enrichment)。然后将板在厌氧环境中温育。将生长最迅速的菌落刮入新鲜培养基并如上所述处理。反复地重复此过程直至不再观察到生长速率的进一步升高。
实施例13:对大肠杆菌测试正丁醇抗性
丁醇抑制不仅丙酮丁醇梭菌中的而且大肠杆菌中的最终正丁醇生成水平下的细胞生长。实施初始实验以确定正丁醇对大肠杆菌细胞的毒性水平。在这些实验中使用大肠杆菌DH5α细胞。
简言之,给250mL带挡板的锥形瓶中的50mL LB培养基补充0-5%正丁醇,以0.5%为增量。在接种500μL过夜培养物后测定生长速率和最大OD600。在0.5%正丁醇,生长速率和最大OD600大致减半。在1%正丁醇,生长速率不能定量,而最大OD600降低了约40倍。
实施例14:大肠杆菌为提高正丁醇抗性的体内进化
为了提高正丁醇耐受水平,通过在10ml含有正丁醇和葡萄糖的新鲜培养液中1∶100稀释,每天转移大肠杆菌培养物的厌氧培养物。将这些培养物在没有搅动的情况中于37℃温育24小时。随着培养物的密度在后续转移期间升高,逐渐提高正丁醇浓度以选择出抗性突变体。每周一次,稀释培养物并涂布到固体培养基上以富集正丁醇抗性突变体。自这些板刮取生长最快的菌落,并用于接种新鲜培养基。然后如上所述处理这些培养物。培养基中的初始正丁醇浓度为0.5%。每周将此浓度提高0.1%。重复此过程直至不再有明显的正丁醇耐受的进一步升高。
实施例15:表达经过优化的正丁醇途径的重组微生物-BCD/CCR/TER纤细眼虫/密螺旋体
测试了正丁醇途径中的丁酰CoA脱氢酶步骤的备选酶。来自埃氏巨球形菌的Bcd、EtfB和EtfA及来自丙酮丁醇梭菌的Bcd、EtfB和EtfA在发酵实验中不产生任何正丁醇。在正丁醇发酵实验中功能性表达来自山丘链霉菌(Sreptomyces collinus)的巴豆酰-CoA还原酶(Ccr),而且它是有活性的。来自纤细眼虫的反式-2-烯酰-CoA还原酶(TER)在正丁醇发酵实验中比来自山丘链霉菌的Ccr更具活性。
而且,来自纤细眼虫的TER在正丁醇发酵实验中比来自嗜水气单胞菌的FER更具活性。这是遵循如下实验观察到的,其中分别用pGV1191和pGV1113(TEREg-纤细眼虫)和pGV1117(TERAh-嗜水气单胞菌)转化GEVO768(W3110Z1)。通过正丁醇发酵比较转化子。结果图示于图15。具有TERAh的菌株的平均生产力为1.6*10-4g/L/h,而具有TEREg的菌株的平均生产力为3.2*10-4g/L/h。
另外,来自齿垢密螺旋体的细菌TER同系物在正丁醇发酵中比来自纤细眼虫的TER更具活性。这是遵循如下实验观察到的,其中为在大肠杆菌中表达而密码子优化并合成10种编码来自贝氏柯克斯体、α变形细菌HTCC2255、新洋葱伯克霍尔德氏菌、哈氏噬纤维菌、Reinekea、Shewanella woodyi、齿垢密螺旋体、弧菌Ex25、稻黄单胞菌KACC 10331和鼠疫耶尔森氏菌的细菌TER同系物的基因。将TER基因克隆入载体pGV1252中,该载体与正丁醇途径相容且确保TER相对于其它途径基因的低表达。使用pGV1252衍生物pGV1272、pGV1300-1309和pGV1190作为改良的双载体系统,其容许在使得TER活性对于途径是限制性的条件下比较TER基因。使用GEVO1121(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+),ΔmgsA)作为发酵的宿主菌株以测试同系物。在两个独立的瓶发酵实验中测试10个克隆,以pGV1272(TER-纤细眼虫)作为对照。
图示于图16和17的结果显示了,与用纤细眼虫TER进行的发酵相比,来自齿垢密螺旋体的细菌同系物(pGV1344)将发酵的最终效价(titer)提高了4倍,并将发酵的生产力改善了超过4倍(图16)。所测试的所有其它细菌同系物显示出相对于用纤细眼虫TER进行的发酵更低的生存力。凭借来自齿垢密螺旋体的TER,达到了效价0.81g/L和生产力0.022g/L/h。凭借来自纤细眼虫的TER,达到了效价0.2g/L和生产力0.005g/L/h。来自齿垢密螺旋体的TER确保当该基因在常规双载体系统(pGV1113衍生物+pGV1190)中表达时表达了足够的酶活性来确保巴豆酰-CoA的还原不是途径内的限速步骤。
进一步的实验还显示了,对于硫解酶、羟基丁酰-CoA脱氢酶和巴豆酸酶,经过密码子优化的来自丙酮丁醇梭菌的基因具有这些基因的所有测试同系物中的最高体外活性。
具体而言,表达并通过体外活性测定法比较了途径酶羟基丁酰-CoA脱氢酶(Hbd)、巴豆酸酶(Crt)和硫解酶(Thl)的同系物。所测试的羟基丁酰-CoA脱氢酶同系物为pGV1037(来自丙酮丁醇梭菌的Hbd)、pGV1041(来自解纤维丁酸弧菌的Hbd)、pGV1050(来自拜氏梭菌的Hbd)和pGV1154(来自丙酮丁醇梭菌的Hbd,经过密码子优化的基因序列)。所测试的巴豆酸酶同系物为pGV1040(来自溶纤维丁酸弧菌的Crt)、pGV1049(来自拜氏梭菌的Crt)、pGV1094(来自丙酮丁醇梭菌的Crt)和pGV1189(来自丙酮丁醇梭菌的Crt,经过密码子优化的基因序列)。所测试的硫解酶同系物为pGV1035(来自丙酮丁醇梭菌的Thl)、pGV1039(来自解纤维丁酸弧菌的Thl)和pGV1188(来自丙酮丁醇梭菌的Thl,经过密码子优化的基因序列)。遵循以下概述的方案,表达并测定基因。
用每一种质粒转化GEVO768(大肠杆菌W3110Z1),并将转化子涂布在含100μg/mL氯霉素的LB培养基上。将板于37℃温育14-16小时。使用克隆的单菌落接种3mL含100μg/mL氯霉素的LB培养基。将培养物以37℃和250rpm温育过夜。使用过夜培养物接种摇瓶中50mL含100μg/mL氯霉素的富含EZ的培养基。将培养物以37℃和250rpm温育。在指数生长中期(OD600为0.6-0.8),用1mM IPTG诱导培养物。这活化了克隆在lac启动子控制下的基因表达。4小时后,将细胞以4000g离心10分钟。将细胞重悬于100mM Tris缓冲液pH 7.5,并使用珠搅拌器(bead beater)裂解。将细胞以22000g离心5分钟以分离裂解物。将裂解物小心转移至新管并测试酶活性和蛋白质总量。
为了测试Hbd的活性,将10μL裂解物添加至190μL含有0.1mM乙酰乙酰-CoA和0.2mM NADH的50mM MOPS pH 7.0缓冲液。通过在340nm监测NADH的消耗来测量Hbd的活性。为了测试Crt的活性,将10μL裂解物添加至190μL含有30μM巴豆酰-CoA的100mM Tris pH 7.6缓冲液。通过在263nm监测巴豆酰-CoA的消耗来测量酶活性。为了测试Thl的活性,将10μL裂解物添加至190μL含有10mM MgCl2、250μM乙酰乙酰-CoA和200μM CoA的Tris pH 8.0缓冲液。通过在303nm监测乙酰乙酰-CoA的消耗来测量酶活性。用生物学复制品测试所有克隆,而且每种测定法以一式两份进行。
来自经过密码子优化的基因的酶在所测试的克隆中具有最高表达和因此的最高活性。正丁醇途径的这三种转化的最高比活(相对于总细胞蛋白质标准化的),Hbd为11.6nmol/min/μg总细胞蛋白质(表9),巴豆酸酶为1178nmol/min/μg总细胞蛋白质(表10),而硫解酶为2.96nmol/min/μg总细胞蛋白质(表11)。硫解酶、巴豆酸酶和羟基丁酰脱氢酶的经过密码子优化的基因导致最高体外酶活性,而且有可能是会产生最高途径生产力的基因。
表9:正丁醇途径酶Hbd的同系物的比活
hbd | 来源生物体 | 比活(nmol/min/ug总细胞蛋白质) |
pGV1037 | 丙酮丁醇梭菌 | 3.51 |
pGV1041 | 溶纤维丁酸弧菌 | 0.85 |
pGV1050 | 拜氏梭菌 | 2.91 |
pGV1154 | 丙酮丁醇梭菌,密码子优化的 | 11.69 |
pGV1111 | 载体对照 | 0.20 |
表10:Crt同系物的比活
crt | 来源生物体 | 比活(nmol/min/ug总细胞蛋白质) |
pGV1094 | 丙酮丁醇梭菌 | 83.39 |
pGV1040 | 溶纤维丁酸弧菌 | 0.04 |
pGV1049 | 拜氏梭菌 | 10.84 |
GV1189 | 丙酮丁醇梭菌,密码子优化的 | 916.99 |
pGV1111 | 载体对照 | 0.17 |
表11:Thl同系物的比活
thl | 来源生物体 | 比活(nmol/min/ug总细胞蛋白质) |
pGV1035 | 丙酮丁醇梭菌 | 0.36 |
pGV1039 | 溶纤维丁酸弧菌 | 2.44 |
pGV1188 | 丙酮丁醇梭菌,密码子优化的 | 2.50 |
pGV1111 | 载体对照 | 0.18 |
实施例16:工程化改造以在碳生成和消耗方面平衡正丁醇生成的重组微生物-MgsA
在mgsA基因(GEVO1121)中具有额外删除的菌株GEVO1083显示出升高的正丁醇产率,并在其它地方描述。
通过正丁醇瓶发酵来比较GEVO1083(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))、pGV1191、pGV1113(A)和GEVO1121(GEVO1083,ΔmgsA)、pGV1191、pGV1113(B)。
结果图示于图18。菌株A在36小时里生成0.32g/L乳酸,尽管ldhA敲除消除了通向乳酸的发酵性途径。菌株B在36小时里只生成0.065g/L乳酸(图5)。菌株B生成正丁醇,作为主要的还原型发酵产物。菌株A达到了效价0.21g/L、产率0.048g/g和生产力0.006g/L/h。菌株B达到了效价0.22g/L、产率0.057g/g和生产力0.006g/L/h。
这些实验显示了正丁醇生产菌株中mgsA的删除导致正丁醇发酵中的更高产率。具体而言,这些实验显示了mgsA的删除导致乳酸生成降低5倍,这导致正丁醇产率改善19%。
实施例17:工程化改造以在碳生成和消耗方面平衡正丁醇生成的重组大肠杆菌-乙酸途径
通过删除ackA来删除通向乙酸的主要发酵性途径。用以下实验调查此敲除的效果:
通过正丁醇瓶发酵来比较GEVO1083(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))、pGV1190,pGV1113(A)和GEVO1137(GEVO1083,ΔackA)、pGV1190、pGV1113(B)。
将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
显示于图19和表12的分析结果显示了在ackA中具有删除的菌株达到了高10%的产率和高50%的生产力和效价(表13)(图19)。在ackA中具有基因删除的菌株中的乙酸生成与在ackA中没有删除的相同菌株相比降低了5倍(图19)。
表12:用于比较GEVO1083和GEVO1137的工艺参数
产率 | 生产力 | 效价 | |
样品 | g正丁醇/g葡萄糖 | g/L/h | g/L |
1137A | 0.1011 | 0.0174 | 0.627 |
1137B | 0.1034 | 0.0183 | 0.660 |
1083C | 0.0921 | 0.0117 | 0.422 |
1083D | 0.0921 | 0.0123 | 0.442 |
总之,ackA敲除降低乙酸生成和提高产率、生产力和效价。这显示了与正丁醇途径竞争碳的天然大肠杆菌途径的删除改善正丁醇生产工艺的工艺参数。
这些实验显示了乙酸发酵性途径的删除提高生产菌株在正丁醇发酵中的产率、生产力和效价。
实施例18:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌中的fdh
将基因fdh克隆入pGV1113中,在TER之后的操纵子中,以容许共表达fdh和正丁醇途径(pGV1281)。用pGV1113和pGV1190(1)及用pGV1281和pGV1190(2)转化GEVO1083(大肠杆菌W3110,Δndh,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))。通过正丁醇瓶发酵来菌株1和2。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
图示于图20A和20B的结果显示了在正丁醇途径之外还表达NADH依赖性Fdh的菌株1以产率0.086g/g的生成正丁醇,比只表达正丁醇途径的比较菌株2的正丁醇产率高42%(图20A和20B)。
此结果显示了NADH依赖性Fdh在正丁醇生产菌株中的表达提高正丁醇发酵的产率。
实施例19:生成正丁醇的方法-使用培养中和和厌氧条件
对上文表1所列菌株测试它们的正丁醇产率、它们的生产力和最大可实现效价。具体而言,依照以下步骤将培养条件从生长和生物催化都厌氧变成生长阶段需氧和生物催化阶段厌氧。
用用于正丁醇途径的适宜质粒新鲜转换要测试的菌株。然后挑取单菌落,使用3ml富含EZ的培养基+0.4%葡萄糖,一式两份地接种过夜培养物,并添加在丙酮中稀释的3μl Amp(100mg/ml)和3μl Cm(50mg/ml)。因为富含EZ的培养基易受污染,所以在无菌工作台中使用培养基。在乙醇以外的溶剂中稀释所使用的抗生素(即Cm)。
然后采集过夜培养物的O.D.读数,以标准化所需要的接种体的量。在60ml富含EZ的培养基+0.4%葡萄糖中使用过夜培养物的2%接种体,并添加在丙酮中稀释的60μl Amp(100mg/ml)和60μl Cm(50mg/ml),并以37℃/250rpm温育。同样地,在无菌工作台中使用培养基以避免污染富含EZ的培养基。
在O.D.约.600,通过添加60μl 1M IPTG和6μl 10,000x ATC[在甲醇中稀释]来诱导培养物,鉴于ATC的光敏感性,要确保在添加诱导物后培养物不受光照。使用甲醇来掩蔽GC中的乙醇峰。然后将培养物以30℃/250rpm温育6-8小时。然后每种培养物采集100μl样品,将样品置于冰上。获取pH和葡萄糖的读数及在600nm吸光度得到的O.D.读数,使用水作为参照物。具体而言,使用5-10pH范围的pH试纸条采集pH读数。使用OneTouch Ultra葡萄糖监测仪采集葡萄糖读数。
在必要时通过添加2M NaOH将pH调节至7.5,并通过添加40%葡萄糖以维持约0.2%葡萄糖(在葡萄糖计上为约500-600mg/dl)。然后采集2ml样品,以25000g和4℃离心(spin down)5分钟。然后取出上清液供GC/LC分析用,并将沉淀物置于盒中保存在冰箱中。将此样品标记为零小时时间点。
将50mL培养物转移入100mL厌氧充气锯齿形密封瓶(crimp seal flask)中,并将培养物放回温箱。将培养物以30℃/250rpm温育,添加在丙酮中稀释的50μlAmp(100mg/ml)和50μl Cm(50mg/ml)。在丙酮中稀释Cm是为了避免使用在乙醇中稀释的抗生素。
大约每12小时使用注射器在厌氧室中采集2ml样品。使用2ml样品采集O.D.、pH、葡萄糖读数,并将剩余样品用于GC/LC分析。每24小时向培养物中添加在丙酮中稀释的25μl Amp(100mg/ml)和25μl Cm(50mg/ml),避免使用在乙醇中稀释的抗生素。
在必要时,通过添加2M NaOH将pH调节至7.5,并通过添加40%葡萄糖以维持约0.2%葡萄糖(在葡萄糖计上为约500-600mg/dl)。
图示于图21A和21B的这些实验的结果显示了,通过延长发酵时间和通过缩短补料和中和事件之间的间隔,效价从0.011g/L到0.0525g/L,改善了4.7倍。生产力从0.000323g/L/h到0.000795g/L/h改善了超过2倍,而产率从0.001373g/g到0.005831g/g(丁醇/葡萄糖)改善了4倍(TB002-74)。这些发酵是用菌株GEVO768(W3110Z1)进行的。
这些结果显示了发酵条件的改动提高了正丁醇生产工艺的生产力、产率和效价。
实施例20:生成正丁醇的方法-发酵条件的优化
发酵罐中从生长到生物催化的转换的优化改善正丁醇生产力和效价。使用经质粒pGV1190和pGV1113转化的GEVO1083(大肠杆菌W3110 ndh,ldhA,adhE,frd)实施了在需氧到厌氧的不同转换下的正丁醇发酵。用转化菌株的过夜培养物接种4个发酵罐容器,即1、2、3和4,每个装有200mL含有适宜抗生素的富含EZ的培养基。生长阶段将发酵罐维持在37℃,并将pH控制在7.0。将发酵罐设定为搅动速度400rpm,并以1sL/h给它们通气100%空气。在指数中期,用1mM IPTG和100ng/mL无水四环素诱导培养物。在诱导后将发酵罐温度降低至30℃。诱导6小时后,将发酵罐1、2和3编程为通过控制进气的氧气百分比将%溶氧浓度自10%降低至0%。
此转换所需要的时间,发酵罐1为2小时,发酵罐2为6小时,而发酵罐3为12小时。一旦溶氧浓度处于0%,将进气混合物转换成气体流速为5sL/h的100%氮气。在发酵罐4中,在诱导后6小时完全关闭气流,让培养物消耗发酵罐中剩下的氧,直至达到厌氧条件。2小时后,将气体混合物转换成流速为5sL/h的100%氮气。所有发酵运行40小时,而且在不同时间点采集样品。通过HPLC和GC分析样品以测定发酵罐中有机酸、葡萄糖、乙醇和正丁醇的浓度。
结果图示于图22A和22B及下文表1。在具有从需氧到厌氧条件的2小时转换的发酵罐1中达到了最高效价0.88g/L。发酵罐1也具有最高生产力0.022g/L/h(表13)。
表13:具有从需氧到厌氧培养条件的不同转换的发酵中所达到的效价和生产力
发酵罐 | 效价g/L | 生产力g/L/h |
F1 | 0.88 | 0.022 |
F2 | 0.73 | 0.018 |
F3 | 0.79 | 0.02 |
F4 | 0.58 | 0.015 |
这些结果显示了发酵工艺条件的优化如何改善正丁醇生产工艺的产率、生产力和效价。
实施例21:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌野生型菌株中的Fdh突变体
在GEVO1034(大肠杆菌W3110,ΔfdhF)中过表达来自博伊丁氏假丝酵母的NADH依赖性甲酸脱氢酶(在其天然fdhF基因中具有删除的大肠杆菌菌株中的NADH依赖性Fdh)。
通过依照SOP“厌氧瓶中的丁醇发酵”的正丁醇瓶发酵来比较GEVO1034(大肠杆菌W3110,ΔfdhF)、pGV1248(自中等拷贝质粒表达的来自博伊丁氏假丝酵母的fdh1)(A)和GEVO1034、pGV1111(只含载体的对照(vector onlycontrol))(B)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/LCm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。
将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
图示于图23A、23B、23C、23D、24A和24B的结果显示了菌株A以比率0.6+/-0.15生成乙醇和乙酸。菌株A以比率3.43生成乙醇和乙酸。菌株B以比率0.63生成乙醇和乙酸。菌株A生成2.97个NADH每个葡萄糖,而菌株B生成1.91个NADH每个葡萄糖。
总之,此结果指明了来自博伊丁氏假丝酵母的fdh1的表达提高了细胞中的可得NADH(更新数值):
这些实验显示了NADH依赖性Fdh的表达提高了细胞所生成的NADH每葡萄糖比。
实施例22:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌野生型菌株中的pdh突变体
通过正丁醇瓶发酵来比较菌株GEVO992(大肠杆菌W3110,ΔldhA,Δfrd)、pGV1278(PLtet::lpdA突变体)(A),GEVO992,pGV1279(PLtet::lpdA突变体)(B),GEVO992,pGV772(只含载体的对照)(C)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。
将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
图示于图25A和25B的结果显示了菌株A以比率1.1生成乙醇和乙酸。菌株B以比率0.8生成乙醇和乙酸。菌株C以比率0.8生成乙醇和乙酸。表达突变型lpdA的菌株A的比率是菌株B和菌株C的比率的1.4倍高。
这些结果指明了突变型LpdA的表达提高了细胞中的可得NADH。具体而言,这些结果显示了被突变以避免受到高NADH/NAD水平抑制的Pdh的表达提高了在厌氧条件下细胞所生成的NADH每葡萄糖比。
实施例23:以高于理论产率的50%的产率生成正丁醇
通过正丁醇瓶发酵来比较菌株GEVO1510(大肠杆菌W3110,ΔldhA,ΔpflB,ΔpflDC,ΔadhE,Δfrd,ΔackA,ΔmgsA),pGV1191,pGV1113(A)和GEVO1511(大肠杆菌W3110,ΔldhA,ΔpflB,ΔpflDC,ΔadhE,Δfrd,ΔackA,ΔmgsA),pGV1191,pGV1113(B)。GEVO1510是为在厌氧条件下表达Pdh而进化得到的。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用1mM IPTG和100ng/mL aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
如上文所述为提高NADH生成而进化得到的菌株A以产率0.3g/g生成正丁醇,对应于理论产率的73.2%。菌株B达到了产率0.1g/g(理论产率的24.4%)。此结果显示了为更高的NADH生成进化正丁醇生产菌株将正丁醇发酵的产率提高到理论产率的50%以上。
这些结果显示了厌氧地生成超过2摩尔NADH每摩尔葡萄糖的菌株容许高于50%的正丁醇产率。
实施例24:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌中fdh
用pGV1583和pGV1191(1)及用pGV1435和pGV1191(2)转化GEVO768(大肠杆菌W3110,attB::(Sp+laclq+tetR+))。通过正丁醇瓶发酵来比较菌株1和2。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了在正丁醇途径之外还表达NADH依赖性Fdh的菌株以理论产率的1.82%的产率生成正丁醇,比只表达正丁醇途径的比较菌株2的正丁醇产率高30%。
此结果显示了NADH依赖性Fdh在正丁醇生产菌株中的表达提高正丁醇发酵的产率。
实施例25:以高于理论产率的50%的产率生成正丁醇
通过正丁醇瓶发酵来比较菌株Gevo1083、pGV1191、pGV1583(A),和GEVO1083、pGV1191、pGV1435(B)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用1mM IPTG和100ng/mL aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。自高拷贝质粒表达来自博伊丁氏假丝酵母的NADH依赖性Fdh的菌株A以产率0.29g/g生成正丁醇,对应于理论产率的70.7%。菌株B达到了产率0.1g/g(理论产率的29%)。
实施例26:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌野生型菌株中的Fdh突变体
在Gevo1034(大肠杆菌W3110,ΔfdhF)中过表达来自博伊丁氏假丝酵母的NADH依赖性甲酸脱氢酶(在其天然fdhF基因中具有删除的大肠杆菌菌株中的NADH依赖性Fdh)。
通过依照SOP“厌氧瓶中的丁醇发酵”的正丁醇瓶发酵比较Gevo1034(大肠杆菌W3110,ΔfdhF),pGV1582(用强tac启动子表达的来自博伊丁氏假丝酵母fdh1)(A)和GEVO1034、pGV1569(只含载体的对照)(B)。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/LAmp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。
将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了菌株A生成4个NADH每个葡萄糖,而菌株B生成2个NADH每个葡萄糖。总之,此结果指明了来自博伊丁氏假丝酵母的fdh1的表达提高了细胞中的可得NADH。
这些实验显示了NADH依赖性Fdh的表达提高了细胞所生成的NADH每葡萄糖比。
实施例27:工程化改造以在NADH生成和消耗方面平衡正丁醇生成的重组微生物-大肠杆菌中的fdh
使用用于表达丁醇途径的和用于表达来自博伊丁氏假丝酵母的NADH依赖性Fdh的质粒转化数种大肠杆菌。用pGV1191和pGV1583转化菌株GEVO1082(大肠杆菌W3110,Δldh,attB::(Sp+laclq+tetR+))(菌株A)、GEVO1054(大肠杆菌W3110,ΔadhE,attB::(Sp+laclg+tetR+))(菌株B)、GEVO1084(大肠杆菌W3110,Δldh,ΔadhE,attB::(Sp+laclq+tetR+))(菌株C)、GEVO1508(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,attB::(Sp+laclq+tetR+))(菌株D)、GEVO1509(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔmgsA,attB::(Sp+laclq+tetR+))(菌株E)、GEVO1085(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔackA,attB::(Sp+laclq+tetR+))(菌株F)、GEVO1507(大肠杆菌W3110,Δldh,ΔadhE,Δfrd,ΔackA,ΔmgsA,attB::(Sp+laclq+tetR+))(菌株G)。(2).通过正丁醇瓶发酵来比较含有这些质粒的菌株A-F。将菌株在培养基B(富含EZ的培养基,含有0.4%葡萄糖、100mg/L Cm和200mg/L Amp)中在管中以37℃和250rpm需氧培养过夜。用过夜培养物以2%接种摇瓶中的60mL培养基B,并将培养物培养至OD600达到0.6。将培养物用IPTG和aTc诱导,并以30℃和250rpm温育12小时。将50mL培养物转移入厌氧瓶中并以30℃和250rpm温育36小时。在不同时间点采集样品,并用葡萄糖给培养物补料,在必要时用NaOH中和。用GC和HPLC分析样品。
结果显示了菌株A以产率5%生成丁醇,菌株B以产率40%生成丁醇,菌株C以产率50%生成丁醇,菌株D以产率55%生成丁醇,菌株E以产率60%生成丁醇,菌株F以产率65%生成丁醇,菌株G以产率70%生成丁醇。
提供上文所列实施例是为了给本领域普通技术人员以关于如何制备和使用本公开内容中的装置、系统和方法的实施方案的完整公开和说明,并非意图限制发明人看作其公开内容的范围。对于本领域技术人员显而易见的用于实施本公开内容的上文所述模式的改动意欲在所附权利要求的范围内。说明书中提及的所有专利和出版物指示了本公开内容所属领域技术人员的技术水平。通过提述将此公开内容中引用的所有参考文献并入本文,其程度就像通过个别地提述将每一篇参考文献完整并入本文一样。
通过提述将背景、详述和实施例中引用的每一份文件的完整公开内容(包括专利、专利申请、期刊论文、摘要、实验室手册、书籍、或其它公开内容)并入本文。另外,通过提述将与之一起提交的序列表的硬拷贝及相应的计算机可读形式二者完整并入本文。
要理解,公开内容不限于特定的组合物或生物学系统,其当然可以有所变化。还要理解,本文中所使用的术语学只是出于描述特定实施方案的目的,并非意图限制。如本说明书和所附权利要求书中所使用的,单数形式“一个”、“一种”、“该”和“所述”包括复数称谓,除非另有明确说明。如此,例如,提到“一个/种生物合成中间产物”包括多个/种此类中间产物,提到“一个/种核酸”包括多个/种此类核酸,而提到“所述经过遗传修饰的宿主细胞”包括提到一个/种或多个/种经过遗传修饰的宿主细胞及其本领域技术人员知道的等同物,等等。如本说明书中所使用的,术语“多个/种”至两个/种或更多个/种称谓(reference),如所指示的,除非另有明确说明。
除非另有定义,本文中所使用的所有技术和科学术语具有与本公开内容所述领域普通技术人员常规理解相同的含义。虽然任何与本文所述方法和材料的类似的或等同的方法和材料都能在实践中用于测试本公开内容,但是本文中描述了适宜的材料和方法的具体实例。通过提述将本文中所提到的所有出版物并入本文以公开和描述与引用该参考文献有关的方法和/或材料。
虽然本文中明确地公开了本公开内容的具体实施方案,但是上文说明书和实施例是例示性的而非限制性的。应当理解,可以进行各式各样的改动而不背离本公开内容的精神和范围。在阅读此说明书和上文实施方案后,本公开内容的许多变化对于本领域技术人员会是显而易见的。本公开内容的完整范围应当通过参考实施方案以及它们的等同方案和说明书的完整范围以及此类变化来确定。因而,其它实施方案落在所附权利要求书的范围内。
序列表
<110>格沃股份有限公司(GEVO,INC.)
<120>用于生产正丁醇的工程化改造的微生物及相关方法
<130>56836.830004.US1
<150>60/868,326
<151>2006-12-01
<150>60/945,576
<151>2007-06-21
<150>60/890,329
<151>2007-02-16
<150>60/905,550
<151>2007-03-06
<150>60/940,877
<151>2007-05-30
<160>86
<170>PatentIn version 3.4
<210>1
<211>858
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>1
Met Lys Val Thr Asn Gln Lys Glu Leu Lys Gln Lys Leu Asn Glu Leu
1 5 10 15
Arg Glu Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp
20 25 30
Lys Ile Phe Lys Gln Cys Ala Ile Ala Ala Ala Lys Glu Arg Ile Asn
35 40 45
Leu Ala Lys Leu Ala Val Glu Glu Thr Gly Ile Gly Leu Val Glu Asp
50 55 60
Lys Ile Ile Lys Asn His Phe Ala Ala Glu Tyr Ile Tyr Asn Lys Tyr
65 70 75 80
Lys Asn Glu Lys Thr Cys Gly Ile Ile Asp His Asp Asp Ser Leu Gly
85 90 95
Ile Thr Lys Val Ala Glu Pro Ile Gly Ile Val Ala Ala Ile Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ser Leu
115 120 125
Lys Thr Arg Asn Ala Ile Phe Phe Ser Pro His Pro Arg Ala Lys Lys
130 135 140
Ser Thr Ile Ala Ala Ala Lys Leu Ile Leu Asp Ala Ala Val Lys Ala
145 150 155 160
Gly Ala Pro Lys Asn Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Gln Asp Leu Met Ser Glu Ala Asp Ile Ile Leu Ala Thr Gly
180 185 190
Gly Pro Ser Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Ile
195 200 205
Gly Val Gly Ala Gly Asn Thr Pro Ala Ile Ile Asp Glu Ser Ala Asp
210 215 220
Ile Asp Met Ala Val Ser Ser Ile Ile Leu Ser Lys Thr Tyr Asp Asn
225 230 235 240
Gly Val Ile Cys Ala Ser Glu Gln Ser Ile Leu Val Met Asn Ser Ile
245 250 255
Tyr Glu Lys Val Lys Glu Glu Phe Val Lys Arg Gly Ser Tyr Ile Leu
260 265 270
Asn Gln Asn Glu Ile Ala Lys Ile Lys Glu Thr Met Phe Lys Asn Gly
275 280 285
Ala Ile Asn Ala Asp Ile Val Gly Lys Ser Ala Tyr Ile Ile Ala Lys
290 295 300
Met Ala Gly Ile Glu Val Pro Gln Thr Thr Lys Ile Leu Ile Gly Glu
305 310 315 320
Val Gln Ser Val Glu Lys Ser Glu Leu Phe Ser His Glu Lys Leu Ser
325 330 335
Pro Val Leu Ala Met Tyr Lys Val Lys Asp Phe Asp Glu Ala Leu Lys
340 345 350
Lys Ala Gln Arg Leu Ile Glu Leu Gly Gly Ser Gly His Thr Ser Ser
355 360 365
Leu Tyr Ile Asp Ser Gln Asn Asn Lys Asp Lys Val Lys Glu Phe Gly
370 375 380
Leu Ala Met Lys Thr Ser Arg Thr Phe Ile Asn Met Pro Ser Ser Gln
385 390 395 400
Gly Ala Ser Gly Asp Leu Tyr Asn Phe Ala Ile Ala Pro Ser Phe Thr
405 410 415
Leu Gly Cys Gly Thr Trp Gly Gly Asn Ser Val Ser Gln Asn Val Glu
420 425 430
Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn
435 440 445
Met Leu Trp Phe Lys Val Pro Gln Lys Ile Tyr Phe Lys Tyr Gly Cys
450 455 460
Leu Arg Phe Ala Leu Lys Glu Leu Lys Asp Met Asn Lys Lys Arg Ala
465 470 475 480
Phe Ile Val Thr Asp Lys Asp Leu Phe Lys Leu Gly Tyr Val Asn Lys
485 490 495
Ile Thr Lys Val Leu Asp Glu Ile Asp Ile Lys Tyr Ser Ile Phe Thr
500 505 510
Asp Ile Lys Ser Asp Pro Thr Ile Asp Ser Val Lys Lys Gly Ala Lys
515 520 525
Glu Met Leu Asn Phe Glu Pro Asp Thr Ile Ile Ser Ile Gly Gly Gly
530 535 540
Ser Pro Met Asp Ala Ala Lys Val Met His Leu Leu Tyr Glu Tyr Pro
545 550 555 560
Glu Ala Glu Ile Glu Asn Leu Ala Ile Asn Phe Met Asp Ile Arg Lys
565 570 575
Arg Ile Cys Asn Phe Pro Lys Leu Gly Thr Lys Ala Ile Ser Val Ala
580 585 590
Ile Pro Thr Thr Ala Gly Thr Gly Ser Glu Ala Thr Pro Phe Ala Val
595 600 605
Ile Thr Asn Asp Glu Thr Gly Met Lys Tyr Pro Leu Thr Ser Tyr Glu
610 615 620
Leu Thr Pro Asn Met Ala Ile Ile Asp Thr Glu Leu Met Leu Asn Met
625 630 635 640
Pro Arg Lys Leu Thr Ala Ala Thr Gly Ile Asp Ala Leu Val His Ala
645 650 655
Ile Glu Ala Tyr Val Ser Val Met Ala Thr Asp Tyr Thr Asp Glu Leu
660 665 670
Ala Leu Arg Ala Ile Lys Met Ile Phe Lys Tyr Leu Pro Arg Ala Tyr
675 680 685
Lys Asn Gly Thr Asn Asp Ile Glu Ala Arg Glu Lys Met Ala His Ala
690 695 700
Ser Asn Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys
705 710 715 720
His Ser Met Ala His Lys Leu Gly Ala Met His His Val Pro His Gly
725 730 735
Ile Ala Cys Ala Val Leu Ile Glu Glu Val Ile Lys Tyr Asn Ala Thr
740 745 750
Asp Cys Pro Thr Lys Gln Thr Ala Phe Pro Gln Tyr Lys Ser Pro Asn
755 760 765
Ala Lys Arg Lys Tyr Ala Glu Ile Ala Glu Tyr Leu Asn Leu Lys Gly
770 775 780
Thr Ser Asp Thr Glu Lys Val Thr Ala Leu Ile Glu Ala Ile Ser Lys
785 790 795 800
Leu Lys Ile Asp Leu Ser Ile Pro Gln Asn Ile Ser Ala Ala Gly Ile
805 810 815
Asn Lys Lys Asp Phe Tyr Asn Thr Leu Asp Lys Met Ser Glu Leu Ala
820 825 830
Phe Asp Asp Gln Cys Thr Thr Ala Asn Pro Arg Tyr Pro Leu Ile Ser
835 840 845
Glu Leu Lys Asp Ile Tyr Ile Lys Ser Phe
850 855
<210>2
<211>261
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>2
Met Glu Leu Asn Asn Val Ile Leu Glu Lys Glu Gly Lys Val Ala Val
1 5 10 15
Val Thr Ile Asn Arg Pro Lys Ala Leu Asn Ala Leu Asn Ser Asp Thr
20 25 30
Leu Lys Glu Met Asp Tyr Val Ile Gly Glu Ile Glu Asn Asp Ser Glu
35 40 45
Val Leu Ala Val Ile Leu Thr Gly Ala Gly Glu Lys Ser Phe Val Ala
50 55 60
Gly Ala Asp Ile Ser Glu Met Lys Glu Met Asn Thr Ile Glu Gly Arg
65 70 75 80
Lys Phe Gly Ile Leu Gly Asn Lys Val Phe Arg Arg Leu Glu Leu Leu
85 90 95
Glu Lys Pro Val Ile Ala Ala Val Asn Gly Phe Ala Leu Gly Gly Gly
100 105 110
Cys Glu Ile Ala Met Ser Cys Asp Ile Arg Ile Ala Ser Ser Asn Ala
115 120 125
Arg Phe Gly Gln Pro Glu Val Gly Leu Gly Ile Thr Pro Gly Phe Gly
130 135 140
Gly Thr Gln Arg Leu Ser Arg Leu Val Gly Met Gly Met Ala Lys Gln
145 150 155 160
Leu Ile Phe Thr Ala Gln Asn Ile Lys Ala Asp Glu Ala Leu Arg Ile
165 170 175
Gly Leu Val Asn Lys Val Val Glu Pro Ser Glu Leu Met Asn Thr Ala
180 185 190
Lys Glu Ile Ala Asn Lys Ile Val Ser Asn Ala Pro Val Ala Val Lys
195 200 205
Leu Ser Lys Gln Ala Ile Asn Arg Gly Met Gln Cys Asp Ile Asp Thr
210 215 220
Ala Leu Ala Phe Glu Ser Glu Ala Phe Gly Glu Cys Phe Ser Thr Glu
225 230 235 240
Asp Gln Lys Asp Ala Met Thr Ala Phe Ile Glu Lys Arg Lys Ile Glu
245 250 255
Gly Phe Lys Asn Arg
260
<210>3
<211>379
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>3
Met Asp Phe Asn Leu Thr Arg Glu Gln Glu Leu Val Arg Gln Met Val
1 5 10 15
Arg Glu Phe Ala Glu Asn Glu Val Lys Pro Ile Ala Ala Glu Ile Asp
20 25 30
Glu Thr Glu Arg Phe Pro Met Glu Asn Val Lys Lys Met Gly Gln Tyr
35 40 45
Gly Met Met Gly Ile Pro Phe Ser Lys Glu Tyr Gly Gly Ala Gly Gly
50 55 60
Asp Val Leu Ser Tyr Ile Ile Ala Val GIu Glu Leu Ser Lys Val Cys
65 70 75 80
Gly Thr Thr Gly Val Ile Leu Ser Ala His Thr Ser Leu Cys Ala Ser
85 90 95
Leu Ile Asn Glu His Gly Thr Glu Glu Gln Lys Gln Lys Tyr Leu Val
100 105 110
Pro Leu Ala Lys Gly Glu Lys Ile Gly Ala Tyr Gly Leu Thr Glu Pro
115 120 125
Asn Ala Gly Thr Asp Ser Gly Ala Gln Gln Thr Val Ala Val Leu Glu
130 135 140
Gly Asp His Tyr Val Ile Asn Gly Ser Lys Ile Phe Ile Thr Asn Gly
145 150 155 160
Gly Val Ala Asp Thr Phe Val Ile Phe Ala Met Thr Asp Arg Thr Lys
165 170 175
Gly Thr Lys Gly Ile Ser Ala Phe Ile Ile Glu Lys Gly Phe Lys Gly
180 185 190
Phe Ser Ile Gly Lys Val Glu Gln Lys Leu Gly Ile Arg Ala Ser Ser
195 200 205
Thr Thr Glu Leu Val Phe Glu Asp Met Ile Val Pro Val Glu Asn Met
210 215 220
Ile Gly Lys Glu Gly Lys Gly Phe Pro Ile Ala Met Lys Thr Leu Asp
225 230 235 240
Gly Gly Arg Ile Gly Ile Ala Ala Gln Ala Leu Gly Ile Ala Glu Gly
245 250 255
Ala Phe Asn Glu Ala Arg Ala Tyr Met Lys Glu Arg Lys Gln Phe Gly
260 265 270
Arg Ser Leu Asp Lys Phe Gln Gly Leu Ala Trp Met Met Ala Asp Met
275 280 285
Asp Val Ala Ile Glu Ser Ala Arg Tyr Leu Val Tyr Lys Ala Ala Tyr
290 295 300
Leu Lys Gln Ala Gly Leu Pro Tyr Thr Val Asp Ala Ala Arg Ala Lys
305 310 315 320
Leu His Ala Ala Asn Val Ala Met Asp Val Thr Thr Lys Ala Val Gln
325 330 335
Leu Phe Gly Gly Tyr Gly Tyr Thr Lys Asp Tyr Pro Val Glu Arg Met
340 345 350
Met Arg Asp Ala Lys Ile Thr Glu Ile Tyr Glu Gly Thr Ser Glu Val
355 360 365
Gln Lys Leu Val Ile Ser Gly Lys Ile Phe Arg
370 375
<210>4
<211>337
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>4
Met Asn Lys Ala Asp Tyr Lys Gly Val Trp Val Phe Ala Glu Gln Arg
1 5 10 15
Asp Gly Glu Leu Gln Lys Val Ser Leu Glu Leu Leu Gly Lys Gly Lys
20 25 30
Glu Met Ala Glu Lys Leu Gly Val Glu Leu Thr Ala Val Leu Leu Gly
35 40 45
His Asn Thr Glu Lys Met Ser Lys Asp Leu Leu Ser His Gly Ala Asp
50 55 60
Lys Val Leu Ala Ala Asp Asn Glu Leu Leu Ala His Phe Ser Thr Asp
65 70 75 80
Gly Tyr Ala Lys Val Ile Cys Asp Leu Val Asn Glu Arg Lys Pro Glu
85 90 95
Ile Leu Phe Ile Gly Ala Thr Phe Ile Gly Arg Asp Leu Gly Pro Arg
100 105 110
Ile Ala Ala Arg Leu Ser Thr Gly Leu Thr Ala Asp Cys Thr Ser Leu
115 120 125
Asp Ile Asp Val Glu Asn Arg Asp Leu Leu Ala Thr Arg Pro Ala Phe
130 135 140
Gly Gly Asn Leu Ile Ala Thr Ile Val Cys Ser Asp His Arg Pro Gln
145 150 155 160
Met Ala Thr Val Arg Pro Gly Val Phe Phe Glu Lys Leu Pro Val Asn
165 170 175
Asp Ala Asn Val Ser Asp Asp Lys Ile Glu Lys Val Ala Ile Lys Leu
180 185 190
Thr Ala Ser Asp Ile Arg Thr Lys Val Ser Lys Val Val Lys Leu Ala
195 200 205
Lys Asp Ile Ala Asp Ile Gly Glu Ala Lys Val Leu Val Ala Gly Gly
210 215 220
Arg Gly Val Gly Ser Lys Glu Asn Phe Glu Lys Leu Glu Glu Leu Ala
225 230 235 240
Ser Leu Leu Gly Gly Thr Ile Ala Ala Ser Arg Ala Ala Ile Glu Lys
245 250 255
Glu Trp Val Asp Lys Asp Leu Gln Val Gly Gln Thr Gly Lys Thr Val
260 265 270
Arg Pro Thr Leu Tyr Ile Ala Cys Gly Ile Ser Gly Ala Ile Gln His
275 280 285
Leu Ala Gly Met Gln Asp Ser Asp Tyr Ile Ile Ala Ile Asn Lys Asp
290 295 300
Val Glu Ala Pro Ile Met Lys Val Ala Asp Leu Ala Ile Val Gly Asp
305 310 315 320
Val Asn Lys Val Val Pro Glu Leu Ile Ala Gln Val Lys Ala Ala Asn
325 330 335
Asn
<210>5
<211>252
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>5
Met Asn Ile Val Val Cys Leu Lys Gln Val Pro Asp Thr Ala Glu Val
1 5 10 15
Arg Ile Asp Pro Val Lys Gly Thr Leu Ile Arg Glu Gly Val Pro Ser
20 25 30
Ile Ile Asn Pro Asp Asp Lys Asn Ala Leu Glu Glu Ala Leu Val Leu
35 40 45
Lys Asp Asn Tyr Gly Ala His Val Thr Val Ile Ser Met Gly Pro Pro
50 55 60
Gln Ala Lys Asn Ala Leu Val Glu Ala Leu Ala Met Gly Ala Asp Glu
65 70 75 80
Ala Val Leu Leu Thr Asp Arg Ala Phe Gly Gly Ala Asp Thr Leu Ala
85 90 95
Thr Ser His Thr Ile Ala Ala Gly Ile Lys Lys Leu Lys Tyr Asp Ile
100 105 110
Val Phe Ala Gly Arg Gln Ala Ile Asp Gly Asp Thr Ala Gln Val Gly
115 120 125
Pro Glu Ile Ala Glu His Leu Gly Ile Pro Gln Val Thr Tyr Val Glu
130 135 140
Lys Val Glu Val Asp Gly Asp Thr Leu Lys Ile Arg Lys Ala Trp Glu
145 150 155 160
Asp Gly Tyr Glu Val Val Glu Val Lys Thr Pro Val Leu Leu Thr Ala
165 170 175
Ile Lys Glu Leu Asn Val Pro Arg Tyr Met Ser Val Glu Lys Ile Phe
180 185 190
Gly Ala Phe Asp Lys Glu Val Lys Met Trp Thr Ala Asp Asp Ile Asp
195 200 205
Val Asp Lys Ala Asn Leu Gly Leu Lys Gly Ser Pro Thr Lys Val Lys
210 215 220
Lys Ser Ser Thr Lys Glu Val Lys Gly Gln Gly Glu Val Ile Asp Lys
225 230 235 240
Pro Val Lys Glu Ala Ala Asp Met Leu Ser Gln Asn
245 250
<210>6
<211>282
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>6
Met Lys Lys Val Cys Val Ile Gly Ala Gly Thr Met Gly Ser Gly Ile
1 5 10 15
Ala Gln Ala Phe Ala Ala Lys Gly Phe Glu Val Val Leu Arg Asp Ile
20 25 30
Lys Asp Glu Phe Val Asp Arg Gly Leu Asp Phe Ile Asn Lys Asn Leu
35 40 45
Ser Lys Leu Val Lys Lys Gly Lys Ile Glu Glu Ala Thr Lys Val Glu
50 55 60
Ile Leu Thr Arg Ile Ser Gly Thr Val Asp Leu Asn Met Ala Ala Asp
65 70 75 80
Cys Asp Leu Val Ile Glu Ala Ala Val Glu Arg Met Asp Ile Lys Lys
85 90 95
Gln Ile Phe Ala Asp Leu Asp Asn Ile Cys Lys Pro Glu Thr Ile Leu
100 105 110
Ala Ser Asn Thr Ser Ser Leu Ser Ile Thr Glu Val Ala Ser Ala Thr
115 120 125
Lys Thr Asn Asp Lys Val Ile Gly Met His Phe Phe Asn Pro Ala Pro
130 135 140
Val Met Lys Leu Val Glu Val Ile Arg Gly Ile Ala Thr Ser Gln Glu
145 150 155 160
Thr Phe Asp Ala Val Lys Glu Thr Ser Ile Ala Ile Gly Lys Asp Pro
165 170 175
Val Glu Val Ala Glu Ala Pro Gly Phe Val Val Asn Arg Ile Leu Ile
180 185 190
Pro Met Ile Asn Glu Ala Val Gly Ile Leu Ala Glu Gly Ile Ala Ser
195 200 205
Val Glu Asp Ile Asp Lys Ala Met Lys Leu Gly Ala Asn His Pro Met
210 215 220
Gly Pro Leu Glu Leu Gly Asp Phe Ile Gly Leu Asp Ile Cys Leu Ala
225 230 235 240
Ile Met Asp Val Leu Tyr Ser Glu Thr Gly Asp Ser Lys Tyr Arg Pro
245 250 255
His Thr Leu Leu Lys Lys Tyr Val Arg Ala Gly Trp Leu Gly Arg Lys
260 265 270
Ser Gly Lys Gly Phe Tyr Asp Tyr Ser Lys
275 280
<210>7
<211>405
<212>PRT
<213>纤细眼虫(E.gracilis)
<400>7
Met Ala Met Phe Thr Thr Thr Ala Lys Val Ile Gln Pro Lys Ile Arg
1 5 10 15
Gly Phe Ile Cys Thr Thr Thr His Pro Ile Gly Cys Glu Lys Arg Val
20 25 30
Gln Glu Glu Ile Ala Tyr Ala Arg Ala His Pro Pro Thr Ser Pro Gly
35 40 45
Pro Lys Arg Val Leu Val Ile Gly Cys Ser Thr Gly Tyr Gly Leu Ser
50 55 60
Thr Arg Ile Thr Ala Ala Phe Gly Tyr Gln Ala AIa Thr Leu Gly Val
65 70 75 80
Phe Leu Ala Gly Pro Pro Thr Lys Gly Arg Pro Ala Ala Ala Gly Trp
85 90 95
Tyr Asn Thr Val Ala Phe Glu Lys Ala Ala Leu Glu Ala Gly Leu Tyr
100 105 110
Ala Arg Ser Leu Asn Gly Asp Ala Phe Asp Ser Thr Thr Lys Ala Arg
115 120 125
Thr Val Glu Ala Ile Lys Arg Asp Leu Gly Thr Val Asp Leu Val Val
130 135 140
Tyr Ser Ile Ala Ala Pro Lys Arg Thr Asp Pro Ala Thr Gly Val Leu
145 150 155 160
His Lys Ala Cys Leu Lys Pro Ile Gly Ala Thr Tyr Thr Asn Arg Thr
165 170 175
Val Asn Thr Asp Lys Ala Glu Val Thr Asp Val Ser Ile Glu Pro Ala
180 185 190
Ser Pro Glu Glu Ile Ala Asp Thr Val Lys Val Met Gly Gly Glu Asp
195 200 205
Trp Glu Leu Trp Ile Gln Ala Leu Ser Glu Ala Gly Val Leu Ala Glu
210 215 220
Gly Ala Lys Thr Val Ala Tyr Ser Tyr Ile Gly Pro Glu Met Thr Trp
225 230 235 240
Pro Val Tyr Trp Ser Gly Thr Ile Gly Glu Ala Lys Lys Asp Val Glu
245 250 255
Lys Ala Ala Lys Arg Ile Thr Gln Gln Tyr Gly Cys Pro Ala Tyr Pro
260 265 270
Val Val Ala Lys Ala Leu Val Thr Gln Ala Ser Ser Ala Ile Pro Val
275 280 285
Val Pro Leu Tyr Ile Cys Leu Leu Tyr Arg Val Met Lys Glu Lys Gly
290 295 300
Thr His Glu Gly Cys Ile Glu Gln Met Val Arg Leu Leu Thr Thr Lys
305 310 315 320
Leu Tyr Pro Glu Asn Gly Ala Pro Ile Val Asp Glu Ala Gly Arg Val
325 330 335
Arg Val Asp Asp Trp Glu Met Ala Glu Asp Val Gln Gln Ala Val Lys
340 345 350
Asp Leu Trp Ser Gln Val Ser Thr Ala Asn Leu Lys Asp Ile Ser Asp
355 360 365
Phe Ala Gly Tyr Gln Thr Glu Phe Leu Arg Leu Phe Gly Phe Gly Ile
370 375 380
Asp Gly Val Asp Tyr Asp Gln Pro Val Asp Val Glu Ala Asp Leu Pro
385 390 395 400
Ser Ala Ala Gln Gln
405
<210>8
<211>397
<212>PRT
<213>嗜水气单胞菌(A.hydrophila)
<400>8
Met Ile Ile Lys Pro Lys Val Arg Gly Phe Ile Cys Thr Thr Thr His
1 5 10 15
Pro Val Gly Cys Glu Ala Asn Val Arg Arg Gln Ile Ala Tyr Thr Lys
20 25 30
Ala Lys Gly Thr Ile Glu Asn Gly Pro Lys Lys Val Leu Val Ile Gly
35 40 45
Ala Ser Thr Gly Tyr Gly Leu Ala Ser Arg Ile Ala Ala Ala Phe Gly
50 55 60
Ser Gly Ala Ala Thr Leu Gly Val Phe Phe Glu Lys Ala Gly Ser Glu
65 70 75 80
Thr Lys Thr Ala Thr Ala Gly Trp Tyr Asn Ser Ala Ala Phe Asp Lys
85 90 95
Ala Ala Lys Glu Ala Gly Leu Tyr Ala Lys Ser Ile Asn Gly Asp Ala
100 105 110
Phe Ser Asn Glu Cys Arg Ala Lys Val Ile Glu Leu Ile Lys Gln Asp
115 120 125
Leu Gly Gln Ile Asp Leu Val Val Tyr Ser Leu Ala Ser Pro Val Arg
130 135 140
Lys Leu Pro Asp Thr Gly Glu Val Val Arg Ser Ala Leu Lys Pro Ile
145 150 155 160
Gly Glu Val Tyr Thr Thr Thr Ala Ile Asp Thr Asn Lys Asp Gln Ile
165 170 175
Ile Thr Ala Thr Val Glu Pro Ala Asn Glu Glu Glu Ile Gln Asn Thr
180 185 190
Ile Thr Val Met Gly Gly Gln Asp Trp Glu Leu Trp Met Ala Ala Leu
195 200 205
Arg Asp Ala Gly Val Leu Ala Asp Gly Ala Lys Ser ValAla Tyr Ser
210 215 220
Tyr Ile Gly Thr Asp Leu Thr Trp Pro Ile Tyr Trp His Gly Thr Leu
225 230 235 240
Gly Arg Ala Lys Glu Asp Leu Asp Arg Ala Ala Ala Ala Ile Arg Gly
245 250 255
Asp Leu Ala Gly Lys Gly Gly Thr Ala His Val Ala Val Leu Lys Ser
260 265 270
Val Val Thr Gln Ala Ser Ser Ala Ile Pro Val Met Pro Leu Tyr Ile
275 280 285
Ser Met Ala Phe Lys Ile Met Lys Glu Lys Gly Ile His Glu Gly Cys
290 295 300
Met Glu Gln Val Asp Arg Met Met Arg Thr Arg Leu Tyr Ala Ala Asp
305 310 315 320
Met Ala Leu Asp Asp Gln Ala Arg Ile Arg Met Asp Asp Trp Glu Leu
325 330 335
Arg Glu Asp Val Gln Gln Thr Cys Arg Asp Leu Trp Pro Ser Ile Thr
340 345 350
Ser Glu Asn Leu Cys Glu Leu Thr Asp Tyr Thr Gly Tyr Lys Gln Glu
355 360 365
Phe Leu Arg Leu Phe Gly Phe Gly Leu Glu Glu Val Asp Tyr Asp Ala
370 375 380
Asp Val Asn Pro Asp Val Lys Phe Asp Val Val Glu Leu
385 390 395
<210>9
<211>318
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)
<400>9
Met Asn Leu Leu Asn Leu Phe Thr Tyr Val Ile Pro Ile Ala Ile Cys
1 5 10 15
Ile Ile Leu Pro Ile Phe Ile Ile Val Thr His Phe Gln Ile Lys Ser
20 25 30
Leu Asn Lys Ala Val Thr Ser Phe Asn Lys Gly Asp Arg Ser Asn Ala
35 40 45
Leu Glu Ile Leu Ser Lys Leu Val Lys Ser Pro Ile Lys Asn Val Lys
50 55 60
Ala Asn Ala Tyr Ile Thr Arg Glu Arg Ile Tyr Phe Tyr Ser Arg Asp
65 70 75 80
Phe Glu Leu Ser Leu Arg Asp Leu Leu Gln Ala Ile Lys Leu Arg Pro
85 90 95
Lys Thr Ile Asn Asp Val Tyr Ser Phe Ala Leu Ser Tyr His Ile Leu
100 105 110
Gly Glu Pro Glu Arg Ala Leu Lys Tyr Phe Leu Arg Ala Val Glu Leu
115 120 125
Gln Pro Asn Val Gly Ile Ser Tyr Glu Asn Leu Ala Trp Phe Tyr Tyr
130 135 140
Leu Thr Gly Lys Tyr Asp Lys Ala Ile Glu Asn Phe Glu Lys Ala Ile
145 150 155 160
Ser Met Gly Ser Thr Asn Ser Val Tyr Arg Ser Leu Gly Ile Thr Tyr
165 170 175
Ala Lys Ile Gly Asp Tyr Lys Lys Ser Glu Glu Tyr Leu Lys Lys Ala
180 185 190
Leu Asp Ala Glu Pro Glu Lys Pro Ser Thr His Ile Tyr Phe Ser Tyr
195 200 205
Leu Lys Arg Lys Thr Asn Asp Ile Lys Leu Ala Lys Glu Tyr Ala Leu
210 215 220
Lys Ala Ile Glu Leu Asn Lys Asn Asn Phe Asp Gly Tyr Lys Asn Leu
225 230 235 240
Ala Glu Val Asn Leu Ala Glu Asp Asp Tyr Asp Gly Phe Tyr Lys Asn
245 250 255
Leu Glu Ile Phe Leu Glu Lys Ile Asn Phe Val Thr Asn Gly Glu Asp
260 265 270
Phe Asn Asp Glu Val Tyr Asp Lys Val Lys Asp Asn Glu Lys Phe Lys
275 280 285
Glu Leu Ile Ala Lys Thr Lys Val Ile Lys Phe Lys Asp Leu Gly Ile
290 295 300
Glu Ile Asp Asp Lys Lys Ile Leu Asn Gly Lys Phe Leu Val
305 310 315
<210>10
<211>389
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)ATCC 824
<400>10
Met Leu Ser Phe Asp Tyr Ser Ile Pro Thr Lys Val Phe Phe Gly Lys
1 5 10 15
Gly Lys Ile Asp Val Ile Gly Glu Glu Ile Lys Lys Tyr Gly Ser Arg
20 25 30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
35 40 45
Asp Arg Ala Thr Ala Ile Leu Lys Glu Asn Asn Ile Ala Phe Tyr Glu
50 55 60
Leu Ser Gly Val Glu Pro Asn Pro Arg Ile Thr Thr Val Lys Lys Gly
65 70 75 80
Ile Glu Ile Cys Arg Glu Asn Asn Val Asp Leu Val Leu Ala Ile Gly
85 90 95
Gly Gly Ser Ala Ile Asp Cys Ser Lys Val Ile Ala Ala Gly Val Tyr
100 105 110
Tyr Asp Gly Asp Thr Trp Asp Met Val Lys Asp Pro Ser Lys Ile Thr
115 120 125
Lys Val Leu Pro Ile Ala Ser Ile Leu Thr Leu Ser Ala Thr Gly Ser
130 135 140
Glu Met Asp Gln Ile Ala Val Ile Ser Asn Met Glu Thr Asn Glu Lys
145 150 155 160
Leu Gly Val Gly His Asp Asp Met Arg Pro Lys Phe Ser Val Leu Asp
165 170 175
Pro Thr Tyr Thr Phe Thr Val Pro Lys Asn Gln Thr Ala Ala Gly Thr
180 185 190
Ala Asp Ile Met Ser His Thr Phe Glu Ser Tyr Phe Ser Gly Val Glu
195 200 205
Gly Ala Tyr Val Gln Asp Gly Ile Arg Glu Ala Ile Leu Arg Thr Cys
210 215 220
Ile Lys Tyr Gly Lys Ile Ala Met Glu Lys Thr Asp Asp Tyr Glu Ala
225 230 235 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
245 250 255
Ser Leu Gly Lys Asp Arg Lys Trp Ser Cys His Pro Met Glu His Glu
260 265 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
275 280 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asp Asp Thr Leu His Lys
290 295 300
Phe Val Ser Tyr Gly Ile Asn Val Trp Gly Ile Asp Lys Asn Lys Asp
305 310 315 320
Asn Tyr Glu Ile Ala Arg Glu Ala Ile Lys Asn Thr Arg Glu Tyr Phe
325 330 335
Asn Ser Leu Gly Ile Pro Ser Lys Leu Arg Glu Val Gly Ile Gly Lys
340 345 350
Asp Lys Leu Glu Leu Met Ala Lys Gln Ala Val Arg Asn Ser Gly Gly
355 360 365
Thr Ile Gly Ser Leu Arg Pro Ile Asn Ala Glu Asp Val Leu Glu Ile
370 375 380
Phe Lys Lys Ser Tyr
385
<210>11
<211>390
<212>PRT
<213>丙酮丁醇梭菌(Clostridium acetobutylicum)ATCC 824
<400>11
Met Val Asp Phe Glu Tyr Ser Ile Pro Thr Arg Ile Phe Phe Gly Lys
1 5 10 15
Asp Lys lle Asn Val Leu Gly Arg Glu Leu Lys Lys Tyr Gly Ser Lys
20 25 30
Val Leu Ile Val Tyr Gly Gly Gly Ser Ile Lys Arg Asn Gly Ile Tyr
35 40 45
Asp Lys Ala Val Ser Ile Leu Glu Lys Asn Ser Ile Lys Phe Tyr Glu
50 55 60
Leu Ala Gly Val Glu Pro Asn Pro Arg Val Thr Thr Val Glu Lys Gly
65 70 75 80
Val Lys Ile Cys Arg Glu Asn Gly Val Glu Val Val Leu Ala Ile Gly
85 90 95
Gly Gly Ser Ala Ile Asp Cys Ala Lys Val Ile Ala Ala Ala Cys Glu
100 105 110
Tyr Asp Gly Asn Pro Trp Asp Ile Val Leu Asp Gly Ser Lys Ile Lys
115 120 125
Arg Val Leu Pro Ile Ala Ser Ile Leu Thr Ile Ala Ala Thr Gly Ser
130 135 140
Glu Met Asp Thr Trp Ala Val Ile Asn Asn Met Asp Thr Asn Glu Lys
145 150 155 160
Leu Ile Ala Ala His Pro Asp Met Ala Pro Lys Phe Ser Ile Leu Asp
165 170 175
Pro Thr Tyr Thr Tyr Thr Val Pro Thr Asn Gln Thr Ala Ala Gly Thr
180 185 190
Ala Asp Ile Met Ser His Ile Phe Glu Val Tyr Phe Ser Asn Thr Lys
195 200 205
Thr Ala Tyr Leu Gln Asp Arg Met Ala Glu Ala Leu Leu Arg Thr Cys
210 215 220
Ile Lys Tyr Gly Gly Ile Ala Leu Glu Lys Pro Asp Asp Tyr Glu Ala
225 230 235 240
Arg Ala Asn Leu Met Trp Ala Ser Ser Leu Ala Ile Asn Gly Leu Leu
245 250 255
Thr Tyr Gly Lys Asp Thr Asn Trp Ser Val His Leu Met Glu His Glu
260 265 270
Leu Ser Ala Tyr Tyr Asp Ile Thr His Gly Val Gly Leu Ala Ile Leu
275 280 285
Thr Pro Asn Trp Met Glu Tyr Ile Leu Asn Asn Asp Thr Val Tyr Lys
290 295 300
Phe Val Glu Tyr Gly Val Asn Val Trp Gly Ile Asp Lys Glu Lys Asn
305 310 315 320
His Tyr Asp Ile Ala His Gln Ala Ile Gln Lys Thr Arg Asp Tyr Phe
325 330 335
Val Asn Val Leu Gly Leu Pro Ser Arg Leu Arg Asp Val Gly Ile Glu
340 345 350
Glu Glu Lys Leu Asp Ile Met Ala Lys Glu Ser Val Lys Leu Thr Gly
355 360 365
Gly Thr Ile Gly Asn Leu Arg Pro Val Asn Ala Ser Glu Val Leu Gln
370 375 380
Ile Phe Lys Lys Ser Val
385 390
<210>12
<211>552
<212>PRT
<213>弗氏柠檬酸杆菌(Citrobacter freundii)
<400>12
Met Ser Gln Phe Phe Phe Asn Gln Arg Thr His Leu Val Ser Asp Val
1 5 10 15
Ile Asp Gly Thr Ile Ile Ala Ser Pro Trp Asn Asn Leu Ala Arg Leu
20 25 30
Glu Ser Asp Pro Ala Ile Arg Ile Val Val Arg Arg Asp Leu Asn Lys
35 40 45
Asn Asn Val Ala Val Ile Ser Gly Gly Gly Ser Gly His Glu Pro Ala
50 55 60
His Val Gly Phe Ile Gly Lys Gly Met Leu Thr Ala Ala Val Cys Gly
65 70 75 80
Asp Val Phe Ala Ser Pro Ser Val Asp Ala Val Leu Thr Ala Ile Gln
85 90 95
Ala Val Thr Gly Glu Ala Gly Cys Leu Leu Ile Val Lys Asn Tyr Thr
100 105 110
Gly Asp Arg Leu Asn Phe Gly Leu Ala Ala Glu Lys Ala Arg Arg Leu
115 120 125
Gly Tyr Asn Val Glu Met Leu Ile Val Gly Asp Asp Ile Ser Leu Pro
130 135 140
Asp Asn Lys His Pro Arg Gly Ile Ala Gly Thr Ile Leu Val His Lys
145 150 155 160
Ile Ala Gly Tyr Phe Ala Glu Arg Gly Tyr Asn Leu Ala Thr Val Leu
165 170 175
Arg Glu Ala Gln Tyr Ala Ala Asn Asn Thr Phe Ser Leu Gly Val Ala
180 185 190
Leu Ser Ser Cys His Leu Pro Gln Glu Ala Asp Ala Ala Pro Arg His
195 200 205
His Pro Gly His Ala Glu Leu Gly Met Gly Ile His Gly Glu Pro Gly
210 215 220
Ala Ser Val Ile Asp Thr Gln Asn Ser Ala Gln Val Val Asn Leu Met
225 230 235 240
Val Asp Lys Leu Met Ala Ala Leu Pro Glu Thr Gly Arg Leu Ala Val
245 250 255
Met Ile Asn Asn Leu Gly Gly Val Ser Val Ala Glu Met Ala Ile Ile
260 265 270
Thr Arg Glu Leu Ala Ser Ser Pro Leu His Pro Arg Ile Asp Trp Leu
275 280 285
Ile Gly Pro Ala Ser Leu Val Thr Ala Leu Asp Met Lys Ser Phe Ser
290 295 300
Leu Thr Ala Ile Val Leu Glu Glu Ser Ile Glu Lys Ala Leu Leu Thr
305 310 315 320
Glu Val Glu Thr Ser Asn Trp Pro Thr Pro Val Pro Pro Arg Glu Ile
325 330 335
Ser Cys Val Pro Ser Ser Gln Arg Ser Ala Arg Val Glu Phe Gln Pro
340 345 350
Ser Ala Asn Ala Met Val Ala Gly Ile Val Glu Leu Val Thr Thr Thr
355 360 365
Leu Ser Asp Leu Glu Thr His Leu Asn Ala Leu Asp Ala Lys Val Gly
370 375 380
Asp Gly Asp Thr Gly Ser Thr Phe Ala Ala Gly Ala Arg Glu Ile Ala
385 390 395 400
Ser Leu Leu His Arg Gln Gln Leu Pro Leu Asp Asn Leu Ala Thr Leu
405 410 415
Phe Ala Leu Ile Gly Glu Arg Leu Thr Val Val Met Gly Gly Ser Ser
420 425 430
Gly Val Leu Met Ser Ile Phe Phe Thr Ala Ala Gly Gln Lys Leu Glu
435 440 445
GIn Gly Ala Ser Val Ala Glu Ser Leu Asn Thr Gly Leu Ala Gln Met
450 455 460
Lys Phe Tyr Gly Gly Ala Asp Glu Gly Asp Arg Thr Met Ile Asp Ala
465 470 475 480
Leu Gln Pro Ala Leu Thr Ser Leu Leu Thr Gln Pro Gln Asn Leu Gln
485 490 495
Ala Ala Phe Asp Ala Ala Gln Ala Gly Ala Glu Arg Thr Cys Leu Ser
500 505 510
Ser Lys Ala Asn Ala Gly Arg Ala Ser Tyr Leu Ser Ser Glu Ser Leu
515 520 525
Leu Gly Asn Met Asp Pro Gly Ala His Ala Val Ala Met Val Phe Lys
530 535 540
Ala Leu Ala Glu Ser Glu Leu Gly
545 550
<210>13
<211>364
<212>PRT
<213>博伊丁氏假丝酵母(Candida boidinii)
<400>13
Met Lys Ile Val Leu Val Leu Tyr Asp Ala Gly Lys His Ala Ala Asp
1 5 10 15
Glu Glu Lys Leu Tyr Gly Cys Thr Glu Asn Lys Leu Gly Ile Ala Asn
20 25 30
Trp Leu Lys Asp Gln Gly His Glu Leu Ile Thr Thr Ser Asp Lys Glu
35 40 45
Gly Glu Thr Ser Glu Leu Asp Lys His Ile Pro Asp Ala Asp Ile Ile
50 55 60
Ile Thr Thr Pro Phe His Pro Ala Tyr Ile Thr Lys Glu Arg Leu Asp
65 70 75 80
Lys Ala Lys Asn Leu Lys Leu Val Val Val Ala Gly Val Gly Ser Asp
85 90 95
His Ile Asp Leu Asp Tyr Ile Asn Gln Thr Gly Lys Lys Ile Ser Val
100 105 110
Leu Glu Val Thr Gly Ser Asn Val Val Ser Val Ala Glu His Val Val
115 120 125
Met Thr Met Leu Val Leu Val Arg Asn Phe Val Pro Ala His Glu Gln
130 135 140
Ile Ile Asn His Asp Trp Glu Val Ala Ala Ile Ala Lys Asp Ala Tyr
145 150 155 160
Asp Ile Glu Gly Lys Thr Ile Ala Thr Ile Gly Ala Gly Arg Ile Gly
165 170 175
Tyr Arg Val Leu Glu Arg Leu Leu Pro Phe Asn Pro Lys Glu Leu Leu
180 185 190
Tyr Tyr Asp Tyr Gln Ala Leu Pro Lys Glu Ala Glu Glu Lys Val Gly
195 200 205
Ala Arg Arg Val Glu Asn Ile Glu Glu Leu Val Ala Gln Ala Asp Ile
210 215 220
Val Thr Val Asn Ala Pro Leu His Ala Gly Thr Lys Gly Leu Ile Asn
225 230 235 240
Lys Glu Leu Leu Ser Lys Phe Lys Lys Gly Ala Trp Leu Val Asn Thr
245 250 255
Ala Arg Gly Ala Ile Cys Val Ala Glu Asp Val Ala Ala Ala Leu Glu
260 265 270
Ser Gly Gln Leu Arg Gly Tyr Gly Gly Asp Val Trp Phe Pro Gln Pro
275 280 285
Ala Pro Lys Asp His Pro Trp Arg Asp Met Arg Asn Lys Tyr Gly Ala
290 295 300
Gly Asn Ala Met Thr Pro His Tyr Ser Gly Thr Thr Leu Asp Ala Gln
305 310 315 320
Thr Arg Tyr Ala Glu Gly Thr Lys Asn Ile Leu Glu Ser Phe Phe Thr
325 330 335
Gly Lys Phe Asp Tyr Arg Pro Gln Asp Ile Ile Leu Leu Asn Gly Glu
340 345 350
Tyr Val Thr Lys Ala Tyr Gly Lys His Asp Lys Lys
355 360
<210>14
<211>549
<212>PRT
<213>肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400>14
Met Ser Gln Phe Phe Phe Asn Gln Arg Ala Ser Leu Val Asn Asp Val
1 5 10 15
Ile Glu Gly Thr Ile Ile Ala Ser Pro Trp Asn Asn Leu Ala Arg Leu
20 25 30
Glu Ser Asp Pro Ala Ile Arg Val Val Val Arg Arg Asp Leu Asn Lys
35 40 45
Asn Asn Val Ala Val Ile Ser Gly Gly Gly Ala Gly His Glu Pro Ala
50 55 60
His Val Gly Phe Ile Gly Lys Gly Met Leu Thr Ala Ala Val Cys Gly
65 70 75 80
Asp Leu Phe Ala Ser Pro Ser Val Asp Ala Val Leu Thr Ala Ile Gln
85 90 95
Ala Val Thr Gly Glu Ala Gly Cys Leu Leu Ile Val Lys Asn Tyr Thr
100 105 110
Gly Asp Arg Leu Asn Phe Gly Leu Ala Ala Glu Lys Ala Arg Arg Leu
115 120 125
Gly Tyr Asn Val Glu Met Leu Ile Val Gly Asp Asp Ile Ser Leu Pro
130 135 140
Asp Asn Lys Gln Pro Arg Gly Ile Ala Gly Thr Ile Leu Val His Lys
145 150 155 160
Val Ala Gly Tyr Phe Ala Glu Arg Gly Phe Asn Leu Ala Thr Val Leu
165 170 175
Arg Glu Ala Gln Tyr Ala Ala Ser His Thr Ala Ser Ile Gly Val Ala
180 185 190
Leu Ala Ser Cys His Leu Pro Gln Glu Ala Asp Ser Ala Pro Arg His
195 200 205
Gln Ala Gly His Ala Glu Leu Gly Met Gly Ile His Gly Glu Pro Gly
210 215 220
Ala Ser Thr Ile Ala Thr Gln Asn Ser Ala Glu Ile Val Asn Leu Met
225 230 235 240
Val Glu Lys Leu Thr Ala Ala Leu Pro Glu Thr Gly Arg Leu Ala Val
245 250 255
Met Leu Asn Asn Leu Gly Gly Val Ser Val Ala Glu Met Ala Ile Leu
260 265 270
Thr Arg Glu Leu Ala Asn Thr Pro Leu Gln Ala Arg Ile Asp Trp Leu
275 280 285
Ile Gly Pro Ala Ser Leu Val Thr Ala Leu Asp Met Lys Gly Phe Ser
290 295 300
Leu Thr Ala Ile Val Leu Glu Glu Ser Ile Glu Lys Ala Leu Leu Ser
305 310 315 320
Asp Val Glu Thr Ala Ser Trp Gln Lys Pro Val Gln Pro Arg Thr Ile
325 330 335
Asn Ala Val Pro Ser Thr Leu Asp Ser Ala Arg Val Asp Phe Thr Pro
340 345 350
Ser Ala Asn Pro Gln Val Gly Asp Tyr Val Ala Gln Val Thr Gly Ala
355 360 365
Leu Ile Asp Leu Glu Glu His Leu Asn Ala Leu Asp Ala Lys Val Gly
370 375 380
Asp Gly Asp Thr Gly Ser Thr Phe Ala Ala Gly Ala Arg Glu Ile Ala
385 390 395 400
Glu Arg Leu Glu Arg Gln Gln Leu Pro Leu Asn Asp Leu Pro Thr Leu
405 410 415
Phe Ala Leu Ile Gly Glu Arg Leu Thr Val Val Met Gly Gly Ser Ser
420 425 430
Gly Val Leu Met Ser Ile Phe Phe Thr Ala Ala Gly Gln Lys Leu Gly
435 440 445
Gln Gly Ala Ser Val Ala Glu Ala Leu Asn Ala Gly Leu Glu Gln Met
450 455 460
Lys Phe Tyr Gly Gly Ala Asp Glu Gly Asp Arg Thr Met Ile Asp Ala
465 470 475 480
Leu Gln Pro Ala Leu Ala Ala Leu Leu Ala Glu Pro Glu Asn Leu Gln
485 490 495
Ala Ala Phe Ala Ala Ala Gln Ala Gly Ala Asp Arg Thr Cys Gln Ser
500 505 510
Ser Lys Ala Gly Ala Gly Arg Ala Ser Tyr Leu Asn Ser Asp Ser Leu
515 520 525
Leu Gly Asn Met Asp Pro Gly Ala His Ala Val Ala Met Val Phe Lys
530 535 540
Ala Leu Ala Glu Arg
545
<210>15
<211>584
<212>PRT
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>15
Met Ser Ala Lys Ser Phe Glu Val Thr Asp Pro Val Asn Ser Ser Leu
1 5 10 15
Lys Gly Phe Ala Leu Ala Asn Pro Ser Ile Thr Leu Val Pro Glu Glu
20 25 30
Lys Ile Leu Phe Arg Lys Thr Asp Ser Asp Lys Ile Ala Leu Ile Ser
35 40 45
Gly Gly Gly Ser Gly His Glu Pro Thr His Ala Gly Phe Ile Gly Lys
50 55 60
Gly Met Leu Ser Gly Ala Val ValGly Glu Ile Phe Ala Ser Pro Ser
65 70 75 80
Thr Lys Gln Ile Leu Asn Ala Ile Arg Leu Val Asn Glu Asn Ala Ser
85 90 95
Gly Val Leu Leu Ile Val Lys Asn Tyr Thr Gly Asp Val Leu His Phe
100 105 110
Gly Leu Ser Ala Glu Arg Ala Arg Ala Leu Gly Ile Asn Cys Arg Val
115 120 125
Ala Val Ile Gly Asp Asp Val Ala Val Gly Arg Glu Lys Gly Gly Met
130 135 140
Val Gly Arg Arg Ala Leu Ala Gly Thr Val Leu Val His Lys Ile Val
145 150 155 160
Gly Ala Phe Ala Glu Glu Tyr Ser Ser Lys Tyr Gly Leu Asp Gly Thr
165 170 175
Ala Lys Val Ala Lys Ile Ile Asn Asp Asn Leu Val Thr Ile Gly Ser
180 185 190
Ser Leu Asp His Cys Lys Val Pro Gly Arg Lys Phe Glu Ser Glu Leu
195 200 205
Asn Glu Lys Gln Met Glu Leu Gly Met Gly Ile His Asn Glu Pro Gly
210 215 220
Val Lys Val Leu Asp Pro Ile Pro Ser Thr Glu Asp Leu Ile Ser Lys
225 230 235 240
Tyr Met Leu Pro Lys Leu Leu Asp Pro Asn Asp Lys Asp Arg Ala Phe
245 250 255
Val Lys Phe Asp Glu Asp Asp Glu Val Val Leu Leu Val Asn Asn Leu
260 265 270
Gly Gly Val Ser Asn Phe Val Ile Ser Ser Ile Thr Ser Lys Thr Thr
275 280 285
Asp Phe Leu Lys Glu Asn Tyr Asn Ile Thr Pro Val Gln Thr Ile Ala
290 295 300
Gly Thr Leu Met Thr Ser Phe Asn Gly Asn Gly Phe Ser Ile Thr Leu
305 310 315 320
Leu Asn Ala Thr Lys Ala Thr Lys Ala Leu Gln Ser Asp Phe Glu Glu
325 330 335
Ile Lys Ser Val Leu Asp Leu Leu Asn Ala Phe Thr Asn Ala Pro Gly
340 345 350
Trp Pro Ile Ala Asp Phe Glu Lys Thr Ser Ala Pro Ser Val Asn Asp
355 360 365
Asp Leu Leu His Asn Glu Val Thr Ala Lys Ala Val Gly Thr Tyr Asp
370 375 380
Phe Asp Lys Phe Ala Glu Trp Met Lys Ser Gly Ala Glu Gln Val Ile
385 390 395 400
Lys Ser Glu Pro His Ile Thr Glu Leu Asp Asn Gln Val Gly Asp Gly
405 410 415
Asp Cys Gly Tyr Thr Leu Val Ala Gly Val Lys Gly Ile Thr Glu Asn
420 425 430
Leu Asp Lys Leu Ser Lys Asp Ser Leu Ser Gln Ala Val Ala Gln Ile
435 440 445
Ser Asp Phe Ile Glu Gly Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
450 455 460
Ser Ile Leu Leu Ser Gly Phe Ser His Gly Leu Ile Gln Val Cys Lys
465 470 475 480
Ser Lys Asp Glu Pro Val Thr Lys Glu Ile ValAla Lys Ser Leu Gly
485 490 495
Ile Ala Leu Asp Thr Leu Tyr Lys Tyr Thr Lys Ala Arg Lys Gly Ser
500 505 510
Ser Thr Met Ile Asp Ala Leu Glu Pro Phe Val Lys Glu Phe Thr Ala
515 520 525
Ser Lys Asp Phe Asn Lys Ala Val Lys Ala Ala Glu Glu Gly Ala Lys
530 535 540
Ser Thr Ala Thr Phe Glu Ala Lys Phe Gly Arg Ala Ser Tyr Val Gly
545 550 555 560
Asp Ser Ser Gln Val Glu Asp Pro Gly Ala Val Gly Leu Cys Glu Phe
565 570 575
Leu Lys Gly Val Gln Ser Ala Leu
580
<210>16
<211>591
<212>PRT
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>16
Met Ser His Lys Gln Phe Lys Ser Asp Gly Asn Ile Val Thr Pro Tyr
1 5 10 15
Leu Leu Gly Leu Ala Arg Ser Asn Pro Gly Leu Thr Val Ile Lys His
20 25 30
Asp Arg Val Val Phe Arg Thr Ala Ser Ala Pro Asn Ser Gly Asn Pro
35 40 45
Pro Lys Val Ser Leu Val Ser Gly Gly Gly Ser Gly His Glu Pro Thr
50 55 60
His Ala Gly Phe Val Gly Glu Gly Ala Leu Asp Ala Ile Ala Ala Gly
65 70 75 80
Ala Ile Phe Ala Ser Pro Ser Thr Lys Gln Ile Tyr Ser Ala Ile Lys
85 90 95
Ala Val Glu Ser Pro Lys Gly Thr Leu Ile Ile Val Lys Asn Tyr Thr
100 105 110
Gly Asp Ile Ile His Phe Gly Leu Ala Ala Glu Arg Ala Lys Ala Ala
115 120 125
Gly Met Lys Val Glu Leu Val Ala Val Gly Asp Asp Val Ser Val Gly
130 135 140
Lys Lys Lys Gly Ser Leu Val Gly Arg Arg Gly Leu Gly Ala Thr Val
145 150 155 160
Leu Val His Lys Ile Ala Gly Ala Ala Ala Ser His Gly Leu Glu Leu
165 170 175
Ala Glu Val Ala Glu Val Ala Gln Ser Val Val Asp Asn Ser Val Thr
180 185 190
Ile Ala Ala Ser Leu Asp His Cys Thr Val Pro Gly His Lys Pro Glu
195 200 205
Ala Ile Leu Gly Glu Asn Glu Tyr Glu Ile Gly Met Gly Ile His Asn
210 215 220
Glu Ser Gly Thr Tyr Lys Ser Ser Pro Leu Pro Ser Ile Ser Glu Leu
225 230 235 240
Val Ser Gln Met Leu Pro Leu Leu Leu Asp Glu Asp Glu Asp Arg Ser
245 250 255
Tyr Val Lys Phe Glu Pro Lys Glu Asp Val Val Leu Met Val Asn Asn
260 265 270
Met Gly Gly Met Ser Asn Leu Glu Leu Gly Tyr Ala Ala Glu Val Ile
275 280 285
Ser Glu Gln Leu Ile Asp Lys Tyr Gln Ile Val Pro Lys Arg Thr Ile
290 295 300
Thr Gly Ala Phe Ile Thr Ala Leu Asn Gly Pro Gly Phe Gly Ile Thr
305 310 315 320
Leu Met Asn Ala Ser Lys Ala Gly Gly Asp Ile Leu Lys Tyr Phe Asp
325 330 335
Tyr Pro Thr Thr Ala Ser Gly Trp Asn Gln Met Tyr His Ser Ala Lys
340 345 350
Asp Trp Glu Val Leu Ala Lys Gly Gln Val Pro Thr Ala Pro Ser Leu
355 360 365
Lys Thr Leu Arg Asn Glu Lys Gly Ser Gly Val Lys Ala Asp Tyr Asp
370 375 380
Thr Phe Ala Lys Ile Leu Leu Ala Gly Ile Ala Lys Ile Asn Glu Val
385 390 395 400
Glu Pro Lys Val Thr Trp Tyr Asp Thr Ile Ala Gly Asp Gly Asp Cys
405 410 415
Gly Thr Thr Leu Val Ser Gly Gly Glu Ala Leu Glu Glu Ala Ile Lys
420 425 430
Asn His Thr Leu Arg Leu Glu Asp Ala Ala Leu Gly Ile Glu Asp Ile
435 440 445
Ala Tyr Met Val Glu Asp Ser Met Gly Gly Thr Ser Gly Gly Leu Tyr
450 455 460
Ser Ile Tyr Leu Ser Ala Leu Ala Gln Gly Val Arg Asp Ser Gly Asp
465 470 475 480
Lys Glu Leu Thr Ala Glu Thr Phe Lys Lys Ala Ser Asn Val Ala Leu
485 490 495
Asp Ala Leu Tyr Lys Tyr Thr Arg Ala Arg Pro Gly Tyr Arg Thr Leu
500 505 510
Ile Asp Ala Leu Gln Pro Phe Val Glu Ala Leu Lys Ala Gly Lys Gly
515 520 525
Pro Arg Ala Ala Ala Gln Ala Ala Tyr Asp Gly Ala Glu Lys Thr Arg
530 535 540
Lys Met Asp Ala Leu Val Gly Arg Ala Ser Tyr Val Ala Lys Glu Glu
545 550 555 560
Leu Arg Lys Leu Asp Ser Glu Gly Gly Leu Pro Asp Pro Gly Ala Val
565 570 575
Gly Leu Ala Ala Leu Leu Asp Gly Phe Val Thr Ala Ala Gly Tyr
580 585 590
<210>17
<211>2253
<212>DNA
<213>pGV772
<400>17
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac 60
atcagcagga cgcactgacc gaattcatta aagaggagaa aggtaccggg ccccccctcg 120
aggtcgacgg tatcgataag cttgatatcg aattcctgca gcccggggga tcccatggta 180
cgcgtgctag aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 240
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgc cctagaccta 300
ggcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 360
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 420
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 480
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 540
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 600
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 660
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 720
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 780
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 840
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 900
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 960
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 1020
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 1080
gaaaactcac gttaagggat tttggtcatg actagtgctt ggattctcac caataaaaaa 1140
cgcccggcgg caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg 1200
atctatcaac aggagtccaa gcgagctctc gaaccccaga gtcccgctca gaagaactcg 1260
tcaagaaggc gatagaaggc gatgcgctgc gaatcgggag cggcgatacc gtaaagcacg 1320
aggaagcggt cagcccattc gccgccaagc tcttcagcaa tatcacgggt agccaacgct 1380
atgtcctgat agcggtccgc cacacccagc cggccacagt cgatgaatcc agaaaagcgg 1440
ccattttcca ccatgatatt cggcaagcag gcatcgccat gggtcacgac gagatcctcg 1500
ccgtcgggca tgcgcgcctt gagcctggcg aacagttcgg ctggcgcgag cccctgatgc 1560
tcttcgtcca gatcatcctg atcgacaaga ccggcttcca tccgagtacg tgctcgctcg 1620
atgcgatgtt tcgcttggtg gtcgaatggg caggtagccg gatcaagcgt atgcagccgc 1680
cgcattgcat cagccatgat ggatactttc tcggcaggag caaggtgaga tgacaggaga 1740
tcctgccccg gcacttcgcc caatagcagc cagtcccttc ccgcttcagt gacaacgtcg 1800
agcacagctg cgcaaggaac gcccgtcgtg gccagccacg atagccgcgc tgcctcgtcc 1860
tgcagttcat tcagggcacc ggacaggtcg gtcttgacaa aaagaaccgg gcgcccctgc 1920
gctgacagcc ggaacacggc ggcatcagag cagccgattg tctgttgtgc ccagtcatag 1980
ccgaatagcc tctccaccca agcggccgga gaacctgcgt gcaatccatc ttgttcaatc 2040
atgcgaaacg atcctcatcc tgtctcttga tcagatcttg atcccctgcg ccatcagatc 2100
cttggcggca agaaagccat ccagtttact ttgcagggct tcccaacctt accagagggc 2160
gccccagctg gcaattccga cgtctaagaa accattatta tcatgacatt aacctataaa 2220
aataggcgta tcacgaggcc ctttcgtctt cac 2253
<210>18
<211>3068
<212>DNA
<213>pGV1010
<400>18
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa 1080
gaggagaaag gtaccatgtc agttttcgtt tcaggtgcta acgggttcat tgcccaacac 1140
attgtcgatc tcctgttgaa ggaagactat aaggtcatcg gttctgccag aagtcaagaa 1200
aaggccgaga atttaacgga ggcctttggt aacaacccaa aattctccat ggaagttgtc 1260
ccagacatat ctaagctgga cgcatttgac catgttttcc aaaagcacgg caaggatatc 1320
aagatagttc tacatacggc ctctccattc tgctttgata tcactgacag tgaacgcgat 1380
ttattaattc ctgctgtgaa cggtgttaag ggaattctcc actcaattaa aaaatacgcc 1440
gctgattctg tagaacgtgt agttctcacc tcttcttatg cagctgtgtt cgatatggca 1500
aaagaaaacg ataagtcttt aacatttaac gaagaatcct ggaacccagc tacctgggag 1560
agttgccaaa gtgacccagt taacgcctac tgtggttcta agaagtttgc tgaaaaagca 1620
gcttgggaat ttctagagga gaatagagac tctgtaaaat tcgaattaac tgccgttaac 1680
ccagtttacg tttttggtcc gcaaatgttt gacaaagatg tgaaaaaaca cttgaacaca 1740
tcttgcgaac tcgtcaacag cttgatgcat ttatcaccag aggacaagat accggaacta 1800
tttggtggat acattgatgt tcgtgatgtt gcaaaggctc atttagttgc cttccaaaag 1860
agggaaacaa ttggtcaaag actaatcgta tcggaggcca gatttactat gcaggatgtt 1920
ctcgatatcc ttaacgaaga cttccctgtt ctaaaaggca atattccagt ggggaaacca 1980
ggttctggtg ctacccataa cacccttggt gctactcttg ataataaaaa gagtaagaaa 2040
ttgttaggtt tcaagttcag gaacttgaaa gagaccattg acgacactgc ctcccaaatt 2100
ttaaaatttg agggcagaat ataaggatcc catggtacgc gtgctagagg catcaaataa 2160
aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg tcggtgaacg 2220
ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc ggcgagcggt 2280
atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa 2340
gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc 2400
gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag 2460
gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt 2520
gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg 2580
aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg 2640
ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg 2700
taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac 2760
tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg 2820
gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt 2880
taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg 2940
tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc 3000
tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt 3060
ggtcatga 3068
<210>19
<211>3231
<212>DNA
<213>pGV1035
<400>19
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcttatt 1080
atttaggagg agtaaaacat gagagatgta gtaatagtaa gtgctgtaag aactgcaata 1140
ggagcatatg gaaaaacatt aaaggatgta cctgcaacag agttaggagc tatagtaata 1200
aaggaagctg taagaagagc taatataaat ccaaatgaga ttaatgaagt tatttttgga 1260
aatgtacttc aagctggatt aggccaaaac ccagcaagac aagcagcagt aaaagcagga 1320
ttacctttag aaacacctgc gtttacaatc aataaggttt gtggttcagg tttaagatct 1380
ataagtttag cagctcaaat tataaaagct ggagatgctg ataccattgt agtaggtggt 1440
atggaaaata tgtctagatc accatatttg attaacaatc agagatgggg tcaaagaatg 1500
ggagatagtg aattagttga tgaaatgata aaggatggtt tgtgggatgc atttaatgga 1560
tatcatatgg gagtaactgc agaaaatatt gcagaacaat ggaatataac aagagaagag 1620
caagatgaat tttcacttat gtcacaacaa aaagctgaaa aagccattaa aaatggagaa 1680
tttaaggatg aaatagttcc tgtattaata aagactaaaa aaggtgaaat agtctttgat 1740
caagatgaat ttcctagatt cggaaacact attgaagcat taagaaaact taaacctatt 1800
ttcaaggaaa atggtactgt tacagcaggt aatgcatccg gattaaatga tggagctgca 1860
gcactagtaa taatgagcgc tgataaagct aacgctctcg gaataaaacc acttgctaag 1920
attacttctt acggatcata tggggtagat ccatcaataa tgggatatgg agctttttat 1980
gcaactaaag ctgccttaga taaaattaat ttaaaacctg aagacttaga tttaattgaa 2040
gctaacgagg catatgcttc tcaaagtata gcagtaacta gagatttaaa tttagatatg 2100
agtaaagtta atgttaatgg tggagctata gcacttggac atccaatagg tgcatctggt 2160
gcacgtattt tagtaacatt actatacgct atgcaaaaaa gagattcaaa aaaaggtctt 2220
gctactctat gtattggtgg aggtcaggga acagctctcg tagttgaaag agactaagga 2280
tccgatccga tcccatggta cgcgtgctag aggcatcaaa taaaacgaaa ggctcagtcg 2340
aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct gagtaggaca 2400
aatccgccgc cctagaccta ggcgttcggc tgcggcgagc ggtatcagct cactcaaagg 2460
cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg tgagcaaaag 2520
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 2580
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 2640
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 2700
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 2760
aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 2820
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 2880
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 2940
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 3000
ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 3060
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 3120
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 3180
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg a 3231
<210>20
<211>2908
<212>DNA
<213>pGV1037
<400>20
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgga attcattgat 1080
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggtgcaggt 1140
actatgggtt caggaattgc tcaggcattt gcagctaaag gatttgaagt agtattaaga 1200
gatattaaag atgaatttgt tgatagagga ttagatttta tcaataaaaa tctttctaaa 1260
ttagttaaaa aaggaaagat agaagaagct actaaagttg aaatcttaac tagaatttcc 1320
ggaacagttg accttaatat ggcagctgat tgcgatttag ttatagaagc agctgttgaa 1380
agaatggata ttaaaaagca gatttttgct gacttagaca atatatgcaa gccagaaaca 1440
attcttgcat caaatacatc atcactttca ataacagaag tggcatcagc aactaaaaga 1500
cctgataagg ttataggtat gcatttcttt aatccagctc ctgttatgaa gcttgtagag 1560
gtaataagag gaatagctac atcacaagaa acttttgatg cagttaaaga gacatctata 1620
gcaataggaa aagatcctgt agaagtagca gaagcaccag gatttgttgt aaatagaata 1680
ttaataccaa tgattaatga agcagttggt atattagcag aaggaatagc ttcagtagaa 1740
gacatagata aagctatgaa acttggagct aatcacccaa tgggaccatt agaattaggt 1800
gattttatag gtcttgatat atgtcttgct ataatggatg ttttatactc agaaactgga 1860
gattctaagt atagaccaca tacattactt aagaagtatg taagagcagg atggcttgga 1920
agaaaatcag gaaaaggttt ctacgattat tcaaaataag gatccgatcc catggtacgc 1980
gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 2040
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc 2100
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 2160
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 2220
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 2280
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 2340
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 2400
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 2460
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 2520
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 2580
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2640
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2700
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2760
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2820
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2880
aactcacgtt aagggatttt ggtcatga 2908
<210>21
<211>3285
<212>DNA
<213>pGV1039
<400>21
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttttcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcgctcaa 1080
ttacacaacg gaggtataat aatgggcaaa gaaagtagtt ttagctgtgc atgtcgtaca 1140
gccatcggaa caatgggtgg atctcttagc acaattcctg cagtagattt aggtgctatc 1200
gttatcaaag aggctcttaa ccgcgcaggt gttaaacctg aagatgttga tcacgtatac 1260
atgggatgcg ttattcaggc aggacaggga cagaacgttg ctcgtcaggc ttctatcaag 1320
gctggtcttc ctgtagaagt acctgcagtt acaactaacg ttgtatgtgg ttcaggtctt 1380
aactgtgtta accaggcagc tcagatgatc atggctggag atgctgatat cgttgttgcc 1440
ggtggtatgg aaaacatgtc acttgcacca tttgcacttc ctaatggccg ttacggatat 1500
cgtatgatgt ggccaagcca gagccagggt ggtcttgtag acactatggt taaggatgct 1560
ctttgggatg ctttcaatga ttatcatatg atccagacag cagacaacat ctgcacagag 1620
tggggtctta cacgtgaaga gctcgatgag tttgcagcta agagccagaa caaggcttgt 1680
gcagcaatcg aagctggcgc attcaaggat gagatcgttc ctgtagagat caagaagaag 1740
aaagagacag ttatcttcga tacagatgaa ggcccaagac agggtgttac acctgaatct 1800
ctttcaaagc ttcgtcctat caacaaggat ggattcgtta cagctggtaa cgcttcaggt 1860
atcaacgacg gtgctgcagc actcgtagtt atgtctgaag agaaggctaa ggagctcggc 1920
gttaagccta tggctacatt cgtagctgga gcacttgctg gtgttcgtcc tgaagttatg 1980
ggtatcggtc ctgtagcagc tactcagaag gctatgaaga aggctggtat cgagaacgta 2040
tctgagttcg atatcatcga ggctaacgaa gcattcgcag ctcagtctgt agcagttggt 2100
aaggatcttg gaatcgacgt ccacaagcag ctcaatccta acggtggtgc tatcgctctt 2160
ggacacccag ttggagcttc aggtgctcgt atccttgtta cacttcttca cgagatgcag 2220
aagaaagacg ctaagaaggg tcttgctaca ctttgcatcg gtggcggtat gggatgcgct 2280
actatcgttg agaagtacga ataattaaac tttcagaggg tgtgaaggtc atataagatc 2340
aggatcccat ggtacgcgtg ctagaggcat caaataaaac gaaaggctca gtcgaaagac 2400
tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg 2460
ccgccctaga cctaggcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa 2520
tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc 2580
aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc 2640
ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat 2700
aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc 2760
cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcatagct 2820
cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg 2880
aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc 2940
cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga 3000
ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa 3060
ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta 3120
gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc 3180
agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg 3240
acgctcagtg gaacgaaaac tcacgttaag ggattttggt catga 3285
<210>22
<211>2877
<212>DNA
<213>pGV1040
<400>22
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcccacac 1080
cctcttaata ctgctaataa ttggaggacg aatcaatgag ttttgtttta tatgaacaga 1140
aagataagat cgctgttgta actatcaacc gtccggaagc acttaatgct cttaactcag 1200
cagttctcga tgagcttaat gaagttctcg ataacgttga tcttaataca gttagagcac 1260
tcgttcttac cggtgctgga gataagtctt ttgtagctgg tgctgatatt ggagagatgt 1320
ccacacttac aaaggctgaa ggtgaagctt ttggtaagaa gggtaacgat gtattccgta 1380
agcttgagac acttcctatc cctgtaattg cagctgttaa cggctttgca cttggcggcg 1440
gatgtgagat ctctatgagc tgcgatatcc gtatctgctc agacaacgct atgttcggtc 1500
agcctgaagt tggtcttgga attactcctg gattcggcgg aacacagaga cttgcaagaa 1560
cagttggtgt tggtatggct aaacagctta tctacacagc tcgtaatatc aaagctgacg 1620
aagcacttcg tatcggcctt gtaaacgctg tatacactca ggaagagctt cttcctgcag 1680
ctgagaagct tgcaacaaca atcgctggta acgctcctat agctgttcgt gcttgtaaga 1740
aagctatcaa cgatggtctt cagactgata tcgacagcgc acttgtaatc gaagaaaagc 1800
tctttggttc atgcttcgag tcagaagatc aggtagaagg aatggctaac ttccttcgta 1860
agaaagatga tcctaagaag gttaagcacg tagatttcaa gaatgcttaa tatcgatctt 1920
tgatgtgata ttcggatccc atggtacgcg tgctagaggc atcaaataaa acgaaaggct 1980
cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt 2040
aggacaaatc cgccgcccta gacctaggcg ttcggctgcg gcgagcggta tcagctcact 2100
caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag 2160
caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata 2220
ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc 2280
cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg 2340
ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc 2400
tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg 2460
gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc 2520
ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga 2580
ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg 2640
gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt accttcggaa 2700
aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg 2760
tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt 2820
ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatga 2877
<210>23
<211>2994
<212>DNA
<213>pGV1041
<400>23
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attctacaag 1080
gtgagtatta cagtcaaata atcggggatt aaatagacat atatcattta acggaaaata 1140
atagataaaa tatatctaag gaggatttac aatgaaagta gctgtaattg gtgcaggaac 1200
aatgggttct ggtattgcac aggcattcgc acagtgtgac gctgttgaga cagtttatct 1260
ttgcgatatc aagcaggagt tcgctgatgg cggtaagagc aagatcgaga agaatcttgg 1320
acgtcttgtt aagaaggaaa agatgactca ggaagctgct gatgcaatcg tagcaaaggt 1380
taagacaggt cttaacacaa tcgctacaga tcctgatctc gtagttgagg ctgcacttga 1440
agttatggat atcaagaaag cttgcttcaa ggaacttcag gagaacatcg ttaagaatcc 1500
tgattgtatc tatgcttcaa acacatcatc tctttcaatc acagagatcg gtgcaggtct 1560
taagactcct atcatcggaa tgcacttgtt caacccagct cctgttatga agctcatcga 1620
ggttatctca ggcgctaaca cacctaagga gacaacagag aaggttatcg agatctccaa 1680
gactcttggt aagacacctg tacaggttaa cgaggctcct ggattcgttg ttaaccgtat 1740
tcttattcca cttatcaacg aaggtatctt cgtatattca gaaggaattt ctgatatcga 1800
aggcatcgat acagctatga agcttggatg taaccatcct atgggacccc ttgaactggg 1860
tgactatgta ggtcttgata tcgttcttgc tatcatggat gtactttaca atgagactaa 1920
ggattccaag tatcgtgcat gcggactcct tcgtaagatg gttcgtgcag gtcaccttgg 1980
cgttaagtca ggaatcggtt tctacaagta caacgaagac agaacaaaga ctcctgttga 2040
caagctttaa ggatcccatg gtacgcgtgc tagaggcatc aaataaaacg aaaggctcag 2100
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 2160
acaaatccgc cgccctagac ctaggcgttc ggctgcggcg agcggtatca gctcactcaa 2220
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 2280
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 2340
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 2400
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 2460
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 2520
ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 2580
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 2640
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 2700
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 2760
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 2820
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 2880
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 2940
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga 2994
<210>24
<211>2855
<212>DNA
<213>pGV1049
<400>24
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcattaaag 1080
aggagaaagg taccaaaata agcaagtttg aaggaggtcc ttagaatgga attaaaaaat 1140
gttattcttg aaaaagaagg gcatttagct attgttacaa tcaatagacc aaaggcatta 1200
aatgcattga attcagaaac actaaaagat ttaaatgttg ttttagatga tttagaagca 1260
gacaacaatg tgtatgcagt tatagttaca ggtgctggtg agaaatcttt tgttgctgga 1320
gcagatattt cagaaatgaa agatcttaat gaagaacaag gtaaagaatt tggtatttta 1380
ggaaacaatg tcttcagaag attagaaaaa ttggataagc cagttatcgc agctatatca 1440
ggatttgctc ttggtggtgg atgtgaactt gctatgtcat gtgacataag aatagcttca 1500
gttaaagcta aatttggtca accagaagca ggacttggaa taactccagg atttggtgga 1560
actcaaagat tagctagaat tgtagggcca ggaaaagcta aagaattaat ttatacttgt 1620
gaccttataa atgcagaaga agcttataga ataggtttag ttaataaagt agttgaatta 1680
gaaaaattga tggaagaagc aaaagcaatg gctaacaaga ttgcagctaa tgctccaaaa 1740
gcagttgcat attgtaaaga tgctatagac agaggaatgc aagttgatat agatgcagct 1800
atattaatag aagcagaaga ctttggaaag tgctttgcaa cagaagatca aacagaagga 1860
atgactgcgt tcttagaaag aagagcagaa aagaattttc aaaataaata aggatcccat 1920
ggtacgcgtg ctagaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 1980
gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgccctaga 2040
cctaggcgtt cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc 2100
cacagaatca ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag 2160
gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca 2220
tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca 2280
ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg 2340
atacctgtcc gcctttctcc cttcgggaag cgtggcgctt tctcaatgct cacgctgtag 2400
gtatctcagt tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt 2460
tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca 2520
cgacttatcg ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg 2580
cggtgctaca gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt 2640
tggtatctgc gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc 2700
cggcaaacaa accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg 2760
cagaaaaaaa ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg 2820
gaacgaaaac tcacgttaag ggattttggt catga 2855
<210>25
<211>2891
<212>DNA
<213>pGV1050
<400>25
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaaaagat 1080
ttagaggagg aataattcat gaaaaagatt tttgtacttg gagcaggaac aatgggtgct 1140
ggtatcgttc aagcattcgc tcaaaaaggt tgtgaagtaa ttgtaagaga cataaaggaa 1200
gaatttgttg acagaggaat agctggaatc actaaaggat tagaaaagca agttgctaaa 1260
ggaaaaatgt ctgaagaaga taaagaagct atactttcaa gaatttcagg aacaactgat 1320
atgaaattag ctgctgactg tgatttagta gttgaagctg caatcgaaaa catgaaaatt 1380
aagaaggaaa tcttcgctga attagatgga atttgtaagc cagaagcgat tttagcttca 1440
aacacttcat ctttatcaat tactgaagtt gcttcagcta caaagagacc tgataaagtt 1500
atcggaatgc atttctttaa tccagctcca gtaatgaagc ttgttgaaat tattaaagga 1560
atagctactt ctcaagaaac ttttgatgct gttaaggaat tatcagttgc tattggaaaa 1620
gaaccagtag aagttgcaga agctccagga ttcgttgtaa acagaatatt aatcccaatg 1680
attaacgaag cttcatttat cctacaagaa ggaatagctt cagttgaaga tattgataca 1740
gctatgaaat atggtgctaa ccatccaatg ggacctttag ctttaggaga tcttattgga 1800
ttagacgttt gcttagctat catggatgtt ttattcactg aaacaggtga taacaagtac 1860
agagctagca gcatattaag aaaatatgtt agagctggat ggcttggaag aaaatcagga 1920
aaaggattct atgattattc taaataagga tcccatggta cgcgtgctag aggcatcaaa 1980
taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga 2040
acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc 2100
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 2160
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 2220
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2280
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2340
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2400
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2460
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2520
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 2580
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 2640
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 2700
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 2760
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 2820
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 2880
tttggtcatg a 2891
<210>26
<211>5125
<212>DNA
<213>pGV1052
<400>26
aattctaaac taactatacg ctaaggagag tggaacatca tggattttaa cttaacagat 60
attcagcaag acttcctgaa gctggcacac gactttggtg aaaagaaact ggcccctact 120
gttaccgaac gcgaccacaa aggtatctac gataaagaac tgattgacga actgctgtct 180
ctgggtatca ccggcgcata cttcgaagaa aaatacggcg gtagcggtga cgacggtggc 240
gatgtactgt cttatatcct ggccgtagaa gaactggcga aatacgacgc tggtgttgct 300
atcactctgt ctgccaccgt aagcctgtgt gcgaatccga tttggcagtt tggtactgag 360
gctcagaaag aaaagtttct ggttccactg gtcgaaggta ctaaactggg tgcgtttggt 420
ctgaccgaac cgaacgcggg cactgatgcg agcggccagc aaactattgc tactaaaaac 480
gatgacggca cgtacaccct gaacggtagc aaaatcttca tcaccaacgg tggcgctgcc 540
gatatctaca tcgtatttgc gatgaccgac aaaagcaagg gtaaccatgg catcaccgcg 600
ttcatcctgg aagatggcac tccgggtttc acctacggca aaaaggaaga taaaatgggt 660
atccacacct ctcagactat ggaactggtt ttccaggacg ttaaggtccc ggccgagaac 720
atgctgggcg aagaaggcaa aggcttcaag attgcaatga tgaccctgga cggcggtcgc 780
attggcgttg cggcccaggc actgggcatc gcagaggcag cgctggccga cgctgttgaa 840
tacagcaaac agcgtgttca gtttggcaaa cctctgtgca aattccaatc cattagcttt 900
aagctggccg atatgaaaat gcagatcgaa gccgcacgca acctggtata taaagctgca 960
tgcaagaaac aagaaggtaa accgttcacc gtagacgctg cgatcgcgaa acgtgtagcc 1020
agcgatgtgg caatgcgcgt gactaccgaa gcagttcaga ttttcggtgg ctatggttac 1080
tctgaagaat acccggtggc tcgccacatg cgcgacgcaa aaatcactca gatctacgag 1140
ggtacgaacg aagtgcagct gatggtcacc ggcggtgctc tgttaagtta attaaagttt 1200
atgctcggcc tgccctttgc tgggcccgtt acataaaaaa agattttagg aggcaaaacg 1260
taaatggaaa tattggtatg tgtcaaacaa gtgccggata ctgcagaagt caaaattgat 1320
ccggttaaac acaccgtgat tcgtgcgggt gtgccgaata tcttcaaccc gttcgaccaa 1380
aacgcgctgg aagcggcgct ggcgctgaag gacgcggata aagacgttaa gattactctg 1440
ctgtctatgg gcccggacca ggcaaaagat gttctgcgtg aaggcctggc catgggcgct 1500
gatgacgcgt acctgctgtc cgatcgtaaa ctgggtggct ccgacactct ggccaccggt 1560
tatgctctgg cccaggctat taagaaactg gctgcggaca agggtattga gcaattcgac 1620
atcatcctgt gtggtaagca agcgattgac ggtgataccg ctcaggtagg tccacagatc 1680
gcttgtgagc tgggcatccc gcagatcact tatgctcgtg acatcaaggt tgagggcgat 1740
aaggttactg tgcagcagga aaacgaagag ggttacatcg tgaccgaagc gcagttcccg 1800
gttctgatca ccgcggttaa agacctgaac gaacctcgtt tcccgaccat ccgtggcacc 1860
atgaaggcga agcgtcgtga aatcccgaac ctggacgcag ctgcagttgc cgcggacgac 1920
gcgcagatcg gcctgtccgg ttctccgacc aaagtacgca aaattttcac cccaccgcag 1980
cgttccggcg gtctggtact gaaagtggaa gacgacaacg aacaggccat tgtcgaccag 2040
gttatggaaa aactggttgc ccagaaaatc atttaatcta aggaggaaca gtgaaaatgg 2100
atttagcaga atacaaaggc atctacgtga tcgcagagca gttcgaaggt aaactgcgtg 2160
acgtttcttt cgaactgctg ggtcaagcgc gcatcctggc ggacacgatc ggcgacgaag 2220
taggcgcaat cctgattggc aaagatgtaa aaccactggc gcaggaactg atcgcgcatg 2280
gtgctcataa agtgtacgtc tatgacgacc cgcagctgga acattacaac acgactgcct 2340
atgccaaagt gatttgcgac ttctttcatg aagagaaacc aaacgttttc ctggttggtg 2400
caactaacat cggtcgtgac ctgggtccac gtgtagcgaa cagcctgaaa accggtctga 2460
ctgcggattg tacccagctg ggtgttgatg atgataagaa aaccatcgtt tggacccgtc 2520
cggcactggg cggcaacatc atggcggaaa ttatctgtcc agataaccgc ccgcagatgg 2580
gcactgtgcg tcctcatgtc ttcaaaaagc cggaagccga cccgagcgca actggtgaag 2640
tcattgaaaa gaaagcgaac ctgtctgacg ctgatttcat gactaagttc gtagaactga 2700
tcaaactggg tggtgaaggc gttaaaatcg aggatgccga tgttattgtt gctggtggcc 2760
gtggcatgaa tagcgaagag ccttttaaaa ccggtatcct gaaagagtgc gcggacgtac 2820
tgggcggtgc tgtcggtgcc agccgtgccg ccgtggacgc gggctggatc gacgctctgc 2880
accaggtcgg ccagactggc aaaaccgttg gtccgaaaat ctacattgct tgtgcgatta 2940
gcggtgctat ccagccgctg gcaggcatga cgggctctga ttgtattatc gcaattaaca 3000
aagatgaaga cgcgcctatt ttcaaggtgt gcgactatgg cattgtgggc gatgtgttca 3060
aagtgctgcc actgctgact gaggcgatca agaaacagaa aggcattgca taaggatccc 3120
atggtacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 3180
tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgcccta 3240
gacctaggcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 3300
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 3360
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 3420
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 3480
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 3540
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 3600
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 3660
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 3720
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 3780
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 3840
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 3900
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 3960
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 4020
tggaacgaaa actcacgtta agggattttg gtcatgacta gtgcttggat tctcaccaat 4080
aaaaaacgcc cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctgaggtcat 4140
tactggatct atcaacagga gtccaagcga gctcgatatc aaattacgcc ccgccctgcc 4200
actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga 4260
cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt 4320
tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac 4380
tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag 4440
ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact 4500
gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga 4560
aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca 4620
tacgaaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa 4680
acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct 4740
ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt 4800
gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc 4860
ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa 4920
agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccagatatcg acgtctaaga 4980
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 5040
tcacctcgag aaatgtgagc ggataacaat tgacattgtg agcggataac aagatactga 5100
gcacatcagc aggacgcact gaccg 5125
<210>27
<211>2982
<212>DNA
<213>pGV1054
<400>27
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa 1080
gaggagaaag gtaccaagaa ttatttaaag cttattatgc caaaatactt atatagtatt 1140
ttggtgtaaa tgcattgata gtttctttaa atttagggag gtctgtttaa tgaaaaaggt 1200
atgtgttata ggcgcgggaa ccatgggtag cggtattgcc caggcatttg ctgcaaaagg 1260
tttcgaagtg gttctgcgtg atatcaagga cgagtttgtc gatcgcggct tagacttcat 1320
taataaaaac ctgtctaaac tggtaaagaa agggaaaatc gaagaggcga cgaaggtgga 1380
aattttaact cggatcagtg gaacagttga tctgaatatg gccgctgact gcgatctggt 1440
cattgaagcg gccgtagagc gtatggatat caaaaaacaa atttttgcag acttagataa 1500
catctgtaag ccggaaacca ttctggcttc aaatacgtcc tcgctgagca tcactgaggt 1560
ggcgtctgcc acaaaacgcc cagacaaagt tattggcatg catttcttta accctgcacc 1620
ggtcatgaag ttagtggaag taatccgtgg gattgctacc agtcaggaaa cgttcgatgc 1680
ggttaaagag acctcaatcg ccattggaaa agacccagtg gaagtcgcag aggcgcctgg 1740
ctttgttgta aatcgcattc tgatcccgat gattaacgaa gctgtgggaa tcctggccga 1800
aggaattgca tccgtcgagg atatcgacaa ggcgatgaaa ttaggcgcta atcacccgat 1860
gggtccactg gaactgggcg acttcattgg tctggatatc tgcttagcca ttatggacgt 1920
tctgtattcg gagactgggg atagcaaata ccggcctcat acactgttaa agaaatatgt 1980
gcgtgcagga tggctgggcc gcaaatctgg taagggtttc tacgattatt caaaataagg 2040
atcccatggt acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg 2100
gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg 2160
ccctagacct aggcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac 2220
ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa 2280
aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 2340
acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 2400
gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 2460
ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 2520
gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 2580
cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 2640
taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 2700
atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga 2760
cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 2820
cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 2880
ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 2940
ctcagtggaa cgaaaactca cgttaaggga ttttggtcat ga 2982
<210>28
<211>5125
<212>DNA
<213>pGV1088
<400>28
aattctaaac taactatacg ctaaggagag tggaacatca tggattttaa cttaacagat 60
attcagcaag acttcctgaa gctggcacac gactttggtg aaaagaaact ggcccctact 120
gttaccgaac gcgaccacaa aggtatctac gataaagaac tgattgacga actgctgtct 180
ctgggtatca ccggcgcata cttcgaagaa aaatacggcg gtagcggtga cgacggtggc 240
gatgtactgt cttatatcct ggccgtagaa gaactggcga aatacgacgc tggtgttgct 300
atcactctgt ctgccaccgt aagcctgtgt gcgaatccga tttggcagtt tggtactgag 360
gctcagaaag aaaagtttct ggttccactg gtcgaaggta ctaaactggg tgcgtttggt 420
ctgaccgaac cgaacgcggg cactgatgcg agcggccagc aaactattgc tactaaaaac 480
gatgacggca cgtacaccct gaacggtagc aaaatcttca tcaccaacgg tggcgctgcc 540
gatatctaca tcgtatttgc gatgaccgac aaaagcaagg gtaaccatgg catcaccgcg 600
ttcatcctgg aagatggcac tccgggtttc acctacggca aaaaggaaga taaaatgggt 660
atccacacct ctcagactat ggaactggtt ttccaggacg ttaaggtccc ggccgagaac 720
atgctgggcg aagaaggcaa aggcttcaag attgcaatga tgaccctgga cggcggtcgc 780
attggcgttg cggcccaggc actgggcatc gcagaggcag cgctggccga cgctgttgaa 840
tacagcaaac agcgtgttca gtttggcaaa cctctgtgca aattccaatc cattagcttt 900
aagctggccg atatgaaaat gcagatcgaa gccgcacgca acctggtata taaagctgca 960
tgcaagaaac aagaaggtaa accgttcacc gtagacgctg cgatcgcgaa acgtgtagcc 1020
agcgatgtgg caatgcgcgt gactaccgaa gcagttcaga ttttcggtgg ctatggttac 1080
tctgaagaat acccggtggc tcgccacatg cgcgacgcaa aaatcactca gatctacgag 1140
ggtacgaacg aagtgcagct gatggtcacc ggcggtgctc tgttaagtta attaaagttt 1200
atgctcggcc tgccctttgc tgggcccgtt acataaaaaa agattttagg aggcaaaacg 1260
taaatggaaa tattggtatg tgtcaaacaa gtgccggata ctgcagaagt caaaattgat 1320
ccggttaaac acaccgtgat tcgtgcgggt gtgccgaata tcttcaaccc gttcgaccaa 1380
aacgcgctgg aagcggcgct ggcgctgaag gacgcggata aagacgttaa gattactctg 1440
ctgtctatgg gcccggacca ggcaaaagat gttctgcgtg aaggcctggc catgggcgct 1500
gatgacgcgt acctgctgtc cgatcgtaaa ctgggtggct ccgacactct ggccaccggt 1560
tatgctctgg cccaggctat taagaaactg gctgcggaca agggtattga gcaattcgac 1620
atcatcctgt gtggtaagca agcgattgac ggtgataccg ctcaggtagg tccacagatc 1680
gcttgtgagc tgggcatccc gcagatcact tatgctcgtg acatcaaggt tgagggcgat 1740
aaggttactg tgcagcagga aaacgaagag ggttacatcg tgaccgaagc gcagttcccg 1800
gttctgatca ccgcggttaa agacctgaac gaacctcgtt tcccgaccat ccgtggcacc 1860
atgaaggcga agcgtcgtga aatcccgaac ctggacgcag ctgcagttgc cgcggacgac 1920
gcgcagatcg gcctgtccgg ttctccgacc aaagtacgca aaattttcac cccaccgcag 1980
cgttccggcg gtctggtact gaaagtggaa gacgacaacg aacaggccat tgtcgaccag 2040
gttatggaaa aactggttgc ccagaaaatc atttaatcta aggaggaaca gtgaaaatgg 2100
atttagcaga atacaaaggc atctacgtga tcgcagagca gttcgaaggt aaactgcgtg 2160
acgtttcttt cgaactgctg ggtcaagcgc gcatcctggc ggacacgatc ggcgacgaag 2220
taggcgcaat cctgattggc aaagatgtaa aaccactggc gcaggaactg atcgcgcatg 2280
gtgctcataa agtgtacgtc tatgacgacc cgcagctgga acattacaac acgactgcct 2340
atgccaaagt gatttgcgac ttctttcatg aagagaaacc aaacgttttc ctggttggtg 2400
caactaacat cggtcgtgac ctgggtccac gtgtagcgaa cagcctgaaa accggtctga 2460
ctgcggattg tacccagctg ggtgttgatg atgataagaa aaccatcgtt tggacccgtc 2520
cggcactggg cggcaacatc atggcggaaa ttatctgtcc agataaccgc ccgcagatgg 2580
gcactgtgcg tcctcatgtc ttcaaaaagc cggaagccga cccgagcgca actggtgaag 2640
tcattgaaaa gaaagcgaac ctgtctgacg ctgatttcat gactaagttc gtagaactga 2700
tcaaactggg tggtgaaggc gttaaaatcg aggatgccga tgttattgtt gctggtggcc 2760
gtggcatgaa tagcgaagag ccttttaaaa ccggtatcct gaaagagtgc gcggacgtac 2820
tgggcggtgc tgtcggtgcc agccgtgccg ccgtggacgc gggctggatc gacgctctgc 2880
accaggtcgg ccagactggc aaaaccgttg gtccgaaaat ctacattgct tgtgcgatta 2940
gcggtgctat ccagccgctg gcaggcatga cgggctctga ttgtattatc gcaattaaca 3000
aagatgaaga cgcgcctatt ttcaaggtgt gcgactatgg cattgtgggc gatgtgttca 3060
aagtgctgcc actgctgact gaggcgatca agaaacagaa aggcattgca taaggatccc 3120
atggtacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 3180
tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgcccta 3240
gacctaggcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 3300
tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 3360
aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 3420
catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 3480
caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 3540
ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 3600
aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 3660
gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 3720
cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 3780
ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 3840
tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 3900
tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg 3960
cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc tgacgctcag 4020
tggaacgaaa actcacgtta agggattttg gtcatgacta gtgcttggat tctcaccaat 4080
aaaaaacgcc cggcggcaac cgagcgttct gaacaaatcc agatggagtt ctgaggtcat 4140
tactggatct atcaacagga gtccaagcga gctcgatatc aaattacgcc ccgccctgcc 4200
actcatcgca gtactgttgt aattcattaa gcattctgcc gacatggaag ccatcacaga 4260
cggcatgatg aacctgaatc gccagcggca tcagcacctt gtcgccttgc gtataatatt 4320
tgcccatggt gaaaacgggg gcgaagaagt tgtccatatt ggccacgttt aaatcaaaac 4380
tggtgaaact cacccaggga ttggctgaga cgaaaaacat attctcaata aaccctttag 4440
ggaaataggc caggttttca ccgtaacacg ccacatcttg cgaatatatg tgtagaaact 4500
gccggaaatc gtcgtggtat tcactccaga gcgatgaaaa cgtttcagtt tgctcatgga 4560
aaacggtgta acaagggtga acactatccc atatcaccag ctcaccgtct ttcattgcca 4620
tacgaaactc cggatgagca ttcatcaggc gggcaagaat gtgaataaag gccggataaa 4680
acttgtgctt atttttcttt acggtcttta aaaaggccgt aatatccagc tgaacggtct 4740
ggttataggt acattgagca actgactgaa atgcctcaaa atgttcttta cgatgccatt 4800
gggatatatc aacggtggta tatccagtga tttttttctc cattttagct tccttagctc 4860
ctgaaaatct cgataactca aaaaatacgc ccggtagtga tcttatttca ttatggtgaa 4920
agttggaacc tcttacgtgc cgatcaacgt ctcattttcg ccagatatcg acgtctaaga 4980
aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 5040
tcacctcgag aaatgtgagc ggataacaat tgacattgtg agcggataac aagatactga 5100
gcacatcagc aggacgcact gaccg 5125
<210>29
<211>2836
<212>DNA
<213>pGV1094
<400>29
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccggg aattcctatc 1080
tatttttgaa gccttcaatt tttcttttct ctatgaaagc tgtcattgca tccttttgat 1140
cctctgttga aaagcattct ccaaatgctt ctgattcaaa tgctaaagca gtatcaatat 1200
cacactgcat tcctctatta atagcctgtt tgcttaactt aacagctact ggagcattgc 1260
tcacaatttt gtttgcaatt tcttttgctg tattcattaa ttcactaggt tctactacct 1320
tatttacaag tccgattctt aatgcttcat ctgcctttat attttgtgca gtaaatataa 1380
gctgctttgc catgcccatt ccaactaatc ttgaaagtct ttgtgtacca ccaaaaccag 1440
gtgttattcc gagacctact tctggttgac caaatcttgc gttgcttgaa gctattctta 1500
tatcacaaga catagctatt tcgcatccgc ctcctaaagc aaaaccatta acagctgcta 1560
ttacaggctt ttcaagaagt tctaatcttc taaacacttt atttccaagt atcccgaatt 1620
ttctaccttc aatggtattc atttccttca tctcagaaat atctgctcct gctacaaatg 1680
atttttctcc tgctccagtt aaaattactg caagtacttc gctatcattt tcaatttcac 1740
ctataacata atccatttct tttagtgtat cactatttaa cgcatttaat gctttaggtc 1800
tgttaatggt aactacagca actttacctt ccttttcaag gatgacattg tttagttcca 1860
tgactaatcc tcctaaaata ttggatccga tccgatccca tggtacgcgt gctagaggca 1920
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 1980
ggtgaacgct ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg 2040
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 2100
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 2160
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 2220
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 2280
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 2340
ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 2400
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 2460
ttatccggta actatcgtct tgagtccaac ccggtaagacacgacttatc gccactggca 2520
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 2580
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 2640
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 2700
ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 2760
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 2820
gggattttgg tcatga 2836
<210>30
<211>2018
<212>DNA
<213>pGV1111
<400>30
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaattgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcggatccc 1080
atggtacgcg tgctagaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 1140
tcgttttatc tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgcccta 1200
gacctagggc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 1260
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 1320
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 1380
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 1440
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 1500
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 1560
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 1620
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 1680
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 1740
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 1800
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 1860
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 1920
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 1980
gtggaacgaa aactcacgtt aagggatttt ggtcatga 2018
<210>31
<211>3258
<212>DNA
<213>pGV1113
<400>31
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acaattgaca 1020
ttgtgagcgg ataacaagat actgagcaca tcagcaggac gcactgaccg aattcattaa 1080
agaggagaaa ggtaccatgg ccatgttcac cactaccgcc aaggttattc agccgaaaat 1140
ccgtggtttt atctgtacga ccacccaccc gattggctgt gaaaaacgcg tgcaggaaga 1200
aattgcttac gcacgtgcac atccaccgac cagcccgggt ccgaaacgtg tcctggtcat 1260
cggctgttcc actggctacg gcctgtctac tcgtatcacc gcagctttcg gctatcaggc 1320
ggctactctg ggcgtgttcc tggctggtcc gccgactaaa ggtcgcccgg ctgcggccgg 1380
ttggtataac accgtagctt tcgaaaaagc ggccctggaa gccggtctgt atgcccgctc 1440
cctgaacggt gacgcttttg actctactac caaagcacgc accgtggaag ctatcaaacg 1500
tgacctgggc accgttgacc tggtggttta tagcattgca gctccgaaac gtaccgatcc 1560
ggctaccggc gtgctgcaca aagcgtgtct gaaaccgatc ggtgcgacct acaccaaccg 1620
tacggtaaat actgacaaag ctgaagttac ggacgtgtcc atcgaaccgg cgagcccaga 1680
agaaattgca gacactgtga aagtaatggg tggcgaagac tgggaactgt ggattcaggc 1740
tctgtctgaa gccggcgttc tggcagaagg cgcgaaaacc gtcgcatact cttatatcgg 1800
tccggagatg acctggccgg tgtactggtc cggcaccatt ggtgaagcca aaaaggatgt 1860
tgaaaaagcc gctaaacgta ttacccagca gtacggctgt ccggcatacc cggttgtggc 1920
aaaagcactg gtgacgcagg catcctccgc gatcccggtc gtcccgctgt atatttgtct 1980
gctgtaccgt gtaatgaaag aaaaaggcac tcacgaaggt tgcatcgaac aaatggtgcg 2040
tctgctgacc acgaaactgt acccggaaaa cggtgccccg atcgttgatg aagcgggccg 2100
tgttcgtgtg gacgattggg aaatggcaga agacgttcag caagccgtta aagacctgtg 2160
gagccaggtg agcacggcaa acctgaaaga tatttccgac ttcgccggtt accaaaccga 2220
gttcctgcgc ctgtttggtt ttggtatcga tggcgtggac tatgaccagc cggttgacgt 2280
agaggcagac ctgccgagcg cagctcagca gtaaggatcc catggtacgc gtgctagagg 2340
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 2400
tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc 2460
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 2520
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 2580
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 2640
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 2700
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 2760
tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 2820
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 2880
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 2940
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 3000
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 3060
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 3120
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 3180
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 3240
aagggatttt ggtcatga 3258
<210>32
<211>3233
<212>DNA
<213>pGV1117
<400>32
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa 1080
gaggagaaag gtaccatgat cattaaaccg aaagttcgtg gcttcatttg taccaccact 1140
catccggttg gctgtgaagc taatgtacgc cgccagatcg cgtataccaa agcaaaaggc 1200
actatcgaaa acggccctaa gaaagtgctg gtgattggtg cgagcaccgg ttacggtctg 1260
gcgtcccgca ttgcagcggc gttcggtagc ggcgccgcga ccctgggtgt tttcttcgaa 1320
aaagcgggct ccgaaactaa aaccgcgacc gcaggttggt acaactctgc cgcgtttgac 1380
aaagccgcca aagaggctgg cctgtatgcg aaatctatta acggtgacgc gttcagcaac 1440
gaatgccgtg ctaaagtgat cgaactgatc aaacaggatc tgggccaaat tgatctggtt 1500
gtttattctc tggcctcccc ggttcgtaaa ctgccggata ccggcgaagt tgtgcgcagc 1560
gctctgaaac ctattggtga agtgtacacc acgaccgcaa ttgatactaa taaggaccag 1620
attatcaccg caaccgtcga gccggccaac gaggaagaga tccagaatac catcactgtg 1680
atgggcggtc aagactggga actgtggatg gcagcactgc gcgacgcagg tgttctggca 1740
gacggtgcaa agagcgtcgc ttactcttac atcggcactg acctgacttg gccgatctac 1800
tggcatggca ccctgggtcg cgcgaaagag gatctggatc gcgcagcggc agcgatccgc 1860
ggtgatctgg ccggtaaggg cggtactgcg cacgttgccg ttctgaaatc cgtggtcacc 1920
caggcatctt ctgcaatccc ggtgatgccg ctgtatattt ctatggcctt taaaatcatg 1980
aaagagaagg gtatccacga aggctgtatg gagcaagtgg accgcatgat gcgtactcgc 2040
ctgtacgcgg cggacatggc actggatgac caggcgcgta tccgtatgga cgattgggaa 2100
ctgcgtgaag atgttcagca gacttgccgt gatctgtggc cgtccattac ctccgaaaac 2160
ctgtgcgagc tgaccgatta cactggttac aaacaggaat ttctgcgtct gttcggtttc 2220
ggtctggaag aagtagacta cgatgcagac gttaacccgg acgttaaatt tgatgttgtc 2280
gaactgtgag gatcccatgg tacgcgtgct agaggcatca aataaaacga aaggctcagt 2340
cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga 2400
caaatccgcc gccctagacc taggcgttcg gctgcggcga gcggtatcag ctcactcaaa 2460
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 2520
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 2580
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 2640
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 2700
gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc 2760
tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 2820
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 2880
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 2940
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 3000
cactagaagg acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 3060
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 3120
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 3180
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tga 3233
<210>33
<211>2908
<212>DNA
<213>pGV1154
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgga attcattgat 1080
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggtgcaggt 1140
actatgggtt caggaattgc tcaggcattt gcagctaaag gatttgaagt agtattaaga 1200
gatattaaag atgaatttgt tgatagagga ttagatttta tcaataaaaa tctttctaaa 1260
ttagttaaaa aaggaaagat agaagaagct actaaagttg aaatcttaac tagaatttcc 1320
ggaacagttg accttaatat ggcagctgat tgcgatttag ttatagaagc agctgttgaa 1380
agaatggata ttaaaaagca gatttttgct gacttagaca atatatgcaa gccagaaaca 1440
attcttgcat caaatacatc atcactttca ataacagaag tggcatcagc aactaaaaga 1500
cctgataagg ttataggtat gcatttcttt aatccagctc ctgttatgaa gcttgtagag 1560
gtaataagag gaatagctac atcacaagaa acttttgatg cagttaaaga gacatctata 1620
gcaataggaa aagatcctgt agaagtagca gaagcaccag gatttgttgt aaatagaata 1680
ttaataccaa tgattaatga agcagttggt atattagcag aaggaatagc ttcagtagaa 1740
gacatagata aagctatgaa acttggagct aatcacccaa tgggaccatt agaattaggt 1800
gattttatag gtcttgatat atgtcttgct ataatggatg ttttatactc agaaactgga 1860
gattctaagt atagaccaca tacattactt aagaagtatg taagagcagg atggcttgga 1920
agaaaatcag gaaaaggttt ctacgattat tcaaaataag gatccgatcc catggtacgc 1980
gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 2040
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc 2100
gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 2160
tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 2220
aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 2280
aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 2340
ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 2400
tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc 2460
agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 2520
gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 2580
tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 2640
acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 2700
tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 2760
caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 2820
aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 2880
aactcacgtt aagggatttt ggtcatga 2908
<210>34
<211>3278
<212>DNA
<213>pGV1188
<400>34
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaattgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaacaata 1080
aaaaccgtat caaaatttag gaggttagtt agaatgaaag aagttgtaat agctagcgcg 1140
gtgcgtaccg ccattggctc ttatggtaaa agtctgaagg atgttccggc agtcgactta 1200
ggggctacgg cgatcaaaga agccgtaaaa aaggcaggaa ttaaaccaga ggatgtgaat 1260
gaagttatcc tgggcaacgt cctgcaggct ggtttagggc aaaatcctgc gcgccaggcc 1320
tcatttaaag caggactgcc ggtagagatt ccagctatga ctatcaacaa ggtgtgcggc 1380
tccggtctgc ggacagtttc gttagcggcc caaattatca aagcaggcga cgctgatgtc 1440
attatcgcgg gtgggatgga aaatatgagc cgtgcccctt acctggcaaa caatgcgcgc 1500
tggggatatc gtatgggcaa cgctaaattc gtggacgaaa tgattaccga tggtctgtgg 1560
gatgccttta atgactacca tatgggcatc acggcagaga acattgcgga acgctggaat 1620
atctctcggg aggaacagga tgagttcgct ttagccagtc agaagaaagc agaggaagcg 1680
attaaatcag gtcaatttaa ggacgagatc gtaccggttg tgattaaagg gcgtaaagga 1740
gaaactgtcg ttgatacaga cgaacacccg cgcttcggct ccaccattga gggtctggct 1800
aagctgaaac cagcctttaa aaaggatggg acggtaaccg caggcaacgc gtcgggttta 1860
aatgattgtg ccgcagtgct ggtcatcatg agcgcggaaa aagctaaaga gctgggagtt 1920
aagcctctgg ccaaaattgt gtcttatggc agtgcgggtg tagacccggc tatcatgggg 1980
tacggcccgt tctatgcaac taaagccgcg attgaaaagg ctggttggac agtcgatgaa 2040
ttagacctga tcgagtcaaa cgaagcattt gccgcgcagt ccctggctgt tgcaaaagat 2100
ttaaaattcg atatgaataa ggtgaacgta aatggaggcg ccattgcgct gggtcatcca 2160
atcggggctt cgggagcacg tattctggtt acgttagtgc acgccatgca aaaacgcgac 2220
gcgaaaaagg gcctggctac cctgtgcatc ggtgggggcc agggtactgc aatattgcta 2280
gaaaagtgct agacttaatt aacaataatc gatgggccca aggtacctaa gcttggatcc 2340
catggtacgc gtgctagagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct 2400
ttcgttttat ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgccct 2460
agacctaggc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 2520
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 2580
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 2640
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 2700
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 2760
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg 2820
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 2880
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 2940
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 3000
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 3060
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 3120
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 3180
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 3240
gtggaacgaa aactcacgtt aagggatttt ggtcatga 3278
<210>35
<211>2863
<212>DNA
<213>pGV1189
<400>35
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaattgtg agcggataac attgacattg 1020
tgagcggata acaagatact gagcacatca gcaggacgca ctgaccgaat tcagtattaa 1080
ttaacaataa tcgatatatt ttaggaggat tagtcatgga actaaacaat gtcatcctgg 1140
aaaaagaggg caaggtggcg gttgtcacca ttaatcgtcc gaaagcctta aacgcactga 1200
atagcgatac gctgaaagaa atggactatg taatcggtga gattgaaaac gattctgaag 1260
tgttagctgt tatcctgact ggggcgggag agaagagttt tgtcgccggc gcagacattt 1320
cagaaatgaa agagatgaat acaatcgaag gtcgcaaatt cgggattctg ggaaacaagg 1380
tatttcggcg tttagaactg ctggagaaac cagtgatcgc tgcggttaat ggcttcgcct 1440
taggtggcgg ttgcgaaatt gcaatgtcct gtgatatccg cattgcttcg agcaacgcgc 1500
gttttgggca gcctgaggtc ggactgggca tcacaccggg tttcggcggt acgcaacgcc 1560
tgtctcggtt agtggggatg ggaatggcca aacagctgat ttttactgca caaaatatca 1620
aggctgacga agcgctgcgt attggcctgg taaacaaagt tgtggaacca agtgagttaa 1680
tgaatacagc caaagaaatc gcaaacaaga ttgtctcaaa tgcgcctgtt gctgtaaaac 1740
tgtccaaaca ggccattaac cgcggtatgc agtgcgatat cgacaccgca ctggcgttcg 1800
agtcggaagc ttttggggaa tgtttcagca cggaggacca aaaggatgcc atgaccgcat 1860
ttattgaaaa acgtaaaatt gaaggcttca aaaatagata ggataggtac ctaagcttgg 1920
atcccatggt acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc gaaagactgg 1980
gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg 2040
ccctagacct agggcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 2100
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 2160
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 2220
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 2280
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 2340
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 2400
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 2460
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 2520
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 2580
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 2640
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 2700
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 2760
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 2820
gctcagtgga acgaaaactc acgttaaggg attttggtca tga 2863
<210>36
<211>7813
<212>DNA
<213>pGV1190
<400>36
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac 60
atcagcagga cgcactgacc gaattcacaa taaaaaccgt atcaaaattt aggaggttag 120
ttagaatgaa agaagttgta atagctagcg cggtgcgtac cgccattggc tcttatggta 180
aaagtctgaa ggatgttccg gcagtcgact taggggctac ggcgatcaaa gaagccgtaa 240
aaaaggcagg aattaaacca gaggatgtga atgaagttat cctgggcaac gtcctgcagg 300
ctggtttagg gcaaaatcct gcgcgccagg cctcatttaa agcaggactg ccggtagaga 360
ttccagctat gactatcaac aaggtgtgcg gctccggtct gcggacagtt tcgttagcgg 420
cccaaattat caaagcaggc gacgctgatg tcattatcgc gggtgggatg gaaaatatga 480
gccgtgcccc ttacctggca aacaatgcgc gctggggata tcgtatgggc aacgctaaat 540
tcgtggacga aatgattacc gatggtctgt gggatgcctt taatgactac catatgggca 600
tcacggcaga gaacattgcg gaacgctgga atatctctcg ggaggaacag gatgagttcg 660
ctttagccag tcagaagaaa gcagaggaag cgattaaatc aggtcaattt aaggacgaga 720
tcgtaccggt tgtgattaaa gggcgtaaag gagaaactgt cgttgataca gacgaacacc 780
cgcgcttcgg ctccaccatt gagggtctgg ctaagctgaa accagccttt aaaaaggatg 840
ggacggtaac cgcaggcaac gcgtcgggtt taaatgattg tgccgcagtg ctggtcatca 900
tgagcgcgga aaaagctaaa gagctgggag ttaagcctct ggccaaaatt gtgtcttatg 960
gcagtgcggg tgtagacccg gctatcatgg ggtacggccc gttctatgca actaaagccg 1020
cgattgaaaa ggctggttgg acagtcgatg aattagacct gatcgagtca aacgaagcat 1080
ttgccgcgca gtccctggct gttgcaaaag atttaaaatt cgatatgaat aaggtgaacg 1140
taaatggagg cgccattgcg ctgggtcatc caatcggggc ttcgggagca cgtattctgg 1200
ttacgttagt gcacgccatg caaaaacgcg acgcgaaaaa gggcctggct accctgtgca 1260
tcggtggggg ccagggtact gcaatattgc tagaaaagtg ctagacttaa ttaaatttta 1320
taaaggagtg tatataaatg aaagttacaa atcaaaaaga actaaaacaa aagctaaatg 1380
aattgagaga agcgcaaaag aagtttgcaa cctatactca agagcaagtt gataaaattt 1440
ttaaacaatg tgccatagcc gcagctaaag aaagaataaa cttagctaaa ttagcagtag 1500
aagaaacagg aataggtctt gtagaagata aaattataaa aaatcatttt gcagcagaat 1560
atatatacaa taaatataaa aatgaaaaaa cttgtggcat aatagaccat gacgattctt 1620
taggcataac aaaggttgct gaaccaattg gaattgttgc agccatagtt cctactacta 1680
atccaacttc cacagcaatt ttcaaatcat taatttcttt aaaaacaaga aacgcaatat 1740
tcttttcacc acatccacgt gcaaaaaaat ctacaattgc tgcagcaaaa ttaattttag 1800
atgcagctgt taaagcagga gcacctaaaa atataatagg ctggatagat gagccatcaa 1860
tagaactttc tcaagatttg atgagtgaag ctgatataat attagcaaca ggaggtcctt 1920
caatggttaa agcggcctat tcatctggaa aacctgcaat tggtgttgga gcaggaaata 1980
caccagcaat aatagatgag agtgcagata tagatatggc agtaagctcc ataattttat 2040
caaagactta tgacaatgga gtaatatgcg cttctgaaca atcaatatta gttatgaatt 2100
caatatacga aaaagttaaa gaggaatttg taaaacgagg atcatatata ctcaatcaaa 2160
atgaaatagc taaaataaaa gaaactatgt ttaaaaatgg agctattaat gctgacatag 2220
ttggaaaatc tgcttatata attgctaaaa tggcaggaat tgaagttcct caaactacaa 2280
agatacttat aggcgaagta caatctgttg aaaaaagcga gctgttctca catgaaaaac 2340
tatcaccagt acttgcaatg tataaagtta aggattttga tgaagctcta aaaaaggcac 2400
aaaggctaat agaattaggt ggaagtggac acacgtcatc tttatatata gattcacaaa 2460
acaataagga taaagttaaa gaatttggat tagcaatgaa aacttcaagg acatttatta 2520
acatgccttc ttcacaggga gcaagcggag atttatacaa ttttgcgata gcaccatcat 2580
ttactcttgg atgcggcact tggggaggaa actctgtatc gcaaaatgta gagcctaaac 2640
atttattaaa tattaaaagt gttgctgaaa gaagggaaaa tatgctttgg tttaaagtgc 2700
cacaaaaaat atattttaaa tatggatgtc ttagatttgc attaaaagaa ttaaaagata 2760
tgaataagaa aagagccttt atagtaacag ataaagatct ttttaaactt ggatatgtta 2820
ataaaataac aaaggtacta gatgagatag atattaaata cagtatattt acagatatta 2880
aatctgatcc aactattgat tcagtaaaaa aaggtgctaa agaaatgctt aactttgaac 2940
ctgatactat aatctctatt ggtggtggat cgccaatgga tgcagcaaag gttatgcact 3000
tgttatatga atatccagaa gcagaaattg aaaatctagc tataaacttt atggatataa 3060
gaaagagaat atgcaatttc cctaaattag gtacaaaggc gatttcagta gctattccta 3120
caactgctgg taccggttca gaggcaacac cttttgcagt tataactaat gatgaaacag 3180
gaatgaaata ccctttaact tcttatgaat tgaccccaaa catggcaata atagatactg 3240
aattaatgtt aaatatgcct agaaaattaa cagcagcaac tggaatagat gcattagttc 3300
atgctataga agcatatgtt tcggttatgg ctacggatta tactgatgaa ttagccttaa 3360
gagcaataaa aatgatattt aaatatttgc ctagagccta taaaaatggg actaacgaca 3420
ttgaagcaag agaaaaaatg gcacatgcct ctaatattgc ggggatggca tttgcaaatg 3480
ctttcttagg tgtatgccat tcaatggctc ataaacttgg ggcaatgcat cacgttccac 3540
atggaattgc ttgtgctgta ttaatagaag aagttattaa atataacgct acagactgtc 3600
caacaaagca aacagcattc cctcaatata aatctcctaa tgctaagaga aaatatgctg 3660
aaattgcaga gtatttgaat ttaaagggta ctagcgatac cgaaaaggta acagccttaa 3720
tagaagctat ttcaaagtta aagatagatt tgagtattcc acaaaatata agtgccgctg 3780
gaataaataa aaaagatttt tataatacgc tagataaaat gtcagagctt gcttttgatg 3840
accaatgtac aacagctaat cctaggtatc cacttataag tgaacttaag gatatctata 3900
taaaatcatt ttaaatcgat atattttagg aggattagtc atggaactaa acaatgtcat 3960
cctggaaaaa gagggcaagg tggcggttgt caccattaat cgtccgaaag ccttaaacgc 4020
actgaatagc gatacgctga aagaaatgga ctatgtaatc ggtgagattg aaaacgattc 4080
tgaagtgtta gctgttatcc tgactggggc gggagagaag agttttgtcg ccggcgcaga 4140
catttcagaa atgaaagaga tgaatacaat cgaaggtcgc aaattcggga ttctgggaaa 4200
caaggtattt cggcgtttag aactgctgga gaaaccagtg atcgctgcgg ttaatggctt 4260
cgccttaggt ggcggttgcg aaattgcaat gtcctgtgat atccgcattg cttcgagcaa 4320
cgcgcgtttt gggcagcctg aggtcggact gggcatcaca ccgggtttcg gcggtacgca 4380
acgcctgtct cggttagtgg ggatgggaat ggccaaacag ctgattttta ctgcacaaaa 4440
tatcaaggct gacgaagcgc tgcgtattgg cctggtaaac aaagttgtgg aaccaagtga 4500
gttaatgaat acagccaaag aaatcgcaaa caagattgtc tcaaatgcgc ctgttgctgt 4560
aaaactgtcc aaacaggcca ttaaccgcgg tatgcagtgc gatatcgaca ccgcactggc 4620
gttcgagtcg gaagcttttg gggaatgttt cagcacggag gaccaaaagg atgccatgac 4680
cgcatttatt gaaaaacgta aaattgaagg cttcaaaaat agataggata ggtaccaaga 4740
attatttaaa gcttattatg ccaaaatact tatatagtat tttggtgtaa atgcattgat 4800
agtttcttta aatttaggga ggtctgttta atgaaaaagg tatgtgttat aggcgcggga 4860
accatgggta gcggtattgc ccaggcattt gctgcaaaag gtttcgaagt ggttctgcgt 4920
gatatcaagg acgagtttgt cgatcgcggc ttagacttca ttaataaaaa cctgtctaaa 4980
ctggtaaaga aagggaaaat cgaagaggcg acgaaggtgg aaattttaac tcggatcagt 5040
ggaacagttg atctgaatat ggccgctgac tgcgatctgg tcattgaagc ggccgtagag 5100
cgtatggata tcaaaaaaca aatttttgca gacttagata acatctgtaa gccggaaacc 5160
attctggctt caaatacgtc ctcgctgagc atcactgagg tggcgtctgc cacaaaacgc 5220
ccagacaaag ttattggcat gcatttcttt aaccctgcac cggtcatgaa gttagtggaa 5280
gtaatccgtg ggattgctac cagtcaggaa acgttcgatg cggttaaaga gacctcaatc 5340
gccattggaa aagacccagt ggaagtcgca gaggcgcctg gctttgttgt aaatcgcatt 5400
ctgatcccga tgattaacga agctgtggga atcctggccg aaggaattgc atccgtcgag 5460
gatatcgaca aggcgatgaa attaggcgct aatcacccga tgggtccact ggaactgggc 5520
gacttcattg gtctggatat ctgcttagcc attatggacg ttctgtattc ggagactggg 5580
gatagcaaat accggcctca tacactgtta aagaaatatg tgcgtgcagg atggctgggc 5640
cgcaaatctg gtaagggttt ctacgattat tcaaaataag gatcccatgg tacgcgtgct 5700
agaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 5760
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gccctagacc taggggatat 5820
attccgcttc ctcgctcact gactcgctac gctcggtcgt tcgactgcgg cgagcggaaa 5880
tggcttacga acggggcgga gatttcctgg aagatgccag gaagatactt aacagggaag 5940
tgagagggcc gcggcaaagc cgtttttcca taggctccgc ccccctgaca agcatcacga 6000
aatctgacgc tcaaatcagt ggtggcgaaa cccgacagga ctataaagat accaggcgtt 6060
tccccctggc ggctccctcg tgcgctctcc tgttcctgcc tttcggttta ccggtgtcat 6120
tccgctgtta tggccgcgtt tgtctcattc cacgcctgac actcagttcc gggtaggcag 6180
ttcgctccaa gctggactgt atgcacgaac cccccgttca gtccgaccgc tgcgccttat 6240
ccggtaacta tcgtcttgag tccaacccgg aaagacatgc aaaagcacca ctggcagcag 6300
ccactggtaa ttgatttaga ggagttagtc ttgaagtcat gcgccggtta aggctaaact 6360
gaaaggacaa gttttggtga ctgcgctcct ccaagccagt tacctcggtt caaagagttg 6420
gtagctcaga gaaccttcga aaaaccgccc tgcaaggcgg ttttttcgtt ttcagagcaa 6480
gagattacgc gcagaccaaa acgatctcaa gaagatcatc ttattaatca gataaaatat 6540
ttctagattt cagtgcaatt tatctcttca aatgtagcac ctgaagtcag ccccatacga 6600
tataagttgt tactagtgct tggattctca ccaataaaaa acgcccggcg gcaaccgagc 6660
gttctgaaca aatccagatg gagttctgag gtcattactg gatctatcaa caggagtcca 6720
agcgagctcg taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 6780
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 6840
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 6900
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 6960
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 7020
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 7080
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 7140
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 7200
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 7260
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 7320
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 7380
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 7440
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 7500
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 7560
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 7620
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 7680
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 7740
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 7800
ctttcgtctt cac 7813
<210>37
<211>7814
<212>DNA
<213>pGV1191
<400>37
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac 60
atcagcagga cgcactgacc gaattcacaa taaaaaccgt atcaaaattt aggaggttag 120
ttagaatgaa agaagttgta atagctagcg cggtgcgtac cgccattggc tcttatggta 180
aaagtctgaa ggatgttccg gcagtcgact taggggctac ggcgatcaaa gaagccgtaa 240
aaaaggcagg aattaaacca gaggatgtga atgaagttat cctgggcaac gtcctgcagg 300
ctggtttagg gcaaaatcct gcgcgccagg cctcatttaa agcaggactg ccggtagaga 360
ttccagctat gactatcaac aaggtgtgcg gctccggtct gcggacagtt tcgttagcgg 420
cccaaattat caaagcaggc gacgctgatg tcattatcgc gggtgggatg gaaaatatga 480
gccgtgcccc ttacctggca aacaatgcgc gctggggata tcgtatgggc aacgctaaat 540
tcgtggacga aatgattacc gatggtctgt gggatgcctt taatgactac catatgggca 600
tcacggcaga gaacattgcg gaacgctgga atatctctcg ggaggaacag gatgagttcg 660
ctttagccag tcagaagaaa gcagaggaag cgattaaatc aggtcaattt aaggacgaga 720
tcgtaccggt tgtgattaaa gggcgtaaag gagaaactgt cgttgataca gacgaacacc 780
cgcgcttcgg ctccaccatt gagggtctgg ctaagctgaa accagccttt aaaaaggatg 840
ggacggtaac cgcaggcaac gcgtcgggtt taaatgattg tgccgcagtg ctggtcatca 900
tgagcgcgga aaaagctaaa gagctgggag ttaagcctct ggccaaaatt gtgtcttatg 960
gcagtgcggg tgtagacccg gctatcatgg ggtacggccc gttctatgca actaaagccg 1020
cgattgaaaa ggctggttgg acagtcgatg aattagacct gatcgagtca aacgaagcat 1080
ttgccgcgca gtccctggct gttgcaaaag atttaaaatt cgatatgaat aaggtgaacg 1140
taaatggagg cgccattgcg ctgggtcatc caatcggggc ttcgggagca cgtattctgg 1200
ttacgttagt gcacgccatg caaaaacgcg acgcgaaaaa gggcctggct accctgtgca 1260
tcggtggggg ccagggtact gcaatattgc tagaaaagtg ctagacttaa ttaaaatttt 1320
ataaaggagt gtatataaat gaaagttaca aatcaaaaag aactgaaaca gaagttaaat 1380
gagctgcgtg aggcgcaaaa aaaatttgcc acctatacgc aggaacaagt ggataagatt 1440
ttcaaacagt gcgcaatcgc tgcggccaaa gaacgcatta acctggcaaa gttagctgtt 1500
gaagagactg gcatcggtct ggtcgaggac aaaattatca aaaatcattt tgcggccgag 1560
tacatttata acaagtacaa aaacgagaaa acctgtggga tcattgacca cgatgatagc 1620
ctgggaatca caaaggtagc agaaccgatt ggcatcgtgg ctgcgattgt tccaacgact 1680
aatcctacat ctaccgccat cttcaaaagt ttaatttcac tgaaaacgcg gaatgcaatc 1740
tttttctccc cgcatccacg tgctaagaaa tcgaccattg cggccgcaaa actgatttta 1800
gacgcggctg tcaaggccgg tgcacctaaa aacatcattg ggtggatcga cgaaccgagc 1860
attgaactgt ctcaggatct gatgagtgag gcggacatca ttttagctac tggaggcccg 1920
tcaatggtaa aagccgcata ttcctcgggt aagccagcga tcggcgtggg tgctgggaat 1980
actcctgcca ttatcgacga aagcgcagac attgatatgg cggtttctag tatcattctg 2040
tcaaaaacgt acgacaacgg agtcatctgc gcctccgaac agtcgattct ggtgatgaat 2100
agcatctatg agaaagtaaa ggaagagttt gttaaacgcg gctcttacat tctgaaccag 2160
aatgaaattg caaaaatcaa ggaaaccatg ttcaaaaacg gtgcgattaa tgctgatatc 2220
gtgggcaaaa gtgcctatat tatcgcgaag atggctggta ttgaggtccc gcaaactaca 2280
aaaatcttaa ttggggaagt tcagtcagta gaaaaatccg agctgtttag ccacgaaaag 2340
ctgtcgccgg tgttagcaat gtataaagtc aaagatttcg acgaggccct gaagaaagcg 2400
cagcgtctga tcgaattagg aggctctggt cataccagtt cactgtacat tgatagccaa 2460
aacaataaag acaaggttaa agaatttggg ctggctatga aaacgtcccg cacctttatc 2520
aacatgccat cgtctcaggg cgcaagtggt gatttatata atttcgccat tgcgcctagc 2580
tttactctgg gatgtggcac atggggtggg aactcagtgt cccaaaatgt agagccgaag 2640
catctgctga acatcaaatc ggtcgctgaa cggcgtgaga atatgttatg gttcaaagtt 2700
ccacagaaga tttactttaa atatggctgc ctgcgcttcg cactgaaaga attaaaggat 2760
atgaacaaaa aacgtgcctt tatcgtgacg gacaaggatc tgttcaaact gggttacgta 2820
aataaaatta ccaaggtttt agacgaaatt gatatcaaat attctatttt tactgacatc 2880
aaaagcgatc cgacaattga tagtgtgaag aaaggagcga aagagatgct gaacttcgaa 2940
cctgacacga tcatttcaat cggcggtggg tccccgatgg atgctgcaaa ggtcatgcat 3000
ctgttatacg agtatccaga agccgaaatt gagaatctgg cgatcaactt tatggacatt 3060
cgcaaacgga tctgtaattt tccgaaactg ggaaccaagg ctattagcgt tgcaatccct 3120
actacggccg gcaccggttc ggaagcgaca ccgttcgctg tgattaccaa cgatgagact 3180
gggatgaaat atccactgac atcttacgaa ttaacgccga atatggcaat cattgatacc 3240
gaactgatgc tgaacatgcc tcgtaaatta actgccgcga cgggcattga cgcactggta 3300
cacgccatcg aggcgtatgt cagtgttatg gcaaccgatt acacagacga actggcgtta 3360
cgcgctatta agatgatctt taaatatctg ccacgtgcct acaaaaatgg tactaacgat 3420
attgaagcgc gcgagaagat ggctcatgca tcaaatatcg ccggaatggc gttcgctaac 3480
gcatttctgg gcgtgtgcca cagcatggcc cataaattag gtgcgatgca ccatgtaccg 3540
catgggattg cttgtgcagt cctgatcgaa gaggttatta aatataatgc cacggactgc 3600
cctaccaagc agacagcgtt cccgcaatac aaatccccaa acgctaaacg gaagtatgca 3660
gaaatcgccg aatatctgaa tctgaaaggc acttcggata cggagaaagt gaccgcgtta 3720
attgaagcta tctctaagct gaaaattgat ctgagtatcc cgcagaacat ttcagcagcc 3780
ggtattaata aaaaggactt ttacaacacc ttagataaaa tgagcgagct ggcgttcgac 3840
gatcaatgta caactgctaa tcctcgttat ccgctgatct ccgaattaaa agatatctat 3900
ataaaatcat tttaaatcga tatattttag gaggattagt catggaacta aacaatgtca 3960
tcctggaaaa agagggcaag gtggcggttg tcaccattaa tcgtccgaaa gccttaaacg 4020
cactgaatag cgatacgctg aaagaaatgg actatgtaat cggtgagatt gaaaacgatt 4080
ctgaagtgtt agctgttatc ctgactgggg cgggagagaa gagttttgtc gccggcgcag 4140
acatttcaga aatgaaagag atgaatacaa tcgaaggtcg caaattcggg attctgggaa 4200
acaaggtatt tcggcgttta gaactgctgg agaaaccagt gatcgctgcg gttaatggct 4260
tcgccttagg tggcggttgc gaaattgcaa tgtcctgtga tatccgcatt gcttcgagca 4320
acgcgcgttt tgggcagcct gaggtcggac tgggcatcac accgggtttc ggcggtacgc 4380
aacgcctgtc tcggttagtg gggatgggaa tggccaaaca gctgattttt actgcacaaa 4440
atatcaaggc tgacgaagcg ctgcgtattg gcctggtaaa caaagttgtg gaaccaagtg 4500
agttaatgaa tacagccaaa gaaatcgcaa acaagattgt ctcaaatgcg cctgttgctg 4560
taaaactgtc caaacaggcc attaaccgcg gtatgcagtg cgatatcgac accgcactgg 4620
cgttcgagtc ggaagctttt ggggaatgtt tcagcacgga ggaccaaaag gatgccatga 4680
ccgcatttat tgaaaaacgt aaaattgaag gcttcaaaaa tagataggat aggtaccaag 4740
aattatttaa agcttattat gccaaaatac ttatatagta ttttggtgta aatgcattga 4800
tagtttcttt aaatttaggg aggtctgttt aatgaaaaag gtatgtgtta taggcgcggg 4860
aaccatgggt agcggtattg cccaggcatt tgctgcaaaa ggtttcgaag tggttctgcg 4920
tgatatcaag gacgagtttg tcgatcgcgg cttagacttc attaataaaa acctgtctaa 4980
actggtaaag aaagggaaaa tcgaagaggc gacgaaggtg gaaattttaa ctcggatcag 5040
tggaacagtt gatctgaata tggccgctga ctgcgatctg gtcattgaag cggccgtaga 5100
gcgtatggat atcaaaaaac aaatttttgc agacttagat aacatctgta agccggaaac 5160
cattctggct tcaaatacgt cctcgctgag catcactgag gtggcgtctg ccacaaaacg 5220
cccagacaaa gttattggca tgcatttctt taaccctgca ccggtcatga agttagtgga 5280
agtaatccgt gggattgcta ccagtcagga aacgttcgat gcggttaaag agacctcaat 5340
cgccattgga aaagacccag tggaagtcgc agaggcgcct ggctttgttg taaatcgcat 5400
tctgatcccg atgattaacg aagctgtggg aatcctggcc gaaggaattg catccgtcga 5460
ggatatcgac aaggcgatga aattaggcgc taatcacccg atgggtccac tggaactggg 5520
cgacttcatt ggtctggata tctgcttagc cattatggac gttctgtatt cggagactgg 5580
ggatagcaaa taccggcctc atacactgtt aaagaaatat gtgcgtgcag gatggctggg 5640
ccgcaaatct ggtaagggtt tctacgatta ttcaaaataa ggatcccatg gtacgcgtgc 5700
tagaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg ttttatctgt 5760
tgtttgtcgg tgaacgctct cctgagtagg acaaatccgc cgccctagac ctaggggata 5820
tattccgctt cctcgctcac tgactcgcta cgctcggtcg ttcgactgcg gcgagcggaa 5880
atggcttacg aacggggcgg agatttcctg gaagatgcca ggaagatact taacagggaa 5940
gtgagagggc cgcggcaaag ccgtttttcc ataggctccg cccccctgac aagcatcacg 6000
aaatctgacg ctcaaatcag tggtggcgaa acccgacagg actataaaga taccaggcgt 6060
ttccccctgg cggctccctc gtgcgctctc ctgttcctgc ctttcggttt accggtgtca 6120
ttccgctgtt atggccgcgt ttgtctcatt ccacgcctga cactcagttc cgggtaggca 6180
gttcgctcca agctggactg tatgcacgaa ccccccgttc agtccgaccg ctgcgcctta 6240
tccggtaact atcgtcttga gtccaacccg gaaagacatg caaaagcacc actggcagca 6300
gccactggta attgatttag aggagttagt cttgaagtca tgcgccggtt aaggctaaac 6360
tgaaaggaca agttttggtg actgcgctcc tccaagccag ttacctcggt tcaaagagtt 6420
ggtagctcag agaaccttcg aaaaaccgcc ctgcaaggcg gttttttcgt tttcagagca 6480
agagattacg cgcagaccaa aacgatctca agaagatcat cttattaatc agataaaata 6540
tttctagatt tcagtgcaat ttatctcttc aaatgtagca cctgaagtca gccccatacg 6600
atataagttg ttactagtgc ttggattctc accaataaaa aacgcccggc ggcaaccgag 6660
cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca acaggagtcc 6720
aagcgagctc gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct 6780
cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta 6840
cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct 6900
caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg 6960
gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa 7020
gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt 7080
cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta 7140
catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca 7200
gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta 7260
ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct 7320
gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg 7380
cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac 7440
tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact 7500
gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa 7560
atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt 7620
ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat 7680
gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg 7740
acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc 7800
cctttcgtct tcac 7814
<210>38
<211>3126
<212>DNA
<213>pGV1248
<400>38
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttcaggagga 1080
atttaaaatg aagatcgttt tagtcttata tgatgctggt aaacacgctg ccgatgaaga 1140
aaaattatac ggttgtactg aaaacaaatt aggtattgcc aattggttga aagatcaagg 1200
acatgaatta atcaccacgt ctgataaaga aggcggaaac agtgtgttgg atcaacatat 1260
accagatgcc gatattatca ttacaactcc tttccatcct gcttatatca ctaaggaaag 1320
aatcgacaag gctaaaaaat tgaaattagt tgttgtcgct ggtgtcggtt ctgatcatat 1380
tgatttggat tatatcaacc aaaccggtaa gaaaatctcc gttttggaag ttaccggttc 1440
taatgttgtc tctgttgcag aacacgttgt catgaccatg cttgtcttgg ttagaaattt 1500
tgttccagct cacgaacaaa tcattaacca cgattgggag gttgctgcta tcgctaagga 1560
tgcttacgat atcgaaggta aaactatcgc caccattggt gccggtagaa ttggttacag 1620
agtcttggaa agattagtcc cattcaatcc taaagaatta ttatactacg attatcaagc 1680
tttaccaaaa gatgctgaag aaaaagttgg tgctagaagg gttgaaaata ttgaagaatt 1740
ggttgcccaa gctgatatag ttacagttaa tgctccatta cacgctggta caaaaggttt 1800
aattaacaag gaattattgt ctaaattcaa gaaaggtgct tggttagtca atactgcaag 1860
aggtgccatt tgtgttgccg aagatgttgc tgcagcttta gaatctggtc aattaagagg 1920
ttatggtggt gatgtttggt tcccacaacc agctccaaaa gatcacccat ggagagatat 1980
gagaaacaaa tatggtgctg gtaacgccat gactcctcat tactctggta ctactttaga 2040
tgctcaaact agatacgctc aaggtactaa aaatatcttg gagtcattct ttactggtaa 2100
gtttgattac agaccacaag atatcatctt attaaacggt gaatacgtta ccaaagctta 2160
cggtaaacac gataagaaat aaggatccca tggtacgcgt gctagaggca tcaaataaaa 2220
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct 2280
ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg cgagcggtat 2340
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 2400
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 2460
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 2520
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 2580
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 2640
gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 2700
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 2760
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 2820
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 2880
ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta 2940
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 3000
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 3060
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 3120
tcatga 3126
<210>39
<211>2106
<212>DNA
<213>pGV1252
<400>39
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtacctt aacgatcggt 1140
tggcgcctta ggattcccgg gagatcccca tggtacgcgt gctagaggca tcaaataaaa 1200
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct 1260
ctcctgagta ggacaaatcc gccgccctag acctaggcgt tcggctgcgg cgagcggtat 1320
cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 1380
acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 1440
ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 1500
ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 1560
gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 1620
gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 1680
ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 1740
actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 1800
gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 1860
ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta 1920
ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 1980
gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 2040
tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 2100
tcatga 2106
<210>40
<211>3311
<212>DNA
<213>pGV1272
<400>40
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaattgt gagcggataa caattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attctgagga 1080
gaagtcgact tggaagcggc cgcttaggat ccttgaggag attggtacca tggccatgtt 1140
caccactacc gccaaggtta ttcagccgaa aatccgtggt tttatctgta cgaccaccca 1200
cccgattggc tgtgaaaaac gcgtgcagga agaaattgct tacgcacgtg cacatccacc 1260
gaccagcccg ggtccgaaac gtgtcctggt catcggctgt tccactggct acggcctgtc 1320
tactcgtatc accgcagctt tcggctatca ggcggctact ctgggcgtgt tcctggctgg 1380
tccgccgact aaaggtcgcc cggctgcggc cggttggtat aacaccgtag ctttcgaaaa 1440
agcggccctg gaagccggtc tgtatgcccg ctccctgaac ggtgacgctt ttgactctac 1500
taccaaagca cgcaccgtgg aagctatcaa acgtgacctg ggcaccgttg acctggtggt 1560
ttatagcatt gcagctccga aacgtaccga tccggctacc ggcgtgctgc acaaagcgtg 1620
tctgaaaccg atcggtgcga cctacaccaa ccgtacggta aatactgaca aagctgaagt 1680
tacggacgtg tccatcgaac cggcgagccc agaagaaatt gcagacactg tgaaagtaat 1740
gggtggcgaa gactgggaac tgtggattca ggctctgtct gaagccggcg ttctggcaga 1800
aggcgcgaaa accgtcgcat actcttatat cggtccggag atgacctggc cggtgtactg 1860
gtccggcacc attggtgaag ccaaaaagga tgttgaaaaa gccgctaaac gtattaccca 1920
gcagtacggc tgtccggcat acccggttgt ggcaaaagca ctggtgacgc aggcatcctc 1980
cgcgatcccg gtcgtcccgc tgtatatttg tctgctgtac cgtgtaatga aagaaaaagg 2040
cactcacgaa ggttgcatcg aacaaatggt gcgtctgctg accacgaaac tgtacccgga 2100
aaacggtgcc ccgatcgttg atgaagcggg ccgtgttcgt gtggacgatt gggaaatggc 2160
agaagacgtt cagcaagccg ttaaagacct gtggagccag gtgagcacgg caaacctgaa 2220
agatatttcc gacttcgccg gttaccaaac cgagttcctg cgcctgtttg gttttggtat 2280
cgatggcgtg gactatgacc agccggttga cgtagaggca gacctgccga gcgcagctca 2340
gcagtaaggc gccttaggat tcccgggaga tcccatggta cgcgtgctag aggcatcaaa 2400
taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga 2460
acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc tgcggcgagc 2520
ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg 2580
aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct 2640
ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca 2700
gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct 2760
cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc 2820
gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg tgtaggtcgt 2880
tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc 2940
cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc 3000
cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg 3060
gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc 3120
agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag 3180
cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga 3240
tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat 3300
tttggtcatg a 3311
<210>41
<211>3620
<212>DNA
<213>pGV1278
<400>41
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac 60
atcagcagga cgcactgacc gaattcatta aagaggagaa aggtaccatg agtactgaaa 120
tcaaaactca ggtcgtggta cttggggcag gccccgcagg ttactccgct gccttccgtt 180
gcgctgattt aggtctggaa accgtaatcg tagaacgtta caacaccctt ggcggtgttt 240
gcctgaacgt cggctgtatc ccttctaaag tactgctgca cgtagcaaaa gttatcgaag 300
aagccaaagc gctggctgaa cacggtatcg tcttcggcga accgaaaacc gatatcgaca 360
agattcgtac ctggaaagag aaagtgatca atcagctgac cggtggtctg gctggtatgg 420
cgaaaggccg caaagtcaaa gtggtcaacg gtctgggtaa attcaccggg gctaacaccc 480
tggaagttga aggtgagaac ggcaaaaccg tgatcaactt cgacaacgcg atcattgcag 540
cgggttctcg cccgatccaa ctgccgttta ttccgcatga agatccgcgt atctgggact 600
ccactgacgc gctggaactg aaagaagtac cagaacgcct gctggtaatg ggtggcggta 660
tcatcggtct ggaaatgggc accgtttacc acgcgctggg ttcacagatt gacgtggttg 720
aaatgttcga ccaggttatc ccggcagctg acaaagacat cgttaaagtc ttcaccaagc 780
gtatcagcaa gaaattcaac ctgatgctgg aaaccaaagt taccgccgtt gaagcgaaag 840
aagacggcat ttatgtgacg atggaaggca aaaaagcacc cgctgaaccg cagcgttacg 900
acgccgtgct ggtagcgatt ggtcgtgtgc cgaacggtaa aaacctcgac gcaggcaaag 960
caggcgtgga agttgacgac cgtggtttca tccgcgttga caaacagctg cgtaccaacg 1020
taccgcacat ctttgctatc ggcgatatcg tcggtcaacc gatgctggca cacaaaggtg 1080
ttcacgaagg tcacgttgcc gctgaagtta tcgccggtaa gaaacactac ttcgatccga 1140
aagttatccc gtccatcgcc tataccgaac cagaagttgc atgggtgggt ctgactgaga 1200
aagaagcgaa agagaaaggc atcagctatg aaaccgccac cttcccgtgg gctgcttctg 1260
gtcgtgctat cgcttccgac tgcgcagacg gtatgaccaa gctgattttc gacaaagaat 1320
ctcaccgtgt gatcggtggt gcgattgtcg gtactaacgg cggcgagctg ctgggtgaaa 1380
tcggcctggc aatcgaaatg ggttgtgatg ctgaagacat cgcactgacc atccacgcgc 1440
acccgactct gcacgagtct gtgggcctgg cggcagaagt gttcgaaggt agcattaccg 1500
acctgccgaa cccgaaagcg aagaagaagt aattggatcc catggtacgc gtgctagagg 1560
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 1620
tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc 1680
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 1740
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 1800
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 1860
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 1920
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 1980
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 2040
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 2100
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 2160
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 2220
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 2280
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 2340
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 2400
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 2460
aagggatttt ggtcatgact agtgcttgga ttctcaccaa taaaaaacgc ccggcggcaa 2520
ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc tatcaacagg 2580
agtccaagcg agctctcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 2640
agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 2700
cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 2760
ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 2820
tgatattcgg caagcaggca tcgccatggg tcacgacgag atcctcgccg tcgggcatgc 2880
gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 2940
catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 3000
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 3060
ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 3120
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 3180
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 3240
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 3300
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 3360
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 3420
ctcatcctgt ctcttgatca gatcttgatc ccctgcgcca tcagatcctt ggcggcaaga 3480
aagccatcca gtttactttg cagggcttcc caaccttacc agagggcgcc ccagctggca 3540
attccgacgt ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca 3600
cgaggccctt tcgtcttcac 3620
<210>42
<211>3620
<212>DNA
<213>pGV1279
<400>42
ctcgagtccc tatcagtgat agagattgac atccctatca gtgatagaga tactgagcac 60
atcagcagga cgcactgacc gaattcatta aagaggagaa aggtaccatg agtactgaaa 120
tcaaaactca ggtcgtggta cttggggcag gccccgcagg ttactccgct gccttccgtt 180
gcgctgattt aggtctggaa accgtaatcg tagaacgtta caacaccctt ggcggtgttt 240
gcctgaacgt cggctgtatc ccttctaaag cactgctgca cgtagcaaaa gttatcgaag 300
aagccaaagc gctggctgaa cacggtatcg tcttcggcga accgaaaacc gatatcgaca 360
agattcgtac ctggaaagag aaagtgatca atcagctgac cggtggtctg gctggtatgg 420
cgaaaggccg caaagtcaaa gtggtcaacg gtctgggtaa attcaccggg gctaacaccc 480
tggaagttga aggtgagaac ggcaaaaccg tgatcaactt cgacaacgcg atcattgcag 540
cgggttctcg cccgatccaa ctgccgttta ttccgcatga agatccgcgt atctgggact 600
ccactgacgc gctggaactg aaagaagtac cagaacgcct gctggtaatg ggtggcggta 660
tcatcggtct ggaaatgggc accgtttacc acgcgctggg ttcacagatt gacgtggttg 720
aaatgttcga ccaggttatc ccggcagctg acaaagacat cgttaaagtc ttcaccaagc 780
gtatcagcaa gaaattcaac ctgatgctgg aaaccaaagt taccgccgtt gaagcgaaag 840
aagacggcat ttatgtgacg atggaaggca aaaaagcacc cgctgaaccg cagcgttacg 900
acgccgtgct ggtagcgatt ggtcgtgtgc cgaacggtaa aaacctcgac gcaggcaaag 960
caggcgtgga agttgacgac cgtggtttca tccgcgttga caaacagctg cgtaccaacg 1020
taccgcacat ctttgctatc ggcgatatcg tcggtcaacc gatgctggca cacaaaggtg 1080
ttcacgaagg tcacgttgcc gctgaagtta tcgccggtaa gaaacactac ttcgatccga 1140
aagttatccc gtccatcgcc tataccgaac cagaagttgc atgggtgggt ctgactgaga 1200
aagaagcgaa agagaaaggc atcagctatg aaaccgccac cttcccgtgg gctgcttctg 1260
gtcgtgctat cgcttccgac tgcgcagacg gtatgaccaa gctgattttc gacaaagaat 1320
ctcaccgtgt gatcggtggt gcgattgtcg gtactaacgg cggcgagctg ctgggtgaaa 1380
tcggcctggc aatcgaaatg ggttgtgatg ctgaagacat cgcactgacc atccacgcgc 1440
acccgactct gcacgagtct gtgggcctgg cggcagaagt gttcgaaggt agcattaccg 1500
acctgccgaa cccgaaagcg aagaagaagt aattggatcc catggtacgc gtgctagagg 1560
catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat ctgttgtttg 1620
tcggtgaacg ctctcctgag taggacaaat ccgccgccct agacctaggc gttcggctgc 1680
ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata 1740
acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 1800
cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 1860
caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 1920
gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 1980
tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt 2040
aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 2100
ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 2160
cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 2220
tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 2280
tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 2340
ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 2400
aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 2460
aagggatttt ggtcatgact agtgcttgga ttctcaccaa taaaaaacgc ccggcggcaa 2520
ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc tatcaacagg 2580
agtccaagcg agctctcgaa ccccagagtc ccgctcagaa gaactcgtca agaaggcgat 2640
agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg aagcggtcag 2700
cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg tcctgatagc 2760
ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca ttttccacca 2820
tgatattcgg caagcaggca tcgccatggg tcacgacgag atcctcgccg tcgggcatgc 2880
gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct tcgtccagat 2940
catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg cgatgtttcg 3000
cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc attgcatcag 3060
ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc tgccccggca 3120
cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc acagctgcgc 3180
aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc agttcattca 3240
gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct gacagccgga 3300
acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg aatagcctct 3360
ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg cgaaacgatc 3420
ctcatcctgt ctcttgatca gatcttgatc ccctgcgcca tcagatcctt ggcggcaaga 3480
aagccatcca gtttactttg cagggcttcc caaccttacc agagggcgcc ccagctggca 3540
attccgacgt ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca 3600
cgaggccctt tcgtcttcac 3620
<210>43
<211>4244
<212>DNA
<213>pGV1281
<400>43
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacggaa ttccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acattgacat 1020
tgtgagcgga taacaagata ctgagcacat cagcaggacg cactgaccga attcattaaa 1080
gaggagaaag gtaccatggc catgttcacc actaccgcca aggttattca gccgaaaatc 1140
cgtggtttta tctgtacgac cacccacccg attggctgtg aaaaacgcgt gcaggaagaa 1200
attgcttacg cacgtgcaca tccaccgacc agcccgggtc cgaaacgtgt cctggtcatc 1260
ggctgttcca ctggctacgg cctgtctact cgtatcaccg cagctttcgg ctatcaggcg 1320
gctactctgg gcgtgttcct ggctggtccg ccgactaaag gtcgcccggc tgcggccggt 1380
tggtataaca ccgtagcttt cgaaaaagcg gccctggaag ccggtctgta tgcccgctcc 1440
ctgaacggtg acgcttttga ctctactacc aaagcacgca ccgtggaagc tatcaaacgt 1500
gacctgggca ccgttgacct ggtggtttat agcattgcag ctccgaaacg taccgatccg 1560
gctaccggcg tgctgcacaa agcgtgtctg aaaccgatcg gtgcgaccta caccaaccgt 1620
acggtaaata ctgacaaagc tgaagttacg gacgtgtcca tcgaaccggc gagcccagaa 1680
gaaattgcag acactgtgaa agtaatgggt ggcgaagact gggaactgtg gattcaggct 1740
ctgtctgaag ccggcgttct ggcagaaggc gcgaaaaccg tcgcatactc ttatatcggt 1800
ccggagatga cctggccggt gtactggtcc ggcaccattg gtgaagccaa aaaggatgtt 1860
gaaaaagccg ctaaacgtat tacccagcag tacggctgtc cggcataccc ggttgtggca 1920
aaagcactgg tgacgcaggc atcctccgcg atcccggtcg tcccgctgta tatttgtctg 1980
ctgtaccgtg taatgaaaga aaaaggcact cacgaaggtt gcatcgaaca aatggtgcgt 2040
ctgctgacca cgaaactgta cccggaaaac ggtgccccga tcgttgatga agcgggccgt 2100
gttcgtgtgg acgattggga aatggcagaa gacgttcagc aagccgttaa agacctgtgg 2160
agccaggtga gcacggcaaa cctgaaagat atttccgact tcgccggtta ccaaaccgag 2220
ttcctgcgcc tgtttggttt tggtatcgat ggcgtggact atgaccagcc ggttgacgta 2280
gaggcagacc tgccgagcgc agctcagcag taaggatcca ggaggaattt aaaatgaaga 2340
tcgttttagt cttatatgat gctggtaaac acgctgccga tgaagaaaaa ttatacggtt 2400
gtactgaaaa caaattaggt attgccaatt ggttgaaaga tcaaggacat gaattaatca 2460
ccacgtctga taaagaaggc ggaaacagtg tgttggatca acatatacca gatgccgata 2520
ttatcattac aactcctttc catcctgctt atatcactaa ggaaagaatc gacaaggcta 2580
aaaaattgaa attagttgtt gtcgctggtg tcggttctga tcatattgat ttggattata 2640
tcaaccaaac cggtaagaaa atctccgttt tggaagttac cggttctaat gttgtctctg 2700
ttgcagaaca cgttgtcatg accatgcttg tcttggttag aaattttgtt ccagctcacg 2760
aacaaatcat taaccacgat tgggaggttg ctgctatcgc taaggatgct tacgatatcg 2820
aaggtaaaac tatcgccacc attggtgccg gtagaattgg ttacagagtc ttggaaagat 2880
tagtcccatt caatcctaaa gaattattat actacgatta tcaagcttta ccaaaagatg 2940
ctgaagaaaa agttggtgct agaagggttg aaaatattga agaattggtt gcccaagctg 3000
atatagttac agttaatgct ccattacacg ctggtacaaa aggtttaatt aacaaggaat 3060
tattgtctaa attcaagaaa ggtgcttggt tagtcaatac tgcaagaggt gccatttgtg 3120
ttgccgaaga tgttgctgca gctttagaat ctggtcaatt aagaggttat ggtggtgatg 3180
tttggttccc acaaccagct ccaaaagatc acccatggag agatatgaga aacaaatatg 3240
gtgctggtaa cgccatgact cctcattact ctggtactac tttagatgct caaactagat 3300
acgctcaagg tactaaaaat atcttggagt cattctttac tggtaagttt gattacagac 3360
cacaagatat catcttatta aacggtgaat acgttaccaa agcttacggt aaacacgata 3420
agaaataacc tagggcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 3480
acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 3540
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 3600
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 3660
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 3720
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcaatgctc 3780
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 3840
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 3900
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 3960
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 4020
gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 4080
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 4140
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 4200
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga 4244
<210>44
<211>1395
<212>DNA
<213>合成的
<400>44
atgaatcgtt ccgcaatcgg cgtctcctct atggtgggta acctggtttt ctctgttatc 60
tccgttaaac gtgagatcac gggccagtct ggtactttcc gtgcccgtcc gccagccatc 120
ggctgcttcc tgtacaacgc acgcgatttc tccgatttcc gcccgtctcc gccgtttcgt 180
caggaagtat ctatgatcat caaacctcgc gttcgtggct tcatctgcgt taccacccac 240
ccagttggct gtgaggcgaa cgttaaagaa cagatcgact acgttacgag ccacggcccg 300
attgcaaacg gtccgaaaaa ggtactggta attggtgcga gcaccggtta cggcctggcc 360
gctcgcatca gcgccgcttt cggtagcggc gcagacactc tgggtgtttt cttcgaacgt 420
gcaggtagcg aaaccaagcc gggcaccgcg ggttggtaca actccgccgc cttcgaaaaa 480
ttcgctgcgg aaaagggcct gtacgctcgt tccatcaatg gcgatgcgtt cagcgacaaa 540
gtaaaacagg tgaccatcga caccattaag caggacctgg gtaaggtgga cctggttgtt 600
tattctctgg ctgcgccacg ccgtacccat ccgaagacgg gtgaaaccat ctccagcacc 660
ctgaagcctg tgggtaaagc ggttactttc cgcggcctgg atacggacaa agaggttatc 720
cgcgaagtat ccctggaacc ggcaacccaa gaagagattg acggcaccgt ggcagttatg 780
ggcggcgagg attggcagat gtggatcgac gctctggatg aggcaggcgt actggccgac 840
ggcgctaaaa ctaccgcttt cacttacctg ggtgaacaga tcacccatga catctattgg 900
aacggcagca ttggcgaagc taaaaaggac ctggacaaga aagtgctgag cattcgcgac 960
aagctggccg cgcacggcgg cgatgctcgc gtaagcgtcc tgaaagcagt cgtgacccaa 1020
gcgtcttctg caatcccgat gatgccgctg tatctgagcc tgctgttcaa agtgatgaag 1080
gagactggca ctcatgaagg ttgtatcgaa caggtgtacg gcctgctgaa agacagcctg 1140
tatggtgcta ctccacacgt agacgaagag ggccgtctgc gtgctgacta taaagaactg 1200
gacccgcagg tacaagataa agtggtagct atgtgggata aagttaccaa cgaaaatctg 1260
tacgaaatga ctgacttcgc gggttacaaa accgaatttc tgcgcctgtt cggctttgaa 1320
atcgcaggtg ttgattatga tgccgacgtt aatcctgatg ttaagattcc gggcattatt 1380
gatactacgg tttga 1395
<210>45
<211>1221
<212>DNA
<213>合成的
<400>45
atgatcgtcc agccgaaagt tcgcggtttt atctgcacta ccgcacaccc agaaggctgc 60
gcgcgtcacg ttggtgagtg gatcaattat gctaagcagg agccttccct gaccggcggt 120
ccgcagaaag tactgattat cggtgcgagc acgggctttg gtctggcgtc tcgtatcgtg 180
gctgccttcg gtgcgggtgc taaaacgatt ggtgtgtttt tcgaacgtcc ggcttctggc 240
aaacgcaccg cgtcccctgg ttggtacaat actgcagcgt tcgagaagac cgctctggcg 300
gctggcctgt acgcgaaatc tatcaacggc gacgcgttca gcgacgaaat taaacagcaa 360
accatcgacc tgatccagaa agattggcag ggcggtgttg acctggtaat ttactctatc 420
gcgagcccgc gtcgcgtaca cccgcgtact ggtgaaatct tcaactctgt cctgaaacct 480
attggtcaga cctaccacaa caaaactgtg gacgtaatga ccggcgaagt ttccccggta 540
tctattgagc cggcaacgga aaaggaaatc cgcgacactg aagcggtaat gggtggcgac 600
gactgggcgc tgtggatcaa cgcgctgttc aaatacaact gcctggccga aggcgtcaaa 660
accgttgcgt tcacctatat tggtccggaa ctgacccacg cggtatatcg taacggcact 720
atcggccgtg cgaaactgca cctggaaaag actgctcgcg aactggatac ccagctggag 780
agcgcgctgt ctggtcaggc tctgatttct gttaacaaag ccctggtgac ccaggcttcc 840
gcagctatcc cggtagttcc gctgtatatc tccctgctgt ataaaatcat gaaagagaaa 900
aacatccacg agggttgcat cgagcagatg tggcgtctgt ttaaggagcg cctgtactct 960
aaccagaaca tccctactga ctccgaaggc cgcatccgta ttgatgactg ggaaatgcgc 1020
gaagacgtac aagcggaaat caaacgtctg tgggaatcca tcaacaccgg taacgttgaa 1080
actgtctctg atatcgctgg ctatcgtgag gacttctata aactgttcgg tttcggtctg 1140
aacggtatcg actacgaacg tggcgttgaa attgaaaagg ctatcccgtc catcactgtt 1200
actcctgaaa acccggaata a 1221
<210>46
<211>1179
<212>DNA
<213>合成的
<400>46
atgatcatta aaccgaaggt gcgtggcttt atctgcacta ctgctcatcc ggtcggctgt 60
gcagagaatg ttcaacagca gatcgactac gtagcagccc agaacgcccc gtctagcggc 120
ccgaaaaatg tactggtcat cggttgcagc aacggttacg gtctggcgtc ccgcatcacc 180
agcgcattcg gctttggtgc gaacaccctg ggcgtcatgt tcgaaaaaga accgaccgaa 240
cgccgtccgg catctgccgg ttggtataac acccgtgcgc tggagaaagc ggctcaggaa 300
aaaggtctgt acgcgcaatc tctgaatgtg gatgcgttct ccgatgaagc taaaaccgca 360
gtaatcgagg ctgtgaaagc taacatgggt aaaattgatc tggtcgttta cagcctgggt 420
gcaccgcgtc gtaaagatcc ggaaaccggc actgtctact ccagcacgct gaaacctatt 480
ggcaaagctg tgacccgtaa aaacctgaac actgacaccc gtgaggtagg tgaagtgact 540
ctggaaccag cgaccgaaga agaaattttc aacacggtga aagtaatggg cggtgaagac 600
tgggaacgct ggatgaccgc tctggacgac gctggcgtgc tggcagacgg cgttaaaact 660
accgcgtata cctacattgg taaagagctg acctggccga tctacggcgg tgcgaccatc 720
ggcaaggcta aagaagatct ggatcgcgca tccgttgcta ttaacaagaa actggcagac 780
aaatatcagg gtgttagcta cgtcgcagtg ctgaaagcgc tggtaactca gtcttcttcc 840
gccatcccag taatgccgct gtacatttct gctctgtatc gtgttatgaa ggaagaaggc 900
acgcacgaag gctgcatcga gcagatcacg ggcctgtttt tcgaccagct gttctctgaa 960
aacgccctga acctggatga taccggccgt atccgcatgg aagataacga actgaaagcg 1020
tctgtacagg agaaagttgc tgcgatctgg gaacaggtta acacggaaaa tctggacgag 1080
ctgaccgact tcaaaggtta ccaggaagaa tttttcaaac tgttcggttt cggcttcgaa 1140
ggtgttgatt acgacgcaga cgtagatcca gtggtgtga 1179
<210>47
<211>1203
<212>DNA
<213>合成的
<400>47
atgattatca aaccgaaaac gcgtggcttt atctgcacta ccacccaccc ggttggttgt 60
gaagccaacg ttctggaaca aatcaacacc actaaagcca aaggcccgat caccaatggt 120
ccaaaaaaag ttctggttat tggcagctcc agcggttacg gtctgtcttc ccgtatcgct 180
gcggcgtttg gttccggtgc agcgaccctg ggtgtattct tcgaaaaacc gggcaccgag 240
aagaaacctg gcaccgctgg ttggtataac agcgctgctt tcgataaatt cgctaaggca 300
gatggcctgt actctaaatc tattaacggt gacgcgttct cccacgaagc caaacagaaa 360
gcgatcgacc tgatcaaagc ggatctgggc caaattgaca tggttgtgta ctctctggct 420
tctccggttc gtaaactgcc ggattccggc gaactgattc gttctagcct gaaaccaatc 480
ggcgaaactt acaccgctac tgctgttgac acgaacaaag acctgatcat tgaaacgagc 540
gttgaaccag cgagcgaaca ggaaatccaa gatactgtaa ccgtaatggg cggtgaagac 600
tgggaactgt ggctggccgc gctgagcgat gctggtgtcc tggcggatgg ctgcaaaacc 660
gttgcgtact cttacattgg tacggaactg acctggccga tctactggca cggcgctctg 720
ggcaaggcaa aaatggacct ggaccgtgcc gcaaaagcgc tggacgaaaa actgagcacg 780
accggtggct ctgcaaatgt ggctgtgctg aaatctgtag tgacccaggc gtcctccgct 840
atcccggtga tgccgctgta catcgccatg gtattcaaaa agatgcgcga agaaggtctg 900
cacgaaggct gcatggaaca gatcaaccgt atgttcgcgg aacgtctgta ccgtgaagat 960
ggtcaggctc cgcaggtcga tgatgcaaat cgtctgcgcc tggacgattg ggaactgcgc 1020
gaggagatcc agcagcactg ccgtgatctg tggccgtctg tgactactga gaacctgagc 1080
gagctgaccg actaccgtga atataaagat gagttcctga aactgttcgg tttcggcgtt 1140
gaaggtgtag attacgacgc cgacgttaac ccggaagtaa acttcgacgt agaacagttc 1200
taa 1203
<210>48
<211>1194
<212>DNA
<213>合成的
<400>48
atgatcgtaa agcctatggt tcgtaacaat atttgcctga acgctcatcc gcagggttgc 60
aagaaaggtg tcgaggatca gattgaatac accaagaaac gtattaccgc tgaagttaaa 120
gcaggtgcta aagcgccgaa aaacgtgctg gttctgggct gttccaacgg ctacggcctg 180
gcgtctcgca tcactgctgc gtttggttat ggtgcggcta ctatcggtgt ttcttttgaa 240
aaagcgggct ccgaaaccaa atatggcacc ccaggttggt acaacaacct ggcgttcgat 300
gaagcggcta aacgcgaggg cctgtactct gtgactatcg acggtgacgc cttcagcgat 360
gaaatcaaag cacaggttat cgaggaagcc aaaaagaaag gcattaagtt tgacctgatt 420
gtgtactctc tggctagccc ggtgcgtacc gatccggata ccggcatcat gcacaaatcc 480
gtcctgaaac cgttcggcaa aactttcacc ggtaaaacgg tagatccgtt cactggtgag 540
ctgaaagaaa tctctgccga gccagctaac gatgaagagg cagctgctac tgtcaaagtc 600
atgggtggtg aagattggga acgttggatc aaacagctgt ctaaagaagg tctgctggag 660
gaaggctgca ttaccctggc atactcctac attggtccag aggccactca ggcgctgtat 720
cgtaaaggta ctatcggtaa agctaaagaa cacctggaag ctacggctca ccgtctgaac 780
aaagaaaacc cgtccatccg tgcattcgtt tccgtcaaca agggcctggt cacccgtgca 840
tccgcagtta tcccggtcat ccctctgtat ctggcttccc tgttcaaggt tatgaaggaa 900
aaaggtaacc atgagggttg tatcgaacag atcacccgtc tgtacgccga acgtctgtac 960
cgcaaggatg gcaccatccc ggttgatgag gaaaaccgca ttcgtatcga cgactgggaa 1020
ctggaagaag atgttcaaaa agctgtgtct gcgctgatgg aaaaagtgac cggcgaaaat 1080
gcggaatccc tgacggacct ggcgggctat cgtcatgact ttctggcgtc caacggtttt 1140
gatgttgagg gcatcaacta tgaagcggaa gtagagcgtt ttgaccgcat ttaa 1194
<210>49
<211>1386
<212>DNA
<213>合成的
<400>49
atgcgtctgc tgttcgaagc agttcacgcg cgtaagcgtt ggcatcgtac tgcgccggct 60
gccgcattca ctcgttttca caccgctgca tgcgtgactc atcaggcagt ttcccgtgct 120
ccacacgccc tgcgttgtcg ccagcacctg gcagatcagg agtccacgct gatcattcac 180
ccgaaagtac gtggtttcat ctgcacgacc actcaccctc tgggttgcga acgtaacgtc 240
ctggaacaga tcgcggctac tcgtgctcgc ggtgttcgta acgatggtcc gaagaaagtt 300
ctggtgatcg gcgcgtctag cggttacggt ctggccagcc gcattaccgc cgcattcggt 360
ttcggtgcgg ataccctggg tgttttcttc gaaaaaccgg gtactgcctc taaagctggc 420
acggcgggtt ggtacaactc cgcagcattc gacaagcacg caaaagcggc tggtctgtac 480
tctaaatcta tcaatggtga tgcgttcagc gatgcggcgc gtgcacaggt gatcgaactg 540
atcaaaactg agatgggtgg tcaagttgac ctggttgttt actctctggc ctccccggta 600
cgtaaactgc cgggctctgg tgaagttaaa cgttctgcgc tgaagccaat cggccagacc 660
tacaccgcaa cggcgatcga caccaacaag gacactatca tccaggcttc cattgaacct 720
gcttctgcgc aggaaatcga ggataccatc accgtgatgg gcggccaaga ctgggaactg 780
tggatcgacg cactggaagg tgcaggcgta ctggcagatg gcgctcgttc tgtagcgttc 840
tcctatatcg gcaccgaaat cacttggccg atctactggc atggcgcact gggcaaagca 900
aaagtggacc tggaccgtac cgctcaacgt ctgaatgccc gtctggcaaa acacggtggt 960
ggcgcaaacg tggcagttct gaagagcgta gtgacccaag cttctgccgc tattccggtt 1020
atgccgctgt acatttccat ggtgtataaa atcatgaaag aaaaaggtct gcatgagggt 1080
actatcgaac agctggatcg cctgtttcgt gaacgtctgt accgccagga cggtcagccg 1140
gcagaagtag atgaagttga tgaacagaac cgtctgcgcc tggacgattg ggaactgcgc 1200
gacgatgtac aggacgcctg caaggctctg tggccgcagg taactactga aaatctgttc 1260
gagctgaccg attacgcggg ctacaaacat gagttcctga aactgtttgg cttcggccgt 1320
accgacgttg attacgatgc ggatgttgca actgacgtgg ctttcgattg tatcgaactg 1380
gcctga 1386
<210>50
<211>1200
<212>DNA
<213>合成的
<400>50
atgatcatta aaccgcgtgt tcgtggcttt atctgtgtta ccgctcatcc gaccggctgc 60
gaagcgaacg tcaaaaagca gatcgactac gttaccactg aaggcccgat cgctaacggc 120
cctaaacgcg ttctggtaat tggcgcttct accggttacg gcctggcggc acgtatcacc 180
gccgcgtttg gttgcggcgc tgacaccctg ggtgtgttct tcgaacgtcc gggtgaagaa 240
ggcaaaccgg gcacttctgg ctggtacaac tccgcagcgt ttcacaaatt tgccgctcag 300
aaaggtctgt acgcaaaatc tatcaacggc gacgctttca gcgacgaaat caaacagctg 360
accattgacg cgatcaaaca ggacctgggc caggtagatc aggtgatcta ctccctggcc 420
tctccgcgtc gcacccaccc taaaaccggt gaagtattca attccgccct gaagccgatc 480
ggtaacgcag taaacctgcg cggcctggat accgacaagg aggtgatcaa agaaagcgtg 540
ctgcagccgg caacccagtc tgaaattgac tccactgttg cggtgatggg tggcgaagat 600
tggcagatgt ggatcgacgc gctgctggat gcaggcgtac tggcagaagg cgctcagact 660
accgcgttca cgtacctggg cgaaaagatc acccatgaca tttattggaa cggttccatt 720
ggcgctgcca aaaaggacct ggatcagaaa gttctggcta tccgtgaatc cctggctgct 780
cacggtggtg gcgatgcacg tgtctccgtg ctgaaagcag tcgtcaccca ggcgtcctcc 840
gcgattccaa tgatgccgct gtatctgagc ctgctgttta aagtcatgaa ggaaaaaggc 900
acccacgagg gctgcattga acaggtgtac tctctgtata aagattctct gtgtggtgat 960
agcccacata tggaccagga aggtcgtctg cgtgctgact ataaagagct ggacccggaa 1020
gtgcagaacc aggttcagca gctgtgggat caagttacta acgacaacat ttaccagctg 1080
acggatttcg taggctacaa atctgagttt ctgaacctgt tcggtttcgg tatcgacggt 1140
gtggactatg atgccgatgt caacccggat gtaaagattc cgaacctgat ccaaggttaa 1200
<210>51
<211>1188
<212>DNA
<213>合成的
<400>51
atggttattt ctcctaaggt tcgcggcttt atttgcacta atgcgcaccc ggttggttgt 60
gcgaaaagcg tggaaaacca gatcgcttac gttaaagcgc agggtctgtc tgctgaggcg 120
gcagatgcac cgaaaaacgt gctggttctg ggctgttcca ccggctatgg tctggcgtct 180
cgtatcactg cgtcctttgg ctatggtgcc aacactgtag gcgtttgttt cgaaaaagct 240
ccgacggaac gcaaaaccgg tactgcgggt tggtataaca cggcggcgtt ccacagcgaa 300
gcaaaagccg caggcgttca ggcccatacc ctgaatggcg acgcattctc caacgaactg 360
aaagcacaga ccatcgaaac cctgaagaac accatcggta aagttgacct ggtggtgtac 420
tctctggcgt ccccgcgtcg taccgacccg gaaactggtg aagtgtataa gagcaccctg 480
aaaccggttg gtcaggcata tgagaccaag acctacgaca ctgacaaaga tctgatccac 540
acggtggctc tggaaccggc ttctcaggat gaaattgata acaccatcaa agtgatgggt 600
ggtgaagact gggaactgtg gatcaaagcg ctggcggaag cggatctgct ggcggagggt 660
gctaaaacca ccgcttacac ctacatcggc aaaaagctga cctggccgat ctacggctcc 720
gccactatcg gcaaagcaaa agaagacctg gatcgcgctg ccaccgcgat caacaccacc 780
tacgcaaacc tgaacgttga tgctcacgta tctagcctga aagccctggt gacccaagcc 840
tcttccgcta tcccggtcat gcctctgtat atcagcctga tttacaaagt tatgaaagaa 900
gagggcactc acgaaggttg tatcgaacag atcgttggtc tgtttactca gtgcctgctg 960
aacgacggcg cgactctgga tgaagttaac cgttatcgta tggatggtaa agaaactaac 1020
gacgccactc aggctaaaat tgaagagctg tggcaccagg tgacccagga caactttcac 1080
gaactgtccg actacgctgg ttataacgct gatttcctga acctgtttgg ttttggcatc 1140
gaaggtgttg attacgaagc ggacgttgat ccgcaggtgt cctggtaa 1188
<210>52
<211>1198
<212>DNA
<213>合成的
<400>52
ggtaccatga ttattgaacc taagatgcgt ggctttattt gtctgacctc ccacccgacg 60
ggttgtgaac agaacgttat caaccagatc aactacgtga aaagcaaagg cgttattaat 120
ggcccgaaga aagttctggt tattggcgca tccactggct tcggcctggc gtctcgtatc 180
acttctgctt tcggtagcaa tgctgcgacg atcggtgtct tcttcgaaaa accggcgcag 240
gagggtaaac cgggctctcc gggctggtat aacaccgtag ctttccagaa tgaggccaaa 300
aaggctggca tttacgctaa aagcatcaac ggtgatgcct tttccactga agtaaagcag 360
aaaaccatcg acctgattaa agctgatctg ggtcaagtgg acctggttat ctacagcctg 420
gcaagccctg ttcgtaccaa cccggtaacc ggtgtaaccc accgctctgt actgaaaccg 480
attggtggtg cgttctctaa caaaactgtt gacttccata ccggcaacgt aagcaccgtt 540
accatcgaac cagcgaacga agaagatgtt accaacaccg tcgctgttat gggtggtgag 600
gattggggca tgtggatgga cgcgatgctg gaagcaggcg ttctggccga aggcgcaact 660
acggttgcat attcctacat cggtccggct ctgaccgaag cggtgtatcg taagggcact 720
atcggccgtg cgaaagacca cctggaggca tctgctgcaa ccattactga taaactgaaa 780
tctgttaaag gtaaagccta cgtgtctgtg aacaaagcgc tggtcaccca ggcttccagc 840
gcaattccgg ttattccgct gtacatctct ctgctgtaca aggttatgaa agcagagggc 900
attcacgaag gttgtatcga acagattcag cgtctgtacg ctgaccgtct gtacacgggc 960
aaagctatcc caacggacga gcagggccgt atccgtatcg acgattggga aatgcgtgaa 1020
gatgtccagg cgaacgttgc agcactgtgg gaacaagtta cttctgaaaa cgtttccgac 1080
atctctgacc tgaaaggtta taagaacgac tttctgaacc tgttcggttt cgcggttaac 1140
aaagttgatt atctggctga cgtgaacgaa aacgttacga tcgaaggtct ggtatgag 1198
<210>53
<211>1203
<212>DNA
<213>合成的
atgatcatta aacctcgtat ccgtggcttt atctgcacca cgactcaccc ggtaggttgc 60
gaagctaacg tcaaagaaca aatcgcatac actaaagctc agggcccgat caaaaacgcc 120
cctaaacgtg ttctggttgt tggtgcctcc tccggttatg gtctgtcttc tcgtatcgcg 180
gcagcgtttg gcggcggtgc ttccaccatc ggcgtgttct tcgaaaagga aggcaccgaa 240
aagaaacctg gtactgctgg cttctacaac gctgcggcgt tcgaaaaact ggcgcgtgaa 300
gagggcctgt acgccaagag cctgaacggc gatgcattct ccaacgaggc gaaacagaaa 360
accattgaac tgatcaaaga agacctgggt caaattgata tggtggttta cagcctggca 420
tccccggtgc gcaaaatgcc ggaaaccggt gaactggtgc gcagcgcact gaaaccgatt 480
ggtgagactt atacctctac cgcggtcgat acgaataagg atgtgatcat tgaagcgagc 540
gttgaaccgg cgaccgaaga ggaaatcaaa gataccgtga ctgtaatggg tggtgaggat 600
tgggaactgt ggatcaatgc gctgagcgat gcaggcgtgc tggctgaagg ttgcaaaact 660
gttgcttata gctacattgg caccgaactg acctggccta tctactggga cggtgcactg 720
ggtaaagcta aaatggatct ggatcgtgca gccaaagcac tgaacgacaa actggcggca 780
accggtggct ctgcgaatgt cgctgttctg aaatccgttg taacccaagc ttcctccgca 840
atcccggtta tgccgctgta tatcgcaatg gtgttcaaga aaatgcgcga agaaggtgta 900
cacgaaggct gcatggaaca gatttaccgt atgttctctc agcgtctgta caaggaagac 960
ggctctgctg ccgaggttga tgaaatgaac cgtctgcgtc tggacgattg ggagctgcgc 1020
gacgacattc agcagcactg ccgtgaactg tggccgcaga ttaccaccga aaatctgaaa 1080
gaactgaccg attacgttga atataaggaa gagttcctga aactgttcgg tttcggtgtt 1140
gagggcgttg attacgaagc agacgtgaac ccggctgtgg aagccgattt catccagatc 1200
taa 1203
<210>54
<211>3487
<212>DNA
<213>pGV1340
<400>54
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gaatcgttcc 1140
gcaatcggcg tctcctctat ggtgggtaac ctggttttct ctgttatctc cgttaaacgt 1200
gagatcacgg gccagtctgg tactttccgt gcccgtccgc cagccatcgg ctgcttcctg 1260
tacaacgcac gcgatttctc cgatttccgc ccgtctccgc cgtttcgtca ggaagtatct 1320
atgatcatca aacctcgcgt tcgtggcttc atctgcgtta ccacccaccc agttggctgt 1380
gaggcgaacg ttaaagaaca gatcgactac gttacgagcc acggcccgat tgcaaacggt 1440
ccgaaaaagg tactggtaat tggtgcgagc accggttacg gcctggccgc tcgcatcagc 1500
gccgctttcg gtagcggcgc agacactctg ggtgttttct tcgaacgtgc aggtagcgaa 1560
accaagccgg gcaccgcggg ttggtacaac tccgccgcct tcgaaaaatt cgctgcggaa 1620
aagggcctgt acgctcgttc catcaatggc gatgcgttca gcgacaaagt aaaacaggtg 1680
accatcgaca ccattaagca ggacctgggt aaggtggacc tggttgttta ttctctggct 1740
gcgccacgcc gtacccatcc gaagacgggt gaaaccatct ccagcaccct gaagcctgtg 1800
ggtaaagcgg ttactttccg cggcctggat acggacaaag aggttatccg cgaagtatcc 1860
ctggaaccgg caacccaaga agagattgac ggcaccgtgg cagttatggg cggcgaggat 1920
tggcagatgt ggatcgacgc tctggatgag gcaggcgtac tggccgacgg cgctaaaact 1980
accgctttca cttacctggg tgaacagatc acccatgaca tctattggaa cggcagcatt 2040
ggcgaagcta aaaaggacct ggacaagaaa gtgctgagca ttcgcgacaa gctggccgcg 2100
cacggcggcg atgctcgcgt aagcgtcctg aaagcagtcg tgacccaagc gtcttctgca 2160
atcccgatga tgccgctgta tctgagcctg ctgttcaaag tgatgaagga gactggcact 2220
catgaaggtt gtatcgaaca ggtgtacggc ctgctgaaag acagcctgta tggtgctact 2280
ccacacgtag acgaagaggg ccgtctgcgt gctgactata aagaactgga cccgcaggta 2340
caagataaag tggtagctat gtgggataaa gttaccaacg aaaatctgta cgaaatgact 2400
gacttcgcgg gttacaaaac cgaatttctg cgcctgttcg gctttgaaat cgcaggtgtt 2460
gattatgatg ccgacgttaa tcctgatgtt aagattccgg gcattattga tactacggtt 2520
tgaggcgcct taggattccc gggagatccc atggtacgcg tgctagaggc atcaaataaa 2580
acgaaaggct cagtcgaaag actgggcctt tcgttttatc tgttgtttgt cggtgaacgc 2640
tctcctgagt aggacaaatc cgccgcccta gacctaggcg ttcggctgcg gcgagcggta 2700
tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 2760
aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg 2820
tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc aagtcagagg 2880
tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag ctccctcgtg 2940
cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct cccttcggga 3000
agcgtggcgc tttctcaatg ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc 3060
tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc cttatccggt 3120
aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc agcagccact 3180
ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt gaagtggtgg 3240
cctaactacg gctacactag aaggacagta tttggtatct gcgctctgct gaagccagtt 3300
accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc tggtagcggt 3360
ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca agaagatcct 3420
ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg 3480
gtcatga 3487
<210>55
<211>3313
<212>DNA
<213>pGV1341
<400>55
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcgtccag 1140
ccgaaagttc gcggttttat ctgcactacc gcacacccag aaggctgcgc gcgtcacgtt 1200
ggtgagtgga tcaattatgc taagcaggag ccttccctga ccggcggtcc gcagaaagta 1260
ctgattatcg gtgcgagcac gggctttggt ctggcgtctc gtatcgtggc tgccttcggt 1320
gcgggtgcta aaacgattgg tgtgtttttc gaacgtccgg cttctggcaa acgcaccgcg 1380
tcccctggtt ggtacaatac tgcagcgttc gagaagaccg ctctggcggc tggcctgtac 1440
gcgaaatcta tcaacggcga cgcgttcagc gacgaaatta aacagcaaac catcgacctg 1500
atccagaaag attggcaggg cggtgttgac ctggtaattt actctatcgc gagcccgcgt 1560
cgcgtacacc cgcgtactgg tgaaatcttc aactctgtcc tgaaacctat tggtcagacc 1620
taccacaaca aaactgtgga cgtaatgacc ggcgaagttt ccccggtatc tattgagccg 1680
gcaacggaaa aggaaatccg cgacactgaa gcggtaatgg gtggcgacga ctgggcgctg 1740
tggatcaacg cgctgttcaa atacaactgc ctggccgaag gcgtcaaaac cgttgcgttc 1800
acctatattg gtccggaact gacccacgcg gtatatcgta acggcactat cggccgtgcg 1860
aaactgcacc tggaaaagac tgctcgcgaa ctggataccc agctggagag cgcgctgtct 1920
ggtcaggctc tgatttctgt taacaaagcc ctggtgaccc aggcttccgc agctatcccg 1980
gtagttccgc tgtatatctc cctgctgtat aaaatcatga aagagaaaaa catccacgag 2040
ggttgcatcg agcagatgtg gcgtctgttt aaggagcgcc tgtactctaa ccagaacatc 2100
cctactgact ccgaaggccg catccgtatt gatgactggg aaatgcgcga agacgtacaa 2160
gcggaaatca aacgtctgtg ggaatccatc aacaccggta acgttgaaac tgtctctgat 2220
atcgctggct atcgtgagga cttctataaa ctgttcggtt tcggtctgaa cggtatcgac 2280
tacgaacgtg gcgttgaaat tgaaaaggct atcccgtcca tcactgttac tcctgaaaac 2340
ccggaataag gcgccttagg attcccggga gatcccatgg tacgcgtgct agaggcatca 2400
aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt gtttgtcggt 2460
gaacgctctc ctgagtagga caaatccgcc gccctagacc taggcgttcg gctgcggcga 2520
gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 2580
ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 2640
ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 2700
cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 2760
ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 2820
tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc ggtgtaggtc 2880
gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 2940
tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 3000
gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 3060
tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 3120
ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 3180
agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 3240
gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 3300
attttggtca tga 3313
<210>56
<211>3271
<212>DNA
<213>pGV1342
<400>56
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcattaaa 1140
ccgaaggtgc gtggctttat ctgcactact gctcatccgg tcggctgtgc agagaatgtt 1200
caacagcaga tcgactacgt agcagcccag aacgccccgt ctagcggccc gaaaaatgta 1260
ctggtcatcg gttgcagcaa cggttacggt ctggcgtccc gcatcaccag cgcattcggc 1320
tttggtgcga acaccctggg cgtcatgttc gaaaaagaac cgaccgaacg ccgtccggca 1380
tctgccggtt ggtataacac ccgtgcgctg gagaaagcgg ctcaggaaaa aggtctgtac 1440
gcgcaatctc tgaatgtgga tgcgttctcc gatgaagcta aaaccgcagt aatcgaggct 1500
gtgaaagcta acatgggtaa aattgatctg gtcgtttaca gcctgggtgc accgcgtcgt 1560
aaagatccgg aaaccggcac tgtctactcc agcacgctga aacctattgg caaagctgtg 1620
acccgtaaaa acctgaacac tgacacccgt gaggtaggtg aagtgactct ggaaccagcg 1680
accgaagaag aaattttcaa cacggtgaaa gtaatgggcg gtgaagactg ggaacgctgg 1740
atgaccgctc tggacgacgc tggcgtgctg gcagacggcg ttaaaactac cgcgtatacc 1800
tacattggta aagagctgac ctggccgatc tacggcggtg cgaccatcgg caaggctaaa 1860
gaagatctgg atcgcgcatc cgttgctatt aacaagaaac tggcagacaa atatcagggt 1920
gttagctacg tcgcagtgct gaaagcgctg gtaactcagt cttcttccgc catcccagta 1980
atgccgctgt acatttctgc tctgtatcgt gttatgaagg aagaaggcac gcacgaaggc 2040
tgcatcgagc agatcacggg cctgtttttc gaccagctgt tctctgaaaa cgccctgaac 2100
ctggatgata ccggccgtat ccgcatggaa gataacgaac tgaaagcgtc tgtacaggag 2160
aaagttgctg cgatctggga acaggttaac acggaaaatc tggacgagct gaccgacttc 2220
aaaggttacc aggaagaatt tttcaaactg ttcggtttcg gcttcgaagg tgttgattac 2280
gacgcagacg tagatccagt ggtgtgaggc gccttaggat tcccgggaga tcccatggta 2340
cgcgtgctag aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt 2400
tatctgttgt ttgtcggtga acgctctcct gagtaggaca aatccgccgc cctagaccta 2460
ggcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 2520
gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 2580
cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 2640
aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 2700
tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 2760
ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat 2820
ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 2880
cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 2940
ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 3000
gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 3060
atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 3120
aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 3180
aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 3240
gaaaactcac gttaagggat tttggtcatg a 3271
<210>57
<211>3295
<212>DNA
<213>pGV1343
<400>57
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gattatcaaa 1140
ccgaaaacgc gtggctttat ctgcactacc acccacccgg ttggttgtga agccaacgtt 1200
ctggaacaaa tcaacaccac taaagccaaa ggcccgatca ccaatggtcc aaaaaaagtt 1260
ctggttattg gcagctccag cggttacggt ctgtcttccc gtatcgctgc ggcgtttggt 1320
tccggtgcag cgaccctggg tgtattcttc gaaaaaccgg gcaccgagaa gaaacctggc 1380
accgctggtt ggtataacag cgctgctttc gataaattcg ctaaggcaga tggcctgtac 1440
tctaaatcta ttaacggtga cgcgttctcc cacgaagcca aacagaaagc gatcgacctg 1500
atcaaagcgg atctgggcca aattgacatg gttgtgtact ctctggcttc tccggttcgt 1560
aaactgccgg attccggcga actgattcgt tctagcctga aaccaatcgg cgaaacttac 1620
accgctactg ctgttgacac gaacaaagac ctgatcattg aaacgagcgt tgaaccagcg 1680
agcgaacagg aaatccaaga tactgtaacc gtaatgggcg gtgaagactg ggaactgtgg 1740
ctggccgcgc tgagcgatgc tggtgtcctg gcggatggct gcaaaaccgt tgcgtactct 1800
tacattggta cggaactgac ctggccgatc tactggcacg gcgctctggg caaggcaaaa 1860
atggacctgg accgtgccgc aaaagcgctg gacgaaaaac tgagcacgac cggtggctct 1920
gcaaatgtgg ctgtgctgaa atctgtagtg acccaggcgt cctccgctat cccggtgatg 1980
ccgctgtaca tcgccatggt attcaaaaag atgcgcgaag aaggtctgca cgaaggctgc 2040
atggaacaga tcaaccgtat gttcgcggaa cgtctgtacc gtgaagatgg tcaggctccg 2100
caggtcgatg atgcaaatcg tctgcgcctg gacgattggg aactgcgcga ggagatccag 2160
cagcactgcc gtgatctgtg gccgtctgtg actactgaga acctgagcga gctgaccgac 2220
taccgtgaat ataaagatga gttcctgaaa ctgttcggtt tcggcgttga aggtgtagat 2280
tacgacgccg acgttaaccc ggaagtaaac ttcgacgtag aacagttcta aggcgcctta 2340
ggattcccgg gagatcccat ggtacgcgtg ctagaggcat caaataaaac gaaaggctca 2400
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 2460
gacaaatccg ccgccctaga cctaggcgtt cggctgcggc gagcggtatc agctcactca 2520
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 2580
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 2640
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 2700
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 2760
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 2820
tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 2880
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 2940
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3000
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 3060
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 3120
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 3180
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 3240
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catga 3295
<210>58
<211>3286
<212>DNA
<213>pGV1344
<400>58
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcgtaaag 1140
cctatggttc gtaacaatat ttgcctgaac gctcatccgc agggttgcaa gaaaggtgtc 1200
gaggatcaga ttgaatacac caagaaacgt attaccgctg aagttaaagc aggtgctaaa 1260
gcgccgaaaa acgtgctggt tctgggctgt tccaacggct acggcctggc gtctcgcatc 1320
actgctgcgt ttggttatgg tgcggctact atcggtgttt cttttgaaaa agcgggctcc 1380
gaaaccaaat atggcacccc aggttggtac aacaacctgg cgttcgatga agcggctaaa 1440
cgcgagggcc tgtactctgt gactatcgac ggtgacgcct tcagcgatga aatcaaagca 1500
caggttatcg aggaagccaa aaagaaaggc attaagtttg acctgattgt gtactctctg 1560
gctagcccgg tgcgtaccga tccggatacc ggcatcatgc acaaatccgt cctgaaaccg 1620
ttcggcaaaa ctttcaccgg taaaacggta gatccgttca ctggtgagct gaaagaaatc 1680
tctgccgagc cagctaacga tgaagaggca gctgctactg tcaaagtcat gggtggtgaa 1740
gattgggaac gttggatcaa acagctgtct aaagaaggtc tgctggagga aggctgcatt 1800
accctggcat actcctacat tggtccagag gccactcagg cgctgtatcg taaaggtact 1860
atcggtaaag ctaaagaaca cctggaagct acggctcacc gtctgaacaa agaaaacccg 1920
tccatccgtg cattcgtttc cgtcaacaag ggcctggtca cccgtgcatc cgcagttatc 1980
ccggtcatcc ctctgtatct ggcttccctg ttcaaggtta tgaaggaaaa aggtaaccat 2040
gagggttgta tcgaacagat cacccgtctg tacgccgaac gtctgtaccg caaggatggc 2100
accatcccgg ttgatgagga aaaccgcatt cgtatcgacg actgggaact ggaagaagat 2160
gttcaaaaag ctgtgtctgc gctgatggaa aaagtgaccg gcgaaaatgc ggaatccctg 2220
acggacctgg cgggctatcg tcatgacttt ctggcgtcca acggttttga tgttgagggc 2280
atcaactatg aagcggaagt agagcgtttt gaccgcattt aaggcgcctt aggattcccg 2340
ggagatccca tggtacgcgt gctagaggca tcaaataaaa cgaaaggctc agtcgaaaga 2400
ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc 2460
gccgccctag acctaggcgt tcggctgcgg cgagcggtat cagctcactc aaaggcggta 2520
atacggttat ccacagaatc aggggataac gcaggaaaga acatgtgagc aaaaggccag 2580
caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt ttttccatag gctccgcccc 2640
cctgacgagc atcacaaaaa tcgacgctca agtcagaggt ggcgaaaccc gacaggacta 2700
taaagatacc aggcgtttcc ccctggaagc tccctcgtgc gctctcctgt tccgaccctg 2760
ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa gcgtggcgct ttctcaatgc 2820
tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac 2880
gaaccccccg ttcagcccga ccgctgcgcc ttatccggta actatcgtct tgagtccaac 2940
ccggtaagac acgacttatc gccactggca gcagccactg gtaacaggat tagcagagcg 3000
aggtatgtag gcggtgctac agagttcttg aagtggtggc ctaactacgg ctacactaga 3060
aggacagtat ttggtatctg cgctctgctg aagccagtta ccttcggaaa aagagttggt 3120
agctcttgat ccggcaaaca aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag 3180
cagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc tacggggtct 3240
gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg tcatga 3286
<210>59
<211>3479
<212>DNA
<213>pGV1345
<400>59
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gcgtctgctg 1140
ttcgaagcag ttcacgcgcg taagcgttgg catcgtactg cgccggctgc cgcattcact 1200
cgttttcaca ccgctgcatg cgtgactcat caggcagttt cccgtgctcc acacgccctg 1260
cgttgtcgcc agcacctggc agatcaggag tccacgctga tcattcaccc gaaagtacgt 1320
ggtttcatct gcacgaccac tcaccctctg ggttgcgaac gtaacgtcct ggaacagatc 1380
gcggctactc gtgctcgcgg tgttcgtaac gatggtccga agaaagttct ggtgatcggc 1440
gcgtctagcg gttacggtct ggccagccgc attaccgccg cattcggttt cggtgcggat 1500
accctgggtg ttttcttcga aaaaccgggt actgcctcta aagctggcac ggcgggttgg 1560
tacaactccg cagcattcga caagcacgca aaagcggctg gtctgtactc taaatctatc 1620
aatggtgatg cgttcagcga tgcggcgcgt gcacaggtga tcgaactgat caaaactgag 1680
atgggtggtc aagttgacct ggttgtttac tctctggcct ccccggtacg taaactgccg 1740
ggctctggtg aagttaaacg ttctgcgctg aagccaatcg gccagaccta caccgcaacg 1800
gcgatcgaca ccaacaagga cactatcatc caggcttcca ttgaacctgc ttctgcgcag 1860
gaaatcgagg ataccatcac cgtgatgggc ggccaagact gggaactgtg gatcgacgca 1920
ctggaaggtg caggcgtact ggcagatggc gctcgttctg tagcgttctc ctatatcggc 1980
accgaaatca cttggccgat ctactggcat ggcgcactgg gcaaagcaaa agtggacctg 2040
gaccgtaccg ctcaacgtct gaatgcccgt ctggcaaaac acggtggtgg cgcaaacgtg 2100
gcagttctga agagcgtagt gacccaagct tctgccgcta ttccggttat gccgctgtac 2160
atttccatgg tgtataaaat catgaaagaa aaaggtctgc atgagggtac tatcgaacag 2220
ctggatcgcc tgtttcgtga acgtctgtac cgccaggacg gtcagccggc agaagtagat 2280
gaagttgatg aacagaaccg tctgcgcctg gacgattggg aactgcgcga cgatgtacag 2340
gacgcctgca aggctctgtg gccgcaggta actactgaaa atctgttcga gctgaccgat 2400
tacgcgggct acaaacatga gttcctgaaa ctgtttggct tcggccgtac cgacgttgat 2460
tacgatgcgg atgttgcaac tgacgtggct ttcgattgta tcgaactggc ctgaggcgcc 2520
ttaggattcc cgggagatcc ccatggtacg cgtgctagag gcatcaaata aaacgaaagg 2580
ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga 2640
gtaggacaaa tccgccgccc tagacctagg cgttcggctg cggcgagcgg tatcagctca 2700
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 2760
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 2820
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 2880
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 2940
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 3000
gctttctcaa tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 3060
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 3120
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 3180
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 3240
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 3300
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 3360
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 3420
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatga 3479
<210>60
<211>3292
<212>DNA
<213>pGV1346
<400>60
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcattaaa 1140
ccgcgtgttc gtggctttat ctgtgttacc gctcatccga ccggctgcga agcgaacgtc 1200
aaaaagcaga tcgactacgt taccactgaa ggcccgatcg ctaacggccc taaacgcgtt 1260
ctggtaattg gcgcttctac cggttacggc ctggcggcac gtatcaccgc cgcgtttggt 1320
tgcggcgctg acaccctggg tgtgttcttc gaacgtccgg gtgaagaagg caaaccgggc 1380
acttctggct ggtacaactc cgcagcgttt cacaaatttg ccgctcagaa aggtctgtac 1440
gcaaaatcta tcaacggcga cgctttcagc gacgaaatca aacagctgac cattgacgcg 1500
atcaaacagg acctgggcca ggtagatcag gtgatctact ccctggcctc tccgcgtcgc 1560
acccacccta aaaccggtga agtattcaat tccgccctga agccgatcgg taacgcagta 1620
aacctgcgcg gcctggatac cgacaaggag gtgatcaaag aaagcgtgct gcagccggca 1680
acccagtctg aaattgactc cactgttgcg gtgatgggtg gcgaagattg gcagatgtgg 1740
atcgacgcgc tgctggatgc aggcgtactg gcagaaggcg ctcagactac cgcgttcacg 1800
tacctgggcg aaaagatcac ccatgacatt tattggaacg gttccattgg cgctgccaaa 1860
aaggacctgg atcagaaagt tctggctatc cgtgaatccc tggctgctca cggtggtggc 1920
gatgcacgtg tctccgtgct gaaagcagtc gtcacccagg cgtcctccgc gattccaatg 1980
atgccgctgt atctgagcct gctgtttaaa gtcatgaagg aaaaaggcac ccacgagggc 2040
tgcattgaac aggtgtactc tctgtataaa gattctctgt gtggtgatag cccacatatg 2100
gaccaggaag gtcgtctgcg tgctgactat aaagagctgg acccggaagt gcagaaccag 2160
gttcagcagc tgtgggatca agttactaac gacaacattt accagctgac ggatttcgta 2220
ggctacaaat ctgagtttct gaacctgttc ggtttcggta tcgacggtgt ggactatgat 2280
gccgatgtca acccggatgt aaagattccg aacctgatcc aaggttaagg cgccttagga 2340
ttcccgggag atcccatggt acgcgtgcta gaggcatcaa ataaaacgaa aggctcagtc 2400
gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc tgagtaggac 2460
aaatccgccg ccctagacct aggcgttcgg ctgcggcgag cggtatcagc tcactcaaag 2520
gcggtaatac ggttatccac agaatcaggg gataacgcag gaaagaacat gtgagcaaaa 2580
ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc 2640
cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca 2700
ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg 2760
accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct 2820
caatgctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt 2880
gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag 2940
tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc 3000
agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac 3060
actagaagga cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga 3120
gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc 3180
aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg 3240
gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat ga 3292
<210>61
<211>3280
<212>DNA
<213>pGV1347
<400>61
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat ggttatttct 1140
cctaaggttc gcggctttat ttgcactaat gcgcacccgg ttggttgtgc gaaaagcgtg 1200
gaaaaccaga tcgcttacgt taaagcgcag ggtctgtctg ctgaggcggc agatgcaccg 1260
aaaaacgtgc tggttctggg ctgttccacc ggctatggtc tggcgtctcg tatcactgcg 1320
tcctttggct atggtgccaa cactgtaggc gtttgtttcg aaaaagctcc gacggaacgc 1380
aaaaccggta ctgcgggttg gtataacacg gcggcgttcc acagcgaagc aaaagccgca 1440
ggcgttcagg cccataccct gaatggcgac gcattctcca acgaactgaa agcacagacc 1500
atcgaaaccc tgaagaacac catcggtaaa gttgacctgg tggtgtactc tctggcgtcc 1560
ccgcgtcgta ccgacccgga aactggtgaa gtgtataaga gcaccctgaa accggttggt 1620
caggcatatg agaccaagac ctacgacact gacaaagatc tgatccacac ggtggctctg 1680
gaaccggctt ctcaggatga aattgataac accatcaaag tgatgggtgg tgaagactgg 1740
gaactgtgga tcaaagcgct ggcggaagcg gatctgctgg cggagggtgc taaaaccacc 1800
gcttacacct acatcggcaa aaagctgacc tggccgatct acggctccgc cactatcggc 1860
aaagcaaaag aagacctgga tcgcgctgcc accgcgatca acaccaccta cgcaaacctg 1920
aacgttgatg ctcacgtatc tagcctgaaa gccctggtga cccaagcctc ttccgctatc 1980
ccggtcatgc ctctgtatat cagcctgatt tacaaagtta tgaaagaaga gggcactcac 2040
gaaggttgta tcgaacagat cgttggtctg tttactcagt gcctgctgaa cgacggcgcg 2100
actctggatg aagttaaccg ttatcgtatg gatggtaaag aaactaacga cgccactcag 2160
gctaaaattg aagagctgtg gcaccaggtg acccaggaca actttcacga actgtccgac 2220
tacgctggtt ataacgctga tttcctgaac ctgtttggtt ttggcatcga aggtgttgat 2280
tacgaagcgg acgttgatcc gcaggtgtcc tggtaaggcg ccttaggatt cccgggagat 2340
cccatggtac gcgtgctaga ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 2400
ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccgcc 2460
ctagacctag gcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 2520
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 2580
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 2640
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 2700
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 2760
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 2820
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 2880
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 2940
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3000
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 3060
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3120
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3180
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3240
cagtggaacg aaaactcacg ttaagggatt ttggtcatga 3280
<210>62
<211>3283
<212>DNA
<213>pGV1348
<400>62
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gattattgaa 1140
cctaagatgc gtggctttat ttgtctgacc tcccacccga cgggttgtga acagaacgtt 1200
atcaaccaga tcaactacgt gaaaagcaaa ggcgttatta atggcccgaa gaaagttctg 1260
gttattggcg catccactgg cttcggcctg gcgtctcgta tcacttctgc tttcggtagc 1320
aatgctgcga cgatcggtgt cttcttcgaa aaaccggcgc aggagggtaa accgggctct 1380
ccgggctggt ataacaccgt agctttccag aatgaggcca aaaaggctgg catttacgct 1440
aaaagcatca acggtgatgc cttttccact gaagtaaagc agaaaaccat cgacctgatt 1500
aaagctgatc tgggtcaagt ggacctggtt atctacagcc tggcaagccc tgttcgtacc 1560
aacccggtaa ccggtgtaac ccaccgctct gtactgaaac cgattggtgg tgcgttctct 1620
aacaaaactg ttgacttcca taccggcaac gtaagcaccg ttaccatcga accagcgaac 1680
gaagaagatg ttaccaacac cgtcgctgtt atgggtggtg aggattgggg catgtggatg 1740
gacgcgatgc tggaagcagg cgttctggcc gaaggcgcaa ctacggttgc atattcctac 1800
atcggtccgg ctctgaccga agcggtgtat cgtaagggca ctatcggccg tgcgaaagac 1860
cacctggagg catctgctgc aaccattact gataaactga aatctgttaa aggtaaagcc 1920
tacgtgtctg tgaacaaagc gctggtcacc caggcttcca gcgcaattcc ggttattccg 1980
ctgtacatct ctctgctgta caaggttatg aaagcagagg gcattcacga aggttgtatc 2040
gaacagattc agcgtctgta cgctgaccgt ctgtacacgg gcaaagctat cccaacggac 2100
gagcagggcc gtatccgtat cgacgattgg gaaatgcgtg aagatgtcca ggcgaacgtt 2160
gcagcactgt gggaacaagt tacttctgaa aacgtttccg acatctctga cctgaaaggt 2220
tataagaacg actttctgaa cctgttcggt ttcgcggtta acaaagttga ttatctggct 2280
gacgtgaacg aaaacgttac gatcgaaggt ctggtatgag gcgccttagg attcccggga 2340
gatcccatgg tacgcgtgct agaggcatca aataaaacga aaggctcagt cgaaagactg 2400
ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc 2460
gccctagacc taggcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 2520
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 2580
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 2640
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 2700
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 2760
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcaatgctca 2820
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 2880
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 2940
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 3000
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 3060
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 3120
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 3180
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 3240
gctcagtgga acgaaaactc acgttaaggg attttggtca tga 3283
<210>63
<211>3295
<212>DNA
<213>pGV1349
<400>63
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagaaatgtg agcggataac aattgacatt 1020
gtgagcggat aacaagatac tgagcacatc agcaggacgc actgaccgaa ttctgaggag 1080
aagtcgactt ggaagcggcc gcttaggatc cttgaggaga ttggtaccat gatcattaaa 1140
cctcgtatcc gtggctttat ctgcaccacg actcacccgg taggttgcga agctaacgtc 1200
aaagaacaaa tcgcatacac taaagctcag ggcccgatca aaaacgcccc taaacgtgtt 1260
ctggttgttg gtgcctcctc cggttatggt ctgtcttctc gtatcgcggc agcgtttggc 1320
ggcggtgctt ccaccatcgg cgtgttcttc gaaaaggaag gcaccgaaaa gaaacctggt 1380
actgctggct tctacaacgc tgcggcgttc gaaaaactgg cgcgtgaaga gggcctgtac 1440
gccaagagcc tgaacggcga tgcattctcc aacgaggcga aacagaaaac cattgaactg 1500
atcaaagaag acctgggtca aattgatatg gtggtttaca gcctggcatc cccggtgcgc 1560
aaaatgccgg aaaccggtga actggtgcgc agcgcactga aaccgattgg tgagacttat 1620
acctctaccg cggtcgatac gaataaggat gtgatcattg aagcgagcgt tgaaccggcg 1680
accgaagagg aaatcaaaga taccgtgact gtaatgggtg gtgaggattg ggaactgtgg 1740
atcaatgcgc tgagcgatgc aggcgtgctg gctgaaggtt gcaaaactgt tgcttatagc 1800
tacattggca ccgaactgac ctggcctatc tactgggacg gtgcactggg taaagctaaa 1860
atggatctgg atcgtgcagc caaagcactg aacgacaaac tggcggcaac cggtggctct 1920
gcgaatgtcg ctgttctgaa atccgttgta acccaagctt cctccgcaat cccggttatg 1980
ccgctgtata tcgcaatggt gttcaagaaa atgcgcgaag aaggtgtaca cgaaggctgc 2040
atggaacaga tttaccgtat gttctctcag cgtctgtaca aggaagacgg ctctgctgcc 2100
gaggttgatg aaatgaaccg tctgcgtctg gacgattggg agctgcgcga cgacattcag 2160
cagcactgcc gtgaactgtg gccgcagatt accaccgaaa atctgaaaga actgaccgat 2220
tacgttgaat ataaggaaga gttcctgaaa ctgttcggtt tcggtgttga gggcgttgat 2280
tacgaagcag acgtgaaccc ggctgtggaa gccgatttca tccagatcta aggcgcctta 2340
ggattcccgg gagatcccat ggtacgcgtg ctagaggcat caaataaaac gaaaggctca 2400
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 2460
gacaaatccg ccgccctaga cctaggcgtt cggctgcggc gagcggtatc agctcactca 2520
aaggcggtaa tacggttatc cacagaatca ggggataacg caggaaagaa catgtgagca 2580
aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt tgctggcgtt tttccatagg 2640
ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa gtcagaggtg gcgaaacccg 2700
acaggactat aaagatacca ggcgtttccc cctggaagct ccctcgtgcg ctctcctgtt 2760
ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc cttcgggaag cgtggcgctt 2820
tctcaatgct cacgctgtag gtatctcagt tcggtgtagg tcgttcgctc caagctgggc 2880
tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct tatccggtaa ctatcgtctt 2940
gagtccaacc cggtaagaca cgacttatcg ccactggcag cagccactgg taacaggatt 3000
agcagagcga ggtatgtagg cggtgctaca gagttcttga agtggtggcc taactacggc 3060
tacactagaa ggacagtatt tggtatctgc gctctgctga agccagttac cttcggaaaa 3120
agagttggta gctcttgatc cggcaaacaa accaccgctg gtagcggtgg tttttttgtt 3180
tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag aagatccttt gatcttttct 3240
acggggtctg acgctcagtg gaacgaaaac tcacgttaag ggattttggt catga 3295
<210>64
<211>3234
<212>DNA
<213>pGV1563
<400>64
ctagtgcttg gattctcacc aataaaaaac gcccggcggc aaccgagcgt tctgaacaaa 60
tccagatgga gttctgaggt cattactgga tctatcaaca ggagtccaag cgagctcgat 120
atcaaattac gccccgccct gccactcatc gcagtactgt tgtaattcat taagcattct 180
gccgacatgg aagccatcac agacggcatg atgaacctga atcgccagcg gcatcagcac 240
cttgtcgcct tgcgtataat atttgcccat ggtgaaaacg ggggcgaaga agttgtccat 300
attggccacg tttaaatcaa aactggtgaa actcacccag ggattggctg agacgaaaaa 360
catattctca ataaaccctt tagggaaata ggccaggttt tcaccgtaac acgccacatc 420
ttgcgaatat atgtgtagaa actgccggaa atcgtcgtgg tattcactcc agagcgatga 480
aaacgtttca gtttgctcat ggaaaacggt gtaacaaggg tgaacactat cccatatcac 540
cagctcaccg tctttcattg ccatacgaaa ctccggatga gcattcatca ggcgggcaag 600
aatgtgaata aaggccggat aaaacttgtg cttatttttc tttacggtct ttaaaaaggc 660
cgtaatatcc agctgaacgg tctggttata ggtacattga gcaactgact gaaatgcctc 720
aaaatgttct ttacgatgcc attgggatat atcaacggtg gtatatccag tgattttttt 780
ctccatttta gcttccttag ctcctgaaaa tctcgataac tcaaaaaata cgcccggtag 840
tgatcttatt tcattatggt gaaagttgga acctcttacg tgccgatcaa cgtctcattt 900
tcgccagata tcgacgtcta agaaaccatt attatcatga cattaaccta taaaaatagg 960
cgtatcacga ggccctttcg tcttcacctc gagataaatg tgagcggata acaattgaca 1020
ttgtgagcgg ataacaagat actgagcaca tcagcaggac gcactgaccg aattcattaa 1080
agaggagaaa ggtaccatga tcgtaaagcc tatggttcgt aacaatattt gcctgaacgc 1140
tcatccgcag ggttgcaaga aaggtgtcga ggatcagatt gaatacacca agaaacgtat 1200
taccgctgaa gttaaagcag gtgctaaagc gccgaaaaac gtgctggttc tgggctgttc 1260
caacggctac ggcctggcgt ctcgcatcac tgctgcgttt ggttatggtg cggctactat 1320
cggtgtttct tttgaaaaag cgggctccga aaccaaatat ggcaccccag gttggtacaa 1380
caacctggcg ttcgatgaag cggctaaacg cgagggcctg tactctgtga ctatcgacgg 1440
tgacgccttc agcgatgaaa tcaaagcaca ggttatcgag gaagccaaaa agaaaggcat 1500
taagtttgac ctgattgtgt actctctggc tagcccggtg cgtaccgatc cggataccgg 1560
catcatgcac aaatccgtcc tgaaaccgtt cggcaaaact ttcaccggta aaacggtaga 1620
tccgttcact ggtgagctga aagaaatctc tgccgagcca gctaacgatg aagaggcagc 1680
tgctactgtc aaagtcatgg gtggtgaaga ttgggaacgt tggatcaaac agctgtctaa 1740
agaaggtctg ctggaggaag gctgcattac cctggcatac tcctacattg gtccagaggc 1800
cactcaggcg ctgtatcgta aaggtactat cggtaaagct aaagaacacc tggaagctac 1860
ggctcaccgt ctgaacaaag aaaacccgtc catccgtgca ttcgtttccg tcaacaaggg 1920
cctggtcacc cgtgcatccg cagttatccc ggtcatccct ctgtatctgg cttccctgtt 1980
caaggttatg aaggaaaaag gtaaccatga gggttgtatc gaacagatca cccgtctgta 2040
cgccgaacgt ctgtaccgca aggatggcac catcccggtt gatgaggaaa accgcattcg 2100
tatcgacgac tgggaactgg aagaagatgt tcaaaaagct gtgtctgcgc tgatggaaaa 2160
agtgaccggc gaaaatgcgg aatccctgac ggacctggcg ggctatcgtc atgactttct 2220
ggcgtccaac ggttttgatg ttgagggcat caactatgaa gcggaagtag agcgttttga 2280
ccgcatttaa ggatcccatg gtacgcgtgc tagaggcatc aaataaaacg aaaggctcag 2340
tcgaaagact gggcctttcg ttttatctgt tgtttgtcgg tgaacgctct cctgagtagg 2400
acaaatccgc cgccctagac ctaggcgttc ggctgcggcg agcggtatca gctcactcaa 2460
aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa 2520
aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc 2580
tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga 2640
caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc 2700
cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt 2760
ctcatagctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct 2820
gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg 2880
agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta 2940
gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct 3000
acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa 3060
gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt 3120
gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta 3180
cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc atga 3234
<210>65
<211>5241
<212>DNA
<213>pGV1563
taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac gaggcccttt 60
cgtcttcacc tcgagaattg tgagcggata acaattgaca ttgtgagcgg ataacaagat 120
actgagcaca tcagcaggac gcactgaccg aattcattaa agaggagaaa ggtaccatgt 180
ctcaattctt ttttaatcaa cgcacccatc tcgtgagcga cgtcatcgac ggtacgatta 240
tcgccagccc gtggaataac ctggcgcgtc tggaaagcga tccggccatt cgcatcgtgg 300
tccgtcgtga cctcaacaaa aataacgtgg cggtaatttc cggcggtggt tcagggcacg 360
aacccgcgca cgttgggttt atcggtaaag gcatgctaac cgctgcggtt tgcggcgacg 420
ttttcgcttc cccgagcgtg gatgcggtac tgaccgccat ccaggcggta accggtgagg 480
cgggctgttt attgatcgtg aaaaattaca ccggtgaccg tcttaatttc ggtctcgccg 540
ccgagaaagc ccgtcgcctt ggttacaacg ttgaaatgct gattgttggc gacgacatct 600
ccctgcctga taacaaacac ccacgcggca ttgcgggaac catcctggtg cataaaatcg 660
caggctattt tgccgaacgc ggctacaacc tcgccaccgt cctgcgtgaa gcgcagtacg 720
cggccaataa caccttcagc ctgggcgttg cgctttccag ctgtcatctg ccgcaagaag 780
ccgacgccgc cccgcgtcat catccgggcc acgcggaact gggcatgggc attcacggcg 840
aaccaggcgc atcggttatc gacacccaga acagtgcgca ggtggtgaac ctgatggtgg 900
ataagctgat ggcagccctg cctgaaaccg gccgtctggc ggtgatgatt aacaatcttg 960
gcggcgtttc tgttgccgaa atggccatca ttacccgcga actggccagc agcccgctgc 1020
acccacgtat cgactggctg attggcccgg cctcactggt caccgctctg gatatgaaaa 1080
gcttttcact gacggccatc gtgctggaag aaagcatcga aaaagcgtta ctcaccgagg 1140
tggaaaccag caactggccg acgccggtcc cgccgcgtga aatcagttgt gtaccatcat 1200
ctcagcgtag cgcacgcgtg gaattccagc cttcggcgaa cgccatggtg gccgggattg 1260
tggaacttgt caccacaacc ctttccgatc tggagactca tcttaatgcg ctggacgcca 1320
aagtcggcga tggcgatacc ggttcgacct ttgccgctgg cgcgcgtgaa attgccagtc 1380
tgttgcatcg ccagcagttg ccgctggata accttgccac gctgttcgcg ctgattggcg 1440
aacgtctgac cgtagtgatg ggtggttcca gcggtgtgct gatgtctatt ttctttaccg 1500
ctgcggggca gaaactggaa cagggagcta gcgttgccga atccctgaat acgggactgg 1560
cgcagatgaa gttctacggc ggcgcagacg aaggcgatcg caccatgatt gatgcgctgc 1620
aaccagccct gacttcgctg ctcacgcagc cgcaaaatct gcaggccgca ttcgacgccg 1680
cgcaagcggg agccgaacga acctgtttgt cgagcaaagc caatgccggt cgcgcatcgt 1740
atctcagcag cgaaagcctg ctcggaaata tggaccccgg cgcgcacgcc gtagcgatgg 1800
tgtttaaagc gctagcggag agtgagctgg gctaatctag aggcatcaaa taaaacgaaa 1860
ggctcagtcg aaagactggg cctttcgttt tatctgttgt ttgtcggtga acgctctcct 1920
gagtaggaca aatccgccgc cctagaccta gggtacgggt tttgctgccc gcaaacgggc 1980
tgttctggtg ttgctagttt gttatcagaa tcgcagatcc ggcttcaggt ttgccggctg 2040
aaagcgctat ttcttccaga attgccatga ttttttcccc acgggaggcg tcactggctc 2100
ccgtgttgtc ggcagctttg attcgataag cagcatcgcc tgtttcaggc tgtctatgtg 2160
tgactgttga gctgtaacaa gttgtctcag gtgttcaatt tcatgttcta gttgctttgt 2220
tttactggtt tcacctgttc tattaggtgt tacatgctgt tcatctgtta cattgtcgat 2280
ctgttcatgg tgaacagctt taaatgcacc aaaaactcgt aaaagctctg atgtatctat 2340
cttttttaca ccgttttcat ctgtgcatat ggacagtttt ccctttgata tctaacggtg 2400
aacagttgtt ctacttttgt ttgttagtct tgatgcttca ctgatagata caagagccat 2460
aagaacctca gatccttccg tatttagcca gtatgttctc tagtgtggtt cgttgttttt 2520
gcgtgagcca tgagaacgaa ccattgagat catgcttact ttgcatgtca ctcaaaaatt 2580
ttgcctcaaa actggtgagc tgaatttttg cagttaaagc atcgtgtagt gtttttctta 2640
gtccgttacg taggtaggaa tctgatgtaa tggttgttgg tattttgtca ccattcattt 2700
ttatctggtt gttctcaagt tcggttacga gatccatttg tctatctagt tcaacttgga 2760
aaatcaacgt atcagtcggg cggcctcgct tatcaaccac caatttcata ttgctgtaag 2820
tgtttaaatc tttacttatt ggtttcaaaa cccattggtt aagcctttta aactcatggt 2880
agttattttc aagcattaac atgaacttaa attcatcaag gctaatctct atatttgcct 2940
tgtgagtttt cttttgtgtt agttctttta ataaccactc ataaatcctc atagagtatt 3000
tgttttcaaa agacttaaca tgttccagat tatattttat gaattttttt aactggaaaa 3060
gataaggcaa tatctcttca ctaaaaacta attctaattt ttcgcttgag aacttggcat 3120
agtttgtcca ctggaaaatc tcaaagcctt taaccaaagg attcctgatt tccacagttc 3180
tcgtcatcag ctctctggtt gctttagcta atacaccata agcattttcc ctactgatgt 3240
tcatcatctg agcgtattgg ttataagtga acgataccgt ccgttctttc cttgtagggt 3300
tttcaatcgt ggggttgagt agtgccacac agcataaaat tagcttggtt tcatgctccg 3360
ttaagtcata gcgactaatc gctagttcat ttgctttgaa aacaactaat tcagacatac 3420
atctcaattg gtctaggtga ttttaatcac tataccaatt gagatgggct agtcaatgat 3480
aattactagt ccttttcccg ggagatctgg gtatctgtaa attctgctag acctttgctg 3540
gaaaacttgt aaattctgct agaccctctg taaattccgc tagacctttg tgtgtttttt 3600
ttgtttatat tcaagtggtt ataatttata gaataaagaa agaataaaaa aagataaaaa 3660
gaatagatcc cagccctgtg tataactcac tactttagtc agttccgcag tattacaaaa 3720
ggatgtcgca aacgctgttt gctcctctac aaaacagacc ttaaaaccct aaaggcttaa 3780
gtagcaccct cgcaagctcg ggcaaatcgc tgaatattcc ttttgtctcc gaccatcagg 3840
cacctgagtc gctgtctttt tcgtgacatt cagttcgctg cgctcacggc tctggcagtg 3900
aatgggggta aatggcacta caggcgcctt ttatggattc atgcaaggaa actacccata 3960
atacaagaaa agcccgtcac gggcttctca gggcgtttta tggcgggtct gctatgtggt 4020
gctatctgac tttttgctgt tcagcagttc ctgccctctg attttccagt ctgaccactt 4080
cggattatcc cgtgacaggt cattcagact ggctaatgca cccagtaagg cagcggtatc 4140
atcaacaggc ttacccgtct tactgtccct agtgcttgga ttctcaccaa taaaaaacgc 4200
ccggcggcaa ccgagcgttc tgaacaaatc cagatggagt tctgaggtca ttactggatc 4260
tatcaacagg agtccaagcg agctctcgaa ccccagagtc ccgctcagaa gaactcgtca 4320
agaaggcgat agaaggcgat gcgctgcgaa tcgggagcgg cgataccgta aagcacgagg 4380
aagcggtcag cccattcgcc gccaagctct tcagcaatat cacgggtagc caacgctatg 4440
tcctgatagc ggtccgccac acccagccgg ccacagtcga tgaatccaga aaagcggcca 4500
ttttccacca tgatattcgg caagcaggca tcgccatggg tcacgacgag atcctcgccg 4560
tcgggcatgc gcgccttgag cctggcgaac agttcggctg gcgcgagccc ctgatgctct 4620
tcgtccagat catcctgatc gacaagaccg gcttccatcc gagtacgtgc tcgctcgatg 4680
cgatgtttcg cttggtggtc gaatgggcag gtagccggat caagcgtatg cagccgccgc 4740
attgcatcag ccatgatgga tactttctcg gcaggagcaa ggtgagatga caggagatcc 4800
tgccccggca cttcgcccaa tagcagccag tcccttcccg cttcagtgac aacgtcgagc 4860
acagctgcgc aaggaacgcc cgtcgtggcc agccacgata gccgcgctgc ctcgtcctgc 4920
agttcattca gggcaccgga caggtcggtc ttgacaaaaa gaaccgggcg cccctgcgct 4980
gacagccgga acacggcggc atcagagcag ccgattgtct gttgtgccca gtcatagccg 5040
aatagcctct ccacccaagc ggccggagaa cctgcgtgca atccatcttg ttcaatcatg 5100
cgaaacgatc ctcatcctgt ctcttgatca gatcttgatc ccctgcgcca tcagatcctt 5160
ggcggcaaga aagccatcca gtttactttg cagggcttcc caaccttacc agagggcgcc 5220
ccagctggca attccgacgt c 5241
<210>66
<211>2302
<212>DNA
<213>pGV1569
<400>66
ctcgagagct tactccccat ccccctgttg acaattaatc atcggctcgt ataatgtgtg 60
gaattgtgag cggataacaa ttgaattcat taaagaggag aaagtcgaca ttatgcggcc 120
gcggatccat aaggaggatt aattaagact tcccgggtga tcccatggta cgcgtgctag 180
aggcatcaaa taaaacgaaa ggctcagtcg aaagactggg cctttcgttt tatctgttgt 240
ttgtcggtga acgctctcct gagtaggaca aatccgccgc cctagaccta ggcgttcggc 300
tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca gaatcagggg 360
ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg 420
ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac aaaaatcgac 480
gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg tttccccctg 540
gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac ctgtccgcct 600
ttctcccttc gggaagcgtg gcgctttctc aatgctcacg ctgtaggtat ctcagttcgg 660
tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct 720
gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac ttatcgccac 780
tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt gctacagagt 840
tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt atctgcgctc 900
tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc aaacaaacca 960
ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga aaaaaaggat 1020
ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac gaaaactcac 1080
gttaagggat tttggtcatg actagtgctt ggattctcac caataaaaaa cgcccggcgg 1140
caaccgagcg ttctgaacaa atccagatgg agttctgagg tcattactgg atctatcaac 1200
aggagtccaa gcgagctcgt aaacttggtc tgacagttac caatgcttaa tcagtgaggc 1260
acctatctca gcgatctgtc tatttcgttc atccatagtt gcctgactcc ccgtcgtgta 1320
gataactacg atacgggagg gcttaccatc tggccccagt gctgcaatga taccgcgaga 1380
cccacgctca ccggctccag atttatcagc aataaaccag ccagccggaa gggccgagcg 1440
cagaagtggt cctgcaactt tatccgcctc catccagtct attaattgtt gccgggaagc 1500
tagagtaagt agttcgccag ttaatagttt gcgcaacgtt gttgccattg ctacaggcat 1560
cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc tccggttccc aacgatcaag 1620
gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat 1680
cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg gttatggcag cactgcataa 1740
ttctcttact gtcatgccat ccgtaagatg cttttctgtg actggtgagt actcaaccaa 1800
gtcattctga gaatagtgta tgcggcgacc gagttgctct tgcccggcgt caatacggga 1860
taataccgcg ccacatagca gaactttaaa agtgctcatc attggaaaac gttcttcggg 1920
gcgaaaactc tcaaggatct taccgctgtt gagatccagt tcgatgtaac ccactcgtgc 1980
acccaactga tcttcagcat cttttacttt caccagcgtt tctgggtgag caaaaacagg 2040
aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg aaatgttgaa tactcatact 2100
cttccttttt caatattatt gaagcattta tcagggttat tgtctcatga gcggatacat 2160
atttgaatgt atttagaaaa ataaacaaat aggggttccg cgcacatttc cccgaaaagt 2220
gccacctgac gtctaagaaa ccattattat catgacatta acctataaaa ataggcgtat 2280
cacgaggccc tttcgtcttc ac 2302
<210>67
<211>3384
<212>DNA
<213>pGV1582
<400>67
ctcgagagct tactccccat ccccctgttg acaattaatc atcggctcgt ataatgtgtg 60
gaattgtgag cggataacaa ttgaattcat taaagaggag aaagtcgaca tgaagatcgt 120
tttagtctta tatgatgctg gtaaacacgc tgccgatgaa gaaaaattat acggttgtac 180
tgaaaacaaa ttaggtattg ccaattggtt gaaagatcaa ggacatgaat taatcaccac 240
gtctgataaa gaaggcggaa acagtgtgtt ggatcaacat ataccagatg ccgatattat 300
cattacaact cctttccatc ctgcttatat cactaaggaa agaatcgaca aggctaaaaa 360
attgaaatta gttgttgtcg ctggtgtcgg ttctgatcat attgatttgg attatatcaa 420
ccaaaccggt aagaaaatct ccgttttgga agttaccggt tctaatgttg tctctgttgc 480
agaacacgtt gtcatgacca tgcttgtctt ggttagaaat tttgttccag ctcacgaaca 540
aatcattaac cacgattggg aggttgctgc tatcgctaag gatgcttacg atatcgaagg 600
taaaactatc gccaccattg gtgccggtag aattggttac agagtcttgg aaagattagt 660
cccattcaat cctaaagaat tattatacta cgattatcaa gctttaccaa aagatgctga 720
agaaaaagtt ggtgctagaa gggttgaaaa tattgaagaa ttggttgccc aagctgatat 780
agttacagtt aatgctccat tacacgctgg tacaaaaggt ttaattaaca aggaattatt 840
gtctaaattc aagaaaggtg cttggttagt caatactgca agaggtgcca tttgtgttgc 900
cgaagatgtt gctgcagctt tagaatctgg tcaattaaga ggttatggtg gtgatgtttg 960
gttcccacaa ccagctccaa aagatcaccc atggagagat atgagaaaca aatatggtgc 1020
tggtaacgcc atgactcctc attactctgg tactacttta gatgctcaaa ctagatacgc 1080
tcaaggtact aaaaatatct tggagtcatt ctttactggt aagtttgatt acagaccaca 1140
agatatcatc ttattaaacg gtgaatacgt taccaaagct tacggtaaac acgataagaa 1200
ataaggatcc ataaggagga ttaattaaga cttcccgggt gatcccatgg tacgcgtgct 1260
agaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 1320
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gccctagacc taggcgttcg 1380
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg 1440
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 1500
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 1560
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 1620
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 1680
ctttctccct tcgggaagcg tggcgctttc tcaatgctca cgctgtaggt atctcagttc 1740
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 1800
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 1860
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 1920
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 1980
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 2040
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 2100
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 2160
acgttaaggg attttggtca tgactagtgc ttggattctc accaataaaa aacgcccggc 2220
ggcaaccgag cgttctgaac aaatccagat ggagttctga ggtcattact ggatctatca 2280
acaggagtcc aagcgagctc gtaaacttgg tctgacagtt accaatgctt aatcagtgag 2340
gcacctatct cagcgatctg tctatttcgt tcatccatag ttgcctgact ccccgtcgtg 2400
tagataacta cgatacggga gggcttacca tctggcccca gtgctgcaat gataccgcga 2460
gacccacgct caccggctcc agatttatca gcaataaacc agccagccgg aagggccgag 2520
cgcagaagtg gtcctgcaac tttatccgcc tccatccagt ctattaattg ttgccgggaa 2580
gctagagtaa gtagttcgcc agttaatagt ttgcgcaacg ttgttgccat tgctacaggc 2640
atcgtggtgt cacgctcgtc gtttggtatg gcttcattca gctccggttc ccaacgatca 2700
aggcgagtta catgatcccc catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg 2760
atcgttgtca gaagtaagtt ggccgcagtg ttatcactca tggttatggc agcactgcat 2820
aattctctta ctgtcatgcc atccgtaaga tgcttttctg tgactggtga gtactcaacc 2880
aagtcattct gagaatagtg tatgcggcga ccgagttgct cttgcccggc gtcaatacgg 2940
gataataccg cgccacatag cagaacttta aaagtgctca tcattggaaa acgttcttcg 3000
gggcgaaaac tctcaaggat cttaccgctg ttgagatcca gttcgatgta acccactcgt 3060
gcacccaact gatcttcagc atcttttact ttcaccagcg tttctgggtg agcaaaaaca 3120
ggaaggcaaa atgccgcaaa aaagggaata agggcgacac ggaaatgttg aatactcata 3180
ctcttccttt ttcaatatta ttgaagcatt tatcagggtt attgtctcat gagcggatac 3240
atatttgaat gtatttagaa aaataaacaa ataggggttc cgcgcacatt tccccgaaaa 3300
gtgccacctg acgtctaaga aaccattatt atcatgacat taacctataa aaataggcgt 3360
atcacgaggc cctttcgtct tcac 3384
<210>68
<211>4570
<212>DNA
<213>pGV1583
<400>68
ctcgagagct tactccccat ccccctgttg acaattaatc atcggctcgt ataatgtgtg 60
gaattgtgag cggataacaa ttgaattcat taaagaggag aaagtcgaca tgaagatcgt 120
tttagtctta tatgatgctg gtaaacacgc tgccgatgaa gaaaaattat acggttgtac 180
tgaaaacaaa ttaggtattg ccaattggtt gaaagatcaa ggacatgaat taatcaccac 240
gtctgataaa gaaggcggaa acagtgtgtt ggatcaacat ataccagatg ccgatattat 300
cattacaact cctttccatc ctgcttatat cactaaggaa agaatcgaca aggctaaaaa 360
attgaaatta gttgttgtcg ctggtgtcgg ttctgatcat attgatttgg attatatcaa 420
ccaaaccggt aagaaaatct ccgttttgga agttaccggt tctaatgttg tctctgttgc 480
agaacacgtt gtcatgacca tgcttgtctt ggttagaaat tttgttccag ctcacgaaca 540
aatcattaac cacgattggg aggttgctgc tatcgctaag gatgcttacg atatcgaagg 600
taaaactatc gccaccattg gtgccggtag aattggttac agagtcttgg aaagattagt 660
cccattcaat cctaaagaat tattatacta cgattatcaa gctttaccaa aagatgctga 720
agaaaaagtt ggtgctagaa gggttgaaaa tattgaagaa ttggttgccc aagctgatat 780
agttacagtt aatgctccat tacacgctgg tacaaaaggt ttaattaaca aggaattatt 840
gtctaaattc aagaaaggtg cttggttagt caatactgca agaggtgcca tttgtgttgc 900
cgaagatgtt gctgcagctt tagaatctgg tcaattaaga ggttatggtg gtgatgtttg 960
gttcccacaa ccagctccaa aagatcaccc atggagagat atgagaaaca aatatggtgc 1020
tggtaacgcc atgactcctc attactctgg tactacttta gatgctcaaa ctagatacgc 1080
tcaaggtact aaaaatatct tggagtcatt ctttactggt aagtttgatt acagaccaca 1140
agatatcatc ttattaaacg gtgaatacgt taccaaagct tacggtaaac acgataagaa 1200
ataaggatcc ataaggagga ttaattaaat gatcgtaaag cctatggttc gtaacaatat 1260
ttgcctgaac gctcatccgc agggttgcaa gaaaggtgtc gaggatcaga ttgaatacac 1320
caagaaacgt attaccgctg aagttaaagc aggtgctaaa gcgccgaaaa acgtgctggt 1380
tctgggctgt tccaacggct acggcctggc gtctcgcatc actgctgcgt ttggttatgg 1440
tgcggctact atcggtgttt cttttgaaaa agcgggctcc gaaaccaaat atggcacccc 1500
aggttggtac aacaacctgg cgttcgatga agcggctaaa cgcgagggcc tgtactctgt 1560
gactatcgac ggtgacgcct tcagcgatga aatcaaagca caggttatcg aggaagccaa 1620
aaagaaaggc attaagtttg acctgattgt gtactctctg gctagcccgg tgcgtaccga 1680
tccggatacc ggcatcatgc acaaatccgt cctgaaaccg ttcggcaaaa ctttcaccgg 1740
taaaacggta gatccgttca ctggtgagct gaaagaaatc tctgccgagc cagctaacga 1800
tgaagaggca gctgctactg tcaaagtcat gggtggtgaa gattgggaac gttggatcaa 1860
acagctgtct aaagaaggtc tgctggagga aggctgcatt accctggcat actcctacat 1920
tggtccagag gccactcagg cgctgtatcg taaaggtact atcggtaaag ctaaagaaca 1980
cctggaagct acggctcacc gtctgaacaa agaaaacccg tccatccgtg cattcgtttc 2040
cgtcaacaag ggcctggtca cccgtgcatc cgcagttatc ccggtcatcc ctctgtatct 2100
ggcttccctg ttcaaggtta tgaaggaaaa aggtaaccat gagggttgta tcgaacagat 2160
cacccgtctg tacgccgaac gtctgtaccg caaggatggc accatcccgg ttgatgagga 2220
aaaccgcatt cgtatcgacg actgggaact ggaagaagat gttcaaaaag ctgtgtctgc 2280
gctgatggaa aaagtgaccg gcgaaaatgc ggaatccctg acggacctgg cgggctatcg 2340
tcatgacttt ctggcgtcca acggttttga tgttgagggc atcaactatg aagcggaagt 2400
agagcgtttt gaccgcattc ccgggtgatc ccatggtacg cgtgctagag gcatcaaata 2460
aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt gtcggtgaac 2520
gctctcctga gtaggacaaa tccgccgccc tagacctagg cgttcggctg cggcgagcgg 2580
tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa 2640
agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg 2700
cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga 2760
ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg 2820
tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg 2880
gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg taggtcgttc 2940
gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg 3000
gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca 3060
ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt 3120
ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag 3180
ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg 3240
gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc 3300
ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt 3360
tggtcatgac tagtgcttgg attctcacca ataaaaaacg cccggcggca accgagcgtt 3420
ctgaacaaat ccagatggag ttctgaggtc attactggat ctatcaacag gagtccaagc 3480
gagctcgtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 3540
gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 3600
acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 3660
ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 3720
tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 3780
ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 3840
ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 3900
atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 3960
taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 4020
catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 4080
atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 4140
acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 4200
aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 4260
ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 4320
cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 4380
atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 4440
ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt 4500
ctaagaaacc attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt 4560
tcgtcttcac 4570
<210>69
<211>35
<212>DNA
<213>Cac_thlF
<400>69
aattgaattc ttattattta ggaggagtaa aacat 35
<210>70
<211>35
<212>DNA
<213>Cac_thlR
<400>70
aattggatcc ttagtctctt tcaactacga gagct 35
<210>71
<211>35
<212>DNA
<213>Cac_aadF
<400>71
aattgaattc atattttaga aagaagtgta tattt 35
<210>72
<211>42
<212>DNA
<213>Cac_aadR
<400>72
aattacgcgt ttaaggttgt tttttaaaac aatttatata ca 42
<210>73
<211>36
<212>DNA
<213>Cac_bdhF
<400>73
aattgaattc attagatgct tgtattaaaa taataa 36
<210>74
<211>36
<212>DNA
<213>Cac_bdhR
<400>74
aattggatcc ttacacagat tttttgaata tttgta 36
<210>75
<211>35
<212>DNA
<213>Cac_hbdF
<400>75
aattgaattc attgatagtt tctttaaatt taggg 35
<210>76
<211>35
<212>DNA
<213>Cac_hbdR
<400>76
aattggatcc ttattttgaa taatcgtaga aacct 35
<210>77
<211>35
<212>DNA
<213>Cac_crtF
<400>77
aattgaattc ctatctattt ttgaagcctt caatt 35
<210>78
<211>36
<212>DNA
<213>Cac_crtR
<400>78
aattggatcc aatattttag gaggattagt catgga 36
<210>79
<211>37
<212>DNA
<213>Cac_bcdF
<400>79
aattggtacc ttaattatta gcagctttaa cttgagc 37
<210>80
<211>40
<212>DNA
<213>Cac_bcdR
<400>80
aattggatcc aaaattgaag gcttcaaaaa tagataggag 40
<210>81
<211>44
<212>DNA
<213>Cac_adhF
<400>81
aattgtcgac attttataaa ggagtgtata taaatgaaag ttac 44
<210>82
<211>36
<212>DNA
<213>Cac_adhR
<400>82
ttaatctaga ttaaaatgat tttatataga tatcct 36
<210>83
<211>20
<212>DNA
<213>glpDchk_F
<400>83
ccgtgggtga aacagttctt 20
<210>84
<211>20
<212>DNA
<213>glpDchk_R
<400>84
cgtaagtgcg agcgtaatga 20
<210>85
<211>20
<212>DNA
<213>glpKchk_F
<400>85
aaagctccac gctggtagaa 20
<210>86
<211>20
<212>DNA
<213>glpKchk_R
<400>86
gtcacgcgtc tgataagcaa 20
Claims (44)
1.一种能够以理论产率的至少5%的产率生成正丁醇的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性途径的异源酶,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;
工程化改造微生物以灭活一种或多种途径的天然酶,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一;和
工程化改造微生物以活化至少NADH生成酶和NADH生成途径之一,从而平衡所述NADH依赖性异源途径。
2.权利要求1的重组微生物,其中所述一种或多种天然途径是NADH依赖性途径。
3.权利要求1的重组微生物,其中所述异源酶选自下组:厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶、乙酰-CoA-乙酰基转移酶(硫解酶)、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶和正丁醇脱氢酶。
4.权利要求3的重组微生物,其中所述天然酶包含催化乙酰-CoA转化成乙醇的醇脱氢酶,且所述重组微生物能够以理论产率的至少30%的产率生成正丁醇。
5.权利要求4的重组微生物,其中所述NADH生成酶是NADH依赖性甲酸脱氢酶。
6.权利要求4的重组微生物,其中所述NADH生成酶是在厌氧条件下有活性的丙酮酸脱氢酶。
7.权利要求4的重组微生物,其中所述NADH生成途径是用于将甘油转化成丙酮酸的途径,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
8.权利要求1的重组微生物,其中所述天然酶选自下组:D-乳酸脱氢酶、丙酮酸甲酸裂合酶、乙醛/醇脱氢酶、磷酸乙酰转移酶、乙酸激酶A、延胡索酸还原酶、丙酮酸氧化酶和甲基乙二醛合酶。
9.权利要求4的重组微生物,其中所述天然酶进一步包含乳酸脱氢酶,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
10.权利要求9的重组微生物,其中所述天然酶进一步包含延胡索酸还原酶,且所述重组微生物能够以理论产率的至少55%的产率生成正丁醇。
11.权利要求10的重组微生物,其中所述天然酶进一步包含甲基乙二醛合酶,且所述重组微生物能够以理论产率的至少60%的产率生成正丁醇。
12.权利要求11的重组微生物,其中所述天然酶进一步包含乙酸激酶,且所述重组微生物能够以理论产率的至少65%的产率生成正丁醇。
13.权利要求12的重组微生物,其中所述NADH生成酶是在厌氧条件下有活性的丙酮酸脱氢酶,且所述重组微生物能够以理论产率的至少73%的产率生成正丁醇。
14.一种能够以理论产率的至少2%的产率生成正丁醇的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性途径的异源酶,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;和
工程化改造微生物以灭活一种或多种途径的天然酶,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
15.权利要求14的重组微生物,其中所述一种或多种天然途径是NADH依赖性途径。
16.权利要求14的重组微生物,其中所述异源酶选自下组:厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶、乙酰-CoA-乙酰基转移酶(硫解酶)、羟基丁酰-CoA脱氢酶、巴豆酸酶、丁酰-CoA脱氢酶、丁醛脱氢酶和正丁醇脱氢酶。
17.权利要求16的重组微生物,其中所述天然酶包含催化乙酰-CoA转化成乙醇的醇脱氢酶,且所述重组微生物能够以理论产率的至少5%的产率生成正丁醇。
18.权利要求17的重组微生物,其中所述天然酶进一步包含乳酸脱氢酶,且所述重组微生物能够以理论产率的至少7%的产率生成正丁醇。
19.权利要求18的重组微生物,其中所述天然酶进一步包含延胡索酸还原酶,且所述重组微生物能够以理论产率的至少20%的产率生成正丁醇。
20.权利要求19的重组微生物,其中所述天然酶进一步包含甲基乙二醛合酶,且所述重组微生物能够以理论产率的至少25%的产率生成正丁醇。
21.权利要求19的重组微生物,其中所述天然酶进一步包含乙酸激酶,且所述重组微生物能够以理论产率的至少25%的产率生成正丁醇。
22.一种表达用于将碳源转化成正丁醇的异源途径的重组微生物,该异源途径包含以下底物变成产物的转化:
乙酰-CoA变成乙酰乙酰-CoA,乙酰乙酰-CoA变成羟基丁酰-CoA,羟基丁酰-CoA变成巴豆酰-CoA,巴豆酰-CoA变成丁酰-CoA,丁酰-CoA变成丁醛,和丁醛变成正丁醇,
该重组微生物被工程化改造以灭活一种或多种天然途径,该途径用于将底物转化成产物,其中所述底物是丙酮酸或乙酰CoA,
该重组微生物被进一步工程化改造以活化至少厌氧活性丙酮酸脱氢酶、NADH依赖性甲酸脱氢酶和用于将甘油转化成丙酮酸的异源途径之一,且
该重组微生物能够以理论产率的至少5%的产率生成正丁醇。
23.权利要求22的重组微生物,其中所述一种或多种天然途径是NADH依赖性途径。
24.权利要求25的重组微生物,其中所述被灭活的途径包含至少乙酰CoA转化成乙醇、丙酮酸转化成乳酸、丙酮酸转化成琥珀酸和二羟基丙酮磷酸转化成甲基乙二醛、乙酰-CoA转化成乙酸和丙酮酸转化成乙酸之一。
25.权利要求22的重组微生物,其中所述一种或多种天然途径包含乙酰-CoA转化成乙醇,且所述重组微生物能够以理论产率的至少30%的产率生成正丁醇。
26.权利要求25的重组微生物,其中所述NADH生成途径是用于将甘油转化成丙酮酸的途径,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
27.权利要求25的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成乳酸,且所述重组微生物能够以理论产率的至少50%的产率生成正丁醇。
28.权利要求27的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成琥珀酸,且所述重组微生物能够以理论产率的至少55%的产率生成正丁醇。
29.权利要求28的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成甲基乙二醛,且所述重组微生物能够以理论产率的至少60%的产率生成正丁醇。
30.权利要求29的重组微生物,其中所述被灭活的途径进一步包含乙酰-CoA转化成乙酸,且所述重组微生物能够以理论产率的至少65%的产率生成正丁醇。
31.权利要求20的重组微生物,其中所述NADH生成酶是在厌氧条件下有活性的丙酮酸脱氢酶,且所述重组微生物能够以理论产率的至少73%的产率生成正丁醇。
32.一种表达用于将碳源转化成正丁醇的异源途径的重组微生物,该异源途径包含以下底物变成产物的转化:
乙酰-CoA变成乙酰乙酰-CoA;乙酰乙酰-CoA变成羟基丁酰-CoA;羟基丁酰-CoA变成巴豆酰-CoA;巴豆酰-CoA变成丁酰-CoA;丁酰-CoA变成丁醛,和丁醛变成正丁醇,
该重组微生物被工程化改造以灭活一种或多种天然途径,该途径用于将底物转化成产物,其中所述底物是丙酮酸或乙酰CoA,
该重组微生物能够以理论产率的至少2%的产率生成正丁醇。
33.权利要求32的重组微生物,其中所述被灭活的途径包含至少乙酰-CoA转化成乙醇,丙酮酸转化成乳酸,丙酮酸转化成琥珀酸和丙酮酸转化成甲基乙二醛,乙酰-CoA转化成乙酸和丙酮酸转化成乙酸之一。
34.权利要求32的重组微生物,其中所述一种或多种天然途径包含乙酰-CoA转化成乙醇,且所述重组微生物能够以理论产率的至少5%的产率生成正丁醇。
35.权利要求34的重组微生物,其中所述一种或多种天然途径进一步包含丙酮酸转化成乳酸,且所述重组微生物能够以理论产率的至少7%的产率生成正丁醇。
36.权利要求35的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成琥珀酸,且所述重组微生物能够以理论产率的至少20%的产率生成正丁醇。
37.权利要求36的重组微生物,其中所述被灭活的途径进一步包含丙酮酸转化成甲基乙二醛,且所述重组微生物能够以理论产率的至少25%的产率生成正丁醇。
38.权利要求36的重组微生物,其中所述被灭活的途径进一步包含乙酰-CoA转化成乙酸,且所述重组微生物能够以理论产率的至少35%的产率生成正丁醇。
39.一种用于生产正丁醇的方法,该方法包括
提供依照权利要求1的重组微生物,
使该重组微生物接触碳源,接触的时间和条件足以容许正丁醇生成,直至生成了可回收量的正丁醇,和
回收可回收量的正丁醇。
40.依照权利要求39的方法,其中在需氧条件下培养所述微生物,且其中在厌氧条件下进行生物催化。
41.依照权利要求32的方法,其中培养微生物的pH控制为pH5-7,且其中培养温度控制为25-37℃。
42.一种能够以理论产率的至少5%的产率生成丁酸的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成丁酸;和
工程化改造微生物以灭活天然途径,该途径用于将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
43.能够以理论产率的至少5%的产率生成丁酸和正丁醇混合物的重组微生物,该重组微生物是通过如下可获得的:
工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成丁酸;
工程化改造微生物以活化NADH依赖性异源途径,该途径用于通过生成一种或多种代谢中间产物而将碳源转化成正丁醇;和
工程化改造微生物以灭活天然途径,该途径将底物转化成产物,其中所述底物是一种或多种代谢中间产物之一。
44.权利要求43的重组微生物,其中所述重组微生物是通过如下可获得的:进一步工程化改造微生物以活化至少NADH生成酶和NADH生成途径之一,从而平衡所述NADH依赖性异源途径。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US86832606P | 2006-12-01 | 2006-12-01 | |
US60/868,326 | 2006-12-01 | ||
US60/890,329 | 2007-02-16 | ||
US60/905,550 | 2007-03-06 | ||
US60/940,877 | 2007-05-30 | ||
US60/945,576 | 2007-06-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101627109A true CN101627109A (zh) | 2010-01-13 |
Family
ID=41522321
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200780050853A Pending CN101627109A (zh) | 2006-12-01 | 2007-12-03 | 用于生产正丁醇的工程化改造的微生物及相关方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101627109A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102618569A (zh) * | 2012-03-15 | 2012-08-01 | 南京工业大学 | 产丁醇基因工程菌的构建、菌株及其应用 |
CN108004260A (zh) * | 2016-10-28 | 2018-05-08 | 深圳华大基因研究院 | 调节动物肠道菌群结构的方法 |
CN110452827A (zh) * | 2019-07-24 | 2019-11-15 | 上海中溶科技有限公司 | 一种具有脱毒功能的基因重组酿酒酵母及构建方法及其应用 |
CN113736717A (zh) * | 2021-11-03 | 2021-12-03 | 广东省科学院生态环境与土壤研究所 | 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用 |
-
2007
- 2007-12-03 CN CN200780050853A patent/CN101627109A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102618569A (zh) * | 2012-03-15 | 2012-08-01 | 南京工业大学 | 产丁醇基因工程菌的构建、菌株及其应用 |
CN108004260A (zh) * | 2016-10-28 | 2018-05-08 | 深圳华大基因研究院 | 调节动物肠道菌群结构的方法 |
CN108004260B (zh) * | 2016-10-28 | 2021-07-06 | 深圳华大生命科学研究院 | 调节动物肠道菌群结构的方法 |
CN110452827A (zh) * | 2019-07-24 | 2019-11-15 | 上海中溶科技有限公司 | 一种具有脱毒功能的基因重组酿酒酵母及构建方法及其应用 |
CN110452827B (zh) * | 2019-07-24 | 2020-07-31 | 中溶科技股份有限公司 | 一种具有脱毒功能的基因重组酿酒酵母及构建方法及其应用 |
CN113736717A (zh) * | 2021-11-03 | 2021-12-03 | 广东省科学院生态环境与土壤研究所 | 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用 |
CN113736717B (zh) * | 2021-11-03 | 2022-02-11 | 广东省科学院生态环境与土壤研究所 | 一株具有脱氮功能和缺氧抗逆性的甲烷氧化菌及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2021203937B2 (en) | Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves | |
BRPI0719748A2 (pt) | Microrganismo modificados por engenharia para produzir n-butanol e métodos relacionados | |
RU2763170C2 (ru) | Производство олигосахаридов человеческого молока в микроорганизмах-хозяевах с модифицированным импортом/экспортом | |
AU2023270322A1 (en) | Compositions and methods for modifying genomes | |
DK2576605T3 (en) | PREPARATION OF METABOLITES | |
KR102092422B1 (ko) | 유전자 조작된 미생물로부터 뮤콘산의 생산 | |
DK2087105T3 (da) | Delta 17-desaturase og anvendelse heraf ved fremstilling af flerumættede fedtsyrer | |
KR20180081527A (ko) | 클로스트리듐 박테리아의 형질전환을 위한 유전자 도구 | |
KR102593668B1 (ko) | 유도 기질 부재 하의 사상 진균 세포에서의 단백질 생산 | |
KR101633477B1 (ko) | 개선된 단백질 발현계 | |
KR20120099509A (ko) | 재조합 숙주 세포에서 육탄당 키나아제의 발현 | |
IL236992A (en) | Genetically modified cyanobacteria that produce ethanol | |
KR20140099224A (ko) | 케토-아이소발레레이트 데카르복실라제 효소 및 이의 이용 방법 | |
EP2181195A2 (de) | Fermentative gewinnung von aceton aus erneuerbaren rohstoffen mittels neuen stoffwechselweges | |
KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
KR20130138760A (ko) | 고농도의 에이코사펜타엔산 생성을 위한 재조합 미생물 숙주 세포 | |
CN109996874A (zh) | 10-甲基硬脂酸的异源性产生 | |
KR20190003939A (ko) | 유전자 조작된 미생물로부터 개선된 뮤콘산 생산 | |
KR102303832B1 (ko) | 내산성을 갖는 효모 세포, 상기 효모 세포를 제조하는 방법 및 이의 용도 | |
US20110059485A1 (en) | Plasmids from Thermophilic Organisms, Vectors Derived Therefrom, and Uses Thereof | |
CN109843909B (zh) | 利用替代的葡萄糖转运蛋白产生鼠李糖脂的细胞和方法 | |
CN115698297A (zh) | 多模块生物合成酶基因组合文库的制备方法 | |
CN115927299A (zh) | 增加双链rna产生的方法和组合物 | |
CN101627109A (zh) | 用于生产正丁醇的工程化改造的微生物及相关方法 | |
KR102287346B1 (ko) | Rgt1의 활성이 감소된 효모 세포, 그를 제조하는 방법 및 그를 사용하여 산물을 생산하는 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100113 |