CN101889092A

CN101889092A - 生物燃料生产

Info

Publication number: CN101889092A
Application number: CN2008801192815A
Authority: CN
Inventors: 吉国靖雄; 樫山雄树
Original assignee: Bio Architecture Lab Inc
Current assignee: Bio Architecture Lab Inc
Priority date: 2007-10-04
Filing date: 2008-10-03
Publication date: 2010-11-17
Also published as: US8318473B2; US20130252312A1; CL2008002961A1; WO2009046370A8; KR20100091162A; NZ584162A; JP2010539988A; EP2195440A2; US20110244553A1; US8211689B2; BRPI0817754A2; WO2009046370A3; US20090139134A1; US20110256595A1; CA2699929A1; US8318464B2; US20110269215A1; US20110236939A1; MX2010003501A; US20090155873A1

Abstract

提供了用于将多糖、如衍生自生物质的多糖转化为适宜的单糖或寡糖，以及将适宜的单糖或寡糖转化为大量生产型化学品如生物燃料的方法、酶、重组微生物以及微生物系统。还提供了本文所述方法所产生的大量生产型化学品。还提供了富大量生产型化学品的精炼的石油产品，以及产生该石油产品的方法。

Description

生物燃料生产

优先权信息

本申请要求2007年10月24日提交的美国临时申请第60/977,628号的优先权，在此通过引用，将其全文并入。

有关序列表的声明

以文本格式提供了本申请相关的序列表，替代纸件，并且特此通过引用将其并入本说明书。含有序列表的文本文件的名称为150097_40101_SEQUENCE_LISTING.txt。该文本文件为519KB，于2008年10月3日生成，并经由EFS-Web以电子的方式提交。

发明领域

本发明通常涉及微生物系统和化学系统将生物质转化为大量生产型化学品(commodity chemicals)如生物燃料/生物汽油(biopetrol)的用途。

发明背景

石油正面临全球存储量下降，且带来超过30％的温室气体排放，促使全球变暖。每年全球消耗8000亿桶运输燃料(transportation fuel)。柴油燃料和喷气燃料(jet fuel)占全球运输燃料的50％以上。

已经通过意义重大的立法，要求燃料生产商给来自运输燃料的生产和使用的碳排放设定上限或者将其减少。燃料生产商正在寻求实质相似的低碳燃料，其可以通过现有基础设施(如精炼厂、管道、油罐)混合并且分送。

由于石油成本的增加以及对石化给料的依赖，化学工业也在寻找改善利润和价格的稳定性同时减少对环境的影响。化学工业正致力于发展更绿色的产品，其比当前的产品在能量、水和CO₂方面更有效。由生物来源如生物质所产生的燃料代表了过程的一个方面。

现有的将生物质转化为生物燃料的方法聚焦于木质纤维素生物质的用途，并且存在许多与使用这种方法有关的问题。纤维素生物质的大规模栽培需要大量耕地，这仅可以通过用能量作物生产代替粮食作物生产、采伐森林以及再耕作当前未耕作土地而实现。其他的问题包括，水的可利用性和质量的减少以及杀虫剂和肥料使用的增加。

由于其坚固的机械强度和复杂的化学组成，利用生物系统降解木质纤维素生物质是非常困难的挑战。将木质素完全转化为单糖，需要大约30种不同的酶。该复杂方法唯一可利用的替代选择需要大量的热、压力和强酸。因此本领域需要将生物质转化为可用作生物燃料或生物汽油的烃的经济且技术简单的方法。

附图简要说明

图1表示实施例1所述的fosmid克隆的灿烂弧菌(Vibrio splendidus)的基因组区。基因用橙色箭头标示。标记表示数值基因指数(numericalgene indices)以及预测的蛋白功能。

图2说明某些实施方案所涉及的途径，在所述实施方案中，大肠杆菌(E.coli)经基因工程可以生长于作为唯一碳源的藻酸盐上。

图3说明某些实施方案所涉及的途径，在所述实施方案中，大肠杆菌经基因工程可以生长于作为唯一碳源的果胶上。

图4表示生长于作为唯一碳源的藻酸盐上的工程或重组的大肠杆菌的结果(参看实心圆)。根癌农杆菌(Agrobacterium tumefaciens)细胞提供了阳性对照(参看同心圆(hatched circle))。紧邻根癌农杆菌阳性对照左侧的孔含有DH10B大肠杆菌细胞，该细胞提供了阴性对照。

图5表示大肠杆菌重组菌株在半乳糖醛酸盐和果胶中的生长。图5A表示24hr后大肠杆菌在各种长度的半乳糖醛酸盐上的生长。图5A中的重组菌株是大肠杆菌BL21(DE3)菌株，容纳有pTrlogl-kdgR+pBBRGal3P，对照菌株是BL21(DE3)菌株，容纳有pTrc99A+pBBR1MCS-2，如实施例2所述。图5B表示3-4天后重组大肠杆菌在果胶上的生长。图5B中的重组菌株是大肠杆菌DH5a菌株，含有pPEL74(Ctrl)、pPEL74以及pROU2，如实施例2所述。

图6表示藻酸盐降解形成丙酮酸盐。图6A说明藻酸盐降解和代谢的简化代谢途径。图6B表示藻酸盐通过酶促降解途径，体外降解形成丙酮酸盐的结果。图6C表示藻酸盐通过化学降解途径，体外降解形成丙酮酸盐的结果。

图7表示从根癌农杆菌C58分离的各种醇脱氢酶的生物活性。图7A示出通过NADPH消耗所监测的DEHU氢化酶活性，图7B表示通过NADPH消耗所监测的甘露糖醛酸氢化酶(mannuronate hydrogenase)活性。

图8表示对照样品(图8A)和由pBADalsS-ilvCD-leuABCD2和pTrcBALK(图8B)产生的异丁醛、3-甲基戊醇以及2-甲基戊醛的GC-MS层析谱结果。

图9表示对照样品(图9A)和由pBADtyrA-aroLAC-aroG-tktA-aroBDE和pTrcBALK(图9B)产生的4-羟苯基乙醇以及吲哚-3-乙醇的GC-MS层析谱结果。

图10表示异丁醛(图10A)、3-甲基戊醇(图10B)以及2-甲基戊醇(图10C)的质谱结果。

图11表示苯基乙醇(图11A)、4-羟苯基乙醇(图11B)以及吲哚-3-乙醇(图11C)的质谱结果。

图12表示二醇脱水酶的生物活性。图12A表示NADH消耗所监测的丁偶姻(butyroin)通过ddh1、ddh2以及ddh3的还原。图12B表示ddh3对1，2-环戊二醇和1，2-环己二醇的氧化活性，这通过NADH产生测量。

图13概括了DDH多肽所催化的氧化反应中各种底物动力学研究的结果。这些反应是NAD+依赖性的。

图14表示分离自短乳杆菌(Lactobaccilus brevis)ATCC 367的二醇脱氢酶DDH1的核苷酸序列(图14A)(SEQ ID NO：97)和多肽序列(图14B)(SEQ ID NO：98)。

图15表示分离自恶臭假单胞菌(Pseudomonas putida)KT2440的二醇脱氢酶DDH2的核苷酸序列(图15A)(SEQ ID NO：99)和多肽序列(图15B)(SEQ ID NO：100)。

图16表示分离自肺炎克雷伯氏菌(Klebsiella pneumoniae)MGH78578的二醇脱氢酶DDH3的核苷酸序列(图16A)(SEQ ID NO：101)和多肽序列(图16B)(SEQ ID NO：102)。

图17表示分离自荧光假单胞菌(Pseudomonas fluorescens)的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种(Klebsiella pneumoniae subsp.pneumoniae)MGH78578(DDH3)的ddh基因的依次的体内生物活性。该反应说明丁醛依次转化为5-羟基-4-辛酮和4，5-辛酮二醇。图17A表示丁偶姻(5-羟基-4-辛酮)在5.36分钟时的检测，而图17B表示4，5-辛二醇在6.49和6.65分钟时的检测。

图18表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明正-戊醛依次转化为6-羟基-5-癸酮和5，6-癸二醇。图18A表示valeroin(6-羟基-5-癸酮)在8.22分钟时的检测，而图18B表示5，6癸二醇在9.22和9.35分钟时的检测。

图19表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明，3-甲基丁醛依次转化为2，7-二甲基-5-羟基-4-辛酮和2，7-二甲基-4，5-辛二醇。图19A表示isoveraloin(2，7-二甲基-5-羟基-4-辛酮)在6.79分钟时的检测，而图19B表示2，7-二甲基-4，5-辛二醇在7.95和8.15分钟时的检测。

图20表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明，正-己醛依次转化为7-羟基-6-十二碳酮和6，7-十二烷二醇。图20A表示hexanoin(7-羟基-6-癸酮)在10.42分钟时的检测，而图20B表示6，7-十二烷二醇在10.89和10.95分钟时的检测。

图21表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明，4-甲基戊醛依次转化为2，9-二甲基-6-羟基-5-癸酮和2，9-二甲基-5，6-癸二醇。图21A表示isohexanoin(2，9-二甲基-6-羟基-5-癸酮)在9.45分钟时的检测，而图21B表示2，9-二甲基-5，6-癸二醇在10.38和10.44分钟时的检测。

图22表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的体内生物活性。该图说明，通过显示octanoin(9-羟基-8-十六碳酮)在12.35分钟时的检测，正-辛醛转化为9-羟基-8-十六碳酮。

图23表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的体内生物活性。该图说明，通过显示乙偶姻(acetoin)(3-羟基-2-丁酮)在rt＝0.91分钟时的检测，乙醛转化为3-羟基-2-丁酮。

图24表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明，正-丙醛依次转化为4-羟基-3-己酮和3，4-己二醇。图24A表示propioin(4羟基-3-己酮)在rt＝2.62分钟时的检测，而图24B表示3，4-己二醇在rt＝3.79分钟时的检测。

图25表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用，用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的体内生物活性。该图说明，通过显示1，4-二苯基-3-羟基-2-丁酮在rt＝13.66分钟时的检测，苯乙醛转化为1，4-二苯基-3-羟基-2-丁酮。

图26表示来自肺炎克雷伯氏菌MGH 78578(DDH3)的二醇脱氢酶ddh和来自肺炎克雷伯氏菌MGH 78578的二醇脱水酶pduCDE的依次生物学活性。图26A表示GC-MS数据，该数据证实，在样品提取物中存在4，5-辛二醇，该辛二醇是通过ddh3由丁偶姻还原所产生的预期产物。图26B表示GC-MS数据，其证实在样品提取物种存在4-辛酮，该4-辛酮是丁偶姻和4，5-辛二醇分别通过ddh3和pduCDE依次脱氢和脱水而产生的预期产物。

图27表示来自肺炎克雷伯氏菌MGH 78578(DDH3)的二醇脱氢酶ddh和来自肺炎克雷伯氏菌MGH 78578的二醇脱水酶pduCDE的依次生物学活性。图27A和图27B表示样品提取物气相层析/质谱和4-辛酮标准气相层析/质谱间的比较，证实4-辛酮是由丁偶姻利用酶二醇脱氢酶(ddh3)和二醇脱水酶(pduCDE)产生的。

图28表示分离自肺炎克雷伯氏菌MGH 78578的二醇脱水酶大亚基(pduC)的核苷酸序列(图28A)(SEQ ID NO：103)和多肽序列(图28B)(SEQID NO：104)。

图29表示除了分离自肺炎克雷伯氏菌MGH 78578的二醇脱水酶小亚基(pduE)的核苷酸序列(图29C)(SEQ ID NO：107)和多肽序列(图29D)(SEQ ID NO：108)外，分离自肺炎克雷伯氏菌MGH 78578的二醇脱水酶中亚基(pduD)的核苷酸序列(图29A)(SEQ ID NO：105)和多肽序列(图29B)(SEQ ID NO：106)。

图30表示NADP产生(图30A)和NADPH产生(图30B)所监测的4-辛醇通过次级醇脱氢酶(secondary alcohol dehydrogenase)的氧化。

图31表示NADP产生(图31A)和NADPH产生(图31B)所监测的4-辛醇通过次级醇脱氢酶的氧化。

图32表示NADH产生(图32A)和NADPH产生(图32B)所监测的2，7-二甲基辛醇通过次级醇脱氢酶的氧化。

图33表示2ADH11和2ADH16的氧化和还原活性。图33A表示NADPH消耗所测量的2，7-二甲基-4-辛酮的还原。图33B表示2，7-二甲基-4-辛酮、4-辛酮以及环戊酮的还原。

图34表示环戊醇通过次级醇脱氢酶的氧化和还原。图34A表示NADH或NADPH形成所监测的环戊醇的氧化。图34B表示NADPH消耗所监测的环戊醇的还原。

图35表示每个底物的所示还原反应的计算的速率常数，该还原反应是由次级醇脱氢酶ADH-16(SEQ ID NO：138)催化的。

图36表示每个底物的所示氧化反应的计算的速率常数，该氧化反应是由次级醇脱氢酶ADH-16(SEQ ID NO：138)催化的。

图37示出藻酸盐裂解酶基因/蛋白的名录，该藻酸盐裂解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。

图38示出果胶酸裂解酶基因/蛋白的名录，该果胶酸裂解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。

图39A示出鼠李聚糖半乳糖醛酸(rhamnogalacturonan)裂解酶基因/蛋白的名录，该裂解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。图39B表示鼠李聚糖半乳糖醛酸水解酶基因/蛋白的名录，该水解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。

图40示出果胶甲酯酶基因/蛋白的名录，该果胶甲酯酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。

图41示出果胶乙酰酯酶(pectate acetyl esterase)基因/蛋白的名录，该果胶乙酰酯酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。

图42表示24小时时，由实施例4所述的重组微生物产生的2-苯基乙醇(图42A)、2-(4-羟苯基)乙醇(图42B)以及2-(吲哚-3-)乙醇(图42C)，其包含功能性2-苯基乙醇、2-(4-羟苯基)乙醇以及2-(吲哚-3-)乙醇生物合成途径。

图43表示GC-MS层析谱结果，该结果证实在一周时，由实施例4所述的重组微生物(pBADpheA-aroLAC-aroG-tktA-aroBDE和pTrcBALK)产生2-苯基乙醇(图43B)。图43A表示阴性对照细胞(pBAD33和pTrc99A)。

图44表示GC-MS层析谱结果，该结果证实在一周时，由实施例4所述的重组微生物(pBADtyrA-aroLAC-aroG-tktA-aroBDE和pTrcBALK)产生2-(4-羟苯基)乙醇(9.36分钟)和2-(吲哚-3)乙醇(10.32分钟)。

图45证实由1，2-丙二醇形成1-丙醛(图45A)和由内消旋-2，3-丁二醇形成2-丁酮(图45B)，二者均由分离的不依赖B12的二醇脱水酶体外催化，如实施例9所述。

图46A表示由1，2-丙二醇体内产生1-丙醇。图46B表示由内消旋-2，3丁二醇体内产生2-丁醇。图46C表示由反式-1，2-环戊二醇体内产生环戊酮。这些实验是按实施例9中所述进行的。

图47表示实施例10所进行的TBA测定的结果。图47中左侧的试管表示取自表达Vs24254的细胞的过夜培养物的培养基，表明分泌藻酸盐裂解酶，而右侧的试管表示利用来自表达Vs24259的细胞的培养基(阴性对照)的TBA反应。在阴性对照中缺少粉红着色表明，没有发生或者发生很少的藻酸盐多聚体切割。

图48表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的苯甲醛裂解酶(BAL)催化由乙醛和丙醛间的连接反应体内产生3-羟基-2-戊酮和2-羟基-3-戊酮(图48A)，并催化由丙醛和丁醛间的连接反应体内产生4-羟基-3-庚酮和3-羟基-4-庚酮(图48B)。

图49表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由乙醛和戊醛间的连接反应体内产生3-羟基-2-庚酮(图49A)，并催化由戊醛和丙醛间的连接反应体内产生4-羟基-3-辛酮和3-羟基-4-辛酮(图49B)。

图50表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由丁醛和戊醛间的连接反应体内产生5-羟基-4-壬酮(图50A)，并催化由己醛和3-甲基丁醛间的连接反应体内产生2-甲基-5-羟基-4-癸酮和2-甲基-4-羟基-5-癸酮(图50B)。

图51表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由乙醛和4-甲基己醛间的连接反应体内产生6-甲基-3-羟基-2-庚酮(图51A)，并催化由4-甲基己醛和丙醛间的连接反应体内产生7-甲基-4-羟基-3-辛酮(图51B)。

图52表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由4-甲基己醛和丁醛间的连接反应体内产生8-甲基-5-羟基-4-壬酮(图52A)，并催化由乙醛和辛醛间的连接反应体内产生3-羟基-2-癸酮(图52B)。

图53表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由辛醛和丙醛间的连接反应体内产生4-羟基-3-十一碳酮(图53A)，并催化由辛醛和丁醛间的连接反应体内产生5-羟基-4-十二碳酮(图53B)。

图54表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由辛醛和戊醛间的连接反应体内产生6-羟基-5-十三碳酮(图54A)，并催化由辛醛和3-甲基丁醛间的连接反应体内产生2-甲基-5-羟基4-十二碳酮和2-甲基-4-羟基-5-癸酮(图54B)。

图55表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明，密码子优化的BAL催化由辛醛和4-甲基戊醛间的连接反应体内产生2-甲基-6-羟基-5-十三碳酮。

图56表示如实施例10所述，重组大肠杆菌在作为唯一碳源的藻酸盐上的生长。在葡萄糖上的生长(图56B)提供了阳性对照。细胞用无质粒(BL21-阴性对照)、一种质粒(如Da或3a)或两种质粒(如Dk3a和Da3k)转化。质粒以小写字母表示：“a”表示pET-DEST42质粒骨架，而“k”表示pENTR/D/TOPO骨架。“D”表示质粒含有基因组区Vs24214-24249，而“3”表示质粒含有基因组区Vs24189-24209。因此，Da为pET-DEST42-Vs24214-24249，Da3k为pET-DEST42-Vs24214-24249和pENTR/D/TOPO-Vs24189-24209等。这些结果表明，组合的基因组区Vs24214-24249和Vs24189-24209足以赋予大肠杆菌在作为唯一碳源的藻酸盐上生长的能力。

图57表示如实施例11所进行的，通过生长于藻酸盐上的大肠杆菌产生乙醇。用pBBRPdc-AdhA/B或pBBRPdc-AdhA/B+1.5FOS转化大肠杆菌，并允许其在含有藻酸盐的m9培养基中生长。

发明概述

本发明的实施方案包括将多糖转化为大量生产型化学品的方法，包括(a)使多糖与多糖降解或解聚代谢系统接触，其中所述多糖任选地衍生于生物质，所述代谢系统选自(i)酶促或化学催化，和(ii)微生物系统，其中所述微生物系统包含重组微生物，其中该重组微生物包含一个或多个允许其在作为唯一碳源的多糖上生长的外源基因，据此将所述多糖转化为适宜的单糖或寡糖；以及(b)使适宜的单糖或寡糖与大量生产型化学品生物合成途径接触，其中该大量生产型化学品生物合成途径包含醛或酮生物合成途径，据此将多糖转化为大量生产型化学品。

在某些方面，生物质选自海洋生物质和蔬菜(vegetable)/果实(fruit)/植物(plant)生物质。在某些方面，海洋生物质选自海藻(kelp)、巨藻(giantkelp)、马尾藻类海草(sargasso)、海藻(seaweed)、藻类(algae)、海洋微生物区系(marine microflora)、微藻类(microalgae)以及海草(sea grass)。在某些方面，蔬菜/果实/植物生物质包含植物皮(plant peel)或渣。在某些方面，蔬菜/果实/植物生物质选自柑橘(citrus)、马铃薯(potato)、番茄(tomato)、葡萄(grape)、醋栗(gooseberry)、胡萝卜(carrot)、芒果(mango)、甜菜(sugar-beet)、苹果(apple)、柳枝稷(switchgrass)、木材(wood)以及干草(stover)。

在某些方面，多糖选自藻酸盐、琼脂、角叉菜聚糖、岩藻依聚糖、果胶、多聚半乳糖醛酸盐、纤维素、半纤维素、木聚糖、阿拉伯聚糖以及甘露聚糖。在某些方面，适宜的单糖或寡糖选自2-酮-3-脱氧D-葡糖酸盐(KDG)、D-甘露醇、古洛糖醛酸盐(guluronate)、甘露糖醛酸盐、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸盐、半乳糖醛酸盐以及鼠李糖。

在某些方面，大量生产型化学品选自甲烷、甲醇、乙烷、乙烯、乙醇、正-丙烷、1-丙烯、1-丙醇、丙醛、丙酮、丙酸盐、正-丁烷、1-丁烯、1-丁醇、丁醛、丁酸盐、异丁醛、异丁醇、2-甲基丁醛、2-甲基丁醇、3-甲基丁醛、3-甲基丁醇、2-丁烯、2-丁醇、2-丁酮、2，3-丁二醇、3-羟基-2-丁酮、2，3-丁二酮、乙苯、苯乙烯、2-苯基乙醇、苯乙醛、1-苯基丁烷、4-苯基-1-丁烯、4-苯基-2-丁烯、1-苯基-2-丁烯、1-苯基-2-丁醇、4-苯基-2-丁醇、1-苯基-2-丁酮、4-苯基-2-丁酮、1-苯基-2，3-丁二醇、1-苯基-3-羟基-2-丁酮、4-苯基-3-羟基-2-丁酮、1-苯基-2，3-丁二酮、正-戊烷、乙基苯酚、乙烯基苯酚、2-(4-羟苯基)乙醇、4-羟苯基乙醛、1-(4-羟苯基)丁烷、4-(4-羟苯基)-1-丁烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯基)-2-丁醇、1-(4-羟苯基)-2-丁酮、4-(4-羟苯基)-2-丁酮、1-(4-羟苯基)-2，3-丁二醇、1-(4-羟苯基)-3-羟基-2-丁酮、4-(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-2，3-丁二酮、吲哚乙烷(indolylethane)、吲哚乙烯(indolylethene)、2-(吲哚-3-)乙醇、正-戊烷、1-戊烯、1-戊醇、戊醛、戊酸盐、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2，3-戊二醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2，3-戊二酮、2-甲基戊烷、4-甲基-1-戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲基-3-戊酮、4-甲基-2，3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、4-甲基-2，3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基-2，3-戊二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2，3-戊二酮、4-甲基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2，3-戊二醇、4-甲基-1-苯基-2，3-戊二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1-(4-羟苯基)戊烷、1-(4-羟苯基)-1-戊烯、1-(4-羟苯基)-2-戊烯、1-(4-羟苯基)-3-戊烯、1-(4-羟苯基)-2-戊醇、1-(4-羟苯基)-3-戊醇、1-(4-羟苯基)-2-戊酮、1-(4-羟苯基)-3-戊酮、1-(4-羟苯基)-2，3-戊二醇、1-(4-羟苯基)-2-羟基-3-戊酮、1-(4-羟苯基)-3-羟基-2-戊酮、1-(4-羟苯基)-2，3-戊二酮、4-甲基-1-(4-羟苯基)戊烷、4-甲基-1-(4-羟苯基)-2-戊烯、4-甲基-1-(4-羟苯基)-3-戊烯、4-甲基-1-(4-羟苯基)-1-戊烯、4-甲基-1-(4-羟苯基)-3-戊醇、4-甲基-1-(4-羟苯基)-2-戊醇、4-甲基-1-(4-羟苯基)-3-戊酮、4-甲基-1-(4-羟苯基)-2-戊酮、4-甲基-1-(4-羟苯基)-2，3-戊二醇、4-甲基-1-(4-羟苯基)-2，3-戊二酮、4-甲基-1-(4-羟苯基)-3-羟基-2-戊酮、4-甲基-1-(4-羟苯基)-2-羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-1-戊烯、1-(吲哚-3)-2-戊烯、1-(吲哚-3)-3-戊烯、1-(吲哚-3)-2-戊醇、1-(吲哚-3)-3-戊醇、1-(吲哚-3)-2-戊酮、1-(吲哚-3)-3-戊酮、1-(吲哚-3)-2，3-戊二醇、1-(吲哚-3)-2-羟基-3-戊酮、1-(吲哚-3)-3-羟基-2-戊酮、1-(吲哚-3)-2，3-戊二酮、4-甲基-1-(吲哚-3-)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲哚-3)-1-戊烯、4-甲基-2-(吲哚-3)-3-戊醇、4-甲基-1-(吲哚-3)-2-戊醇、4-甲基-1-(吲哚-3)-3-戊酮、4-甲基-1-(吲哚-3)-2-戊酮、4-甲基-1-(吲哚-3)-2，3-戊二醇、4-甲基-1-(吲哚-3)-2，3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲基-1-(吲哚-3)-2-羟基-3-戊酮、正-己烷、1-己烯、1-己醇、己醛、己酸盐、2-己烯、3-己烯、2-己醇、3-己醇、2-己酮、3-己酮、2，3-己二醇、2，3-己二酮、3，4-己二醇、3，4-己二酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、3-甲基己烷、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲基-3-己酮、2-甲基-3，4-己二醇、2-甲基-3，4-己二酮、5-甲基-2，3-己二醇、5-甲基-2，3-己二酮、4-甲基-2，3-己二醇、4-甲基-2，3-己二酮、2-甲基-3-羟基-4-己酮、2-甲基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟基-3-己酮、4-甲基-3-羟基-2-己酮、2，5-二甲基己烷、2，5-二甲基-2-己烯、2，5-二甲基-3-己烯、2，5-二甲基-3-己醇、2，5-二甲基-3-己酮、2，5-二甲基-3，4-己二醇、2，5-二甲基-3，4-己二酮、2，5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2，3-己二醇、4-甲基-1-苯基-2，3-己二醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2，3-己二酮、4-甲基-1-苯基-2，3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1-(4-羟苯基)-1-己烯、5-甲基-1-(4-羟苯基)-2-己烯、5-甲基-1-(4-羟苯基)-3-己烯、4-甲基-1-(4-羟苯基)-1-己烯、4-甲基-1-(4-羟苯基)-2-己烯、4-甲基-1-(4-羟苯基)-3-己烯、5-甲基-1-(4-羟苯基)-2-己醇、5-甲基-1-(4-羟苯基)-3-己醇、4-甲基-1-(4-羟苯基)-2-己醇、4-甲基-1-(4-羟苯基)-3-己醇、5-甲基-1-(4-羟苯基)-2-己酮、5-甲基-1-(4-羟苯基)-3-己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4-羟苯基)-3-己酮、5-甲基-1-(4-羟苯基)-2，3-己二醇、4-甲基-1-(4-羟苯基)-2，3-己二醇、5-甲基-1-(4-羟苯基)-3-羟基-2-己酮、5-甲基-1-(4-羟苯基)-2-羟基-3-己酮、4-甲基-1-(4-羟苯基)-3-羟基-2-己酮、4-甲基-1-(4-羟苯基)-2-羟基-3-己酮、5-甲基-1-(4-羟苯基)-2，3-己二酮、4-甲基-1-(4-羟苯基)-2，3-己二酮、4-甲基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3)-2-己烯、5-甲基-1-(吲哚-3)-3-己烯、4-甲基-1-(吲哚-3)-1-己烯、4-甲基-1-(吲哚-3)-2-己烯、4-甲基-1-(吲哚-3)-3-己烯、5-甲基-1-(吲哚-3)-2-己醇、5-甲基-1-(吲哚-3)-3-己醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基-1-(吲哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚-3)-2-己酮、4-甲基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2，3-己二醇、4-甲基-1-(吲哚-3)-2，3-己二醇、5-甲基-1-(吲哚-3)-3-羟基-2-己酮、5-甲基-1-(吲哚-3)-2-羟基-3-己酮、4-甲基-1-(吲哚-3)-3-羟基-2-己酮、4-甲基-1-(吲哚-3)-2-羟基-3-己酮、5-甲基-1-(吲哚-3)-2，3-己二酮、4-甲基-1-(吲哚-3)-2，3-己二酮、正-庚烷、1-庚烯、1-庚醇、庚醛、庚酸盐、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2，3-庚二醇、2，3-庚二酮、3，4-庚二醇、3，4-庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚酮、2-甲基-3，4-庚二醇、2-甲基-3，4-庚二酮、6-甲基-3，4-庚二醇、6-甲基-3，4-庚二酮、5-甲基-3，4-庚二醇、5-甲基-3，4-庚二酮、2-甲基-3-羟基-4-庚酮、2-甲基-4-羟基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚酮、5-甲基-4-羟基-3-庚酮、2，6-二甲基庚烷、2，5-二甲基庚烷、2，6-二甲基-2-庚烯、2，6-二甲基-3-庚烯、2，5-二甲基-2-庚烯、2，5-二甲基-3-庚烯、3，6-二甲基-3-庚烯、2，6-二甲基-3-庚醇、2，6-二甲基-4-庚醇、2，5-二甲基-3-庚醇、2，5-二甲基-4-庚醇、2，6-二甲基-3，4-庚二醇、2，6-二甲基-3，4-庚二酮、2，5-二甲基-3，4-庚二醇、2，5-二甲基-3，4-庚二酮、2，6-二甲基-3-羟基-4-庚酮、2，6-二甲基-4-羟基-3-庚酮、2，5-二甲基-3-羟基-4-庚酮、2，5-二甲基-4-羟基-3-庚酮、正-辛烷、1-辛烯、2-辛烯、1-辛醇、辛醛、辛酸盐(octanoate)、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4，5-辛二醇、4，5-辛二酮、4-羟基-5-辛酮、2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲基-4，5-辛二醇、2-甲基-4，5-辛二酮、3-甲基-4，5-辛二醇、3-甲基-4，5-辛二酮、2-甲基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟基-4-辛酮、2，7-二甲基辛烷、2，7-二甲基-3-辛烯、2，7-二甲基-4-辛烯、2，7-二甲基-4-辛醇、2，7-二甲基-4-辛酮、2，7-二甲基-4，5-辛二醇、2，7-二甲基-4，5-辛二酮、2，7-二甲基-4-羟基-5-辛酮、2，6-二甲基辛烷、2，6-二甲基-3-辛烯、2，6-二甲基-4-辛烯、3，7-二甲基-3-辛烯、2，6-二甲基-4-辛醇、3，7-二甲基-4-辛醇、2，6-二甲基-4-辛酮、3，7-二甲基-4-辛酮、2，6-二甲基-4，5-辛二醇、2，6-二甲基-4，5-辛二酮、2，6-二甲基-4-羟基-5-辛酮、2，6-二甲基-5-羟基-4-辛酮、3，6-二甲基辛烷、3，6-二甲基-3-辛烯、3，6-二甲基-4-辛烯、3，6-二甲基-4-辛醇、3，6-二甲基-4-辛酮、3，6-二甲基-4，5-辛二醇、3，6-二甲基-4，5-辛二酮、3，6-二甲基-4-羟基-5-辛酮、正-壬烷、1-壬烯、1-壬醇、壬醛、壬酸盐、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基-5-壬醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基-4，5-壬二醇、8-甲基-4，5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2，8-二甲基壬烷、2，8-甲基-3-壬烯、2，8-二甲基-4-壬烯、2，8-二甲基-5-壬烯、2，8-二甲基-4-壬醇、2，8-二甲基-5-壬醇、2，8-二甲基-4-壬酮、2，8-二甲基-5-壬酮、2，8-二甲基-4，5-壬二醇、2，8-二甲基-4，5-壬二酮、2，8-二甲基-4-羟基-5-壬酮、2，8-二甲基-5-羟基-4-壬酮、2，7-二甲基壬烷、3，8-二甲基-3-壬烯、3，8-二甲基-4-壬烯、3，8-二甲基-5-壬烯、3，8-二甲基-4-壬醇、3，8-二甲基-5-壬醇、3，8-二甲基-4-壬酮、3，8-二甲基-5-壬酮、3，8-二甲基-4，5-壬二醇、3，8-二甲基-4，5-壬二酮、3，8-二甲基-4-羟基-5-壬酮、3，8-二甲基-5-羟基-4-壬酮、正-癸烷、1-癸烯、1-癸醇、癸酸盐、2，9-二甲基癸烷、2，9-二甲基-3-癸烯、2，9-二甲基-4-癸烯、2，9-二甲基-5-癸醇、2，9-二甲基-5-癸酮、2，9-二甲基-5，6-癸二醇、2，9-二甲基-6-羟基-5-癸酮、2，9-二甲基-5，6-癸二酮、正-十一烷、1-十一碳烯、1-十一烷醇、十一醛、十一酸盐、正-十二烷、1-十二碳烯、1-十二烷醇、十二醛、十二酸盐、正-十二烷、1-decadecene、1-十二烷醇、十二醛、十二酸盐、正-十三烷、1-十三碳烯、1-十三烷醇、十三醛、十三酸盐、正-十四烷、1-十四碳烯、1-十四烷醇、十四醛、十四酸盐、正-十五烷、1-十五碳烯、1-十五烷醇、十五醛、十五酸盐、正-十六烷、1-十六碳烯、1-十六烷醇、十六醛、十六酸盐、正-十七烷、1-十七碳烯、1-十七烷醇、十七醛、十七酸盐、正-十八烷、1-十八碳烯、1-十八烷醇、十八醛、十八酸盐、正-十九烷、1-十九碳烯、1-十九烷醇、十九醛、十九酸盐、二十烷、1-二十碳烯、1-二十烷醇、二十醛、二十酸盐、3-羟基丙醛、1，3-丙二醇、4-羟基丁醛、1，4-丁二醇、3-羟基-2-丁酮、2，3-丁二醇、1，5-戊二醇、高柠檬酸盐、高异柠檬酸盐、b-羟基己二酸盐、戊二酸盐、glutarsemialdehyde、戊二醛、2-羟基-1-环戊酮、1，2-环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2，3-二羟基-异戊酸盐、2-氧代异戊酸盐、异丁酰辅酶A、异丁酸盐、异丁醛、5-氨基戊醛、1，10-二氨基癸烷、1，10-二氨基-5-癸烯、1，10-二氨基-5-羟基癸烷、1，10-二氨基-5-癸酮、1，10-二氨基-5，6-癸二醇、1，10-二氨基-6-羟基-5-癸酮、苯乙醛(phenylacetoaldehyde)、1，4-二苯基丁烷、1，4-二苯基-1-丁烯、1，4-二苯基-2-丁烯、1，4-二苯基-2-丁醇、1，4-二苯基-2-丁酮、1，4-二苯基-2，3-丁二醇、1，4-二苯基-3-羟基-2-丁酮、1-(4-羟苯基)-4-苯基丁烷、1-(4-羟苯基)-4-苯基-1-丁烯、1-(4-羟苯基)-4-苯基-2-丁烯、1-(4-羟苯基)-4-苯基-2-丁醇、1-(4-羟苯基)-4-苯基-2-丁酮、1-(4-羟苯基)-4-苯基-2，3-丁二醇、1-(4-羟苯基)-4-苯基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲哚-3)-4-苯基-2-丁烯、1-(吲哚-3)-4-苯基-2-丁醇、1-(吲哚-3)-4-苯基-2-丁酮、1-(吲哚-3)-4-苯基-2，3-丁二醇、1-(吲哚-3)-4-苯基-3-羟基-2-丁酮、4-羟苯基乙醛、1，4-二(4-羟苯基)丁烷、1，4-二(4-羟苯基)-1-丁烯、1，4-二(4-羟苯基)-2-丁烯、1，4-二(4-羟苯基)-2-丁醇、1，4-二(4-羟苯基)-2-丁酮、1，4-二(4-羟苯基)-2，3-丁二醇、1，4-二(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-4-(吲哚-3-)丁烷、1-(4-羟苯基)-4-(吲哚-3)-1-丁烯、1-二(4-羟苯基)-4-(吲哚-3)-2-丁烯、1-(4-羟苯基)-4-(吲哚-3)-2-丁醇、1-(4-羟苯基)-4-(吲哚-3)-2-丁酮、1-(4-羟苯基)-4-(吲哚-3)-2，3-丁二醇、1-(4-羟苯基-4-(吲哚-3)-3-羟基-2-丁酮、吲哚-3-乙醛、1，4-二(吲哚-3-)丁烷、1，4-二(吲哚-3)-1-丁烯、1，4-二(吲哚-3)-2-丁烯、1，4-二(吲哚-3)-2-丁醇、1，4-二(吲哚-3)-2-丁酮、1，4-二(吲哚-3)-2，3-丁二醇、1，4-二(吲哚-3)-3-羟基-2-丁酮、琥珀酸半醛、己烷-1，8-二羧酸、3-己烯-1，8-二羧酸、3-羟基-己烷-1，8-二羧酸、3-己酮-1，8-二羧酸、3，4-己二醇-1，8-二羧酸、4-羟基-3-己酮-1，8-二羧酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾以及磷酸盐。

本发明的某些实施方案包括将多糖转化为适宜的单糖或寡糖的方法，包括(a)使多糖与微生物系统接触足以将所述多糖转化为适宜的单糖或寡糖的时间，其中所述多糖任选地由生物质获得，其中所述微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因，其中该裂解酶和/或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域(autotransporter domain)；(ii)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白及超通道(superchannel)；以及(iii)至少一个编码和表达酶的基因，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶，从而将多糖转化为适宜的单糖或寡糖。

本发明的某些实施方案包括将多糖转化为适宜的单糖或寡糖的方法，包括(a)使多糖与化学或酶促催化途径接触足以将所述多糖转化为第一单糖或寡糖的时间，其中所述多糖任选地由生物质获得，和(b)使第一单糖或寡糖与微生物系统接触足以将第一单糖或寡糖转化为适宜的单糖或寡糖的时间，其中所述微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因，(ii)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白及超通道；以及(iii)至少一个编码和表达酶的基因，从而将多糖转化为适宜的单糖或寡糖，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。

在某些方面，裂解酶选自藻酸盐裂解酶、果胶酸裂解酶、多聚甘露糖醛酸裂解酶(polymannuronate lyase)、多聚葡糖酸裂解酶(polygluronatelyase)、多聚半乳糖醛酸裂解酶以及鼠李聚糖半乳糖醛酸裂解酶。在某些方面，水解酶选自藻酸盐水解酶、鼠李聚糖半乳糖醛酸水解酶、多聚甘露糖醛酸水解酶、果胶水解酶以及多聚半乳糖醛酸水解酶。在某些方面，转运蛋白选自ABC转运蛋白、同向转运蛋白(symporter)以及外膜孔蛋白。在某些方面，ABC转运蛋白选自Atu3021、Atu3022、Atu3023、Atu3024、algM1、algM2、AlgQ1、AlgQ2、AlgS、OG2516_05558、OG2516_05563、OG2516_05568、OG2516_05573、TogM、TogN、TogA、TogB和其功能变体。在某些方面，同向转运蛋白选自V12B01_24239(SEQ ID NO：26)、V12B01_24194(SEQ ID NO：8)和TogT，以及其功能变体。在某些方面，外膜孔蛋白包括选自V12B01_24269、KdgM和KdgN的孔蛋白及其功能变体。

某些实施方案包括能在作为唯一碳源的多糖上生长的重组微生物，其中所述多糖选自藻酸盐、果胶、三-半乳糖醛酸盐、二半乳糖醛酸盐、纤维素以及半纤维素。在某些方面，多糖是藻酸盐。在某些方面，多糖是果胶。在某些方面，多糖是三半乳糖醛酸盐。

某些实施方案包括重组的微生物，其包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因，其中所述裂解酶或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域；(ii)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白以及超通道；以及(iii)至少一个编码和表达酶的基因，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。在某些方面，微生物能在作为唯一碳源的多糖上生长。在某些方面，多糖选自藻酸盐、果胶以及三半乳糖醛酸盐。

某些实施方案包括将适宜的单糖或寡糖转化为第一大量生产型化学品的方法，包括(a)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖或寡糖转化为大量生产型化学品的时间，其中所述微生物系统包含重组的微生物，其中所述微生物包含大量生产型化学品生物合成途径，从而将适宜的单糖或寡糖转化为第一大量生产型化学品。在某些方面，大量生产型化学品途径包括一个或多个编码醛或酮生物合成途径的基因。

在某些方面，醛或酮生物合成途径选自乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛、2-吲哚-3-乙醛、戊二醛、5-氨基-戊醛、琥珀酸半醛以及琥珀酸4-羟苯基乙醛生物合成途径中的一个或多个。在某些方面，醛或酮生物合成途径包含乙醛生物合成途径和选自丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

在某些方面，醛或酮生物合成途径包含丙醛生物合成途径和选自丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛以及苯乙醛生物合成途径的生物合成途径。在某些方面，醛或酮生物合成途径包含丁醛生物合成途径和选自异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。在某些方面，醛或酮生物合成途径包含异丁醛生物合成途径和选自2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径中的生物合成途径。

在某些方面，醛或酮生物合成途径包含2-甲基-丁醛生物合成途径和选自3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。在某些方面，醛或酮生物合成途径包含3-甲基-丁醛生物合成途径以及选自2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。在某些方面，醛或酮生物合成途径包含2-苯乙醛生物合成途径和选自2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

在某些方面，醛或酮生物合成途径包含2-(4-羟苯基)乙醛生物合成途径和2-吲哚-3-乙醛生物合成途径。在某些方面，第一大量生产型化学品进一步被酶促和/或化学还原和脱水为第二大量生产型化学品。

某些实施方案包括将适宜的单糖或寡糖转化为大量生产型化学品的方法，包括(a)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖或寡糖转化为大量生产型化学品的时间，其中所述微生物系统包含：(i)一个或多个编码和表达醛生物合成途径的基因，其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因；以及(ii)一个或多个编码和表达醛还原酶的基因，从而将适宜的单糖或寡糖转化为大量生产型化学品。在某些方面，脱羧酶是吲哚-3-丙酮酸脱羧酶(IPDC)。在某些方面，IPDC包含与SEQ ID NO：312所示的氨基酸序列至少80％、90％、95％、98％或99％同一(identical)的氨基酸序列。在某些方面，醛还原酶是苯乙醛还原酶(PAR)。在某些方面，PAR包含与SEQ ID NO：313所示氨基酸序列至少80％、90％、95％、98％或99％同一的氢基酸序列。在某些方面，大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。

某些实施方案包括重组微生物，其包含(i)一个或多个编码和表达醛生物合成途径的基因，其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因；以及(ii)一个或多个编码和表达醛还原酶的基因。在某些方面，醛生物合成途径还包含一个或多个编码和表达酶的基因，所述酶选自辅酶A连接的醛脱氢酶、醛脱氢酶以及醇脱氢酶。在某些方面，脱羧酶是吲哚-3-丙酮酸脱羧酶(IPDC)。在某些方面，醛还原酶是苯乙醛还原酶(PAR)。在某些方面，微生物能将适宜的单糖或寡糖转化为大量生产型化学品。在某些方面，大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。

某些实施方案包括重组微生物，其中该微生物包含与野生型微生物相比降低的乙醇产生能力。在某些方面，该微生物包含乙酰辅酶A向乙醇转化的减少或抑制。在某些方面，该重组微生物包含乙醇脱氢酶的减少，从而提供降低的乙醇产生能力。在某些方面，乙醇脱氢酶是adhE、其同源物或变体。在某些方面，该微生物包含adhE、其同源物或变体的缺失或敲除。在某些方面，该重组微生物包括编码酶的基因中的一个或多个缺失或敲除，所述酶选自催化乙酰辅酶A转化为乙醇的酶、催化丙酮酸盐转化为乳酸盐的酶、催化延胡索酸盐转化为琥珀酸盐的酶、催化乙酰辅酶A和磷酸盐转化为辅酶A和乙酰磷酸盐的酶、催化乙酰辅酶A和甲酸盐转化为辅酶A和丙酮酸盐的酶以及催化α-酮酸转化为支链氨基酸的酶。

某些实施方案包括，其中本文所述的微生物系统或重组微生物包括选自以下的微生物：醋化醋酸杆菌(Acetobacter aceti)、无色杆菌(Achromobacter)、嗜酸菌(Acidiphilium)、不动杆菌(Acinetobacter)、马杜拉放线菌(Actinomadura)、游动放线菌(Actinoplanes)、敏捷好氧炽热球菌(Aeropyrum pernix)、农杆菌(Agrobacterium)、产碱杆菌(Alcaligenes)、菠萝(Ananas comosus)(M)、节杆菌(Arthrobacter)、黑曲霉(Aspargillus niger)、米曲霉(Aspargillus oryze)、蜜蜂曲霉(Aspergillus melleus)、粉状曲霉(Aspergillus pulverulentus)、斋藤曲霉(Aspergillus saitoi)、酱油曲霉(Aspergillus sojea)、宇佐美曲霉(Aspergillus usamii)、嗜碱芽孢杆菌(Bacillusalcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、浸麻芽孢杆菌(Bacillus macerans)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、双歧杆菌(Bifidobacterium)、短短芽孢杆菌(Brevibacillus brevis)、洋葱伯克霍尔德氏菌(Burkholderia cepacia)、圆柱念珠菌(Candida cylindracea)、皱褶念珠菌(Candida rugosa)、番木瓜(Carica papaya)(L)、纤维微菌(Cellulosimicrobium)、头孢霉菌(Cephalosporium)、变动毛壳菌(Chaetomiumerraticum)、细丽毛壳菌(Chaetomium gracile)、梭菌(Clostridium)、丁酸梭菌(Clostridium butyricum)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维素梭菌(Clostridium thermocellum)、(谷氨酸)棒杆菌(Corynebacterium(glutamicum))、Corynebacterium efficiens、大肠杆菌(Escherichia coli)、肠球菌(Enterococcus)、菊欧文氏菌(Erwina chrysanthemi)、葡糖酸杆菌(Gliconobacter)、葡糖酸醋酸杆菌(Gluconacetobacter)、盐盒菌(Haloarcula)、特异腐质霉(Humicola insolens)、Humicola nsolens、西唐北里孢菌(Kitasatospora setae)、克雷伯氏菌(Klebsiella)、产酸克雷伯氏菌(Klebsiella oxytoca)、克鲁维酵母(Kluyveromyces)、脆壁克鲁维酵母(Kluyveromyces fragilis)、乳酸克鲁维酵母(Kluyveromyces lactis)、库克菌(Kocuria)、Lactlactis、乳酸杆菌(Lactobacillus)、发酵乳酸杆菌(Lactobacillusfermentum)、清酒乳酸杆菌(Lactobacillus sake)、乳球菌(Lactococcus)、乳酸乳球菌(Lactococcus lactis)、明串珠菌(Leuconostoc)、甲基孢囊菌(Methylocystis)、西西里甲烷叶菌(Methanolobus siciliae)、嗜器官产甲烷菌(Methanogenium organophilum)、布氏甲杆菌(Methanobacterium bryantii)、蛾微杆菌(Microbacterium imperiale)、溶壁微球菌(Micrococcuslysodeikticus)、小月菌(Microlunatus)、爪哇毛霉(Mucor javanicus)、分枝杆菌(Mycobacterium)、漆斑菌(Myrothecium)、硝化杆菌(Nitrobacter)、亚硝化单胞菌(Nitrosomonas)、诺卡氏菌(Nocardia)、番木瓜(Papaya carica)、片球菌(Pediococcus)、嗜盐片球菌(Pediococcus halophilus)、青霉菌(Penicillium)、产黄青霉(Penicillium camemberti)、橘青霉(Penicilliumcitrinum)、埃默森青霉(Penicillium emersonii)、娄地青霉(Penicilliumroqueforti)、淡紫青霉(Penicillum lilactinum)、多色青霉(Penicillummulticolor)、好氧反硝化菌(Paracoccus pantotrophus)、丙酸杆菌(Propionibacterium)、假单胞菌(Pseudomonas)、荧光假单孢菌(Pseudomonasfluorescens)、脱氮假单胞杆菌(Pseudomonas denitrificans)、火球菌(Pyrococcus)、激烈火球菌(Pyrococcus furiosus)、堀野氏火球菌(Pyrococcushorikoshii)、根癌菌(Rhizobium)、米黑根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucor pusillus Lindt)、根霉(Rhizopus)、德氏根霉(Rhizopusdelemar)、东京根霉(Rhizopus japonicus)、雪白根霉(Rhizopus niveus)、米根霉(Rhizopus oryzae)、少孢根霉(Rhizopus oligosporus)、红球菌(Rhodococcus)、酿酒酵母(Sccharomyces cerevisiae)、Sclerotina libertina、多食鞘氨醇杆菌(Sphingobacterium multivorum)、鞘氨醇杆菌(Sphingobium)、鞘胺醇单胞菌(Sphingomonas)、链球菌(Streptococcus)、嗜热链球菌(Streptococcus thermophilus)Y-1、链霉菌(Streptomyces)、灰色链霉菌(Streptomyces griseus)、变铅青链霉菌(Streptomyces lividans)、鼠灰链霉菌(Streptomyces murinus)、锈棕色链霉菌(Streptomyces rubiginosus)、紫红链霉菌(Streptomyces violaceoruber)、茂原链轮丝菌(Streptoverticilliummobaraense)、四体球菌(Tetragenococcus)、栖热菌(Thermus)、泛养硫球菌(Thiosphaera pantotropha)、栓菌(Trametes)、木霉(Trichoderma)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、潘氏丝孢酵母(Trichosporon penicillatum)、溶藻弧菌(Vibrio alginolyticus)、黄单胞菌(Xanthomonas)、酵母(yeast)、鲁氏接合酵母(Zygosaccharomyces rouxii)、发酵单胞菌(Zymomonas)以及运动发酵单胞菌(Zymomonus mobilis)。

某些实施方案包括通过本文所述方法产生的大量生产型化学品。某些方面包括混合的大量生产型化学品，其包含本文提供的方法所产生的大量生产型化学品以及精炼的石油产品。在某些方面，大量生产型化学品选自C10-C12烃、2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。在某些方面，C10-C12烃选自2，7-二甲基辛烷和2，9-二甲基癸烷。在某些方面，精炼的石油产品选自喷气燃料和柴油燃料。

某些实施方案包括产生富大量生产型化学品的精炼的石油产品的方法，包括(a)将精炼的石油产品与通过本文所述方法产生的大量生产型化学品混合，从而产生富大量生产型化学品的精炼的石油产品。

发明详述

本发明的实施方案涉及意外的发现，即以其它方式不能生长于作为唯一碳源的衍生于生物质的某些多糖上的微生物，经基因工程化，可以在作为唯一碳源的这些多糖上生长。此类微生物可以包括原核微生物和真核微生物两者，如细菌和酵母。在某些方面，大肠杆菌的某些实验室和/或野生型菌株可以经基因工程化生长于作为唯一碳源的衍生于藻酸盐或果胶的生物质上，以产生适宜的单糖或其它分子。除对本领域技术人员显而易见的其它用途，这些工程化或重组微生物在藻酸盐或果胶上的生长所产生的单糖和其它分子，可以用作产生各种大量生产型化学品如生物燃料的给料。

在生物燃料给料的生产方面，相对于其它生物质来源，藻酸盐和果胶提供了优势。例如，大规模水产养殖(aquatic-farming)可以产生显著量的生物质，而无需用能量作物生产替代粮食作物生产，无需采伐森林和再耕种当前未耕种的土地，因为大部分水圈，包括海洋、河流和湖泊，仍然未使用。作为一特定实例，北美洲的太平洋海岸有丰富的大规模水产养殖所需的矿质。巨藻生活在该地区，以快至1m/日的速度生长，是地球上植物中速度最快的，且生长可达50m。另外，水产养殖具有其它的优点，包括防止红潮爆发和产生对鱼类友好的环境。

作为其它优势，且与木质纤维素生物质相反，衍生于水生有机物、果实、植物和/或蔬菜来源的生物质易于降解。此类生物质通常缺少木质素，且比木质纤维素生物质显著更脆且利用酶或化学催化剂(如甲酸盐)易于降解。作为一实例，利用酶或化学催化剂，水生生物质如海藻可以很容易地转化为单糖，因为海藻所具有的主要的糖组分(藻酸盐：30％，甘露醇：15％)与木质纤维素(葡萄糖：24.1-39％，甘露糖：0.2-4.6％，半乳糖：0.5-2.4％，木糖：0.4-22.1％，阿拉伯糖：1.5-2.8％以及糖醛酸：1.2-20.7％，且总的糖含量对应于干重的36.5-70％)相比显著更简单。

作为另外的实例，来自植物如果实和/或蔬菜的生物质含有果胶，即衍生于植物细胞壁的杂多糖。果胶的特征结构是线性链的α-(1-4)-连接的D-半乳糖醛酸，其形成果胶主链即同型半乳糖醛酸聚糖(homogalacturonan)。如本文所述，利用酶、化学催化和/或经设计利用果胶作为碳源的微生物系统，可以容易地将果胶转化为寡糖或适宜的单糖。利用水生、果实和/或蔬菜生物质糖化和发酵比利用木质纤维素容易得多。

在这点上，本发明实施方案也涉及意料之外的发现，即某些微生物可以经过基因工程化产生各种大量生产型化学品如生物燃料。在某些方面，这些生物燃料可以包括链烷，如中到长链的链烷，其提供了优于基于乙醇的生物燃料的优势。在某些方面，各种工程化或重组微生物(如生长于作为碳源的果胶或藻酸盐上的重组微生物)的生长所产生的单糖(如2-酮-3脱氧D葡糖酸盐；KDG)和其它分子可以用于产生大量生产型化学品，如生物燃料。作为一实例，适宜的单糖如KDG，可以为重组微生物利用，以产生链烷，如中到长链的链烷及其它化学品。在某些方面，此类重组微生物可以用于产生如2，7-二甲基辛烷和2，9-二甲基癸烷的大量生产型化学品以及本文所提供的和本领域已知的化学品。

此类方法产生相对于其它生物燃料具有显著优势的生物燃料。特别是，中到长链链烷提供了许多相对于诸如乙醇和丁醇的现有常见生物燃料的重要优势，并且在将来是基于石油的燃料如汽油、柴油、煤油以及重油的引入注目的长期替代品。作为一实例，中到长链链烷和醇是所有石油产品和特别地喷气燃料的主要组分，因此我们生产的链烷可以为现有的发动机直接利用。作为另一实例，中到长链醇是比乙醇好得多的燃料，并且具有几乎可与汽油媲美的能量密度。

作为另一个实例，正-链烷是包括汽油、柴油、煤油以及重油的所有油产品的主要组分。微生物系统或重组微生物可以用来产生具有不同碳长度的正-链烷，所述长度的范围例如对于汽油(如机动车)为从C7到超过C20：C7，对于柴油(如机动车、火车、轮船)C10-C15，以及对于煤油(如航空和轮船)和所有的重油C8-C16。

作为本发明的一方面，本文所述方法和重组微生物所产生的大量生产型化学品可以为现有石油精炼厂利用，用来与传统精炼方法所产生的石油产品混合。为此，如上所述，燃料生产者正寻求实质相似的低碳燃料，其可以通过现有的基础设施(精炼厂、管道、油罐)混合并分送。作为烃，根据本文的方法所产生的大量生产型化学品与衍生于石油的燃料实质相似，将温室气体排放减少超过衍生于石油的燃料的80％，并且与油气工业现有的基础设施兼容。例如，某些本文所产生的大量生产型化学品，包括例如各种C10-C12烃如2，7二甲基辛烷、2，7二甲基癸酮等，可以直接混合成精炼的石油产品，如喷气和柴油燃料。通过利用此类生物产生的大量生产型化学品作为喷气和柴油燃料的混合原料(blendstock)，精炼厂可以将温室气体排放减少超过80％。

因此，本发明的某些实施方案通常涉及将生物质转化为大量生产型化学品的方法，包括从生物质获得多糖；使多糖与多糖降解或解聚途径接触，从而将多糖转化为适宜的单糖。由此类方法获得的适宜的单糖可以用于任何所需目的。例如，在某些方面，通过使适宜的单糖与生物燃料生物合成途径接触(无论其是作为重组微生物的一部分、体外酶促或化学途径或其组合)，从而将单糖转化为大量生产型化学品，可以将适宜的单糖转化为大量生产型化学品(如生物燃料)。

在其它方面，在产生大量生产型化学品如生物燃料时，本文所述，适宜的单糖可以直接从任何可用的来源获得，并通过使适宜的单糖与生物燃料生物合成途径接触，将其转化为大量生产型化学品。除了对本领域技术人员显而易见的其它用途外，此类生物燃料可以随后与精炼的石油产品如喷气和柴油燃料直接混合，以产生富大量生产型化学品的精炼的石油产品。

定义

除非另有定义，否则本文所用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员的通常理解相同的涵义。尽管与本文所述方法和材料相似或等同的任何方法和材料都可以用于实践或检验本发明，但是描述了优选的方法和材料。出于本发明的目的，下面定义了下列术语。本文引用的所有参考文献通过引用全文并入。

冠词“一个(a)和一个(an)”在本文中用于表示物品的一个或多个(即至少一个)语法客体。作为实例，“一个元件”意指一个或多个元件。

“约”意指比参照量、水平、值、数目、频率、百分比、尺度、大小、数量、重量或长度变化差不多30％、25％、20％、25％、10％、9％、8％、7％、6％、5％、4％、3％、2％或1％的量、水平、值、数目、频率、百分比、尺度、大小、数量、重量或长度。

术语“生物活性片段”当用于参照多核苷酸或多肽序列的片段时，指具有至少约0.1％、0.5％、1％、2％、5％、10％、12％、14％、16％、18％、20％、22％、24％、26％、28％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、100％、110％、120％、150％、200％、300％、400％、500％、600％、700％、800％、900％、1000％或更多的参照序列活性的片段。

术语“参照序列”通常指具有本文所述生物活性的任何酶(如糖脱氢酶、醇脱氢酶、脱水酶、裂解酶、转运蛋白、脱羧酶、水解酶等)的核酸编码序列或氨基酸序列，如“野生型”序列，包括例如SEQ ID NOS：1-144和308-313所示的参照序列。参照序列也可以包括本文所述序列的天然存在的功能变体(即直系同源物(ortholog)或同源物)。

包括在本发明范围内的是，长至少约18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、500、600或更多(包括其间所有整数)的邻接(contiguous)核苷酸或氨基酸残基的生物活性片段，其包含或编码具有参照多核苷酸或多肽的酶促活性的多肽。代表性生物活性片段通常参与相互作用，例如分子内或分子间相互作用。分子间相互作用可以是特异性结合相互作用或酶促相互作用。酶促相互作用或活性的实例包括，除了本文所述的以外，糖脱氢酶活性、醇脱氢酶活性、脱水酶活性、裂解酶活性、转运蛋白活性、异构酶活性、激酶活性。生物活性片段通常包含一个或多个本文所述和本领域已知的活性位点或酶促/结合基序。

“编码核酸”意指有助于基因多肽产物密码的任何核酸序列。相反，术语“非编码序列”意指不能有助于基因多肽产物密码的任何核酸序列。

在本文说明书中，除非上下文另有要求，否则词语“包含(comprise)”、“包含(comprises)”以及“包含(comprising)”应理解为意味着包括所述步骤或元件或步骤组或元件组，但不排除任何其它步骤或元件或步骤组或元件组。

“由......组成”意指包括并限于短语“由......组成”后接的那些。因此，短语“由......组成”表示，所列元件是所需的或强制性的，且可以不存在其它元件。

“基本上由......组成”意指包括该短语后所列的任何元件，并限于不干扰或有助于所列元件公开内容中所指的活性或作用的其它元件。因此，短语“基本上由......组成”表示，所列元件是需要的或强制性的，但其它元件是任选的，并且可以存在于或可以不存在，取决于它们是否影响所列元件的活性或作用。

术语“互补”和“互补性”意指碱基配对法则相关的多核苷酸(即核苷酸序列)。例如，序列“A-G-T”与序列“T-C-A”互补。互补性可以是“部分的”，其中仅一些核酸碱基根据碱基配对法则匹配。或者，核酸间存在“完全的”或“全部的”互补性。核酸链间互补性的程度显著影响核酸链间杂交的效率和长度。

“对应于(correspond to)”或“对应于(corresponding to)”意指(a)具有核苷酸序列的多核苷酸，该核苷酸序列与参照多核苷酸序列的全部或部分基本上同一或互补，或编码与肽或蛋白的氨基酸序列同一的氨基酸序列的多核苷酸；或(b)具有氨基酸序列的肽或多肽，该氨基酸序列与参照肽或蛋白的氨基酸序列基本上同一。

“衍生物”意指通过修饰例如通过与其它化学部分偶联或复合(如PEG化(pegylation))或通过本领域所理解的翻译后修饰技术衍生自基本序列的多肽。术语“衍生物”在其范围也包括对亲本序列(parent sequence)已做的变化，包括提供功能等同分子的添加或缺失。

“酶反应条件”意指在环境中任何必需条件条件(如温度、pH、缺少抑制物质等因素)均可用，该条件允许酶发挥功能。酶反应条件可以是体外的，如在试管内，或体内的，如在细胞内。

本文所用术语“功能”和“功能的”等意指生物或酶促功能。

“基因”意指占据染色体上特定基因座且由转录和/或翻译调节序列和/或编码区和/或非翻译序列(即内含子、5’和3’未翻译的序列)组成的遗传单位。

“同源性”指同一或构成保守取代的氨基酸的百分比数量。同源性可以利用序列比较程序测定，如GAP(Deveraux et al.，1984，Nucleic AcidsResearch 12，387-395)，在此通过引用将其并入。以此方式，可以通过将空位插入比对中，比较与本文所述的那些具有相似或实质不同长度的序列，所述空位的确定例如通过GAP所用比较算法。

术语“宿主细胞”包括个体细胞或细胞培养物，其可以是或已是本发明的任何重组载体或分离的多核苷酸的受体。宿主细胞包括单个宿主细胞的子代，以及该子代可以由于自然的、偶然的或蓄意的突变或变化而不必与最初的亲代细胞完全相同(在形态或总DNA互补物方面)。宿主细胞包括用本发明的重组载体或多核苷酸体内或体外转染、转化或感染的细胞。包含本发明的重组载体的宿主细胞，是重组宿主细胞、重组细胞或重组微生物。

“分离的”意指实质或基本上游离于在其天然状态时通常伴随它的组分的材料。例如，本文所用“分离的多核苷酸”指已从在天然存在状态时位于其侧翼的序列中纯化的多核苷酸，如已从序列中去除的DNA片段，该序列通常邻近所述片段。可选地，本文所用“分离的肽”或“分离的多肽”等指肽或多肽分子从其天然细胞环境中和从与细胞其它组分的结合中体外分离和/或纯化，即其与体内物质无结合。

“增加的”或“增加”意指与对照微生物如未修饰的微生物或差异修饰的微生物相比，一种或多种微生物产生更大量给定产物或分子(如大量生产型化学品、生物燃料或其中间产物)的能力。“增加的”量通常是“统计上显著的”量，并且可以包括未修饰微生物或差异修饰的微生物所产生量的1、2、3、4、5、6、7、8、9、10、15、20、30或更多倍数(包括其间所有整数和小数点，如1.5、1.6、1.7、1.8等)。

“获得自”意指样品如多核苷酸提取物或多肽提取物分离自或衍生于特定来源，如期望的生物，通常是期望的微生物。“获得自”也可以指多核苷酸或多肽序列分离自或衍生于特定生物或微生物的情况。例如，编码苯甲醛裂解酶的多核苷酸序列可以分离自多种原核或真核微生物，如假单胞菌(Pseudomonas)。

本文所用术语“可操作连接的”意指将基因置于启动子的调节控制下，该启动子随后控制该基因的转录和任选的翻译。在构建异源启动子/结构基因组合时，通常优选距离基因转录起始位点一定的距离放置基因序列或启动子，所述距离与该基因序列或启动子和其处于天然环境中时控制的基因间的距离大致相同；即衍生基因序列或启动子的基因。本领域已知，可以容纳这种距离的某些变化而不丢失功能。相似地，与待置于其控制下的异源基因有关的调节序列元件的优选定位受其天然环境中元件的定位限制；即衍生它的基因。“组成型启动子”通常在大多数条件下是有活性的，即启动子转录。“诱导型启动子”通常在某些条件下是有活性的，如在存在给定的分子因子(如IPTG)或给定的环境条件(如CO₂浓度，营养水平、光、热)下。在缺少该条件时，诱导型启动子通常不允许显著的或可测量水平的转录活性。

本文所用的叙述“多肽”或“核酸”命名为mRNA、RNA、cRNA、rRNA、cDNA或DNA。该术语通常指长度至少为10个碱基的核苷酸(即核糖核苷酸或脱氧核糖核苷酸或核苷酸的任一类型的修饰形式)的聚合形式。该术语包括单链或双链形式的DNA。

本领域技术人员应当理解，本发明的多核苷酸序列包括基因组序列、基因组外和质粒编码的序列以及较小的工程化基因片段，其表达或可适用于表达蛋白、多肽、肽等。此类片段可以天然分离或人工合成修饰。

多核苷酸可以是单链的(编码或反义)或双链的，并且可以是DNA(基因组的、cDNA或合成的)或RNA分子。其它编码或非编码序列可以但非必须存在于本发明的多核苷酸内，且多核苷酸可以但非必须与其它分子和/或支持材料连接。

多核苷酸可以包含天然序列(即内源序列)，或可以包含此类序列的变体或生物功能等同物。多核苷酸变体可以含有一个或多个取代、添加、缺失和/或插入，如下文所进一步描述的，优选地以致编码的多肽的酶促活性相对于未修饰的多肽未实质减少，且优选地以致编码的多肽的酶促活性相对于未修饰的多肽得到改善(如优化)。对编码的多肽的酶促活性的影响通常可按下文所述进行评价。

本发明的多核苷酸，不管其编码序列自身的长度如何，都可以与其它DNA序列结合，如启动子、多聚腺苷化信号、其它限制酶位点、多克隆位点、其它编码片段等，以致其全长可以进行相当的变化。因此所考虑的是，可以使用几乎任何长度的多核苷酸片段，其总长优选受到制备的便利性和意欲的重组DNA实验方案使用的便利性的限制。

术语“多核苷酸变体”和“变体”等指表现出与本文所述的任何参照多核苷酸序列或基因的实质序列同一性的多核苷酸，并指在下文限定的和本领域已知的低严格性、中等严格性、高严格性或很高的严格性条件下，与本文所述的任何多核苷酸参照序列或本文所述的任何基因或蛋白的任何多核苷酸编码序列杂交的多核苷酸。这些术语也包括通过至少一个核苷酸的添加、缺失或取代而不同于参照多核苷酸的多核苷酸。因此，术语“多核苷酸变体”和“变体”包括其中已添加、缺失一个或多个核苷酸或一个或多个核苷酸被不同的核苷酸取代的多核苷酸。因此，本领域充分理解的是，可以对参照多核苷酸进行包括突变、添加、缺失以及取代在内的某些改变，由此，改变的多核苷酸保持参照多核苷酸的生物功能或活性，或活性相对于参照序列已增加(即优化)。多核苷酸变体包括例如，与本文所述参照多核苷酸具有至少50％(和至少51％-至少99％以及其间所有整数百分比)序列同一性的多核苷酸。

术语“多核苷酸变体”和“变体”也包括编码这些酶的天然存在的等位基因变体。天然存在的变体的实例包括等位基因变体(同一基因座)、同源物(不同基因座)以及直系同源物(不同生物)。诸如这些的天然存在的变体可以利用熟知的分子生物学技术鉴定和分离，包括，例如本领域所知的各种聚合酶链式反应(PCR)和基于杂交的技术。天然存在的变体可以从编码一个或多个具有本文所述的适宜的酶促活性(如C-C连接酶、二醇脱氢酶、果胶酸裂解酶、藻酸盐裂解酶、二醇脱水酶、转运蛋白等)的基因的任何生物分离。

非天然存在的变体可以通过诱变技术制备，所述诱变技术包括应用于多核苷酸、细胞或生物的诱变技术。变体可以含有核苷酸取代、缺失、颠换以及插入。变异可以发生于编码区和非编码区两者或者两者之一中。在某些方面，非天然存在的变体可以已经优化用于给定的微生物(如大肠杆菌)中，所述优化如通过基因工程化和筛选活性、稳定性或任何其它期望的特征增加的酶。变异既可以产生保守氨基酸取代也可以产生非保守氨基酸取代(与最初编码的产物相比)。对于核苷酸序列而言，保守变体包括由于遗传密码的简并性编码参照多肽的氨基酸序列的序列。变异的核苷酸序列也可以包括以合成方式衍生的核苷酸序列，如通过例如使用定点诱变所产生的但仍然编码生物活性多肽的核苷酸序列。通常，特定参照核苷酸序列的变体，与该特定核苷酸序列具有至少约30％、40％、50％、55％、60％、65％、70％，通常至少约75％、80％、85％、90％至95％或更多、甚至约97％或98％或更多的序列同一性，这可由本文其它部分所述的序列比对程序利用缺省参数进行测定。

本文所述术语“在低严格性、中等严格性、高严格性或很高的严格性条件下杂交”描述了杂交和洗涤的条件。进行杂交反应的指南可见于Ausubel et al.，“Current Protocols in Molecular Biology(现代分子生物学实验技术)”，John Wiley & Sons Inc，1994-1998，第6.3.1-6.3.6部分。水性和非水性方法描述与该参考文献中，并且也可以使用。

本文中“低严格性”条件的涵义包括并包含用于42℃下杂交的至少约1％v/v-至少约15％v/v的甲酰胺和至少约1M-至少约2M的盐，以及用于42℃下洗涤的至少约1M-至少约2M的盐。低严格性条件也可以包括用于65℃下杂交的1％牛血清白蛋白(BSA)、1mM EDTA、0.5MNaHPO₄(pH 7.2)、7％SDS，以及用于在室温下洗涤的(i)2×SSC、0.1％SDS；或(ii)0.5％BSA、1mM EDTA、40mM NaHPO₄(pH 7.2)、5％SDS。低严格性条件的一个实施方案包括在6×氯化钠/柠檬酸钠(SSC)中、约45℃下杂交，随后在0.2×SSC、0.1％SDS中，至少50℃下，进行两次洗涤(对于低严格性条件而言，洗涤的温度可以增加到55℃)。

“中等严格性”条件包括和包含用于在42℃下杂交的至少约16％v/v-至少约30％v/v的甲酰胺和至少约0.5M-至少约0.9M的盐，和用于在55℃下洗涤的至少约0.1M-至少约0.2M的盐。中等严格性条件也可以包括用于在65℃下杂交的1％牛血清白蛋白(BSA)、1mM EDTA、0.5M NaHPO₄(pH 7.2)、7％SDS，和用于60-65℃下洗涤的(i)2×SSC、0.1％SDS；或(ii)0.5％BSA、1mM EDTA、40mM NaHPO₄(pH 7.2)、5％SDS。中等严格性条件的一个实施方案包括在6×SSC中、约45℃下杂交，随后在0.2×SSC、0.1％SDS中，60℃下，进行一次或多次洗涤。

“高严格性”条件包括和包含用于在42℃下杂交的至少约31％v/v-至少约50％v/v的甲酰胺和约0.01M-约0.15M的盐，和用于在55℃下洗涤的约0.01M-约0.02M的盐。高严格性条件也可以包括用于在65℃下杂交的1％BSA、1mM EDTA、0.5M NaHPO₄(pH 7.2)、7％SDS，和用于在高于65℃的温度下洗涤的(i)0.2×SSC、0.1％SDS；或(ii)0.5％BSA、1mM EDTA、40mM NaHPO₄(pH 7.2)、1％SDS。高严格性条件的一个实施方案包括在6×SSC中、约45℃下杂交，随后在0.2×SSC、0.1％SDS中，65℃下，进行一次或多次洗涤。

“很高的严格性”条件的一个实施方案包括在0.5M磷酸钠、7％SDS中，65℃下杂交，随后在0.2×SSC、1％SDS中，65℃下，进行一次或多次洗涤。

其它严格性条件在本领域内是熟知的，且本领域技术人员应当认识到，可以操作使用各种因素，优化杂交的特异性。最终洗涤的严格性的优化，可以用来确保高程度杂交。对于详细的实例，参阅Ausubel et al.(同上)的第2.10.1-2.10.16页和Sambrook et al.，Current Protocols in MolecularBiology(现代分子生物学实验技术)(1989)的第1.101-1.104部分。

尽管通常在约42℃-68℃下进行严格洗涤，但本领域技术人员应当理解，其它温度也可以适于严格条件。最大杂交速率于通常在低于形成DNA-DNA杂合体的T_m约20℃-25℃下发生。本领域已充分了解的是，T_m是解链温度或两条互补多核苷酸序列解离的温度。推测T_m的方法在本领域内是熟知的(参阅Ausubel et al.(同上)，第2.10.8页)。

通常，完美匹配的DNA双链体的T_m的近似值可以通过公式预测：T_m＝81.5+16.6(log₁₀M)+0.41(％G+C)-0.63(％甲酰胺)-(600/长度)，其中：M是Na⁺的浓度，优选范围为0.01-0.4摩尔；％G+C是鸟苷和胞嘧啶碱基之和与碱基总数的百分比，其范围为30％-75％G+C；％甲酰胺是按体积计的甲酰胺浓度百分比；长度是DNA双链体中碱基对的数目。随着随机错配碱基对数量每增加1％，双链体DNA的T_m即降低约1℃。洗涤对于高严格性而言，通常在T_m-15℃下进行，或对于中等严格性而言，在T_m-30℃下进行。

在杂交方法的一个实例中，将含有固定化DNA的膜(如硝酸纤维素膜或尼龙膜)在含有标记的探针的杂交缓冲液(50％去离子剂甲酰胺、5×SSC、5×Reinhardt溶液(0.1％fecal、0.1％聚乙烯吡咯烷酮以及0.1％牛血清白蛋白)、0.1％SDS以及200mg/mL变性的鲑鱼精子DNA)中、42℃下杂交过夜。随后将膜进行两次依次中等严格性洗涤(即45℃下2×SSC、0.1％SDS中15分钟，随后50℃下2×SSC、0.1％SDS中15分钟)，随后两次依次更高的严格性洗涤(即55℃下0.2×SSC、0.1％SDS中12分钟，随后65-68℃下0.2×SSC和0.1％SDS溶液中12分钟)。

利用多种本领域内已知的和可用的良好建立的技术中的任何技术，可以制备、操作和/或表达多核苷酸和其融合物。例如，编码本发明的多肽、其融合蛋白或功能等同物的多核苷酸，可以用于重组DNA分子中，指导所选择的酶在适当的宿主细胞中表达。由于遗传密码的固有简并性，也可以产生编码实质上相同或功能等同氨基酸序列的其它DNA序列，且这些序列也可以用来克隆和表达给定的多肽。

本领域技术人员应当理解的是，产生拥有非天然存在的密码子的编码多肽的核苷酸序列，在某些情况下可以是有利的。例如，特定原核或真核宿主偏爱的密码子可以经选择以增加蛋白表达的速率，或产生具有期望的特性的重组RNA转录物，所述特性如比由天然存在的序列所产生的转录物更长的半衰期。此类核苷酸通常称为“密码子优化的”。任何本文所述的核苷酸序列可以用于此类“密码子优化的”形式。例如，来自荧光假单胞菌的苯甲醛裂解酶的核苷酸编码序列可以进行密码子优化，用于在大肠杆菌中表达。

而且，本发明的多核苷酸序列可以利用本领域通常所知的方法进行工程化，以便出于多种原因改变多肽编码序列，所述原因包括但不限于修饰基因产物的克隆、加工、表达和/或活性的改变。

为了表达期望的多肽，可以将编码多肽的核苷酸序列或其功能等同物插入适当的表达载体中，即含有插入的编码序列的转录和翻译所需的元件的载体。可以用本领域技术人员熟知的方法构建含有编码目的多肽的序列和适当的转录及翻译控制元件的表达载体。这些方法包括体外重组DNA技术、合成技术以及体内基因重组。此类技术描述于Sambrook etal.，Molecular Cloning，A Laboratory Manual(分子克隆，实验室手册)(1989)和Ausubel et al.，Current Protocols in Molecular Biology(1989)中。

“多肽”、“多肽片段”、“肽”以及“蛋白”在本文中交换使用，指氨基酸残基的多聚体，并且指其变体和合成的类似物。因此，这些术语适用于氨基酸多聚体，其中一个或多个氨基酸残基是合成的非天然存在的氨基酸，如相应的、天然存在的氨基酸的化学类似物，以及适用于天然存在的氨基酸多聚体。在某些方面，多肽可以包括酶促多肽或“酶“，其通常催化各种化学反应(即增加其速率)。

多肽“变体”这一叙述指通过至少一个氨基酸残基的添加、缺失或取代而不同于参照多肽序列的多肽。在某些实施方案中，多肽变体通过一个或多个取代不同于参照序列，该取代可以是保守的或非保守的。在某些实施方案中，多肽变体包含保守取代，因此，本领域充分理解的是，某些氨基酸可以变成具有广泛相似特性的其它氨基酸，而不改变多肽的活性特性。多肽变体也包括其中已添加、缺失一个或多个氨基酸或一个或多个氨基酸被不同氨基酸残基取代的多肽。

本发明考虑到具有本文所述任何酶促活性的全长多肽的变体、这些全长多肽的截短的片段、截短的片段的变体以及其相关的生物活性片段在本文所述方法中的使用。通常，多肽的生物活性片段可参与相互作用，例如，分子内或分子间相互作用。分子间相互作用可以是特异性结合相互作用或酶促相互作用(如相互作用可以是瞬时的和形成或打开共价键)。具有本文所述酶促活性的多肽/酶的生物活性片段包括这样的肽，该肽包含与(推断的)全长参照多肽序列的氨基酸序列充分相似或由其衍生的氨基酸序列。通常生物活性片段包含具有至少一个酶促活性的结构域或基序，并且可以包括各种活性结构域中的一个或多个(且在某些情况下，所有的结构域)。酶的生物活性片段可以是多肽片段，其例如为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、220、240、260、280、300、320、340、360、380、400、450、500、600或更多(包括其中的整数)个参照多肽序列的邻接氨基酸。在某些实施方案中，生物活性片段包含保守的酶促序列、结构域或基序，如本文其它地方所述和本领域所知的。适宜的是，生物活性片段的活性不低于衍生它的野生型多肽活性的约1％、10％、25％、50％。

术语“外源的”通常指不天然存在于野生型细胞或生物中、但通常通过分子生物学技术引入细胞即进行基因工程产生重组微生物的多核苷酸序列或多肽。“外源”多核苷酸的实例包括编码期望的蛋白或酶的载体、质粒和/或人造核酸构建体。术语“内源的”通常指可以见于给定的野生型细胞或生物中的天然存在的多核苷酸序列或多肽。例如，某些天然存在的细菌或酵母种类通常不含有苯甲醛裂解酶基因，因而不包含编码苯甲醛裂解酶的“内源”多核苷酸序列。因此，还应指出，尽管生物可以包含给定多核苷酸序列或基因的内源拷贝，但是引入编码该序列的质粒或载体以便例如过表达所编码蛋白或调节所编码蛋白的表达，表示该基因或多核苷酸序列的“外源”拷贝。任何本文所述的途径、基因或酶，都可以利用或依赖“内源”序列，或可以被提供而作为一个或多个“外源”多核苷酸序列，和/或可以根据已含于给定微生物内的内源序列来使用。

“重组”微生物通常包含一个或多个外源核苷酸序列，如在质粒或载体中的外源核苷酸序列。

本文所用的“序列同一性”这一叙述，或者例如包括“与......50％同一的序列”，指在比较窗中基于核苷酸与核苷酸或者氨基酸与氨基酸的序列同一程度。因此“序列同一性百分比”的计算可以通过以下进行：在比较窗内比较最佳比对的序列，测定在两条序列中均存在同一核酸碱基(如A、T、C、G、I)或同一氨基酸残基(如Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys以及Met)的位置的数量，以产生匹配位置的数量，以匹配位置的数量除以比较窗中位置的总数(即窗口大小)，以及以100乘以所得结果，获得序列同一性百分比。

用于描述两个或更多个多核苷酸或多肽间序列关系的术语包括“参照序列”、“比较窗”、“序列同一性”、“序列同一性百分比”以及“实质同一性”。“参照序列”是长至少12但经常是15-18且通常至少25的单体单元(monomer unit)，所述单体单元包括核苷酸和氨基酸残基。因为两个多核苷酸中每一个都可以包含(1)在两个多核苷酸间相似的序列(即仅是完整多核苷酸序列的一部分)，和(2)在两个多核苷酸间背离的序列，两个(或更多个)多核苷酸间的序列比较通常通过在“比较窗”内比较两个多核苷酸的序列以鉴定和比较序列相似性的局部区域来进行。“比较窗”指至少6个邻接位置、经常为约5-约100、更经常为约100-约150个位置的概念片段，其中在两个序列最佳比对后，将序列与相同数目的邻接位置的参照序列进行比较。为了对两个序列进行最佳比对，与参照序列(其不包含添加或缺失)相比，比较窗可以包含约20％或更少的添加或缺失(即空位)。用于比对比较窗的序列的最佳比对可以通过以下进行：通过算法(Wisconsin遗传学软件包版本7.0(Wisconsin Genetics Software PackageRelease 7.0)中的GAP、BESTFIT、FASTA以及TFASTA，Genetics ComputerGroup，575Science Drive Madison，WI，USA)的计算机化执行，或者通过检查和所选的各种方法中的任何方法所产生的最佳比对(即在比较窗内产生同源性的最高百分比)。也可以参照BAST程序家族，如Altschul et al.，1997，Nucl.Acids Res.25：3389所公开的。序列分析的详细讨论可见于Ausubel et al.，“Current Protocols in Molecular Biology”，John Wiley & SonsInc，1994-1998，15章的19.3单元。

“转化”通常指细胞中永久的、可遗传的改变，其是由外源DNA摄取和并入宿主细胞基因组所致；还由外源基因从一种生物转移至另一种生物的基因组所致。

“载体”意指由可以插入或克隆入多核苷酸的质粒、噬菌体、酵母或病毒衍生的多核苷酸分子，优选DNA分子。载体优选含有一个或多个独特的限制位点，并且能在限定的宿主细胞中自主复制，所述宿主细胞包括靶细胞或组织或其祖细胞或组织，或可与限定的宿主的基因组整合，从而克隆的序列是可再生的。因此，载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，如线性或闭环质粒、染色体外元件、微型染色体或人工染色体。载体可以含有确保自我复制的任何装置。可选地，载体可以是这样的载体：当其引入宿主细胞时，其整合于基因组并与其整合的染色体一起复制。此类载体可以包含允许重组到宿主染色体特定、所需位点的特异性序列。载体系统可以包含单个载体或质粒、两个或更多个载体或质粒，它们共同含有待引入宿主细胞基因组的总DNA，或转座子。载体的选择通常取决于载体与待引入载体的宿主细胞的相容性。在本发明中，载体优选是在细菌细胞如蓝细菌细胞中可操作地发挥功能的载体。载体可以包含诸如绿色荧光蛋白(GFP)的报告基因，其可以同框(in frame)融合于一个或多个编码的多肽，或单独表达。载体也可以包括可用于选择适宜的转化体的选择标志物如抗生素抗性基因。

术语“野生型”和“天然存在的”可交换使用，指具有从天然存在的来源分离时的该基因或基因产物特征的基因或基因产物。野生型基因或基因产物(如多肽)是在群体中非常频繁地观察到并且因而可以任意设计为基因的“正常”或“野生型”形式的基因或基因产物。

“生物质”的实例包括水生或海洋生物质、基于果实的生物质如果实废弃物，以及基于蔬菜的生物质，如蔬菜废弃物等。水生或海洋生物质的实例包括但不限于海藻、巨藻、海藻、藻类、海洋微生物区系、微藻类、海草等。在某些方面，生物质不包括碳的化石化来源，如通常发现于地壳的顶层内的烃(如天然气、由几乎纯的碳组成的非挥发材料，如无烟煤等)。

果实和/或蔬菜生物质的实例包括但不限于，果胶的任何来源，如植物皮和渣，包括柑橘(citrus)、橙子(orange)、柚子、马铃薯、番茄、葡萄、芒果、醋栗、胡萝卜、甜菜以及苹果等。

生物质的多糖、寡糖、单糖或其它糖类组分的实例包括但不限于，藻酸盐、琼脂、角叉菜聚糖、岩藻依聚糖、果胶、葡糖酸盐、甘露糖醛酸盐、甘露醇、来苏糖、纤维素、半纤维素、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、木聚糖、甘露聚糖、阿拉伯聚糖、阿拉伯糖、葡糖醛酸盐、半乳糖醛酸盐(包括二和三半乳糖醛酸盐)、鼠李糖等。

藻酸盐衍生的多糖的某些实例包括饱和的多糖，如β-D-甘露糖醛酸盐、α-L-葡糖酸盐、二藻酸盐(dialginate)、三藻酸盐(trialginate)、五藻酸盐(pentalginate)、六藻酸盐(hexalginate)、七藻酸盐(heptalginate)、八藻酸盐(octalginate)、九藻酸盐(nonalginate)、十藻酸盐(nondecalginate)、十一藻酸盐(undecalginate)、十二藻酸盐(dodecalginate)和多聚藻酸盐，以及不饱和多糖，如4-脱氧-L-赤(erythro)-5-己酮醣醛酸(hexoseulose uronic acid)、4-(4-脱氧-β-D-mann-4-enuronosyl)-D-甘露糖醛酸盐或L-葡糖酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-二藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-三藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-四藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-五藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-六藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-七藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-八藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-九藻酸盐、4-(4-脱氧-beta-D-mann-4-enuronosyl)-十一藻酸盐以及4-(4-脱氧-β-D-mann-4-enuronosyl)-十二藻酸盐。

果胶衍生的多糖的某些实例包括饱和的多糖，如半乳糖醛酸盐、二半乳糖醛酸盐、三半乳糖醛酸盐、四半乳糖醛酸盐、五半乳糖醛酸盐、六半乳糖醛酸盐、七半乳糖醛酸盐、八半乳糖醛酸盐、九半乳糖醛酸盐、十半乳糖醛酸盐、十二半乳糖醛酸盐、多聚半乳糖醛酸盐，和鼠李糖多聚半乳糖醛酸盐(rhamnopolygalacturonate)，以及饱和的多糖，如4-脱氧-L-苏式-5-hexosuloseuronate、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-二半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-三半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-四半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-五半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-六半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-七半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-八半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-九半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-十半乳糖醛酸盐和4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-十二半乳糖醛酸盐。

可以通过本文所述的微生物将这些多糖或寡糖组分转化为“适宜的单糖”或其它“适宜的糖”，如“适宜的寡糖”，所述微生物能生长于作为碳源(如唯一碳源)的此类多糖或其它糖组分上。

“适宜的单糖”或“适宜的糖”通常指可以由生长于作为碳源或唯一碳源的果胶、藻酸盐或其它糖(如半乳糖醛酸盐、纤维素、半纤维素等)上的重组微生物所产生的任何糖，通常也指可以用于本发明的生物燃料生物合成途径产生烃如生物燃料或生物汽油的任何糖。适宜的单糖或寡糖的实例包括但不限于，2-酮-3-脱氧D-葡糖酸盐(KDG)、D-甘露醇、葡糖酸盐、甘露糖醛酸盐、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸盐(glucuronate)、半乳糖醛酸盐和鼠李糖等。如本文所述，本文所用“适宜的单糖”或“适宜的糖”可以由本发明的工程化或重组微生物产生，或可以从商业可用来源获得。

本文所用“大量生产型化学品”这一叙述，包括任何销售的或适于销售的化学品，其可以直接产生或作为本文所提供方法的副产品产生，包括生物燃料和/或生物汽油。“大量生产型化学品”的一般性实例包括但不限于生物燃料、矿质、多聚体前体、脂肪醇、表面活性剂、可塑剂以及溶剂。本文所用“生物燃料”这一叙述包括至少部分衍生于生物来源如重组微生物的固体、液体或气体燃料。

大量生产型化学品的实例包括但不限于，甲烷、甲醇、乙烷、乙烯、乙醇、正-丙烷、1-丙烯、1-丙醇、丙醛、丙酮、丙酸盐、正-丁烷、1-丁烯、1-丁醇、丁醛、丁酸盐、异丁醛、异丁醇、2-甲基丁醛、2-甲基丁醇、3-甲基丁醛、3-甲基丁醇、2-丁烯、2-丁醇、2-丁酮、2，3-丁二醇、3-羟基-2-丁酮、2，3-丁二酮、乙苯、苯乙烯、2-苯基乙醇、苯乙醛、1-苯基丁烷、4-苯基-1-丁烯、4-苯基-2-丁烯、1-苯基-2-丁烯、1-苯基-2-丁醇、4-苯基-2-丁醇、1-苯基-2-丁酮、4-苯基-2-丁酮、1-苯基-2，3-丁二醇、1-苯基-3-羟基-2-丁酮、4-苯基-3-羟基-2-丁酮、1-苯基-2，3-丁二酮、正-戊烷、乙基苯酚、乙烯基苯酚、2-(4-羟苯基)乙醇、4-羟苯基乙醛、1-(4-羟苯基)丁烷、4-(4-羟苯基)-1-丁烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯基)-2-丁醇、1-(4-羟苯基)-2-丁酮、4-(4-羟苯基)-2-丁酮、1-(4-羟苯基)-2，3-丁二醇、1-(4-羟苯基)-3-羟基-2-丁酮、4-(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-2，3-丁二酮、吲哚乙烷、吲哚乙烯、2-(吲哚-3-)乙醇、正-戊烷、1-戊烯、1-戊醇、戊醛、戊酸盐、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2，3-戊二醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2，3-戊二酮、2-甲基戊烷、4-甲基-1-戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲基-3-戊酮、4-甲基-2，3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、4-甲基-2，3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基-2，3-戊二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2，3-戊二酮、4-甲基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2，3-戊二醇、4-甲基-1-苯基-2，3-戊二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1-(4-羟苯基)戊烷、1-(4-羟苯基)-1-戊烯、1-(4-羟苯基)-2-戊烯、1-(4-羟苯基)-3-戊烯、1-(4-羟苯基)-2-戊醇、1-(4-羟苯基)-3-戊醇、1-(4-羟苯基)-2-戊酮、1-(4-羟苯基)-3-戊酮、1-(4-羟苯基)-2，3-戊二醇、1-(4-羟苯基)-2-羟基-3-戊酮、1-(4-羟苯基)-3-羟基-2-戊酮、1-(4-羟苯基)-2，3-戊二酮、4-甲基-1-(4-羟苯基)戊烷、4-甲基-1-(4-羟苯基)-2-戊烯、4-甲基-1-(4-羟苯基)-3-戊烯、4-甲基-1-(4-羟苯基)-1-戊烯、4-甲基-1-(4-羟苯基)-3-戊醇、4-甲基-1-(4-羟苯基)-2-戊醇、4-甲基-1-(4-羟苯基)-3-戊酮、4-甲基-1-(4-羟苯基)-2-戊酮、4-甲基-1-(4-羟苯基)-2，3-戊二醇、4-甲基-1-(4-羟苯基)-2，3-戊二酮、4-甲基-1-(4-羟苯基)-3-羟基-2-戊酮、4-甲基-1-(4-羟苯基)-2-羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-1-戊烯、1-(吲哚-3)-2-戊烯、1-(吲哚-3)-3-戊烯、1-(吲哚-3)-2-戊醇、1-(吲哚-3)-3-戊醇、1-(吲哚-3)-2-戊酮、1-(吲哚-3)-3-戊酮、1-(吲哚-3)-2，3-戊二醇、1-(吲哚-3)-2-羟基-3-戊酮、1-(吲哚-3)-3-羟基-2-戊酮、1-(吲哚-3)-2，3-戊二酮、4-甲基-1-(吲哚-3-)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲哚-3)-1-戊烯、4-甲基-2-(吲哚-3)-3-戊醇、4-甲基-1-(吲哚-3)-2-戊醇、4-甲基-1-(吲哚-3)-3-戊酮、4-甲基-1-(吲哚-3)-2-戊酮、4-甲基-1-(吲哚-3)-2，3-戊二醇、4-甲基-1-(吲哚-3)-2，3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲基-1-(吲哚-3)-2-羟基-3-戊酮、正-己烷、1-己烯、1-己醇、己醛、己酸盐、2-己烯、3-己烯、2-己醇、3-己醇、2-己酮、3-己酮、2，3-己二醇、2，3-己二酮、3，4-己二醇、3，4-己二酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、3-甲基己烷、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲基-3-己酮、2-甲基-3，4-己二醇、2-甲基-3，4-己二酮、5-甲基-2，3-己二醇、5-甲基-2，3-己二酮、4-甲基-2，3-己二醇、4-甲基-2，3-己二酮、2-甲基-3-羟基-4-己酮、2-甲基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟基-3-己酮、4-甲基-3-羟基-2-己酮、2，5-二甲基己烷、2，5-二甲基-2-己烯、2，5-二甲基-3-己烯、2，5-二甲基-3-己醇、2，5-二甲基-3-己酮、2，5-二甲基-3，4-己二醇、2，5-二甲基-3，4-己二酮、2，5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2，3-己二醇、4-甲基-1-苯基-2，3-己二醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2，3-己二酮、4-甲基-1-苯基-2，3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1-(4-羟苯基)-1-己烯、5-甲基-1-(4-羟苯基)-2-己烯、5-甲基-1-(4-羟苯基)-3-己烯、4-甲基-1-(4-羟苯基)-1-己烯、4-甲基-1-(4-羟苯基)-2-己烯、4-甲基-1-(4-羟苯基)-3-己烯、5-甲基-1-(4-羟苯基)-2-己醇、5-甲基-1-(4-羟苯基)-3-己醇、4-甲基-1-(4-羟苯基)-2-己醇、4-甲基-1-(4-羟苯基)-3-己醇、5-甲基-1-(4-羟苯基)-2-己酮、5-甲基-1-(4-羟苯基)-3-己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4-羟苯基)-3-己酮、5-甲基-1-(4-羟苯基)-2，3-己二醇、4-甲基-1-(4-羟苯基)-2，3-己二醇、5-甲基-1-(4-羟苯基)-3-羟基-2-己酮、5-甲基-1-(4-羟苯基)-2-羟基-3-己酮、4-甲基-1-(4-羟苯基)-3-羟基-2-己酮、4-甲基-1-(4-羟苯基)-2-羟基-3-己酮、5-甲基-1-(4-羟苯基)-2，3-己二酮、4-甲基-1-(4-羟苯基)-2，3-己二酮、4-甲基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3)-2-己烯、5-甲基-1-(吲哚-3)-3-己烯、4-甲基-1-(吲哚-3)-1-己烯、4-甲基-1-(吲哚-3)-2-己烯、4-甲基-1-(吲哚-3)-3-己烯、5-甲基-1-(吲哚-3)-2-己醇、5-甲基-1-(吲哚-3)-3-己醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基-1-(吲哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚-3)-2-己酮、4-甲基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2，3-己二醇、4-甲基-1-(吲哚-3)-2，3-己二醇、5-甲基-1-(吲哚-3)-3-羟基-2-己酮、5-甲基-1-(吲哚-3)-2-羟基-3-己酮、4-甲基-1-(吲哚-3)-3-羟基-2-己酮、4-甲基-1-(吲哚-3)-2-羟基-3-己酮、5-甲基-1-(吲哚-3)-2，3-己二酮、4-甲基-1-(吲哚-3)-2，3-己二酮、正-庚烷、1-庚烯、1-庚醇、庚醛、庚酸盐、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2，3-庚二醇、2，3-庚二酮、3，4-庚二醇、3，4-庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚酮、2-甲基-3，4-庚二醇、2-甲基-3，4-庚二酮、6-甲基-3，4-庚二醇、6-甲基-3，4-庚二酮、5-甲基-3，4-庚二醇、5-甲基-3，4-庚二酮、2-甲基-3-羟基-4-庚酮、2-甲基-4-羟基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚酮、5-甲基-4-羟基-3-庚酮、2，6-二甲基庚烷、2，5-二甲基庚烷、2，6-二甲基-2-庚烯、2，6-二甲基-3-庚烯、2，5-二甲基-2-庚烯、2，5-二甲基-3-庚烯、3，6-二甲基-3-庚烯、2，6-二甲基-3-庚醇、2，6-二甲基-4-庚醇、2，5-二甲基-3-庚醇、2，5-二甲基-4-庚醇、2，6-二甲基-3，4-庚二醇、2，6-二甲基-3，4-庚二酮、2，5-二甲基-3，4-庚二醇、2，5-二甲基-3，4-庚二酮、2，6-二甲基-3-羟基-4-庚酮、2，6-二甲基-4-羟基-3-庚酮、2，5-二甲基-3-羟基-4-庚酮、2，5-二甲基-4-羟基-3-庚酮、正-辛烷、1-辛烯、2-辛烯、1-辛醇、辛醛、辛酸盐、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4，5-辛二醇、4，5-辛二酮、4-羟基-5-辛酮、2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲基-4，5-辛二醇、2-甲基-4，5-辛二酮、3-甲基-4，5-辛二醇、3-甲基-4，5-辛二酮、2-甲基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟基-4-辛酮、2，7-二甲基辛烷、2，7-二甲基-3-辛烯、2，7-二甲基-4-辛烯、2，7-二甲基-4-辛醇、2，7-二甲基-4-辛酮、2，7-二甲基-4，5-辛二醇、2，7-二甲基-4，5-辛二酮、2，7-二甲基-4-羟基-5-辛酮、2，6-二甲基辛烷、2，6-二甲基-3-辛烯、2，6-二甲基-4-辛烯、3，7-二甲基-3-辛烯、2，6-二甲基-4-辛醇、3，7-二甲基-4-辛醇、2，6-二甲基-4-辛酮、3，7-二甲基-4-辛酮、2，6-二甲基-4，5-辛二醇、2，6-二甲基-4，5-辛二酮、2，6-二甲基-4-羟基-5-辛酮、2，6-二甲基-5-羟基-4-辛酮、3，6-二甲基辛烷、3，6-二甲基-3-辛烯、3，6-二甲基-4-辛烯、3，6-二甲基-4-辛醇、3，6-二甲基-4-辛酮、3，6-二甲基-4，5-辛二醇、3，6-二甲基-4，5-辛二酮、3，6-二甲基-4-羟基-5-辛酮、正-壬烷、1-壬烯、1-壬醇、壬醛、壬酸盐、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基-5-壬醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基-4，5-壬二醇、8-甲基-4，5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2，8-二甲基壬烷、2，8-二甲基-3-壬烯、2，8-二甲基-4-壬烯、2，8-二甲基-5-壬烯、2，8-二甲基-4-壬醇、2，8-二甲基-5-壬醇、2，8-二甲基-4-壬酮、2，8-二甲基-5-壬酮、2，8-二甲基-4，5-壬二醇、2，8-二甲基-4，5-壬二酮、2，8-二甲基-4-羟基-5-壬酮、2，8-二甲基-5-羟基-4-壬酮、2，7-二甲基壬烷、3，8-二甲基-3-壬烯、3，8-二甲基-4-壬烯、3，8-二甲基-5-壬烯、3，8-二甲基-4-壬醇、3，8-二甲基-5-壬醇、3，8-二甲基-4-壬酮、3，8-二甲基-5-壬酮、3，8-二甲基-4，5-壬二醇、3，8-二甲基-4，5-壬二酮、3，8-二甲基-4-羟基-5-壬酮、3，8-二甲基-5-羟基-4-壬酮、正-癸烷、1-癸烯、1-癸醇、癸酸盐、2，9-二甲基癸烷、2，9-二甲基-3-癸烯、2，9-二甲基-4-癸烯、2，9-二甲基-5-癸醇、2，9-二甲基-5-癸酮、2，9-二甲基-5，6-癸二醇、2，9-二甲基-6-羟基-5-癸酮、2，9-二甲基-5，6-癸二酮、正-十一烷、1-十一碳烯、1-十一烷醇、十一醛、十一酸盐、正-十二烷、1-十二碳烯、1-十二烷醇、十二醛、十二酸盐、正-十二烷、1-decadecene、1-十二烷醇、十二醛、十二酸盐、正-十三烷、1-十三碳烯、1-十三烷醇、十三醛、十三酸盐、正-十四烷、1-十四碳烯、1-十四烷醇、十四醛、十四酸盐、正-十五烷、1-十五碳烯、1-十五烷醇、十五醛、十五酸盐、正-十六烷、1-十六碳烯、1-十六烷醇、十六醛、十六酸盐、正-十七烷、1-十七碳烯、1-十七烷醇、十七醛、十七酸盐、正-十八烷、1-十八碳烯、1-十八烷醇、十八醛、十八酸盐、正-十九烷、1-十九碳烯、1-十九烷醇、十九醛、十九酸盐、二十烷、1-二十碳烯、1-二十烷醇、二十醛、二十酸盐、3-羟基丙醛、1，3-丙二醇、4-羟基丁醛、1，4-丁二醇、3-羟基-2-丁酮、2，3-丁二醇、1，5-戊二醇、高柠檬酸盐、高异柠檬酸盐、b-羟基己二酸盐、戊二酸盐、glutarsemialdehyde、戊二醛、2-羟基-1-环戊酮、1，2-环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2，3-二羟基-异戊酸盐、2-氧代异戊酸盐、异丁酰辅酶A、异丁酸盐、异丁醛、5-氨基戊醛、1，10-二氨基癸烷、1，10-二氨基-5-癸烯、1，10-二氨基-5-羟基癸烷、1，10-二氨基-5-癸酮、1，10-二氨基-5，6-癸二醇、1，10-二氨基-6-羟基-5-癸酮、苯乙醛、1，4-二苯基丁烷、1，4-二苯基-1-丁烯、1，4-二苯基-2-丁烯、1，4-二苯基-2-丁醇、1，4-二苯基-2-丁酮、1，4-二苯基-2，3-丁二醇、1，4-二苯基-3-羟基-2-丁酮、1-(4-羟苯基)-4-苯基丁烷、1-(4-羟苯基)-4-苯基-1-丁烯、1-(4-羟苯基)-4-苯基-2-丁烯、1-(4-羟苯基)-4-苯基-2-丁醇、1-(4-羟苯基)-4-苯基-2-丁酮、1-(4-羟苯基)-4-苯基-2，3-丁二醇、1-(4-羟苯基)-4-苯基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲哚-3)-4-苯基-2-丁烯、1-(吲哚-3)-4-苯基-2-丁醇、1-(吲哚-3)-4-苯基-2-丁酮、1-(吲哚-3)-4-苯基-2，3-丁二醇、1-(吲哚-3)-4-苯基-3-羟基-2-丁酮、4-羟苯基乙醛、1，4-二(4-羟苯基)丁烷、1，4-二(4-羟苯基)-1-丁烯、1，4-二(4-羟苯基)-2-丁烯、1，4-二(4-羟苯基)-2-丁醇、1，4-二(4-羟苯基)-2-丁酮、1，4-二(4-羟苯基)-2，3-丁二醇、1，4-二(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-4-(吲哚-3-)丁烷、1-(4-羟苯基)-4-(吲哚-3)-1-丁烯、1-二(4-羟苯基)-4-(吲哚-3)-2-丁烯、1-(4-羟苯基)-4-(吲哚-3)-2-丁醇、1-(4-羟苯基)-4-(吲哚-3)-2-丁酮、1-(4-羟苯基)-4-(吲哚-3)-2，3-丁二醇、1-(4-羟苯基-4-(吲哚-3)-3-羟基-2-丁酮、吲哚-3-乙醛、1，4-二(吲哚-3-)丁烷、1，4-二(吲哚-3)-1-丁烯、1，4-二(吲哚-3)-2-丁烯、1，4-二(吲哚-3)-2-丁醇、1，4-二(吲哚-3)-2-丁酮、1，4-二(吲哚-3)-2，3-丁二醇、1，4-二(吲哚-3)-3-羟基-2-丁酮、琥珀酸半醛、己烷-1，8-二羧酸、3-己烯-1，8-二羧酸、3-羟基-己烷-1，8-二羧酸、3-己酮-1，8-二羧酸、3，4-己二醇-1，8-二羧酸、4-羟基-3-己酮-1，8-二羧酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾、磷酸盐等。

本文所用“优化的”这一叙述，指生物活性改变的途径、基因、多肽、酶或其它分子，其例如通过多肽的氨基酸序列的遗传改变，或通过多肽周围细胞环境的改变/修饰，从而相对于原始分子或原始细胞环境(如给定多肽的野生型序列或野生型微生物)改善其功能特征。本文所述的任何多肽或酶可以任选地进行“优化”，且本文所述的任何基因或核苷酸序列都可以任选地编码优化的多肽或酶。本文所述的任何途径都可以任选地含有一种或多种“优化的”酶，或一种或多种编码优化的酶或多肽的核苷酸序列。

通常，多肽、酶或其它分子改善的功能特征涉及多肽或其它分子用于生物途径(如生物合成途径、C-C连接途径)以将单糖或寡糖转化为生物燃料的适宜性。因此，某些实施方案考虑到使用“优化的”生物途径。示例性的“优化的”多肽可以在其氨基酸编码序列中含有一个或多个改变或突变(如点突变、缺失、异源序列的添加)，所述改变或突变促进给定微生物系统或微生物中表达和/或稳定性的改善，允许调控与所需底物有关的多肽活性(如诱导型或抑制活性)，调节多肽在细胞中的定位(如细胞内定位、细胞外分泌)，和/或影响有关所需底物的多肽的总活性水平(如减少或增加酶促活性)。通过改变给定微生物系统或微生物中的一个或多个途径，如改变调控“优化的”多肽或其它分子的表达(如上调)、定位和/或活性的途径，或通过改变最小化不期望的副产品产生的途径等，也可以“优化”多肽或其它分子，供与所述给定微生物系统或生物一起使用。以此方式，在改变或不改变其野生型氨基酸序列或原始化学结构的情况下，可以“优化”多肽或其它分子。根据本领域已知的技术，优化的多肽或生物途径可以通过例如直接诱变或通过所需表型的自然选择获得。

在某些方面，“优化的”基因或多肽可以包含与参照(如野生型)基因或多肽的核苷酸或氨基酸序列50％-99％(包括其中的所有整数)同一的核苷酸编码序列或氨基酸序列。在某些方面，“优化的”多肽或酶的生物活性可以是参照多肽生物活性的约1、2、3、4、5、6、7、8、9、10、20、30、40、50、100(包括其中的所有整数和小数点，如1.2、1.3、1.4、1.5、5.5、5.6、5.7、60、70等)或更多倍。

本发明的某些方面也包括根据本文所述的方法和重组微生物产生的大量生产型化学品，如生物燃料。借助放射性碳定年技术(radio-carbondating techniques)，此类生物燃料(如中到长链链烷)可区分于其它燃料，如传统精炼厂从粗碳源产生的燃料。例如，碳具有两个稳定的非放射性同位素：碳-12(¹²C)和碳-13(¹³C)。另外，地球上存在痕量不稳定的碳-14(¹⁴C)同位素。碳-14的半衰期为5730年，如果不是宇宙射线对地球大气中的氮的持续影响产生更多这种同位素的话，这种同位素可能很久以前已经从地球上消失了。宇宙射线相互作用所产生的中子参与大气中氮分子(N₂)的原子的下述核反应：

植物和其它光合生物通过光合作用摄入大气中的二氧化碳。因为许多植物被动物摄取，地球上每个有生命的生物，在其生活期限内，经常与其环境交换碳-14。然而，一旦生物死亡，这种交换停止，且经放射β衰减，碳-14的量随时间逐渐减少。

大多数基于烃的燃料，如来自采矿作业的原油和天然气，都是古老有机物(如油原)在地质年代的压缩和加热的结果。石油的形成通常发生于烃高温分解，以高温和/或高压下多种通常吸热的反应的形式进行。今天的石油是由史前浮游动物和藻类保存的残余物形成的，这些浮游动物和藻类的残余物在无氧的条件下大量沉积于海底或湖底(另一方面，史前陆地植物的残余物趋向形成煤)。经地质时代，有机物与泥浆混合，并被埋于厚厚的沉积物层之下，导致高水平的热和压(称为岩化作用)。这个过程使有机物发生化学变化，首先变为称为油原的蜡质物质(其发现于全世界的各种油页岩内)，随后在称为退化的过程中，以更多的热，变为液态烃和气态烃。大多数衍生于原油的基于烃的燃料，在地质年代内已经历了碳-14衰减过程，因此有很少或者无可检测的碳-14。相反，本发明的活体微生物所产生的某些生物燃料所包含的碳-14水平，可和所有其它现存的生物媲美(即平衡水平)。以此方式，通过测量本发明的基于烃的生物燃料的碳-12与碳-14的比值，并将该比值与衍生于原油的基于烃的燃料进行比较，可以从结构上区分本文所提供的方法所产生的生物燃料与通常来源的基于烃的燃料。

本发明的实施方案包括将多糖转化为适宜单糖的方法，包括(a)获得多糖；和(b)使多糖与重组微生物或包含此类微生物的微生物系统接触足以将多糖转化为适宜的单糖的时间，其中微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因，其中裂解酶和/或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域；(ii)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白以及多糖转运蛋白；以及(iii)至少一个编码和表达酶的基因，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶，从而将多糖转化为适宜的单糖。

可选地，某些方面可以包括将多糖转化为适宜的单糖的方法，包括(a)获得多糖；和(b)使多糖与微生物系统接触足以将多糖转化为适宜的单糖的时间，其中微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因；(ii)至少一个编码和表达超通道的基因；以及(iii)至少一个编码和表达酶的基因，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶，从而将多糖转化为适宜的单糖。

在某些实施方案中，微生物系统或分离的微生物能利用多糖(如藻酸盐、果胶等)作为唯一碳源和/或能源而生长。“唯一碳源”通常指生长于作为给定的生长培养基中仅有碳源的给定碳源上的能力。

对于藻酸盐而言，海藻干重的约50％包含各种糖组分，其中藻酸盐和甘露醇是主要的组分，两者分别对应于海藻干重的30％和15％。对于果胶而言，尽管诸如大肠杆菌的微生物通常被认为是合成生物学的宿主生物，且尽管此类微生物能代谢甘露醇，但是它们完全缺乏降解并代谢藻酸盐的能力。因此，许多实验室微生物或野生型微生物，如大肠杆菌，不能生长于作为唯一碳源的藻酸盐上。类似地同样，诸如大肠杆菌的许多生物不能降解和代谢果胶这一在许多生物废品中存在的多糖，因此，不能生长于作为唯一碳源的果胶上。因此，本发明的实施方案包括工程化微生物，如大肠杆菌，或包含此类工程化微生物的微生物系统，其能利用多糖如藻酸盐和果胶作为唯一碳源和/或能源。

藻酸盐是β-D-甘露糖醛酸盐(M)和α-D-葡糖酸盐(G)(M和G是C5-羧基的差向异构体)的嵌段共聚物。每一藻酸盐多聚体都包含所有的M(polyM)、所有G(polyG)和/或M和G混合物(polyMG)的区域。为了利用藻酸盐产生一种或多种适宜的单糖，本发明的某些方面提供了工程化或重组微生物或微生物系统，所述微生物或微生物系统能降解藻酸盐或使其解聚，并能用它作为碳源和/或能源。作为实现此目的的一种方式，此类重组微生物可以将一组多糖降解或解聚酶如藻酸盐裂解酶(ALs)并入微生物系统。

根据其催化作用的作用，Als主要分为两种不同的亚家族：内-作用-(EC 4.2.2.3)ALs和外-作用-(EC 4.2.2.-)ALs。内-作用ALs基于其催化特异性还可以进一步分为：M特异性和G特异性ALs。内-作用ALs经由β-消除机制随机切割藻酸盐，并主要将藻酸盐解聚为二糖、三糖以及四糖。在每个寡糖非还原末端的糖醛酸盐被转化为不饱和的糖醛酸盐、4-脱氧-α-L-赤式-hex-4-烯烃吡喃糖醛酸盐。外-作用ALs进一步催化这些寡糖的解聚，并释放不饱和的单糖，其可以以非酶促的方式被转化为单糖，包括α-酮酸、4-脱氧-α-L-赤式-己酮糖糖醛酸盐(DEHU)。工程化微生物系统或分离的工程化微生物的某些实施方案包括内M-作用ALs、内G-作用ALs以及外-作用ALs，以将水生或海洋生物质多糖如藻酸盐降解或解聚为单糖如DEHU。

本发明的实施方案还可以包括分离自各种来源的裂解酶，如藻酸盐裂解酶，所述来源包括但不限于海洋藻类、软体动物和各种微生物，如假单胞菌属、弧菌属(Vibrio)以及鞘氨醇单胞菌属(Sphingomonas)。许多藻酸盐裂解酶是内-作用M特异性的，几个是G特异性的，很少是外-作用的。例如，分离自鞘氨醇单胞菌(Sphingomonas sp.)菌株A1的ALs包括5个内-作用ALs，即A1-I、A1-II、A1-II’、A1-III以及A1-IV’，和外作用AL即A1-IV。

通常，A1-I、A1-II和A1-III的分子量分别为66kDa、25kDa和40kDa。AI-II和AI-III是A1-I的自剪接产物。AI-II可以是对G更特异性的，且A1-III可以是M特异性的。A1-I可以具有对M和G两者的高活性。A1-IV的分子量为约85kDa，并催化寡藻酸盐(oligoalginate)的外裂解解聚。尽管A1-II’和A1-IV’两者是A1-II和A1-IV的功能同源物，但AI-II’具有内-裂解活性并且可以不具有M或G偏好。A1-IV主要具有内裂解活性。除了这些ALs外，衍生于根癌农杆菌的外-裂解AL Atu3025具有解聚寡藻酸盐的高活性，并且可以用于本发明的某些实施方案中。某些实施方案可以将编码A1-I、A1-II’、A1-IV和Atu3025的基因并入微生物系统或分离的微生物中，并且可以包括用于适宜宿主生物如大肠杆菌的优化的密码子使用。

可用于本文的藻酸盐裂解酶或寡藻酸盐裂解酶的某些实例包括，与SEQ ID NOS：67-68共有至少60％、70％、80％、90％、95％、98％或更多的(包括其中的所有整数)序列同一性的酶或多肽，SEQ ID NOS：67-68表示分离自根癌农杆菌的寡藻酸盐裂解酶Atu3025的核苷酸序列(SEQ IDNO：67)和多肽序列(SEQ ID NO：68)。可用于本文的藻酸盐裂解酶的某些实例包括，与图37所示藻酸盐裂解酶以及灿烂弧菌的Vs24254所编码的分泌的藻酸盐裂解酶共有至少60％、70％、80％、90％、95％、98％或更多的(包括其中的所有整数)序列同一性的酶或多肽。

在某些实施方案中，微生物系统或重组微生物可以经基因工程化，如通过将信号肽或自动转运蛋白结构域并入裂解酶，以向培养基分泌或展示裂解酶或藻酸盐裂解酶(ALs)。因此，通常可以理解，细菌具有至少4种不同类型的蛋白分泌机制(I、II、III以及IV型)。例如，在大肠杆菌中，II型分泌机制用于分泌重组蛋白。II型分泌机制可以包括2步过程：将标有信号肽的未成熟的蛋白转位至周质部分(periplasm fraction)并将其加工成成熟蛋白，随后将其分泌至培养基。

第一过程可以通过三种不同途径中的任何途径进行：secB-依赖性途径、信号识别颗粒(SRP)途径或双精氨酸转位(twin-arginine translocation，TAT)途径。重组蛋白可以分泌至周质部分。成熟蛋白的命运因蛋白的类型而各不相同。例如，某些蛋白通过扩散自发地或通过称为分泌器(secretion apparatus)的分泌物被动地分泌，所述分泌物由12-16个蛋白组成，其它的一些蛋白则留在周质部分，并最后降解。

一些蛋白也可以通过自动转运蛋白器(autotransporter apparatus)分泌，如利用自动转运蛋白结构域。自动转运蛋白结构域所分泌的蛋白通常包含在转位至周质中起作用的N末端信号肽，其可以受secB或SRP途径、信使结构域和/或具有特征性β-桶状结构的C末端转位单元(UT)的介导。UT的β-桶状部分构建了跨越外膜的水性孔通道，并有助于信使结构域向培养基的转运。自动展示的信使蛋白经常受到自动转运蛋白的切割，并被释放至培养基。

I型分泌机制也可以用于在大肠杆菌中分泌重组蛋白。I型分泌机制也可以用于分泌高分子量的毒素和外切酶(exoenzyme)。I型分泌机制由两个内膜蛋白(HlyB和HlyD)和一个内源外膜蛋白(TolC)组成，所述内膜蛋白是ATP结合盒(ATP binding cassette，ABC)转运蛋白家族的成员。基于I型分泌机制的重组蛋白的分泌可以利用α-溶血素(HlyA)的C-末端区域作为信号序列。重组蛋白通过I型分泌机制可以很容易地穿过内膜、周质以及外膜。

取决于本申请的各种实施方案所用的连接子和信号肽的类型，自动转运蛋白和I型分泌机制可以针对细胞表面展示机制而改变。可选地，可使用对细胞表面展示有特异性的系统。例如，在该系统中，可将靶蛋白融合于天然展示于枯草芽孢杆菌的表面上的PgsA蛋白(多聚-γ-谷氨酸合成酶复合体)。

某些实施方案可以包括与I型和II型分泌机制两者所分泌的蛋白中存在的各种信号肽和/或自动转运蛋白结构域融合的裂解酶如藻酸盐裂解酶。其它实施方案可以包括与本文所述转运机制所分泌的或本领域已知的蛋白中存在的信号肽和/或自动转运蛋白结构域的任何组合融合的裂解酶如藻酸盐裂解酶。实施方案也可以包括信号肽或自动转运蛋白结构域，其经实验方式再设计后，使裂解酶如藻酸盐裂解酶向培养基的分泌最大化，也可以包括使用许多不同的融合信号肽、裂解酶和自动转运蛋白的连接子序列，所述信号肽、裂解酶和自动转运蛋白改善裂解酶的分泌或细胞表面呈递的效率。

某些实施方案可以包括微生物系统或分离的微生物，所述微生物系统或分离的微生物包含糖转运蛋白，糖转运蛋白能将单糖(如DEHU)和寡糖从培养基转运至细胞溶胶，以有效利用这些单糖作为碳源和/或能源。例如，编码单糖透性酶(即单糖转运蛋白)如DEHU透性酶的基因，可以从生长于作为碳源和/或能源的多糖如藻酸盐上的细菌中分离，并且可以并入本发明微生物系统或分离的微生物的实施方案。作为其它实例，实施方案也可以包括单糖(如DEHU)转运特异性已改变的再设计的天然透性酶或转运蛋白。

在这一点上，大肠杆菌含有几种能转运单糖的透性酶，其包括但不限于2-酮-3-脱氧-D-葡糖酸盐(KDG)转运蛋白的KdgT，如D-半乳糖醛酸盐和D-葡糖醛酸盐的aldohexuronates转运蛋白的ExuT，葡糖酸盐转运蛋白的GntT、GntU、GntP以及GntT，以及质子驱动的α-酮戊二酸转运蛋白的KgtP。本文所述的微生物系统或重组微生物可以包含这些透性酶中的任何透性酶，除了本领域技术人员已知的和本文未提到的透性酶外，并且也可以包括经再设计转运其它单糖如DEHU的透性酶。

本发明的微生物系统或重组微生物也可以包含催化单糖(如D-甘露糖醛酸盐和D-来苏糖)从培养基向微生物的周质或细胞溶胶转运的透性酶/转运蛋白/超通道/孔蛋白。例如，可以将编码土壤气单孢菌(Aeromonas)中D-甘露糖醛酸透性酶的基因并入本文所述的微生物系统中。

作为一可选的实例，微生物系统或微生物可以包含天然透性酶/转运蛋白，其经再设计改变了它们有效转运单糖如转运D-甘露糖醛酸盐和D-来苏糖的特异性。例如，大肠杆菌含有能转运单糖或糖如D-甘露糖酸盐和D-来苏糖的数种透性酶，包括2-酮-3-脱氧-D-葡糖酸(KDG)转运蛋白的KdgT，诸如D-半乳糖醛酸盐和D-葡糖醛酸盐的aldohexuronates的转运蛋白的ExuT，葡糖酸/果糖酮酸(fructuronate)转运蛋白的GntPTU，葡糖苷酸转运蛋白的uidB，L-海藻糖转运蛋白的fucP，半乳糖转运蛋白的galP，乙醇酸转运蛋白的yghK，D-半乳糖酸转运蛋白的dgoT，己糖磷酸盐转运蛋白的uhpT，乳清酸/柠檬酸转运蛋白的dctA，葡糖酸盐转运蛋白的gntUT，麦芽糖转运蛋白的malEGF：D-阿洛糖酸盐转运蛋白的alsABC，L-艾杜糖酸/D-葡糖酸转运蛋白的idnT，质子驱动的α-酮戊二酸转运蛋白的KgtP，乳糖/半乳糖转运蛋白的lacY，D-木糖转运蛋白的xylEFGH，L-阿拉伯糖转运蛋白的araEFGH，以及D-核糖转运蛋白的rbsABC。在某些实施方案中，微生物系统或重组微生物可以包含上文所述的透性酶或转运蛋白，包括经再设计或优化改善某些单糖如D-甘露糖醛酸盐、DEHU以及D-来苏糖的转运的透性酶或转运蛋白。

某些方面可以使用包含“超通道”的重组微生物，通过所述超通道，水生或海洋生物质多糖，如藻酸盐多聚体，或果实或蔬菜生物质，如果胶多聚体，可以直接并入细胞溶胶，并在微生物系统中降解。例如，一组特征为鞘氨醇单胞菌的细菌能广泛降解对环境有害的化合物，如多氯多环芳香物族化合物(polychlorinated polycyclic aromatics)(二噁英)。这些细菌在其细胞表面含有特征性的巨大褶状分子。因此，某些鞘氨醇单胞菌具有特征为“超通道”的结构，该结构能使细胞直接摄取大分子。

作为包含超通道微生物的一特定实例，鞘氨醇单胞菌菌株A1通过超通道直接并入多糖如藻酸盐。此类超通道可由外膜上的小窝(pit)(如AlgR)、周质中的藻酸盐结合蛋白(如AlgQ1和Alg Q2)以及ATP-结合盒(ABC)转运蛋白(如AlgM1、AlgM2以及AlgS)组成。所并入的多糖，如藻酸盐，可很容易地通过裂解酶如细胞溶胶中所产生的藻酸盐裂解酶解聚。因此，某些实施方案可以并入编码超通道的基因(如ccpA、algS、algM1、algM2、algQ1、algQ2)，以将这种能力引入微生物系统或重组微生物。其它实施方案可以包括诸如亚北极鞘氨醇单胞菌(Sphingomonassubarctica)IFO 16058^T的微生物，该微生物容纳含有编码超通道的基因的质粒，并且利用海洋或水生生物质多糖如藻酸盐作为碳源和/或能源的能力已获得显著改善。某些重组微生物可以使用这些含于亚北极鞘氨醇单胞菌IFO 16058^T内的编码超通道的质粒序列。

可以用于本文中的藻酸盐ABC转运蛋白的某些实例包括，ABC转运蛋白Atu3021、Atu3022、Atu3023、Atu3024、algM1、algM2、AlgQ1、AlgQ2、AlgS、OG2516_05558、OG2516_05563、OG2516_05568以及OG2516_05573，包括其功能变体。除其它的以外，可用于本文中的藻酸盐同向转运蛋白的某些实例可以包括，同向转运蛋白V12B01_24239和V12B01_24194，包括其变体。藻酸盐孔蛋白的一个其它实例包括V12B01_24269和其变体。

如上文所述，某些实施方案可以包括重组微生物，其包含一种或多种单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。就单糖脱氢酶而言，某些微生物系统或重组微生物可以并入将各种单糖(如DEHU、甘露糖醛酸盐)还原为适宜生物燃料生物合成的单糖如2-酮-3-脱氧-D-葡糖酸盐(KDG)或D-甘露醇的酶。此类示例性的酶包括，例如，DEHU脱氢酶和甘露糖醛酸脱氢酶(除了具有DEHU脱氢酶和/或甘露糖醛酸脱氢酶活性的各种醇脱氢酶外，如从根癌农杆菌C58分离的新的ADH1至ADH12酶(参阅例如SEQ ID NOS：69-92))。

对于ADH1至ADH12酶的更多详情，SEQ ID NO：69表示从根癌农杆菌C58分离的ADH1 Atu1557的核苷酸序列，SEQ ID NO：70表示其多肽序列。SEQ ID NO：71表示从根癌农杆菌C58分离的ADH2 Atu2022的核苷酸序列，SEQ ID NO：72表示其多肽序列。SEQ ID NO：73表示从根癌农杆菌C58分离的ADH3 Atu0626的核苷酸序列，SEQ ID NO：74表示其多肽序列。

SEQ ID NO：75表示从根癌农杆菌C58分离的ADH4 Atu5240的核苷酸序列，SEQ ID NO：76表示其多肽序列。SEQ ID NO：77表示从根癌农杆菌C58分离的ADH5 Atu3163的核苷酸序列，SEQ ID NO：78表示其多肽序列。SEQ ID NO：79表示从根癌农杆菌C58分离的ADH6 Atu2151的核苷酸序列，SEQ ID NO：80表示其多肽序列。

SEQ ID NO：81表示从根癌农杆菌C58分离的ADH7 Atu2814的核苷酸序列，SEQ ID NO：82表示其多肽序列。SEQ ID NO：83表示从根癌农杆菌C58分离的ADH8 Atu5447的核苷酸序列，SEQ ID NO：84表示其多肽序列。SEQ ID NO：85表示从根癌农杆菌C58分离的ADH9 Atu4087的核苷酸序列，SEQ ID NO：86表示其多肽序列。

SEQ ID NO：87表示从根癌农杆菌C58分离的ADH10 Atu4289的核苷酸序列，SEQ ID NO：88表示其多肽序列。SEQ ID NO：89表示从根癌农杆菌C58分离的ADH11 Atu3027的核苷酸序列，SEQ ID NO：90表示其多肽序列。SEQ ID NO：91表示从根癌农杆菌C58分离的ADH12 Atu3026的核苷酸序列，SEQ ID NO：92表示其多肽序列。

具有脱氢酶活性的酶的其它实例包括，Atu3026、Atu3027、OG2516_05543、OG2516_05538以及V12B01_24244。本发明的微生物和方法也可以利用这些氢化酶的生物活性片段和变体，包括其优化的变体。

作为另一个实例，利用藻酸盐作为唯一碳源和能源而生长的假单胞菌包含DEHU氢化酶，该酶使用NADPH作为辅因子，当溶液中存在NADP+时更稳定，并且在环境pH下有活性。因此，本文所述的微生物系统或重组微生物的某些实施方案可以并入编码衍生于或获得自各种微生物的氢化酶如DEHU或甘露糖醛酸氢化酶的基因，其中这些微生物能生长于作为碳源和/或能源的多糖如藻酸盐或果胶上。

某些实施方案可以并入微生物系统或分离的微生物的组分，所述微生物系统或分离的微生物能有效生长于作为碳源和能源的单糖如D-甘露糖醛酸盐或D-来苏糖上。例如，气单孢菌和产气气杆菌(Aerobacteraerogenes)PRL-R3包含编码单糖脱氢酶的基因，所述酶如D-甘露糖醛酸氢化酶和D-来苏糖异构酶。因此，某些微生物系统或重组微生物可以包含单糖脱氢酶，如来自气单孢菌、产气气杆菌PRL-R3或各种其它适宜的微生物的D-甘露糖醛酸氢化酶和D-来苏糖异构酶，所述适宜的微生物包括能生长于作为碳源和能源的D-甘露糖醛酸盐或D-来苏糖上的微生物。

某些实施方案可以包括将单糖如D-甘露糖酸盐和D-木酮糖转化为适宜生物燃料合成途径的单糖如KDG的效率提高的微生物系统或分离的微生物。仅通过解释的方式，D-甘露糖酸盐和D-木酮糖是微生物如大肠杆菌中的代谢物。D-甘露糖酸盐通过D-甘露糖酸脱水酶转化成KDG。D-木酮糖进入戊糖磷酸途径。因此，为了增加D-甘露糖酸盐向KDG的转化，外源或内源D-甘露糖酸脱水酶(如uxuA)基因在本发明的重组微生物中可以是过表达的。类似地，在其它实施方案中，适宜的内源或外源基因，如激酶(如kdgK)、nad以及KDG醛缩酶(如kdgA和eda)，包括其生物活性变体或片段，如这些基因的优化的变体，可以并入给定的重组微生物或在其中过表达(参见SEQ ID NOS：93-96)。SEQ ID NO：93表示来自大肠杆菌DH10B的2-酮-脱氧葡糖酸激酶(KdgK)的核苷酸序列，SEQID NO：94表示其多肽序列。SEQ ID NO：95表示来自大肠杆菌DH10B的2-酮-脱氧葡糖酸-6-磷酸醛缩酶(KdgA)的核苷酸序列，SEQ ID NO：96表示其多肽序列。

在某些方面，如上所述，能生长于作为唯一碳源的藻酸盐或果胶上的重组微生物，可以利用脱水酶、激酶和/或醛缩酶的天然存在的或内源拷贝。例如，大肠杆菌含有内源脱水酶、激酶和醛缩酶，其能催化多糖转化为适宜的单糖的适当步骤。在这些和其它相关方面，天然存在的脱水酶或激酶也可以是过表达的，如通过提供与高度组成型或诱导型启动子可操作连接的天然存在的脱水酶、激酶或醛缩酶的外源拷贝。

作为用于对重组微生物进行基因工程化使其生长于作为唯一碳源的藻酸盐上的酶的一示例性来源，已知灿烂弧菌能代谢藻酸盐而支持生长。例如，SEQ ID NO：1表示携带某些灿烂弧菌某些基因的分泌蛋白质组区(secretome region)(V12B01_02425-V12B01-02480)，其编码II型分泌器。SEQ ID NO：2表示V12B01_24189至V12B01_24249间的完整基因组区的核苷酸序列，其衍生于灿烂弧菌，且当其转化入大肠杆菌中作为fosmid克隆(fosmid clone)时，足以赋予生长于作为唯一碳源的藻酸盐上的能力。SEQ ID NOS：3-64表示含于SEQ ID NO：2中的单个推断的基因。因此，在某些方面，能生长于作为唯一碳源和/或能源的藻酸盐上的重组微生物(如大肠杆菌)可以包含SEQ ID NOS：1-64所述的一个或多个核苷酸或多肽参照序列，包括其生物活性片段或变体，如优化的变体。

在某些方面，能生长于作为唯一碳源的藻酸盐上的重组微生物，可以含有某些含于SEQ ID NOS：2中的编码核苷酸或多肽序列，如SEQ IDNOS：3-64中的序列，或其生物活性片段或变体，包括优化的变体。这些序列在下文做了进一步描述。

SEQ ID NO：3表示推断的蛋白V12B01_24184的核苷酸编码序列。这种推断的序列含于SEQ ID NO：2的多核苷酸序列中，并编码与自动转运蛋白粘附或I型分泌靶标ggxgxdxxx(SEQ ID NO：145)重复相似的多肽。SEQ ID NO：4表示推断的蛋白V12B01_24184的多肽序列，其是由多核苷酸SEQ ID NO：3编码的。这种推断的多肽与自动转运蛋白粘附或I型分泌靶标ggxgxdxxx(SEQ ID NO：145)重复相似。

SEQ ID NO：5表示编码推断的蛋白V12B01_24189的核苷酸序列。SEQ ID NO：6表示推断的蛋白V12B01_24189的多肽序列，其与环己二烯脱水酶相似。

SEQ ID NO：7表示编码推断的蛋白V12B01_24194的核苷酸序列。SEQ ID NO：8表示推断的蛋白V12B01_24194的多肽序列，其与Na/脯氨酸转运蛋白相似。

SEQ ID NO：9表示编码推断的蛋白V12B01_24199的核苷酸序列。SEQ ID NO：10表示推断的蛋白V12B01_24199的多肽序列，其与酮-脱氧-磷酸葡糖酸醛缩酶相似。

SEQ ID NO：11表示编码推断的蛋白V12B01_24204的核苷酸序列。SEQ ID NO：12表示推断的蛋白V12B01_24204的多肽序列，其与2-脱氢-3-脱氧葡糖酸激酶相似。

SEQ ID NO：13表示编码推断的蛋白V12B01_241209的核苷酸序列。SEQ ID NO：14表示推断的蛋白V12B01_241209的多肽序列。

SEQ ID NO：15表示编码推断的蛋白V12B01_24214的核苷酸序列。SEQ ID NO：16表示推断的蛋白V12B01_24214的多肽序列，其与软骨素AC/藻酸盐裂解酶相似。

SEQ ID NO：17表示编码推断的蛋白V12B01_24219的核苷酸序列。SEQ ID NO：18表示推断的蛋白V12B01_24219的多肽序列，其与软骨素AC/藻酸盐裂解酶相似。

SEQ ID NO：19表示编码推断的蛋白V12B01_24224的核苷酸序列。SEQ ID NO：20表示推断的蛋白V12B01_24224的多肽序列，其与2-酮-4-戊烯酸水合酶(pentenoate hydratase)/2-氧代庚(oxohepta)-3-烯-1，7-二酸水合酶相似。

SEQ ID NO：21表示编码推断的蛋白V12B012_4229的核苷酸序列。SEQ ID NO：22表示推断的蛋白V12B01_24229的多肽序列，其与GntR-家族转录调节蛋白相似。

SEQ ID NO：23表示编码推断的蛋白V12B01_24234的核苷酸序列。SEQ ID NO：24表示推断的蛋白V12B01_24234的多肽序列，其与Na⁺/脯氨酸同向转运蛋白相似。

SEQ ID NO：25表示编码推断的蛋白V12B01_24239的核苷酸序列。SEQ ID NO：26表推断的蛋白V12B01_24239的多肽序列，其与寡藻酸盐裂解酶相似。

SEQ ID NO：27表示编码推断的蛋白V12B01_24244的核苷酸序列。SEQ ID NO：28表示推断的蛋白V12B01_24244的多肽序列，其与3-羟基异丁酸脱氢酶相似。

SEQ ID NO：29表示编码推断的蛋白V12B01_24249的核苷酸序列。SEQ ID NO：30表示推断的蛋白V12B01_24249的多肽序列，其与甲基-接收趋化蛋白相似。

SEQ ID NO：31表示编码推断的蛋白V12B01_24254的核苷酸序列。SEQ ID NO：32表示推断的蛋白V12B01_24254的多肽序列，其与藻酸盐裂解酶相似。

SEQ ID NO：33表示编码推断的蛋白V12B01_24259的核苷酸序列。SEQ ID NO：34表示推断的蛋白V12B01_24259的多肽序列，其与藻酸盐裂解酶相似。

SEQ ID NO：35表示编码推断的蛋白V12B01_24264的核苷酸序列。SEQ ID NO：36推断的蛋白V12B01_24264的多肽序列。

SEQ ID NO：37表示编码推断的蛋白V12B01_24269的核苷酸序列。SEQ ID NO：38表示推断的蛋白V12B01_24269的多肽序列，其与推断的寡半乳糖醛酸盐特异性孔蛋白相似。

SEQ ID NO：39表示编码推断的蛋白V12B01_24274的核苷酸序列。SEQ ID NO：40表示推断的蛋白V12B01_24274的多肽序列，其与藻酸盐裂解酶相似。

图32表示推断的蛋白V12B01_02425的核苷酸编码序列和多肽序列。图32A表示编码推断的蛋白V12B01_02425的核苷酸序列(SEQ IDNO：41).图32B表示推断的蛋白V12B01_02425的多肽序列(SEQ IDNO：42)，其与II型分泌途径组分EpsC相似。

SEQ ID NO：43表示编码推断的蛋白V12B01_02430的核苷酸序列。SEQ ID NO：44表示推断的蛋白V12B01_02430的多肽序列，其与II型分泌途径组分EpsD相似。

SEQ ID NO：45表示编码推断的蛋白V12B01_02435的核苷酸序列。SEQ ID NO：46表示推断的蛋白V12B01_02435的多肽序列，其与II型分泌途径组分EpsE相似。

SEQ ID NO：47表示编码推断的蛋白V12B01_02440的核苷酸序列。SEQ ID NO：48表示推断的蛋白V12B01_02440的多肽序列，其与II型分泌途径组分EpsF相似。

SEQ ID NO：49表示编码推断的蛋白V12B01_02445的核苷酸序列。SEQ ID NO：50表示推断的蛋白V12B01_02445的多肽序列，其与II型分泌途径组分EpsG相似。

SEQ ID NO：51表示编码推断的蛋白V12B01_02450的核苷酸序列。SEQ ID NO：52表示推断的蛋白V12B01_02450的多肽序列，其与II型分泌途径组分EpsH相似。

SEQ ID NO：53表示编码推断的蛋白V12B01_02455的核苷酸序列。SEQ ID NO：54表示推断的蛋白V12B01_02455的多肽序列，其与II型分泌途径组分EpsI相似。

SEQ ID NO：55表示编码推断的蛋白V12B01_02460的核苷酸序列。SEQ ID NO：56表示推断的蛋白V12B01_02460的多肽序列，其与II型分泌途径组分EpsJ相似。

SEQ ID NO：57表示编码推断的蛋白V12B01_02465的核苷酸序列。SEQ ID NO：58表示推断的蛋白V12B01_02465的多肽序列，其与II型分泌途径组分EpsK相似。

SEQ ID NO：59表示编码推断的蛋白V12B01_02470的核苷酸序列。SEQ ID NO：60表示推断的蛋白V12B01_02470的多肽序列，其与II型分泌途径组分EpsL相似。

SEQ ID NO：61表示编码推断的蛋白V12B01_02475的核苷酸序列。SEQ ID NO：62表示推断的蛋白V12B01_02475的多肽序列，其与II型分泌途径组分EpsM相似。

SEQ ID NO：63表示编码推断的蛋白V12B01_02480的核苷酸序列。SEQ ID NO：64表示推断的蛋白V12B01_02480的核苷酸序列，其与II型分泌途径组分EpsC相似。

作为用于对微生物进行基因工程化使其生长于藻酸盐上的酶的另一个示例性来源，根癌农杆菌C58能代谢作为唯一碳源和能源的相对小的藻酸盐分子(～1000mers)。因为根癌农杆菌C58在植物生物技术中的应用已经很久，因此，这种生物的遗传学已经研究的相对良好，并且许多基因工具可以利用，并与其它革兰氏阴性细菌如大肠杆菌相容。因此，某些方面可以使用这种微生物或其中的基因，用于产生适宜的单糖。例如，如上所述，本公开提供了一系列新的具有DEHU和甘露糖醛酸氢化酶活性的ADH基因，这些基因是从根癌农杆菌C58获得的(参见SEQ ID NOS：67-92)。

如上所述，某些方面可以包括重组微生物或微生物系统，其能生长于作为唯一碳源和/或能源的果胶上。果胶是形成果胶主链的线性链的α-(1-4)-连接的D-半乳糖醛酸，即同型半乳糖醛酸聚糖。在主链内，存在半乳糖醛酸被(1-2)-连接的L-鼠李糖取代的区域。自鼠李糖，各种中性糖的侧链通常分支。这种类型的果胶称为I型鼠李糖半乳糖醛酸聚糖。在主链中，遍及地，约最多每第25半乳糖醛酸被鼠李糖取代。某些伸展(stretches)由交互的半乳糖醛酸和鼠李糖组成-“多毛区(hairy region)”，其它的具有低密度鼠李糖-“光滑区”。中性糖主要包含D-半乳糖、L-阿拉伯糖以及D-木糖；中性糖的类型和比例随果胶的来源而不同。实际上，约80％的半乳糖醛酸的羧基与甲醇一起酯化。一些植物，如甜菜、马铃薯和梨，除了甲酯外，还含有带有乙酰化的半乳糖醛酸的果胶。乙酰化防止形成凝胶，但使果胶的稳定和乳化作用增加。某些果胶降解和代谢途径示例于图3中。

除了上文所述的基因、酶和生物途径外，某些重组微生物可以并入可以用于生长于作为唯一碳源的果胶上的特征。例如，为了降解和代谢作为唯一碳源的果胶，果胶甲酯酶和乙酰酯酶首先催化果胶上甲酯和乙酯的水解。果胶甲酯酶的实例包括但不限于pemA和pmeB。果胶乙酰酯酶的实例包括但不限于PaeX和PaeY。可用于本文中的果胶甲酯酶的其它实例包括与图40中的果胶酸甲酯酶共有至少60％、70％、80％、90％、95％、98％或更多序列同一性(包括其中的所有整数)的酶或多肽。可用于本文中的果胶酸乙酰酯酶的其它实例包括与图41中所述的果胶酸乙酰酯酶共有至少60％，、70％、80％、90％、95％、98％或更多序列同一性(包括其中的所有整数)的酶或多肽。

进一步为此目的，果胶酸裂解酶和水解酶可以经由β-消除和水解，催化果胶酸盐的内裂解切割，分别产生寡果胶酸盐。可以用于代谢果胶的其它酶包括。果胶酸裂解酶的实例包括但不限于PelA、PelB、PelC、PelD、PelE、Pelf、PelI、PelL以及PelZ。果胶酸水解酶的实例包括但不限于PehA、PehN、PehV、PehW以及PehX。果胶酸裂解酶的其它实例包括与图38所述的果胶酸裂解酶共有少至60％、70％、80％、90％、95％、98％或更多序列同一性(包括其中的所有整数)的多肽或酶。

多聚半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖裂解酶以及鼠李糖半乳糖醛酸聚糖水解酶也可以用于本文中，以降解和代谢果胶。鼠李糖半乳糖醛酸聚糖裂解酶的实例包括与图39A所述的半乳糖醛酸聚糖裂解酶(即鼠李聚糖半乳糖醛酸酶(rhamnogalacturonases))共有至少60％、70％、80％、90％、95％、98％或更多序列同一性(包括其中的所有整数)的多肽或酶。鼠李聚糖半乳糖醛酸水解酶的实例，包括与图39B所述的鼠李聚糖半乳糖醛酸水解酶共有至少60％、70％、80％、90％、95％、98％或更多序列同一性(包括其中的所有整数)的多肽或酶。

因此，为了降解和代谢果胶，除了本领域已知的其它的外，某些本发明的重组微生物和方法可以并入一种或多种上述甲酯酶和乙酰酯酶和/或水解酶。这些酶可以为内源或外源基因编码和表达，也可以包括这些酶的生物活性片段或变体，如其同源物、直系同源物和/或优化的变体。

为了进一步代谢果胶降解产物，寡果胶酸盐可以通过外膜孔蛋白转运至革兰氏阴性细菌的周质部分，在那里，它们进一步降解为如二半乳糖醛酸盐和三半乳糖醛酸盐的组分。外膜孔蛋白的实例包括可以将寡果胶酸盐转运至周质的外膜孔蛋白，包括但不限于kdgN和kdgM。某些重组微生物可以并入这些或相似基因。

随后可将二和三半乳糖醛酸盐转运至细胞溶胶中，用于进一步降解。细菌含有至少两种不同的负责二和三半乳糖醛酸盐转运的转运蛋白系统，包括同向转运蛋白和ABC转运蛋白(如分别为TogT和TogMNAB)。因此，本文所提供的某些重组微生物可以包含一种或多种二或三半乳糖醛酸盐转运系统，如TogT和/或TogMNAB。

一旦二和三半乳糖醛酸盐并入细胞溶胶，短的果胶酸或半乳糖醛酸裂解酶便将它们分解成D-半乳糖醛酸盐和(4S)-4，6-二羟基-2，5-二氧己糖醛酸盐(dioxohexuronate)。短的果胶酸或半乳糖醛酸裂解酶的实例包括但不限于PelW和Ogl，其基因可以以内源或外源方式并入本文所提供的某些重组微生物中。D-半乳糖醛酸盐和(4S)-4，6-二羟基-2，5-二氧己糖醛酸盐随后被转化为5-脱氢-4-脱氧-D-葡糖醛酸盐，并进一步转化为KDG，这些步骤可分别受KduI和KduD催化。KduI酶具有异构酶活性，KduD酶具有脱氢酶活性，如2-脱氧-D-葡糖酸3-脱氢酶活性。因此，本文所提供的某些重组微生物可以包含一种或多种短的果胶酸或半乳糖醛酸裂解酶，如PelW和/或Ogl，并且可以任选地包含一种或多种异构酶，如KduI，以及一种或多种脱氢酶，如KduD，以便将二和三半乳糖醛酸盐转化为为适宜的单糖，如KDG。

在某些方面，能生长于作为唯一碳源和/或能源的果胶或三半乳糖醛酸盐上的重组微生物如大肠杆菌，可以包含一个或多个含于SEQ IDNOS：65和66中的基因序列，包括其生物活性片段或变体，如优化的变体。SEQ ID NO：65表示胡萝卜软腐欧文氏菌马铃薯黑胫亚种(Erwiniacarotovora subsp.Atroseptica)SCRI1043的kdgF-PaeX区的核苷酸序列。SEQ ID NO：66表示胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043的ogl-kdgR的核苷酸序列。

在某些方面，能生长于作为唯一碳源和/或能源的果胶或三半乳糖醛酸盐的重组微生物如大肠杆菌，可以包含菊欧文氏菌(Erwiniachrysanthemi)的一个或多个基因组区，其包含编码酶(kduI、kduD、ogl、pelW以及paeX)、转运蛋白(togM、togN、togA、togB以及kdgM)和负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的数个基因(kdgF、kduI、kduD、pelW、togM、togN、togA、togB、kdgM、paeX、ogl以及kdgR)，以及编码果胶酸裂解酶(pelA和pelE)、果胶乙酰酯酶(paeY)和果胶甲酯酶(pem)的数个基因(pelA、pelE、paeY以及pem)(参见实施例2)。

可用于本文的异构酶的其它实例包括葡糖醛酸异构酶，如uxaC家族的葡糖醛酸异构酶，以及4-脱氧-L-苏型-5-己酮糖醛酸异构酶，如KduI家族的4-脱氧-L-苏型-5-己酮糖醛酸异构酶。可用于本文的还原酶的其它实例包括塔格糖醛酸还原酶，如uxaB家族的塔格糖醛酸还原酶。可用于本文的脱水酶的其它实例包括阿卓糖酸脱水酶(altronate dehydratase)，如uxaA家族的阿卓糖酸脱水酶。可用于本文的脱氢酶的其它实例包括2-脱氧-D-葡糖酸3-脱氢酶，如kduD家族的2-脱氧-D-葡糖酸3-脱氢酶。

某些方面也可以利用经基因工程化增强KDG降解途径效率的重组微生物。例如，在细菌中，KDG是己糖醛酸盐如D-葡糖醛酸盐和D-半乳糖醛酸盐降解的普通代谢中间物，并进入ED途径(Entner Doudoroffpathway)，在那里，其转化为丙酮酸盐和3-磷酸甘油醛(G3P)。在该途径中，KDG首先被KDG激酶(KdgK)磷酸化，随后利用2-酮-3-脱氧-D-6-磷酸-葡糖酸(KDPG)醛缩酶(KdgA)切割成丙酮酸盐和3-磷酸甘油醛(G3P)。与KDG透性酶(如KdgT)同时发生的这些酶的表达被KdgR负调节，并且在基础水平下几乎不存在。加入己糖醛酸盐，显著诱导表达(3-5倍)，在生长于藻酸盐的假单胞菌中也有类似结果的报道。因此，为了增加KDG向丙酮酸盐和G3P的转化，可以去除负调节蛋白KdgR。为了进一步改善途径的效率，也可将KdgK和KdgA的外源拷贝并入给定的重组微生物中。

在某些方面，能生长于作为唯一碳源的多糖(如藻酸盐、果胶等)上的重组微生物，可能能使所产生的给定的大量生产型化学品(如乙醇)的量增加，同时生长于该多糖上。例如，经基因工程化而生长于藻酸盐上的大肠杆菌，可以经基因工程，以致所产生的乙醇的量，比未经基因工程化生长于藻酸盐上的大肠杆菌所产生的量增加(参阅实施例11)。因此，某些方面包括重组微生物，其能生长于作为唯一碳源的藻酸盐或果胶酸上，并且通过例如包含一个或多个编码和表达丙酮酸脱羧酶(pdc)和/或醇脱氢酶的基因，包括其功能变体，而能使所产生的乙醇的量增加。在某些方面，此类重组微生物可以包含丙酮酸脱羧酶(pdc)和两种醇脱氢酶(adhA和adhB)，其获自运动发酵单孢菌(zymomonas mobilis)。

本发明的实施方案也包括将多糖转化为适宜的单糖的方法，包括(a)获得多糖；(b)使多糖与化学催化或酶促途径接触，从而将多糖转化为第一单糖或寡糖；以及(c)使第一单糖与微生物系统接触足以将第一单糖或寡糖转化为适宜单糖的时间，其中，微生物系统包含(i)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白以及多糖转运蛋白；以及(ii)至少一个编码和表达酶的基因，从而将多糖转化为单糖，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。

在本发明的某些方面，水生或海洋生物质多肽，如藻酸盐，可以利用化学催化剂如酸进行化学降解。类似地，生物质衍生的果胶可以进行化学降解。例如，化学催化剂所催化的反应，通常通过水解，与酶促催化剂所催化的β-消除的反应类型相对。因此，某些实施方案可以包括用强矿物酸沸腾藻酸盐或果胶，以便从D-甘露糖醛酸盐释放二氧化碳，从而形成D-来苏糖，所述D-来苏糖是许多微生物所利用的常见糖类代谢物。除了作为化学催化剂的本领域已知的其它适宜的酸外，此类实施方案可以使用例如，甲酸、盐酸、硫酸。

酶促途径可以利用本文所述的一种或多种酶，其能催化多糖如藻酸盐或果胶的降解。

其它实施方案可以使用与本文所述或本领域技术人员已知的化学催化类似的改变的化学催化，包括适用于生物质相关的多糖的改善的或再设计的化学催化的方法。某些实施方案包括所得的单糖醛酸是D-甘露糖醛酸盐的实施方案。

如上所述，本发明的重组微生物和微生物系统所产生的适宜的单糖或适宜的寡糖，可以用作生产大量生产型化学品如生物燃料以及大量生产型化学品中间物的给料。因此，本发明的某些实施方案通常涉及将适宜的单糖或寡糖转化为大量生产型化学品如生物燃料的方法，包括(a)获得适宜的单糖或寡糖；(b)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖转化为生物燃料的时间，从而将适宜的单糖转化为生物燃料。

某些方面包括将适宜的单糖转化为第一大量生产型化学品如生物燃料的方法，包括(a)获得适宜的单糖；(b)使适宜的单糖与微生物系统接触足以将适宜的单糖转化为第一大量生产型化学品的时间，其中微生物系统包含一个或多个编码醛或酮生物合成途径的基因，从而将适宜的单糖转化为第一大量生产型化学品。

在这些和其它相关方面，取决于所用的特定酮或醛生物合成途径，第一大量生产型化学品可进一步酶促和/或化学还原和脱水为第二大量生产型化学品。此类第二大量生产型化学品的实例包括但不限于丁烯或丁烷；1-苯基丁烯或1-苯基丁烷；戊烯或戊烷；2-甲基戊烯或2-甲基戊烷；1-苯基戊烯或1-苯基戊烷；1-苯基-4-甲基戊烯或1-苯基-4-甲基戊烷；己烯或己烷；2-甲基己烯或2-甲基己烷；3-甲基己烯或3-甲基己烷；2，5-二甲基己烯或2，5-二甲基己烯；1-苯基己烯或1-苯基己烷；1-苯基-4-甲基己烯或1-苯基-4-甲基己烷；1-苯基-5-甲基己烯或1-苯基-5-甲基己烷；庚烯或庚烷；2-甲基庚烯或2-甲基庚烷；3-甲基庚烯或3-甲基庚烷；2，6-二甲基庚烯或2，6-二基庚烷；3，6-二甲基庚烯或3，6-二甲基庚烷；3-甲基辛烯或3-甲基辛烷；2-甲基辛烯或2-甲基辛烷；2，6-二甲基辛烯或2，6-二甲基辛烷；2，7-二甲基辛烯或2，7-二甲基辛烷；3，6-二甲基辛烯或3，6-二甲基辛烷；以及环戊烷或环戊烯。

本发明的某些实施方案也可以包括将适宜的单糖或寡糖转化为大量生产型化学品的方法，包括(a)获得适宜的单糖或寡糖；(b)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖或寡糖转化为大量生产型化学品的时间，其中微生物系统包含(i)一个或多个编码生物合成途径的基因；(ii)一个或多个编码和表达C-C连接途径的基因；以及(iii)一个或多个编码和表达还原和脱水途径的基因，其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶，从而将适宜的单糖或寡糖转化为大量生产型化学品。

某些方面也包括重组微生物，其包含(i)一个或多个编码生物合成途径的基因；(ii)一个或多个编码和表达C-C连接途径的基因；以及(iii)一个或多编码和表达还原和脱水途径的基因，其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶。某些方面也包括重组的微生物，其包括单独的或某些组合的上述途径，如包含一个或多个编码生物合成途径的基因的重组微生物，如上文所述。某些方面也可以包括包含本文所述一个或多个编码和表达C-C连接途径的基因的重组微生物。某些方面也可以包括包含一个或多个编码和表达还原和脱水途径的基因的重组微生物，其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶，如本文所述。

对于包含上述途径的组合的重组微生物而言，某些方面也可以包括重组微生物，其包含(i)一个或多个编码生物合成途径的基因；和(ii)一个或多个编码和表达C-C连接途径的基因。某些方面也可以包括重组微生物，其包含(i)一个或多个编码和表达C-C连接途径的基因；和(ii)一个或多个编码和表达还原和脱水途径的基因，其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶。

某些方面也可以包括包含脱水和还原途径的一个或多个单个组分的重组微生物，如包含二醇脱氢酶、二醇脱水酶或次级醇脱氢酶的重组微生物。这些和其它微生物可以用于，例如将适宜的多糖转化为第一大量生产型化学品或其中间物，或将第一大量生产型化学品或其中间物转化为第二大量生产型化学品。

仅以示例的方式，包含C-C连接途径的重组微生物可以用于，将丁醛转化为第一大量生产型化学品或其中间物，如5-羟基-4-辛酮，其通过任何适宜的途径，随后转化为第二大量生产型化学品或其中间物。作为另一个实例，包含C-C连接途径和二醇氢化酶的重组微生物可用于将丁醛依次转化为5-羟基-4-辛酮和随后地4，5-辛酮二醇。包含本文所述单个途径的这些和其它各种组合，以及这些途径的单个组分的各种组合的重组微生物的实例，对本领域技术人员而言是显而易见的，且也可以见于实施例中。

还包括将多糖转化为第一大量生产型化学品或其中间物的方法，其例如利用包含醛或酮生物合成途径的重组微生物。也包括将第一大量生产型化学品或其中间物转化为第二大量生产型化学品的方法，其例如利用任选地包含生物合成途径、任选地包含C-C连接途径和/或任选地包含脱水和还原途径的一个或多个单个组分的重组微生物。仅以示例的方式，包含C-C外源连接酶(如来自荧光假单胞菌的苯甲醛裂解酶)的重组微生物，可用于将第一大量生产型化学品如3-甲基丁醛转化为第二大量生产型化学品如2，7-二甲基-5-羟基-4-辛酮。沿着这一线路的示例说明，包含二醇脱氢酶的相同或不同重组微生物可用于将2，7-二甲基-5-羟基-4-辛酮转化为另一大量生产型化学品如2，7-二甲基-4，5-辛烷二醇的方法(其它实例参阅表2)。作为另一示例性实例，包含外源次级醇脱氢酶的重组微生物可以用于将第一大量生产型化学品如2，7-二甲基-4-辛酮转化为第二大量生产型化学品如2，7-二甲基辛醇的方法。

本申请的微生物系统或分离的微生物的实施方案可以包括天然存在的生物合成途径，和/或已经优化用于改善功能性的工程化的、重新构建的或再设计的生物合成途径。

本发明微生物系统或重组微生物的实施方案可以包括天然或重新构建的生物合成途径，如在诸如丙酮丁醇梭菌(Clostridium acetobutylicum)和天蓝色链霉菌(Streptomyces coelicolor)的微生物中发现的丁醛生物合成途径。作为解说地，丁酸盐和丁醇是诸如梭状芽胞杆菌(Clostridia)的某些细菌种类的常见发酵产物，在这些种类中，丁酸盐和丁醇的产生受合成硫解酶依赖性途径介导，该途径在特征上与脂肪酸降解途径相似。此类途径由两分子的乙酰辅酶A缩合为乙酰乙酰辅酶A启动，其受硫解酶催化。乙酰乙酰辅酶A随后还原为β-羟基丁酰辅酶A，其受NAD(P)H依赖性β-羟基丁酰辅酶A脱氢酶(HBDH)催化。巴豆酸酶催化β-羟基丁酰辅酶A的脱水，形成巴豆酰辅酶A。NADH-依赖性丁酰辅酶A脱氢酶(BCDH)所催化的其它还原反应，使巴豆酰辅酶A的C2的双键饱和，形成丁酰辅酶A。

在某些实施方案中，硫解酶，即该途径中的第一酶，可以过表达，以使产量最大化。在某些实施方案中，硫解酶可以在大肠杆菌中过表达。在这点上，催化下述反应步骤的所有3种酶(如HBDH、巴豆酸酶以及BCDH)见于丙酮丁醇梭菌ATCC824中。在某些实施方案中，BDH、巴豆酸酶以及BCDH可表达或过表达于适宜的微生物如大肠杆菌中。可选地，衍生于恶臭假单胞菌KT2440的短链脂肪族酰基辅酶A脱氢酶可用于本申请的微生物系统或分离的微生物的其它实施方案。

进一步为此目的，通过至少几种不同的途径，可以很容易地将梭状芽胞杆菌的丁酰辅酶A转化为丁醇和/或丁酸盐。在一途径中，经NADH依赖性辅酶A酰化醛脱氢酶(ALDH)所催化，丁酰辅酶A直接还原为丁醛。丁醛经由NADH依赖性丁醇脱氢酶可以进一步还原为丁醇。尽管辅酶A-酰化ALDH催化丁酰辅酶A向丁醛的一步还原，但是因为其混杂的乙酰辅酶A去酰化活性，辅酶A酰化ALDH向微生物系统的并入可以导致乙醛形成。在某些实施方案中，乙醛的形成可以通过再设计相关酶的功能而最小化。

经磷酸丁酰转移酶所催化，在其它生物合成途径中的丁酰辅酶A去酰化，形成磷酸丁酰。磷酸丁酰随后被可逆的磷酸丁酰激酶水解形成丁酸盐。这个反应与由ADP形成ATP偶联。已知通过这些酶的丁酸盐形成显著更特异。某些实施方案可以将磷酸丁酰转移酶和磷酸丁酰激酶包含于微生物系统中。在其它实施方案中，丁酸盐可以通过短链酰基辅酶A硫酯酶由丁酰辅酶A直接形成。

梭状芽胞杆菌中的丁酸盐也可以依次还原为丁醇，其被单个醇/醛脱氢酶催化。某些实施方案可以包含来自诸如恶臭假单胞菌的其它细菌的短链醛脱氢酶，以便补充丁醛在微生物系统中的产生。一个有关使用短链醛脱氢酶的潜在顾虑与由乙酸盐可能形成乙醛有关。某些实施方案可以涉及在微生物系统中使乙酸盐形成最小化，例如通过缺失数个编码与乙酸盐产生有关的酶的基因。

此外，在大肠杆菌中有形成乙酸盐的多种途径，其中之一受丙酮酸盐的丙酮酸加氧酶(POXB)的介导，而另一个受乙酰辅酶A的磷酸转乙酰酶(PTA)和磷酸乙酰激酶(ACKA)的介导。由带有poxB^-、pta^-和acka^-的大肠杆菌突变菌株产生的乙酸显著减少。另外，已知催化由乙酸盐形成乙酰辅酶A的乙酰辅酶A合酶(ACS)的并入显著减少乙酸盐的积聚。某些实施方案可以包含带有POXB、PTA和/或ACKA基因缺失的微生物系统或分离的微生物，其它实施方案也可以单独或与缺失基因一起，包含一个或多个编码和表达ACS的基因。

本文所提供的微生物系统或重组微生物也可以包含戊二醛生物合成途径。作为一实例，酿酒酵母具有赖氨酸生物合成途径，在该途径中，乙酰辅酶A最初缩合为α-酮戊二酸盐(其是柠檬酸循环中常见的代谢物)，以形成高柠檬酸盐(homocitrate)。这个反应被衍生于酵母、嗜热栖热菌(Thermus thermophilus)或耐辐射奇球菌(Deinococcus radiodurans)的高柠檬酸合酶催化。衍生于酵母、嗜热栖热菌或耐辐射奇球菌的高乌头酸酶催化高柠檬酸盐和高异柠檬酸盐间的转化。高异柠檬酸盐随后氧化脱羧形成2-酮己二酸盐，其被衍生于酵母、嗜热栖热菌或耐辐射奇球菌的高异柠檬酸脱氢酶催化。高异柠檬酸盐也氧化脱羧形成丁酰辅酶A，其可以被高异柠檬酸脱氢酶催化。因此，某些实施方案可以包含高柠檬酸合酶、高柠檬酸酶和/或高异柠檬酸脱氢酶。

进一步为此目的，在合成2-酮-脂肪半醛(2-keto-adipicsemialdehyde)时，2-酮己二酸盐还原为2-酮-脂肪半醛。该反应可以被二醛脱氢酶催化，其例如可以分离自根癌农杆菌C58。因此，某些实施方案可以将二醛脱氢酶并入微生物系统或重组的微生物。

在合成戊二醛时，酰基辅酶A硫酯酶(ACOT)也可以催化戊二酰辅酶A的水解。编码ω-羧基酰基辅酶A特异性过氧化物酶ACOTs的基因见于许多哺乳动物物种中；衍生于小鼠的ACOT4和ACOT8两者之前已经表达于大肠杆菌中，并且已表明，这两种酶对戊二酰辅酶A形成戊二酸的水解是高活性的。某些实施方案可以包含一种或多种酰基辅酶A硫酯酶。

戊二酸盐依次还原为戊二醛。这种反应可以被戊二醛脱氢酶(CpnE)催化，该酶可以例如分离自丛毛单胞菌(Comomonas sp.)菌株NCIMB9872。某些实施方案可以将戊二醛脱氢酶如CpnE并入微生物系统或分离的微生物。其它的实施方案可以包含ACOT和CpnE酶两者。其它实施方案可以包含经再设计催化1-羟基丙酸和琥珀酸还原为1-羟基丙醛和丁二醛的CpnE酶。

在某些方面，生物合成途径可以包括醛生物合成途径、酮生物合成途径或两者。在某些方面，生物合成途径可以包括下述中的一个或多个：乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、苯乙醛、2-苯乙醛、2-(4-羟苯基)乙醛、2-吲哚-3-乙醛、戊二醛、5-氨基-戊醛、琥珀酸半醛和/或琥珀酸4-羟苯基乙醛生物合成途径，包括其各种组合。

对于生物合成途径的组合，生物合成途径可以包含与下述至少之一组合的乙醛生物合成途径：丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径。在某些方面，生物合成途径可以包含与丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的丙醛生物合成途径。在某些方面，生物合成途径可以包含与异丁醛、2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的丁醛生物合成途径。在某些方面，生物合成途径可以包含与2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的异丁醛生物合成途径。在某些方面，生物合成途径可以包含与3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的2-甲基-丁醛生物合成途径。在某些方面，生物合成途径可以包含与苯乙醛生物合成途径组合的3-甲基-丁醛生物合成途径。

在某些方面，丙醛生物合成途径可以包含来自诸如大肠杆菌的生物的苏氨酸脱氨酶(ilvA)基因，和来自诸如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)基因，和/或这些酶的功能变体，包括其同源物或直系同源物，以及优化的变体。这些酶通常可以用于将L-苏氨酸转化为丙醛。

在某些方面，丁醛生物合成途径可以包含下述至少之一：来自如大肠杆菌的生物的硫解酶(atoB)基因，来自如丙酮丁醇梭菌(如ATCC 824)的生物的β-羟基丁酰辅酶A脱氢酶(hbd)基因、巴豆酸酶(crt)基因、丁酰辅酶A脱氢酶(bcd)基因、电子转移黄素蛋白A(etfA)基因，和/或电子转移黄素蛋白B(etfB)基因，以及来自诸如拜氏丙酮丁醇梭菌(Clostridiumbeijerinckii acetobutyricum)ATCC 824的生物的辅酶A连接的丁醛脱氢酶(ald)基因。在某些方面，来自诸如丙酮丁醇梭菌ATCC 824的生物的辅酶A连接的醇脱氢酶(adhE2)基因，可以用作ald基因的替代物。

在某些方面，异丁醛生物合成途径可以包含来自如枯草芽孢杆菌的生物的乙酰乳酸合酶(alsS)，或来自如肺炎克雷伯氏菌肺炎亚种MGH78578的生物的als基因(对于大肠杆菌蛋白的表达，可以优化密码子使用)。此类途径也可以包含来自如大肠杆菌的生物的乙酰乳酸还原异构酶(ilvC)和/或2，3-二羟基异戊酸脱水酶(ilvD)基因，以及来自诸如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)基因。

在某些方面，3-甲基丁醛和2-甲基丁醛生物合成途径可以包含来自如枯草芽孢杆菌的生物的乙酰乳酸合酶(alsS)基因，或来自如肺炎克雷伯氏菌肺炎亚种MGH 78578的生物的(als)基因(对于大肠杆菌蛋白的表达，可以优化密码子使用)。此类途径的某些方面还可以包含来自如大肠杆菌的生物的乙酰乳酸还原异构酶(ilvC)、2，3-二羟基异戊酸脱水酶(ilvD)、异丙基苹果酸合酶(LeuA)、异丙基苹果酸异构酶(LeuC和LeuD)和3-异丙基苹果酸脱氢酶(LeuB)基因，以及来自如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)。

在某些方面，苯乙醛和4-羟苯基乙醛生物合成途径可以包括下述一种或多种：来自如大肠杆菌的生物的3-脱氧-7-phosphoheptulonate合酶(aroF、aroG和aroH)、3-脱氢奎尼酸合酶(aroB)、3-脱氢奎尼酸脱水酶(aroD)、脱氢莽草酸还原酶(aroE)、莽草酸激酶II(aroL)、莽草酸激酶I(aroK)、5-烯醇丙酮醛莽草酸-3-磷酸合成酶(aroA)、分支酸合酶(chorismatesynthase)(aroC)、融合的分支酸歧化酶P/预苯酸(prephenate)脱水酶(pheA)和/或融合的分支酸歧化酶T/预苯酸脱氢酶(tyrA)基因，以及来自如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)。

在某些方面，如为1，10-二氨基-5-癸醇和1，10-二羧基-5-癸醇的最终产生，生物合成途径可以包含一种或多种来自如耐辐射奇球菌和/或嗜热栖热菌的生物的高柠檬酸合酶、高乌头酸水合酶、高异柠檬酸脱氢酶和/或高异柠檬酸脱氢酶的基因，以及酮-己二酸脱羧酶基因、2-氨基己二酸转氨酶基因和L-2-氨基己二酸-6-半醛：NAD+6-氧化还原酶基因。此类生物合成途径能将α-酮戊二酸转化为5-氨基戊醛。

在某些方面，如对于环戊醇产生中的一个步骤，α-酮己二酸半醛生物合成途径可以包含来自如耐辐射奇球菌和/或嗜热栖热菌的生物的高柠檬酸合酶(hcs)、高乌头酸水合酶和高异柠檬酸脱氢酶的基因，和α-酮己二酸半醛脱氢酶基因。此类生物合成途径能将乙酰辅酶A和α-酮戊二酸转化为α-酮己二酸半醛。

为了产生某些大量生产型化学品(除了其它相似的化学品外，如2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇)，生物合成途径(如醛生物合成途径)可以任选地或还包含一个或多个编码羧化酶如吲哚-3-丙酮酸脱羧酶(IPDC)的基因。IPDC可以从例如如巴西固氮螺菌(Azospirillumbrasilense)和多粘类芽孢杆菌(Paenibacillus polymyxa)E681的微生物获得。在这点上，IPDC可用于更有效地催化各种羧酸的脱羧化形成相应的醛，其如本文所述，可以通过还原酶或脱氢酶进一步转化为大量生产型化学品。

在某些方面，2-苯基乙醇、2-(4-羟苯基)乙醇以及2-(吲哚-3-)乙醇生物合成途径可以包含来自大肠杆菌的转酮醇酶(tktA)、3-脱氧-7-phosphoheptulonate合酶(aroF、aroG和aroH)、3-脱氢奎尼酸合酶(aroB)、3-脱氢奎尼酸脱水酶(aroD)、脱氢莽草酸还原酶(aroE)、莽草酸激酶II(aroL)、莽草酸激酶I(aroK)、5-醇烯丙酮酸莽草-3-磷酸合成酶(aroA)、分支酸合酶(aroC)、融合的分支酸歧化酶P/预苯酸脱水酶(pheA)以及融合的预苯酸岐化酶T/预苯酸脱氢(tyrA)基因，和来自如乳酸乳球菌的酮-异戊酸脱羧酶(kivd)、来自酿酒酵母的醇脱氢酶(adh2)、来自巴西固氮螺菌的吲哚-3-丙酮酸脱羧酶(ipdc)、来自红球菌(Rhodococcus sp.)ST-10的苯基乙醇还原酶，和来自荧光假单胞菌的苯甲醛裂解(bal)。

对于本文所述的所有其它途径，本文所述的各生物合成途径的组分都可以内源或外源地存在于重组微生物中。为了改善给定生物合成途径的效率，例如可以上调或过表达内源基因，如通过将该内源基因的其它(即外源)拷贝引入重组微生物中。此类途径的优化也可以通过经由诱变改变基因的内源形式以便改善功能性，随后将改变的基因引入微生物。根据本领域已知的或本文所述的技术，可以上调或下调或甚至除去内源基因的表达。相似地，外源所提供的基因的表达水平可以根据需要进行调节，如通过使用各种组成型或诱导型启动子。此类基因可以是“密码子优化的”，如本文所述或本领域已知的。还包括本文所述基因和酶的功能性的天然存在的变体，包括其同源物或直系同源物。

微生物系统或分离的微生物的某些实施方案可以包含CC连接途径。在某些方面，CC连接途径可以包含ThDP依赖性酶，如C-C连接酶，或优化的C-C连接酶。例如，8个碳单位的分子(丁偶姻)可以通过将两个4碳单位分子(丁醛)缩合在一起而制备。ThDP依赖性酶是一组已知催化C-C键的断裂和形成的酶，并且已经在化学酶促合成中用作催化剂。这些酶催化的化学反应谱的范围从α-酮酸脱羧、氧化脱羧、碳连接(carboligation)到C-C键的切割。

为了提供一些实例，来自荧光假单胞菌的苯甲醛裂解酶(BAL)、来自恶臭假单胞菌的苯甲酰甲酸脱羧酶(benzoylformate decarboxylase，BFD)以及来自运动发酵单孢菌的丙酮脱羧酶(PDC)可以催化两个醛之间的碳连接反应。如本文所示，在这三种酶中，BAL接受最广泛谱系的醛作为底物，从取代的苯甲醛到乙醛等。BAL催化两个醛之间的立体专一碳连接反应，并形成具有超过99％eeR构型的α-羟基酮。从两个苯甲醛分子形成二苯乙醇酮是BAL所催化的有利反应，并且所述形成以快至320μmol(二苯乙醇酮)mg(蛋白)^-1分钟^-1的速度进行。α-羟基酮的形成可以利用许多不同的醛包括丁醛进行。

BFD和PCD也可以催化两个醛分子间的碳连接反应。BFD和PCD分别接受相对较大和较小的醛分子。在苯甲醛和乙醛存在的情况下，BFD催化二苯乙醇酮和(S)-α-羟基苯基丙酮(2S-HPP)的形成，而PCD则催化(R)-α-羟基苯基丙酮(2R-HPP)和(R)-α-羟基2-丁酮(乙偶姻)的形成。如下文详细所述，本申请的某些微生物系统或分离的微生物可以包含天然的或优化的C-C连接酶(ThDP-依赖性酶)，其选自来自荧光假单胞菌的苯甲醛裂解酶(BAL)、来自恶臭假单胞菌的苯甲酰甲酸脱羧酶(BFD)以及来自运动发酵单孢菌的丙酮酸脱羧酶(PDC)。其它实施方案可以包含来自荧光假单胞菌的苯甲醛裂解酶(BAL)(参阅SEQ ID NOS：143-144，分别表示核苷酸序列和多肽序列)，包括其生物活性变体，如优化的变体。

本发明的C-C连接途径通常包含一种或多种C-C连接酶，如裂解酶。示例性的裂解酶包括但不限于，乙醛裂解酶、丙醛裂解酶、丁醛裂解酶、异丁醛裂解酶、2-甲基-丁醛裂解酶、3-甲基-丁醛裂解酶(异戊醛)、苯乙醛裂解酶、α-酮己二酸羧基裂解酶、戊醛裂解酶、4-甲基-戊醛裂解酶、己醛裂解酶、庚醛裂解酶、辛醛裂解酶、4-羟苯基乙醛裂解酶、吲哚乙醛裂解酶、吲哚苯乙醛裂解酶。在某些方面，所选的CC-连接酶或裂解酶可以具有一种或多种上文示例性所示的裂解酶活性，如乙醛裂解酶活性、丙醛裂解酶活性、丁醛裂解酶活性和/或异丁醛裂解酶活性等。

如上所述，C-C连接酶可以包含苯甲醛裂解酶，如分离自荧光假单胞菌的苯甲醛裂解酶(SEQ ID NOS：143-144)，以及这种参照序列的生物活性片段或变体，如苯甲醛裂解酶的优化的变体。因此，某些方面可以包含与SEQ ID NOS：143-144具有80％、85％、90％、95％、97％、98％、99％序列同一性的核苷酸序列或多肽序列，且其能催化碳连接反应，或其具有C-C裂解酶活性，如上文所述。在某些方面，BAL酶包含一个或多个保守的氨基酸残基，包括G27、E50、A57、G155、P162、P234、D271、G277、G422、G447、D448和/或G512。

荧光假单胞菌因为其具有利用硫胺二磷酸(ThDP)作为辅因子切割偶姻键的苯甲醛裂解酶，所以能生长于作为唯一碳源和能源的R-二苯乙醇酮上。在逆反应中，如本文所用的，苯甲醛裂解酶以高底物和立体专一性催化两个醛的碳连接。与其它蛋白进行的基于结构的比较表明，苯甲醛裂解酶属于一组密切相关的ThDP依赖性酶。这些酶的ThDP辅因子固定于其单独的结构域的两个末端，从而于它们之间悬浮着相当机动的噻唑环。尽管结合ThDP的两个末端的残基是非常保守的，但是，噻唑部分周围活性中心口袋(pocket)的内衬在基团内有很大变化。BAL的活性位点已有描述，如在Kneen et al.(Biochimica et Biophysica Acta 1753：263-271，2005)和Brandt et al.(Biochemistry 47：7734-43，2008)中。本文已经证明，衍生于荧光假单胞菌的苯甲醛裂解酶至少具有乙醛裂解酶活性、丙醛裂解酶活性、丁醛裂解酶活性、3-甲基-丁醛裂解酶活性、戊醛裂解酶活性、4-甲基戊醛裂解酶活性、己醛裂解酶活性、苯乙醛裂解酶活性以及辛醛裂解酶活性(参阅表2)，除了其它体内裂解酶活性外(参阅图48-55)。

在某些方面，C-C连接酶，如衍生于荧光假单胞菌的BAL、衍生于恶臭假单胞菌的BFD或衍生于运动发酵单孢菌的PDC，可以包含具有裂解酶活性组合的裂解酶，如除其它组合和活性(如本文所详述的示例性组合)外，还具有丙醛裂解酶裂解酶活性和3-甲基-丁醛裂解酶活性两者的连接酶。仅以示例的方式，具有裂解酶活性组合的裂解酶可以在本文中称为丙醛/3-甲基-丁醛裂解酶。

包含二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶的脱水和还原途径可以用于进一步将醛、酮或相应的醇转化为大量生产型化学品，如生物燃料。

为此，脱水和还原途径可以包含一种或多种二醇脱氢酶。“二醇脱氢酶”通常指催化α-羟基酮和/或其相应的二醇的可逆还原和氧化反应的酶。微生物系统或分离的微生物的某些实施方案可以包含编码二醇脱氢酶的基因，该二醇脱氢酶特异性地催化α-羟基-酮的还原，包括例如4，5，辛二醇脱氢酶。二醇脱氢酶，如4，5，辛二醇脱氢酶，可从多种生物分离，和并入微生物系统或分离的微生物。一组特定的醇脱氢酶具有氧化各种α-羟基醇并还原各种α-羟基酮和α-酮基酮的特征性能力。因此，“二醇脱氢酶”这一叙述还可以包括此类醇脱氢酶。

以有关来自示例性生物的二醇脱氢酶为例，分离自Hansenulaofunaensis的甘油脱氢酶具有广泛的底物特异性，并能以与其天然底物分别地甘油和二羟丙酮相媲美的活性(40-200％)，催化各种α-羟基醇包括1，2-辛烷的氧化，以及各种α-羟基酮和α-酮基酮包括3-羟基-2-丁酮和3，4-己二酮的还原。作为一其它实例，在多型汉逊酵母(Hansenulapolumorpha)DI-1中所发现的甘油脱氢酶起相似的作用。在某些实施方案中，微生物系统或重组的微生物可以包含分离自多型汉逊酵母的甘油脱氢酶基因，分离自多型汉逊酵母DI-1的甘油脱氢酶和/或来自肺炎克雷伯氏菌的内消旋-2，3-丁烷二醇脱氢酶。在其它实施方案中，除了本文详述的其它外，微生物系统或分离的微生物可以包含4，5，辛二醇脱氢酶。二醇脱氢酶也可以从短乳杆菌ATCC 367、恶臭假单胞菌KT2440以及肺炎克雷伯氏菌MGH78578获得，如本文所述(参阅实施例5)。

示例性的二醇脱氢酶包括但不限于：2，3-丁二醇脱氢酶、3，4-己二醇脱氢酶、4，5-辛二醇脱氢酶、5，6-癸二醇脱氢酶、6，7-十二烷二醇脱氢酶、7，8-十四烷二醇脱氢酶、8，9-十六烷二醇脱氢酶、2，5-二甲基-3，4-己二醇脱氢酶、3，6-二甲基-4，5-辛二醇脱氢酶、2，7-二甲基-4，5-辛二醇脱氢酶、2，9-二甲基-5，6-癸二醇脱氢酶、1，4-二苯基-2，3-丁二醇脱氢酶、二-1，4-(4-羟苯基)-2，3-丁二醇脱氢酶、1，4-二吲哚-2，3-丁二醇脱氢酶、1，2-环戊二醇脱氢酶、2，3-戊二醇脱氢酶、2，3-己二醇脱氢酶、2，3-庚二醇脱氢酶、2，3-辛二醇脱氢酶、2，3-壬二醇脱氢酶、4-甲基-2，3-戊二醇脱氢酶、4-甲基-2，3-己二醇脱氢酶、5-甲基-2，3-己二醇脱氢酶、6-甲基-2，3-庚二醇脱氢酶、1-苯基-2，3-丁二醇脱氢酶、1-(4-羟苯基)-2，3-丁二醇脱氢酶、1-吲哚-2，3-丁二醇脱氢酶、3，4-庚二醇脱氢酶、3，4-辛二醇脱氢酶、3，4-壬二醇脱氢酶、3，4-癸二醇脱氢酶、3，4-十一烷二醇脱氢酶、2-甲基-3，4-己二醇脱氢酶、5-甲基-3，4-庚二醇脱氢酶、6-甲基-3，4-庚二醇脱氢酶、7-甲基-3，4-辛二醇脱氢酶、1-苯基-2，3-戊二醇脱氢酶、1-(4-羟苯基)-2，3-戊二醇脱氢酶、1-吲哚-2，3-戊二醇脱氢酶、4，5-壬二醇脱氢酶、4，5-癸二醇脱氢酶、4，5-十一烷二醇脱氢酶、4，5-十二烷二醇脱氢酶、2-甲基-3，4-庚二醇脱氢酶、3-甲基-4，5-辛二醇脱氢酶、2-甲基-4，5-辛二醇脱氢酶、8-甲基-4，5-壬二醇脱氢酶、1-苯基-2，3-己二醇脱氢酶、1-(4-羟苯基)-2，3-己二醇脱氢酶、1-吲哚-2，3-己二醇脱氢酶、5，6-十一烷二醇脱氢酶、5，6-十一烷二醇脱氢酶、5，6-十三烷二醇脱氢酶、2-甲基-3，4-辛二醇脱氢酶、3-甲基-4，5-壬二醇脱氢酶、2-甲基-4，5-壬二醇脱氢酶、2-甲基-5，6-癸二醇脱氢酶、1-苯基-2，3-庚二醇脱氢酶、1-(4-羟苯基)-2，3-庚二醇脱氢酶、1-吲哚-2，3-庚二醇脱氢酶、6，7-十三烷二醇脱氢酶、6，7-十四烷二醇脱氢酶、2-甲基-3，4-壬二醇脱氢酶、3-甲基-4，5-癸二醇脱氢酶、2-甲基-4，5-癸二醇脱氢酶、2-甲基-5，6-十一烷二醇脱氢酶、1-苯基-2，3-辛二醇脱氢酶、1-(4-羟苯基)-2，3-辛二醇脱氢酶、1-吲哚-2，3-辛二醇脱氢酶、7，8-十五烷二醇脱氢酶、2-甲基-3，4-癸二醇脱氢酶、3-甲基-4，5-十一烷二醇脱氢酶、2-甲基-4，5-十一烷二醇脱氢酶、2-甲基-5，6-十二烷二醇脱氢酶、1-苯基-2，3-壬二醇脱氢酶、1-(4-羟苯基)-2，3-壬二醇脱氢酶、1-吲哚-2，3-壬二醇脱氢酶、2-甲基-3，4-十一烷二醇脱氢酶、3-甲基-4，5-十二烷二醇脱氢酶、2-甲基-4，5-十二烷二醇脱氢酶、2-甲基-5，6-十三烷二醇脱氢酶、1-苯基-2，3-癸二醇脱氢酶、1-(4-羟苯基)-2，3-癸二醇脱氢酶、1-吲哚-2，3-癸二醇脱氢酶、2，5-二甲基-3，4-庚二醇脱氢酶、2，6-二甲基-3，4-庚二醇脱氢酶、2，7-二甲基-3，4-辛二醇脱氢酶、1-苯基-4-甲基-2，3-戊二醇脱氢酶、1-(4-羟苯基)-4-甲基-2，3-戊二醇脱氢酶、1-吲哚-4-甲基-2，3-戊二醇脱氢酶、2，6-二甲基-4，5-辛二醇脱氢酶、3，8-二甲基-4，5-壬二醇脱氢酶、1-苯基-4-甲基-2，3-己二醇脱氢酶、1-(4-羟苯基)-4-甲基-2，3-己二醇脱氢酶、1-吲哚-4-甲基-2，3-己二醇脱氢酶、2，8-二甲基-4，5-壬二醇脱氢酶、1-苯基-5-甲基-2，3-己二醇脱氢酶、1-(4-羟苯基)-5-甲基-2，3-己二醇脱氢酶、1-吲哚-5-甲基-2，3-己二醇脱氢酶、1-苯基-6-甲基-2，3-庚二醇脱氢酶、1-(4-羟苯基)-6-甲基-2，3-庚二醇脱氢酶、1-吲哚-6-甲基-2，3-庚二醇脱氢酶、1-(4-羟苯基)-4-苯基-2，3-丁二醇脱氢酶、1-吲哚-4-苯基-2，3-丁二醇脱氢酶、1-吲哚-4-(4-羟苯基)-2，3-丁二醇脱氢酶、1，10-二氨基-5，6-癸二醇脱氢酶、1，4-二(4-羟苯基)-2，3-丁二醇、2，3-己二醇-1，6-二羧酸脱氢酶等。

在某些方面，所选的二醇脱氢酶可以具有一种或多种以上示例性示出的二醇脱氢酶活性，如2，3-丁二醇脱氢酶活性、3，4-己二醇脱氢酶活性和/或4，5-辛二醇脱氢酶活性等。

在某些方面，重组微生物可以包含选自SEQ ID NO：97，99和101的核苷酸参照序列所编码的二醇脱氢酶，或具有选自SEQ ID NO：98、100和102的多肽序列的酶，包括其生物活性片段或变体，如优化的变体。某些方面也可以包含与SEQ ID NOS：97-102具有80％、85％、90％、95％、97％、98％、99％序列同一性的核苷酸序列或多肽序列。

其它实施方案可以包含再设计的二醇脱氢酶，用于将1-羟基丙醛、丁二醛和戊二醛分别还原为1，3-丙二醇、1，4-丁二醇和1，5戊二醇等。

本文所述的脱水和还原途径可以包含一种或多种二醇脱水酶。“二醇脱水酶”通常指催化不可逆的二醇脱水的酶。例如，这种酶可以用于使辛二醇脱水，形成4-辛烷。已认识到，存在至少两种不同类型的二醇脱水酶：对于其催化作用，一种依赖于辅酶B12，另一种不依赖于辅酶B12。辅酶B12依赖性二醇脱水酶已知催化由α-羟基醇至醛或酮的基团介导的脱水反应。例如，来自肺炎克雷伯氏菌的二醇脱水酶催化甘油的脱水，形成β-羟丙基醛，接受2，3-丁二醇作为底物，并催化脱水反应形成2-丁酮。

作为另一实例，肉毒梭菌(Clostridium butylicum)含有不依赖辅酶B12的二醇脱水酶。图46表示分离自肉毒梭菌的不依赖辅酶B12的二醇脱水酶(dhaB1)和激活剂(dhaB2)的体内生物活性(参阅实施例9)。图46A表示由1，2-丙二醇体内产生1-丙醇，图46B表示内消旋-2，3丁二醇体内产生2-丁醇，以及图46C表示由反式-1，2-环戊二醇体内产生环戊酮。

因此，本发明的某些实施方案可以包含优化的或再设计的二醇脱水酶，其容纳各种底物，如4，5-辛二醇作为底物，且可以包括分离和/或优化自肺炎克雷伯氏菌和肉毒梭菌(除了本文所述和本领域已知的生物外)的二醇脱水酶。

示例性二醇脱水酶包括但不限于：2，3-丁二醇脱水酶、3，4-己二醇脱水酶、4，5-辛二醇脱水酶、5，6-癸二醇脱水酶、6，7-十二烷二醇脱水酶、7，8-十四烷二醇脱水酶、8，9-十六烷二醇脱水酶、2，5-二甲基-3，4-己二醇脱水酶、3，6-二甲基-4，5-辛二醇脱水酶、2，7-二甲基-4，5-辛二醇脱水酶、2，9-二甲基-5，6-癸二醇脱水酶、1，4-二苯基-2，3-丁二醇脱水酶、二-1，4-(4-羟苯基)-2，3-丁二醇脱水酶、1，4-二吲哚-2，3-丁二醇脱水酶、1，2-环戊二醇脱水酶、2，3-戊二醇脱水酶、2，3-己二醇脱水酶、2，3-庚二醇脱水酶、2，3-辛二醇脱水酶、2，3-壬二醇脱水酶、4-甲基-2，3-戊二醇脱水酶、4-甲基-2，3-己二醇脱水酶、5-甲基-2，3-己二醇脱水酶、6-甲基-2，3-庚二醇脱水酶、1-苯基-2，3-丁二醇脱水酶、1-(4-羟苯基)-2，3-丁二醇脱水酶、1-吲哚-2，3-丁二醇脱水酶、3，4-庚二醇脱水酶、3，4-辛二醇脱水酶、3，4-壬二醇脱水酶、3，4-癸二醇脱水酶、3，4-十一烷二醇脱水酶、2-甲基-3，4-己二醇脱水酶、5-甲基-3，4-庚二醇脱水酶、6-甲基-3，4-庚二醇脱水酶、7-甲基-3，4-辛二醇脱水酶、1-苯基-2，3-戊二醇脱水酶、1-(4-羟苯基)-2，3-戊二醇脱水酶、1-吲哚-2，3-戊二醇脱水酶、4，5-壬二醇脱水酶、4，5-癸二醇脱水酶、4，5-十一烷二醇脱水酶、4，5-十二烷二醇脱水酶、2-甲基-3，4-庚二醇脱水酶、3-甲基-4，5-辛二醇脱水酶、2-甲基-4，5-辛二醇脱水酶、8-甲基-4，5-壬二醇脱水酶、1-苯基-2，3-己二醇脱水酶、1-(4-羟苯基)-2，3-己二醇脱水酶、1-吲哚-2，3-己二醇脱水酶、5，6-十一烷二醇脱水酶、5，6-十一烷二醇脱水酶、5，6-十三烷二醇脱水酶、2-甲基-3，4-辛二醇脱水酶、3-甲基-4，5-壬二醇脱水酶、2-甲基-4，5-壬二醇脱水酶、2-甲基-5，6-癸二醇脱水酶、1-苯基-2，3-庚二醇脱水酶、1-(4-羟苯基)-2，3-庚二醇脱水酶、1-吲哚-2，3-庚二醇脱水酶、6，7-十三烷二醇脱水酶、6，7-十四烷二醇脱水酶、2-甲基-3，4-壬二醇脱水酶、3-甲基-4，5-癸二醇脱水酶、2-甲基-4，5-癸二醇脱水酶、2-甲基-5，6-十一烷二醇脱水酶、1-苯基-2，3-辛二醇脱水酶、1-(4-羟苯基)-2，3-辛二醇脱水酶、1-吲哚-2，3-辛二醇脱水酶、7，8-十五烷二醇脱水酶、2-甲基-3，4-癸二醇脱水酶、3-甲基-4，5-十一烷二醇脱水酶、2-甲基-4，5-十一烷二醇脱水酶、2-甲基-5，6-十二烷二醇脱水酶、1-苯基-2，3-壬二醇脱水酶、1-(4-羟苯基)-2，3-壬二醇脱水酶、1-吲哚-2，3-壬二醇脱水酶、2-甲基-3，4-十一烷二醇脱水酶、3-甲基-4，5-十二烷二醇脱水酶、2-甲基-4，5-十二烷二醇脱水酶、2-甲基-5，6-十三烷二醇脱水酶、1-苯基-2，3-癸二醇脱水酶、1-(4-羟苯基)-2，3-癸二醇脱水酶、1-吲哚-2，3-癸二醇脱水酶、2，5-二甲基-3，4-庚二醇脱水酶、2，6-二甲基-3，4-庚二醇脱水酶、2，7-二甲基-3，4-辛二醇脱水酶、1-苯基-4-甲基-2，3-戊二醇脱水酶、1-(4-羟苯基)-4-甲基-2，3-戊二醇脱水酶、1-吲哚-4-甲基-2，3-戊二醇脱水酶、2，6-二甲基-4，5-辛二醇脱水酶、3，8-二甲基-4，5-壬二醇脱水酶、1-苯基-4-甲基-2，3-己二醇脱水酶、1-(4-羟苯基)-4-甲基-2，3-己二醇脱水酶、1-吲哚-4-甲基-2，3-己二醇脱水酶、2，8-二甲基-4，5-壬二醇脱水酶、1-苯基-5-甲基-2，3-己二醇脱水酶、1-(4-羟苯基)-5-甲基-2，3-己二醇脱水酶、1-吲哚-5-甲基-2，3-己二醇脱水酶、1-苯基-6-甲基-2，3-庚二醇脱水酶、1-(4-羟苯基)-6-甲基-2，3-庚二醇脱水酶、1-吲哚-6-甲基-2，3-庚二醇脱水酶、1-(4-羟苯基)-4-苯基-2，3-丁二醇脱水酶、1-吲哚-4-苯基-2，3-丁二醇脱水酶、1-吲哚-4-(4-羟苯基)-2，3-丁二醇脱水酶、1，10-二氨基-5，6-癸二醇脱水酶、1，4-二(4-羟苯基)-2，3-丁二醇、2，3-己二醇-1，6-二羧酸脱水酶等。

在某些方面，所选的二醇脱水酶可以具有一种或多种以上示例性示出的二醇脱水酶活性，如2，3-丁二醇脱水酶活性、3，4-己二醇脱水酶活性和/或4，5-辛二醇脱水酶活性等。

在某些方面，二醇脱水酶可以从肺炎克雷伯氏菌MGH 78578获得，包括从这种或其它微生物的pduCDE基因获得。在某些方面，重组微生物可以包含一种或多种选自SEQ ID NO：103、105以及107的核苷酸参照序列所编码的二醇脱水酶，或具有选自SEQ ID NO：104、106以及108的多肽序列的酶，包括其生物活性片段或变体，如优化的变体。某些方面也可以包含与SEQ ID NOS：103-108具有80％、85％、90％、95％、97％、98％、99％序列同一性的核苷酸序列或多肽序列。在某些方面，SEQ IDNO：104的多肽可以包含某些保守的氨基酸残基，包括选自下述的保守氨基酸残基：D149、P151、A155、A159、G165、E168、E170、A183、G189、G196、Q200、E208、G215、Y219、E221、T222、S224、Y226、G227、T228、F232、G235、D236、D237、T238、P239、S241、L245、Y249、S251、R252、G253、K255、R257、S260、E265、M268、G269、S275、Y278、L279、E280、C283、G291、Q293、G294、Q296、N297、G298、G312、E329、S341、R344、G356、D371、N372、F374、S377、R392、D393、R412、L477、A486、G499、D500、S516、N522、D523、Y524、G526以及G530.

在某些方面，二醇脱水酶可以包括多肽，所述多肽包含与SEQ IDNOS：308-311具有0％、85％、90％、95％、97％、98％、99％序列同一性的氨基酸序列。SEQ ID NO：308表示PduG的多肽序列，即衍生于肺炎克雷伯氏菌肺炎亚种MGH 78578的二醇脱水酶再激活大亚基。SEQ IDNO：309表示PduH的多肽序列，即衍生于肺炎克雷伯氏菌肺炎亚种MGH78578的二醇脱水酶再激活小亚基。SEQ ID NO：310表示来自丁酸梭菌的不依赖B12的甘油脱水酶的多肽序列。SEQ ID NO：311表示来自丁酸梭菌的甘油脱水酶激活剂的多肽序列。在某些方面，不依赖B12的甘油脱水酶可以包含保守的氨基酸残基，如T36、G74、P87、E88、E97、W126、R221、A263、Q265、R287、D289、E309、R317、G335、G345、G346、N356、P374、R379、G399、G401、P403、D408、G432、C433、N452、C529、G533、G539、G540、S559、G603、N604、A654、G658、R659、D676、N702、Q735、N737、A747、P751、R760、V761、A762、G763、Q776、I780和/或R782。在某些方面，不依赖B12的甘油脱水酶激活剂可以包含某些保守的氨基酸残基，包括D19、G20、G22、R24、F28、G31、C32、C36、W38、C39、N41、P42、C58、C64、C96、G129、T132、G135、G136、D185、R187、N208、R222和/或R264。

本文所述的脱水和还原途径可以包含一种或多种醇脱氢酶或次级醇脱氢酶。作为脱水和还原途径中一部分的“醇脱氢酶”或“次级醇脱氢酶”通常指催化醛或酮取代基转化为醇的酶。例如，4-辛酮可以被次级醇脱氢酶一酶促步骤还原为4-辛醇，其用于将丁偶姻转化为生物燃料。假单胞菌表达至少一种次级醇脱氢酶，其利用NAD+作为辅因子，将4-辛醇氧化为4-辛酮。作为另一实例，红平红球菌(Rhodococcus erythropolis)ATCC4277利用NADH作为辅因子，利用也催化3-癸醇和4-癸醇氧化的酶，催化中到长链次级脂肪醇的氧化。另外，褐色诺卡氏菌(Norcadia fusca)AKU2123含有(S)-特异性次级醇脱氢酶。

编码次级醇脱氢酶的基因可以根据本领域已知的技术从这些和其它生物分离，并且并入本文所述的微生物系统或重组微生物中。在某些实施方案中，微生物系统或分离的微生物可以包含来自假单胞菌(Pseudomonads)、红平红球菌ATCC4277、褐色诺卡氏菌AKU2123或其它适宜的生物的天然或优化的次级醇脱氢酶。

次级醇脱氢酶的实例包括但不限于2-丁醇脱氢酶、3-己醇脱氢酶、4-辛醇脱氢酶、5-癸醇脱氢酶、6-十二烷醇脱氢酶、7-十四烷醇脱氢酶、8-十六烷醇脱氢酶、2，5-二甲基-3-己醇脱氢酶、3，6-二甲基-4-辛醇脱氢酶、2，7-二甲基-4-辛醇脱氢酶、2，9-二甲基-4-癸醇脱氢酶、1，4-二苯基-2-丁醇脱氢酶、二-1，4-(4-羟苯基)-2-丁醇脱氢酶、1，4-二吲哚-2-丁醇脱氢酶、环戊醇脱氢酶、2(或3)-戊醇脱氢酶、2(或3)-己醇脱氢酶、2(或3)-庚醇脱氢酶、2(或3)-辛醇脱氢酶、2(或3)-壬醇脱氢酶、4-甲基-2(或3)-戊醇脱氢酶、4-甲基-2(或3)-己醇脱氢酶、5-甲基-2(或3)-己醇脱氢酶、6-甲基-2(或3)-庚醇脱氢酶、1-苯基-2(或3)-丁醇脱氢酶、1-(4-羟苯基)-2(或3)-丁醇脱氢酶、1-吲哚-2(或3)-丁醇脱氢酶、3(或4)-庚醇脱氢酶、3(或4)-辛醇脱氢酶、3(或4)-壬醇脱氢酶、3(或4)-癸醇脱氢酶、3(或4)-十一烷醇脱氢酶、2-甲基-3(或4)-己醇脱氢酶、5-甲基-3(或4)-庚醇脱氢酶、6-甲基-3(或4)-庚醇脱氢酶、7-甲基-3(或4)-辛醇脱氢酶、1-苯基-2(或3)-戊醇脱氢酶、1-(4-羟苯基)-2(或3)-戊醇脱氢酶、1-吲哚-2(或3)-戊醇脱氢酶、4(或5)-壬醇脱氢酶、4(或5)-癸醇脱氢酶、4(或5)-十一烷醇脱氢酶、4(或5)-十二烷醇脱氢酶、2-甲基-3(或4)-庚醇脱氢酶、3-甲基-4(或5)-辛醇脱氢酶、2-甲基-4(或5)-辛醇脱氢酶、8-甲基-4(或5)-壬醇脱氢酶、1-苯基-2(或3)-己醇脱氢酶、1-(4-羟苯基)-2(或3)-己醇脱氢酶、1-吲哚-2(或3)-己醇脱氢酶、4(或5)-十一烷醇脱氢酶、5(或6)-十一烷醇脱氢酶、5(或6)-十三烷醇脱氢酶、2-甲基-3(或4)-辛醇脱氢酶、3-甲基-4(或5)-壬醇脱氢酶、2-甲基-4(或5)-壬醇脱氢酶、2-甲基-5(或6)-癸醇脱氢酶、1-苯基-2(或3)-庚醇脱氢酶、1-(4-羟苯基)-2(或3)-庚醇脱氢酶、1-吲哚-2(或3)-庚醇脱氢酶、6(或7)-十三烷醇脱氢酶、6(或7)-十四烷醇脱氢酶、2-甲基-3(或4)-壬醇脱氢酶、3-甲基-4(或5)-癸醇脱氢酶、2-甲基-4(或5)-癸醇脱氢酶、2-甲基-5(或6)-十一烷醇脱氢酶、1-苯基-2(或3)-辛醇脱氢酶、1-(4-羟苯基)-2(或3)-辛醇脱氢酶、1-吲哚-2(或3)-辛醇脱氢酶、7(或8)-十五烷醇脱氢酶、2-甲基-3(或4)-癸醇脱氢酶、3-甲基-4(或5)-十一烷醇脱氢酶、2-甲基-4(或5)-十一烷醇脱氢酶、2-甲基-5(或6)-十二烷醇脱氢酶、1-苯基-2(或3)-壬醇脱氢酶、1-(4-羟苯基)-2(或3)-壬醇脱氢酶、1-吲哚-2(或3)-壬醇脱氢酶、2-甲基-3(或4)-十一烷醇脱氢酶、3-甲基-4(或5)-十二烷醇脱氢酶、2-甲基-4(或5)-十二烷醇脱氢酶、2-甲基-5(或6)-十三烷醇脱氢酶、1-苯基-2(或3)-癸醇脱氢酶、1-(4-羟苯基)-2(或3)-癸醇脱氢酶、1-吲哚-2(或3)-癸醇脱氢酶、2，5-二甲基-3(或4)-庚醇脱氢酶、2，6-二甲基-3(或4)-庚醇脱氢酶、2，7-二甲基-3(或4)-辛醇脱氢酶、1-苯基-4-甲基-2(或3)-戊醇脱氢酶、1-(4-羟苯基)-4-甲基-2(或3)-戊醇脱氢酶、1-吲哚-4-甲基-2(或3)-戊醇脱氢酶、2，6-二甲基-4(或5)-辛醇脱氢酶、3，8-二甲基-4(或5)-壬醇脱氢酶、1-苯基-4-甲基-2(或3)-己醇脱氢酶、1-(4-羟苯基)-4-甲基-2(或3)-己醇脱氢酶、1-吲哚-4-甲基-2(或3)-己醇脱氢酶、2，8-二甲基-4(或5)-壬醇脱氢酶、1-苯基-5-甲基-2(或3)-己醇脱氢酶、1-(4-羟苯基)-5-甲基-2(或3)-己醇脱氢酶、1-吲哚-5-甲基-2(或3)-己醇脱氢酶、1-苯基-6-甲基-2(或3)-庚醇脱氢酶、1-(4-羟苯基)-6-甲基-2(或3)-庚醇脱氢酶、1-吲哚-6-甲基-2(或3)-庚醇脱氢酶、1-(4-羟苯基)-4-苯基-2(或3)-丁醇脱氢酶、1-吲哚-4-苯基-2(或3)-丁醇脱氢酶、1-吲哚-4-(4-羟苯基)-2(或3)-丁醇脱氢酶、1，10-二氨基-5-癸醇脱氢酶、1，4-二(4-羟苯基)-2-丁醇脱氢酶、2-己醇-1，6-二羧酸脱氢酶、苯基乙醇脱氢酶、4-羟苯基乙醇脱氢酶、吲哚-3-乙醇脱氢酶等。

在某些方面，所选的醇脱氢酶或次级醇脱氢酶可以具有一种或多种以上示例性示出的醇脱氢酶活性，如2-丁醇脱氢酶活性、3-己醇脱氢酶活性和/或4-辛醇脱氢酶活性等。

在某些方面，重组微生物可以包含选自SEQ ID NO：109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139以及141的核苷酸参照序列所编码的一种或多种次级醇脱氢酶，或具有选自SEQ ID NO：110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140以及142的多肽序列的酶，包括其生物活性片段或变体，如优化的变体。某些方面也可以包含与SEQ IDNOS：109-142具有80％、85％、90％、95％、97％、98％、99％序列同一性的核苷酸序列或多肽序列。

对于上文所涉及的次级醇脱氢酶序列，SEQ ID NO：109是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-1：PP_1946)的核苷酸序列，SEQ ID NO：110是其多肽序列。SEQ ID NO：111是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-2：PP_1817)的核苷酸序列，SEQ ID NO：112是其多肽序列。

SEQ ID NO：113是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-3：PP_1953)的核苷酸序列，SEQ ID NO：114是其多肽序列。SEQ IDNO：115是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-4：PP_3037)的核苷酸序列，SEQ ID NO：116是其多肽序列。

SEQ ID NO：117是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-5：PP_1852)的核苷酸序列，SEQ ID NO：118是其多肽序列。SEQ IDNO：119是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-6：PP_2723)的核苷酸序列，SEQ ID NO：120是其多肽序列。

SEQ ID NO：121是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-7：PP_2002)的核苷酸序列，SEQ ID NO：122是其多肽序列。SEQ IDNO：123是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-8：PP_1914)的核苷酸序列，SEQ ID NO：124是其多肽序列。

SEQ ID NO：125是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-9：PP_1914)的核苷酸序列，SEQ ID NO：126是其多肽序列。SEQ IDNO：127分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-10：PP_3926)的核苷酸序列，SEQ ID NO：128是其多肽序列。

SEQ ID NO：129是分离自荧光假单胞菌Pf-5的次级醇脱氢酶(2adh-11：PFL_1756)的核苷酸序列，SEQ ID NO：130是其多肽序列。SEQID NO：131是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-12：KPN_01694)的核苷酸序列，SEQ ID NO：132是其多肽序列。

SEQ ID NO：133是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-13：KPN_02061)的核苷酸序列，SEQ ID NO：134是其多肽序列。SEQ ID NO：135是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-14：KPN_00827)的核苷酸序列，SEQ ID NO：136是其多肽序列。

SEQ ID NO：137是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-16：KPN_01350)的核苷酸序列，SEQ ID NO：138是其多肽序列。SEQ ID NO：139是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-17：KPN_03369)的核苷酸序列，SEQ ID NO：140是其多肽序列。SEQ ID NO：141是分离自肺炎克雷伯氏菌肺炎亚种MGH78578的次级醇脱氢酶(2adh-18：KPN_03363)的核苷酸序列，SEQ IDNO：142是其多肽序列。

在某些方面，醇脱氢酶(如DEHU氢化酶)、次级醇脱氢酶(2ADH)，其片段、变体或衍生物，或利用此类活性位点的任何其它酶，可以包含以下至少之一：烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸(NADP+)或NADPH结合基序。在某些实施方案中，NAD+、NADH、NADP+或NADPH结合基序可以选自Y-X-G-G-X-Y、Y-X-X-G-G-X-Y、Y-X-X-X-G-G-X-Y、Y-X-G-X-X-Y、Y-X-X-G-G-X-X-Y、Y-X-X-X-G-X-X-Y、Y-X-G-X-Y、Y-X-X-G-X-Y、Y-X-X-X-G-X-Y以及Y-X-X-X-X-G-X-Y；其中Y独立地选自丙氨酸、甘氨酸以及丝氨酸，其中G是甘氨酸，且其中X独立地选自遗传编码的氨基酸。

作为还原和脱水途径中步骤的一实例，α-羟基环戊酮可以还原为1，2-环戊二醇。例如，分离自Hansenula ofunaensis的甘油脱氢酶有利于α-羟基酮和α-酮基酮的还原，且具有广泛的底物特异性。衍生于多型汉逊酵母的类似的醇脱氢酶和内消旋-2，3-丁二醇脱氢酶具有类似特性。某些实施方案可以将1，2-环戊二醇脱氢酶并入微生物系统或分离的微生物。其它实施方案可以并入来自Hansenula ofunaensis、多型汉逊酵母、肺炎克雷伯氏菌或任何其它适宜生物的甘油脱氢酶。

通过实例的方式，作为还原和脱水途径中的一酶促步骤，化学品或烃，如1，2-环戊二醇，可以脱水形成环戊酮。存在至少两种不同类型的催化化学品如1，2-环戊二醇的脱水反应的二醇脱水酶。包含还原和脱水途径的微生物系统的某些实施方案包含二醇脱水酶，如1，2-环戊二醇脱水酶。

在还原和脱水途径的最后酶促步骤中，此类示例性化学品如α-羟基环戊酮至环戊醇的转化，可以包括环戊酮还原为环戊醇。这个步骤可以为环戊醇脱氢酶催化，其见于丛毛单菌(Comomonas sp.)菌株NCIMB9872，并且已经分离了其基因(cpnA)。微生物系统或分离的微生物的某些实施方案可以包含环戊醇脱氢酶，除了本文所述的其它之外，诸如丛毛单菌菌株NCIMB 9872的cpnA所表达的环戊醇脱氢酶。

如下文所详述的，在某些实施方案中，所选的C-C连接途径可与还原和脱水途径的所选组分或酶组合使用，产生大量生产型化学品或其中间物。

例如，某些实施方案包括方法，其中C-C连接途径可以包含乙醛裂解酶，其中还原和脱水途径可以包含2，3-丁二醇脱氢酶、2，3-丁二醇脱水酶以及2-丁醇脱氢酶中至少之一。其它实施方案可以包括方法，其中C-C连接途径可以包含丙醛裂解酶，且其中还原和脱水途径可以包含3，4-己二醇脱氢酶、3，4-己二醇脱水酶以及3-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛裂解酶，且其中还原和脱水途径可以包含4，5-辛二醇脱氢酶、4，5-辛二醇脱水酶以及4-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛裂解酶，且其中还原和脱水途径可以包含5，6-癸二醇脱氢酶、5，6-癸二醇脱水酶以及5-癸醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛裂解酶，且其中还原和脱水途径包含6，7-十二烷二醇脱氢酶、6，7-十二烷二醇脱水酶以及6-十二烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛裂解酶，且其中还原和脱水途径可以包含7，8-十四烷二醇脱氢酶、7，8-十四烷二醇脱水酶以及7-十四烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛裂解酶，且其中还原和脱水途径可以包含8，9-十六烷二醇脱氢酶、8，9-十六烷二醇脱水酶以及8-十六烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含异丁醛裂解酶，且其中还原和脱水途径可以包含2，5-二甲基-3，4-己二醇脱氢酶、2，5-二甲基-3，4-己二醇脱水酶以及2，5-二甲基-3-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含2-甲基-丁醛裂解酶，且其中还原和脱水途径可以包含3，6-二甲基-4，5-辛二醇脱氢酶、3，6-二甲基-4，5-辛二醇脱水酶以及3，6-二甲基-4-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含3-甲基-丁醛裂解酶，且其中还原和脱水途径可以包含2，7-二甲基-4，5-辛二醇脱氢酶、2，7-二甲基-4，5-辛二醇脱水酶以及2，7-二甲基-4-辛醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含3-甲基-丁醛裂解酶，且其中还原和脱水途径可以包含2，9-二甲基-5，6-癸二醇脱氢酶、2，9-二甲基-4，5-癸二醇脱水酶以及2，9-二甲基-4-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含苯乙醛裂解酶，且其中还原和脱水途径可以包含1，4-二苯基-2，3-丁二醇脱氢酶、1，4-二苯基-2，3-丁二醇脱水酶以及1，4-二苯基-2-丁醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含苯乙醛裂解酶，且其中还原和脱水途径可以包含二-1，4-(4-羟苯基)-2，3-丁二醇脱氢酶、二-1，4-(4-羟苯基)-2，3-丁二醇脱水酶以及二-1，4-(4-羟苯基)-2-丁醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含苯乙醛裂解酶，且其中还原和脱水途径可以包含1，4-二吲哚-2，3-丁二醇脱氢酶、1，4-二吲哚-2，3-丁二醇脱水酶以及1，4-二吲哚-2-丁醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含α-酮己二酸羧基裂解酶，且其中还原和脱水途径可以包含1，2-环戊二醇脱氢酶、1，2-环戊二醇脱水酶以及环戊醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含乙醛/丙醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，3-戊二醇脱氢酶、2，3-戊二醇脱水酶以及2(或3)-戊醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含乙醛/丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，3-己二醇脱氢酶、2，3-己二醇脱水酶以及2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含乙醛/戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，3-庚二醇脱氢酶、2，3-庚二醇脱水酶以及2(或3)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含乙醛/己醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，3-辛二醇脱氢酶、2，3-辛二醇脱水酶以及2(或3)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含乙醛/辛醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，3-壬二醇脱氢酶、2，3-壬二醇脱水酶以及2(或3)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含乙醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含4-甲基-2，3-戊二醇脱氢酶、4-甲基-2，3-戊二醇脱水酶以及4-甲基-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含乙醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含4-甲基-2，3-己二醇脱氢酶、4-甲基-2，3-己二醇脱水酶以及4-甲基-2(或3)-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含乙醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含5-甲基-2，3-己二醇脱氢酶、5-甲基-2，3-己二醇脱氢酶以及5-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含乙醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含6-甲基-2，3-庚二醇脱氢酶、6-甲基-2，3-庚二醇脱氢酶以及6-甲基-2(或3)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含乙醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-丁二醇脱氢酶、1-苯基-2，3-丁二醇脱水酶以及1-苯基-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含乙醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-丁二醇脱氢酶、1-(4-羟苯基)-2，3-丁二醇脱水酶以及1-(4-羟苯基)-2(或3)-丁醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含乙醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-丁二醇脱氢酶、1-吲哚-2，3-丁二醇脱水酶以及1-吲哚-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丙醛/丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含3，4-庚二醇脱氢酶、3，4-庚二醇脱水酶以及3(或4)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丙醛/戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含3，4-辛二醇脱氢酶、3，4-辛二醇脱水酶以及3(或4)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丙醛/己醛裂解酶中至少之一，且其中还原和脱水途径可以包含3，4-壬二醇脱氢酶、3，4-壬二醇脱水酶以及3(或4)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丙醛/庚醛裂解酶中至少之一，且其中还原和脱水途径可以包含3，4-癸二醇脱氢酶、3，4-癸二醇脱水酶以及3(或4)-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丙醛/辛醛裂解酶中至少之一，且其中还原和脱水途径可以包含3，4-十一烷二醇脱氢酶、3，4-十一烷二醇脱水酶以及3(或4)-十一烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丙醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-3，4-己二醇脱氢酶、2-甲基-3，4-己二醇脱水酶以及2-甲基-3(或4)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丙醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含5-甲基-3，4-庚二醇脱氢酶、5-甲基-3，4-庚二醇脱水酶以及5-甲基-3(或4)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丙醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含6-甲基-3，4-庚二醇脱氢酶、6-甲基-3，4-庚二醇脱水酶以及6-甲基-3(或4)-庚醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丙醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含7-甲基-3，4-辛二醇脱氢酶、7-甲基-3，4-辛二醇脱水酶以及7-甲基-3(或4)-辛醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丙醛和苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-戊二醇脱氢酶、1-苯基-2，3-戊二醇脱水酶以及1-苯基-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丙醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-戊二醇脱氢酶、1-(4-羟苯基)-2，3-戊二醇脱水酶以及1-(4-羟苯基)-2(或3)-戊醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丙醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-戊二醇脱氢酶、1-吲哚-2，3-戊二醇脱水酶以及1-吲哚-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛/戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含4，5-壬二醇脱氢酶、4，5-壬二醇脱水酶以及4(或5)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛/己醛裂解酶中至少之一，且其中还原和脱水途径可以包含4，5-癸二醇脱氢酶、4，5-癸二醇脱水酶以及4(或5)-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛/庚醛裂解酶中至少之一，且其中还原和脱水途径可以包含4，5-十一烷二醇脱氢酶、4，5-十一烷二醇脱水酶以及4(或5)-十一烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛/辛醛裂解酶中至少之一，且其中还原和脱水途径可以包含4，5-十二烷二醇脱氢酶、4，5-十二烷二醇脱水酶以及4(或5)-十二烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-3，4-庚二醇脱氢酶、2-甲基-3，4-庚二醇脱水酶以及2-甲基-3(或4)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含3-甲基-4，5-辛二醇脱氢酶、3-甲基-4，5-辛二醇脱水酶以及3-甲基-4(或5)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-4，5-辛二醇脱氢酶、2-甲基-4，5-辛二醇脱水酶以及2-甲基-4(或5)-辛醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含8-甲基-4，5-壬二醇脱氢酶、8-甲基-4，5-壬二醇脱水酶以及8-甲基-4(或5)-壬醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-己二醇脱氢酶、1-苯基-2，3-己二醇脱水酶以及1-苯基-2(或3)-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含丁醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-己二醇脱氢酶、1-(4-羟苯基)-2，3-己二醇脱水酶以及1-(4-羟苯基)-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含丁醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-己二醇脱氢酶、1-吲哚-2，3-己二醇脱水酶以及1-吲哚-2(或3)-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含戊醛/己醛裂解酶中至少之一，且其中还原和脱水途径可以包含5，6-十一烷二醇脱氢酶、4，5-十一烷二醇脱水酶以及4(或5)-十一烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含戊醛/庚醛裂解酶中至少之一，且其中还原和脱水途径可以包含5，6-十一烷二醇脱氢酶、5，6-十一烷二醇脱水酶以及5(或6)-十一烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含戊醛/辛醛裂解酶中至少之一，且其中还原和脱水途径可以包含5，6-十三烷二醇脱氢酶、5，6-十三烷二醇脱水酶以及5(或6)-十三烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含戊醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-3，4-辛二醇脱氢酶、2-甲基-3，4-辛二醇脱水酶以及2-甲基-3(或4)-辛醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含戊醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含3-甲基-4，5-壬二醇脱氢酶、3-甲基-4，5-壬二醇脱水酶以及3-甲基-4(或5)-壬醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含戊醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-4，5-壬二醇脱氢酶、2-甲基-4，5-壬二醇脱水酶以及2-甲基-4(或5)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含戊醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-5，6-癸二醇脱氢酶、2-甲基-5，6-癸二醇脱水酶以及2-甲基-5(或6)-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含戊醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-庚二醇脱氢酶、1-苯基-2，3-庚二醇脱水酶以及1-苯基-2(或3)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含戊醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-庚二醇脱氢酶、1-(4-羟苯基)-2，3-庚二醇脱水酶以及1-(4-羟苯基)-2(或3)-庚醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含戊醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-庚二醇脱氢酶、1-吲哚-2，3-庚二醇脱水酶以及1-吲哚-2(或3)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含己醛/庚醛裂解酶中至少之一，且其中还原和脱水途径可以包含6，7-十三烷二醇脱氢酶、6，7-十三烷二醇脱水酶以及6(或7)-十三烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含己醛/辛醛裂解酶中至少之一，且其中还原和脱水途径可以包含6，7-十四烷二醇脱氢酶、6，7-十四烷二醇脱水酶以及6(或7)-十四烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含己醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-3，4-壬二醇脱氢酶、2-甲基-3，4-壬二醇脱水酶以及2-甲基-3(或4)-壬醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含己醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含3-甲基-4，5-癸二醇脱氢酶、3-甲基-4，5-癸二醇脱水酶以及3-甲基-4(或5)-癸醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含己醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-4，5-癸二醇脱氢酶、2-甲基-4，5-癸二醇脱水酶以及2-甲基-4(或5)-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含己醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-5，6-十一烷二醇脱氢酶、2-甲基-5，6-十一烷二醇脱水酶以及2-甲基-5(或6)-十一烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含己醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-辛二醇脱氢酶、1-苯基-2，3-辛二醇脱水酶以及1-苯基-2(或3)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含己醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-辛二醇脱氢酶、1-(4-羟苯基)-2，3-辛二醇脱水酶以及1-(4-羟苯基)-2(或3)-辛醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含己醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-辛二醇脱氢酶、1-吲哚-2，3-辛二醇脱水酶以及1-吲哚-2(或3)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含庚醛/辛醛裂解酶中至少之一，且其中还原和脱水途径可以包含7，8-十五烷醛脱氢酶、7，8-十五烷醛脱水酶以及7(或8)-十五烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含庚醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-3，4-癸二醇脱氢酶、2-甲基-3，4-癸二醇脱水酶以及2-甲基-3(或4)-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含庚醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含3-甲基-4，5-十一烷二醇脱氢酶、3-甲基-4，5-十一烷二醇脱水酶以及3-甲基-4(或5)-十一烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含庚醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-4，5-十一烷二醇脱氢酶、2-甲基-4，5-十一烷二醇脱水酶以及2-甲基-4(或5)-十一烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含庚醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-5，6-十二烷二醇脱氢酶、2-甲基-5，6-十二烷二醇脱水酶以及2-甲基-5(或6)-十二烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含庚醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-壬二醇脱氢酶、1-苯基-2，3-壬二醇脱水酶以及1-苯基-2(或3)-壬醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含庚醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-壬二醇脱氢酶、1-(4-羟苯基)-2，3-壬二醇脱水酶以及1-(4-羟苯基)-2(或3)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含庚醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-壬二醇脱氢酶、1-吲哚-2，3-壬二醇脱水酶以及1-吲哚-2(或3)-壬醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含辛醛/异丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-3，4-十一烷二醇脱氢酶、2-甲基-3，4-十一烷二醇脱水酶以及2-甲基-3(或4)-十一烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含辛醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含3-甲基-4，5-十二烷二醇脱氢酶、3-甲基-4，5-十二烷二醇脱水酶以及3-甲基-4(或5)-十二烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含辛醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-4，5-十二烷二醇脱氢酶、2-甲基-4，5-十二烷二醇脱水酶以及2-甲基-4(或5)-十二烷醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含辛醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2-甲基-5，6-十三烷二醇脱氢酶、2-甲基-5，6-十三烷二醇脱水酶以及2-甲基-5(或6)-十三烷醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含辛醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-2，3-癸二醇脱氢酶、1-苯基-2，3-癸二醇脱水酶以及1-苯基-2(或3)-癸醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含辛醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-2，3-癸二醇脱氢酶、1-(4-羟苯基)-2，3-癸二醇脱水酶以及1-(4-羟苯基)-2(或3)-癸醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含辛醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-2，3-癸二醇脱氢酶、1-吲哚-2，3-癸二醇脱水酶以及1-吲哚-2(或3)-癸醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含异丁醛/2-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，5-二甲基-3，4-庚二醇脱氢酶、2，5-二甲基-3，4-庚二醇脱水酶以及2，5-二甲基-3(或4)-庚醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含异丁醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，6-二甲基-3，4-庚二醇脱氢酶、2，6-二甲基-3，4-庚二醇脱水酶以及2，6-二甲基-3(或4)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含异丁醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，7-二甲基-3，4-辛二醇脱氢酶、2，7-二甲基-3，4-辛二醇脱水酶以及2，7-二甲基-3(或4)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含异丁醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-4-甲基-2，3-戊二醇脱氢酶、1-苯基-4-甲基-2，3-戊二醇脱水酶以及1-苯基-4-甲基-2(或3)-戊醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含异丁醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-4-甲基-2，3-戊二醇脱氢酶、1-(4-羟苯基)-4-甲基-2，3-戊二醇脱水酶以及1-(4-羟苯基)-4-甲基-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法，且其中C-C连接途径可以包含异丁醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-4-甲基-2，3-戊二醇脱氢酶、1-吲哚-4-甲基-2，3-戊二醇脱水酶以及1-吲哚-4-甲基-2(或3)-戊醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含2-甲基-丁醛/3-甲基-丁醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，6-二甲基-4，5-辛二醇脱氢酶、2，6-二甲基-4，5-辛二醇脱水酶以及2，6-二甲基-4(或5)-辛醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含2-甲基-丁醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含3，8-二甲基-4，5-壬二醇脱氢酶、3，8-二甲基-4，5-壬二醇脱水酶以及3，8-二甲基-4(或5)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含2-甲基-丁醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-4-甲基-2，3-己二醇脱氢酶、1-苯基-4-甲基-2，3-己二醇脱水酶以及1-苯基-4-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含2-甲基-丁醛/4-羟苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-4-甲基-2，3-己二醇脱氢酶、1-(4-羟苯基)-4-甲基-2，3-己二醇脱水酶以及1-(4-羟苯基)-4-甲基-2(或3)-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含2-甲基-丁醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-4-甲基-2，3-己二醇脱氢酶、1-吲哚-4-甲基-2，3-己二醇脱水酶以及1-吲哚-4-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含3-甲基-丁醛/4-甲基-戊醛裂解酶中至少之一，且其中还原和脱水途径可以包含2，8-二甲基-4，5-壬二醇脱氢酶、2，8-二甲基-4，5-壬二醇脱水酶以及2，8-二甲基-4(或5)-壬醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含3-甲基-丁醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-5-甲基-2，3-己二醇脱氢酶、1-苯基-5-甲基-2，3-己二醇脱水酶以及1-苯基-5-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含3-甲基-丁醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-5-甲基-2，3-己二醇脱氢酶、1-(4-羟苯基)-5-甲基-2，3-己二醇脱水酶以及1-(4-羟苯基)-5-甲基-2(或3)-己醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含3-甲基-丁醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-5-甲基-2，3-己二醇脱氢酶、1-吲哚-5-甲基-2，3-己二醇脱水酶以及1-吲哚-5-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含4-甲基-戊醛/苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-苯基-6-甲基-2，3-庚二醇脱氢酶、1-苯基-6-甲基-2，3-庚二醇脱水酶以及1-苯基-6-甲基-2(或3)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含4-甲基-戊醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-6-甲基-2，3-庚二醇脱氢酶、1-(4-羟苯基)-6-甲基-2，3-庚二醇脱水酶以及1-(4-羟苯基)-6-甲基-2(或3)-庚醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含4-甲基-戊醛/吲哚乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-6-甲基-2，3-庚二醇脱氢酶、1-吲哚-6-甲基-2，3-庚二醇脱水酶以及1-吲哚-6-甲基-2(或3)-庚醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含苯乙醛/4-羟苯基乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-(4-羟苯基)-4-苯基-2，3-丁二醇脱氢酶、1-(4-羟苯基)-4-苯基-2，3-丁二醇脱水酶以及1-(4-羟苯基)-4-苯基-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含苯乙醛/吲哚苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-4-苯基-2，3-丁二醇脱氢酶、1-吲哚-4-苯基-2，3-丁二醇脱水酶以及1-吲哚-4-苯基-2(或3)-丁醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含4-羟苯基乙醛/吲哚苯乙醛裂解酶中至少之一，且其中还原和脱水途径可以包含1-吲哚-4-(4-羟苯基)-2，3-丁二醇脱氢酶、1-吲哚-4-(4-羟苯基)-2，3-丁二醇脱水酶以及1-吲哚-4-(4-羟苯基)-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含5-氨基-戊醛(pantaldehyde)裂解酶，且其中还原和脱水途径可以包含1，10-二氨基-5，6-癸二醇脱氢酶、1，10-二氨基-5，6-癸二醇脱水酶以及1，10-二氨基-5-癸醇脱氢酶中至少之一。

其它实施方案包括方法，其中C-C连接途径可以包含4-羟苯基乙醛裂解酶，且其中还原和脱水途径可以包含1，4-二(4-羟苯基)-2，3-丁二醇、1，4-二(4-羟苯基)-2，3-丁二醇脱水酶以及1，4-二(4-羟苯基)-2-丁醇脱氢酶中至少之一。其它实施方案包括方法，其中C-C连接途径可以包含琥珀酸半醛裂解酶，且其中还原和脱水途径可以包含2，3-己二醇-1，6-二羧酸脱氢酶、2，3-己二醇-1，6-二羧酸脱水酶以及2-己醇-1，6-二羧基脱氢酶中至少之一。

微生物系统或重组微生物的某些实施方案可以包含编码能催化(如还原和脱水)4-辛醇转化为辛烯或辛烷的酶的基因。其它实施方案可以包含再设计的或重新设计的该还原和脱水途径的酶。例如，三种再设计的酶可以将4-辛酮转化为3-辛烯和4-辛烯。第一步骤可以被再设计的异柠檬酸脱氢酶催化。这种酶可以催化4-羟基-3(或5)-羧基辛烷的形成。4-羟基可以被再设计的激酶磷酸化。最后，再设计的甲羟戊酸二磷酸脱羧酶催化3(或4)-辛烯的形成。

在其它实施方案中，数种再设计的酶可以将4-辛酮转化为辛烷。例如，4-羟基-3(或5)-羧基辛烷依次还原和脱水，形成3(或5)-羧基辛烷。参与脂肪酸代谢的再设计的酶可以催化这些反应。3(或5)-羧基辛烷可以被醛脱氢酶还原为相应的醛，并且产物可以去羰基化，形成辛烷，其由再设计的脱羰基酶所催化。

如上所述，为了产生某些大量生产型化学品，如2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇等其它相似的化学品，生物合成途径(如醛生物合成途径)可以任选地包含或还包含一个或多个编码脱羧酶的基因，所述酶例如吲哚-3-丙酮酸脱羧酶(IPDC)，以便产生醛。在某些方面，IPDC可以包含与SEQ ID NO：312所示氨基酸序列至少80％、90％、95％、98％或99％同一的氨基酸序列。IDPC酶可以包含某些保守的氨基酸残基，如G24、D25、E48、A55、R60、G75、E89、H113、G252、G405、G413、G428、G430和/或N456。

在这些和其它实施方案中，重组微生物可以包含醛还原酶，如苯乙醛还原酶(PAR)，以便将醛转化为大量生产型化学品。在某些方面，PAR可以包含与SEQ ID NO：313所示的氨基酸序列至少80％、90％、95％、98％或99％同一的氨基酸序列，SEQ ID NO：313表示衍生于红球菌(Rhodococcus sp.)ST-10的PAR酶的序列。在某些方面，PAR酶可以包含烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸(NADP+)或NADPH结合基序中至少之一。在某些实施方案中，NAD+、NADH、NADP+或NADPH结合基序可以选自Y-X-G-G-X-Y、Y-X-X-G-G-X-Y、Y-X-X-X-G-G-X-Y、Y-X-G-X-X-Y、Y-X-X-G-G-X-X-Y、Y-X-X-X-G-X-X-Y、Y-X-G-X-Y、Y-X-X-G-X-Y、Y-X-X-X-G-X-Y以及Y-X-X-X-X-G-X-Y；其中Y独立地选自丙氨酸、甘氨酸以及丝氨酸，其中G是甘氨酸，并且其中X独立地选自遗传编码的氨基酸。

在某些实施方案中，此类重组微生物也可以或可选地包含具有选自下述至少之一的活性的次级醇脱氢酶：苯基乙醇脱氢酶活性、4-羟苯基乙醇脱氢酶活性以及吲哚-3-乙醇脱氢酶活性，以便将醛还原为其相应的醇(如2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇)。

本发明的实施方案还包括将适宜的单糖转化为大量生产型化学品的方法，包括(a)获得适宜的单糖；(b)使适宜的单糖与微生物系统接触足以将适宜的单糖转化为生物燃料的时间，其中微生物系统包含(i)一个或多个编码和表达脂肪酸生物合成途径、氨基酸生物合成途径和/或短链醇生物合成途径的基因；(ii)一个或多个编码和表达酮酸脱羧酶、醛脱氢酶和/或醇脱氢酶的基因；以及(iii)选自以下的酶还原途径：(1)酶促长链醇还原途径，(2)酶促脱羰基途径，(3)酶促脱羧基途径，以及(4)包括(1)、(2)和/或(3)的酶促还原途径，从而将适宜的单糖转化为大量生产型化学品。

本发明的实施方案可以包含一个或多个编码和表达脂肪酸合成途径中的酶的基因，其可以用于，作为一实例，产生链烷形成的生物燃料，如中到长链烷烃。在某些实施方案中，可以重新校准或再设计微生物系统中脂肪酸生物合成途径的特异性。仅以实例的方式，微生物通常产生长链脂肪酸(如大肠杆菌天然产生大量长链脂肪酸(在全细胞中C16-C19：＜95％)和小量中链脂肪酸(在全细胞中C12：2％和C14：5％))的混合物。

在某些实施方案中，重新校准或再基因工程化可以涉及增加中链链烷的产生，其包括但不限于辛酸盐(C8)、癸酸盐(C10)、月桂酸盐(C12)、十四烷酸盐(C14)以及棕榈酸盐(C16)，因为由这些脂肪酸所产生的链烷是汽油、柴油以及煤油的主要组分。除了这些脂肪酸以外，其它实施方案可以涉及长链脂肪酸产生的增加，包括但不限于硬脂酸盐(C18)、花生四烯酸盐(C20)、山嵛酸盐(C22)以及更长的脂肪酸，因为由这些脂肪酸所产生的正-链烷是重油中主要组分之一。

例如，萼距花属(Cuphea)主要积聚中链脂肪酸，其作为其种子油的主要组分，且这些组合物因物种不同而不同。特别是，Cuphea pulcherrima积聚辛酸盐(C8:0)96％，Cuphea koehneana积聚癸酸盐(C10:0)95.3％，Cuphea polymorpha积聚月桂酸盐(C12:0)80.1％。本申请的微生物系统或分离的微生物的实施方案可以并入编码参与脂肪酸生物合成途径的酶的、来自各种萼距花属物种的基因，且这些微生物可以部分涉及中链脂肪酸的产生。

在其它实施方案中，衍生于各种物种包括萼距花(Cupheahookeriana)、Cuphea palustris、加利福尼亚桂树(Umbellularia californica)以及樟树(Cinnamomum camphorum)的酰基-酰基载体蛋白(ACP)硫酯酶(TEs)，可以在如大肠杆菌的微生物中过表达，其中形成辛酸盐(C8)、癸酸盐(C10)、月桂酸盐(C12)、十四烷酸盐(C14)以及棕榈树盐(C16)的每一中链脂肪酸的特异性活性相对野生型获得改善。某些实施方案可以包括参与脂肪酸生物合成的其它酶组分，如本领域技术人员所知的，其包括但不限于ACP和β-酮酰基ACP合酶(KAS)IV。

本申请的微生物系统和分离的微生物也可以并入脂肪醛脱氢酶，以将脂肪酸还原为脂肪醛。仅以说明的方式，脂肪酸向脂肪醛的转化可以被分离自各种适宜生物的中和/或长链脂肪醛脱氢酶催化。某些实施方案可以并入例如衍生于哈维氏弧菌(Vibrio harveyi)的脂肪醛脱氢酶。

本申请的微生物系统和分离的微生物也可以并入一种或多种催化脂肪醛转化为生物燃料如正链烷的酶，包括例如，包含酶促长链醇还原途径的酶。某些实施方案可以并入来自各种其它来源的编码能催化脂肪酸还原和脱水为生物燃料如链烷的酶的基因。例如，细菌菌株HD-1能产生生物燃料，如各种链长度的正链烷，并且也产生奇数和偶数链烷两者。本文所提供的微生物系统和重组微生物的某些实施方案可以并入编码参与该途径的酶的HD-1基因。

其它实施方案可以并入再设计的或重新设计的该还原途径的酶。例如，本发明的实施方案可以包括再设计的异柠檬酸脱氢酶，其可以催化2-羧基-1-醇的形成。在某些实施方案中，2-羧基-1-醇可以依次还原和脱水，形成2-羧基-链烷，该链烷可以被再设计的参与脂肪酸代谢的酶催化。2-羧基-链烷可以被醛脱氢酶还原为相应的醛，随后脱羰基形成正-链烷，其由下文所讨论的再设计的脱羰基酶所催化。这些微生物系统的某些实施方案可以产生偶数正-链烷、奇数正-链烷，或两者。

本申请的某些实施方案可以并入编码催化脱羰基或酶促脱羰基途径的酶的基因。仅以实例的方式，绿色建群藻布朗葡萄藻(Botyrococcusbraunii)种族A产生线性奇数C27、C29以及C31烃，其总计占该藻类干重的达32％。这种生物的微生物制剂具有脱羰基活性。来自布朗葡萄藻培养物的这种脱羰基酶是含有钴-原卟啉IX的酶。分离的微生物的某些微生物系统可以并入编码来自布朗葡萄藻的脂肪醛脱羰基酶的基因。

其它实施方案可以包括再设计的脱羰基酶，例如其中N末端膜序列被取代。以说明的方式，类似的酶即含有Fe-原卟啉IX(亚铁血红素)细胞色素P450的功能活性通过取代N末端膜相关序列获得改善，且本微生物系统的脱羰基酶的功能活性可以包含类似的取代或改善。

其它实施方案可以并入编码Co-卟啉合酶的基因。以说明的方式，脱羰基酶可以利用Co-原卟啉IX作为辅因子，且破伤风梭菌(Clostridiumtetranomorphum)能将钴并入孵育的原卟啉IX中。某些实施方案可以并入来自破伤风梭菌或来自其它适宜微生物的Co-卟啉合酶。其它实施方案可以利用如Co²⁺、Fe²⁺以及Ni²⁺的无机金属作为催化剂，并入重新设计的脱羰基酶。

某些实施方案可以包含编码负责链烯形成或酶促脱羧基途径的酶的基因。这些基因可以衍生于或分离自各种来源，如高等植物和昆虫。例如，诸如萌发的红花(红花(Carthamus tinctorius L.))的高等植物产许多奇数1-链烯，其除了其相应脂肪酸脱羧所产生的约80-90％1，8，11，14-十七四烯外，还包括1-十五碳烯、1-十七碳烯、1，8-十七碳二烯以及1，8，11-十七碳三烯。某些实施方案可以并入来自诸如红花的高等植物的基因。

其它实施方案可以并入编码负责链烯从微生物形成(如酶促脱羧途径)的酶的基因，所述微生物包括但不限于诸如细菌菌株DH-1。以说明的方式，除正-链烷外，细菌菌株DH-1还产生正-链烯。

其它实施方案可以并入来自用于酶促脱羧途径的重新设计的酶的基因。例如，这些再设计的酶将β-羟基脂肪酸转化为正-链烯。第一步被再设计的激酶催化，该激酶催化β-羟基的磷酸化。再设计的甲羟戊酸二磷酸脱羧酶随后催化正-链烯如正-1-链烯的形成。

任何微生物都可以根据本发明来使用。在某些方面，微生物是真核或原核微生物。在某些方面，微生物是酵母，如酿酒酵母。在某些方面，微生物是细菌，如革兰氏阳性细菌或革兰氏阴性细菌。鉴于其快速生长速率、良好了解的遗传学、多种可利用的遗传工具以及产生异源蛋白的能力，遗传修饰的大肠杆菌可用于本文所述的微生物系统的某些实施方案，无论用于降解和代谢多糖，如藻酸盐或果胶，还是形成或生物合成大量生产型化学品，如生物燃料。

部分基于酶和代谢物与宿主生物的相容性，其它微生物可以根据本发明来使用。例如，诸如以下的其它生物：醋化醋酸杆菌、无色杆菌、嗜酸菌、不动杆菌、马杜拉放线菌、游动放线菌、敏捷好氧炽热球菌、农杆菌、产碱杆菌、菠萝(M)、节杆菌、黑曲霉、米曲霉、蜜蜂曲霉、粉状曲霉、斋藤曲霉、酱油曲霉、宇佐美曲霉、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、浸麻芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、双歧芽孢杆菌、短短芽孢杆菌、洋葱伯克霍尔德氏菌、圆柱念珠菌、皱褶念珠菌、番木瓜(L)、纤维微菌、头孢霉菌、变动毛壳菌、细丽毛壳菌、梭菌、丁酸梭菌、丙酮丁醇梭菌、热纤维素梭菌、(谷氨酸)棒杆菌、Corynebacterium efficiens、大肠杆菌、肠球菌、菊欧文氏菌、葡糖酸杆菌、葡糖酸醋酸杆菌、盐盒菌、特异腐质霉、Humicola nsolens、西唐北里孢菌、克雷伯氏菌、产酸克雷伯氏菌、克鲁维酵母、脆壁克鲁维酵母、乳酸克鲁维酵母、库克菌、Lactlactis、乳酸杆菌、发酵乳酸杆菌、清酒乳酸杆菌、乳球菌、乳酸乳球菌、明串珠菌、甲基孢囊菌、西西里甲烷叶菌、嗜器官产甲烷菌、布氏甲杆菌、蛾微杆菌、溶壁微球菌、小月菌、爪哇毛霉、分枝杆菌、漆斑菌、番木、亚硝化单胞菌、诺卡氏菌、番木瓜、片球菌、嗜盐片球菌、青霉菌、产黄青霉、橘青霉、埃默森青霉、娄地青霉、淡紫青霉、多色青霉、好氧反硝化菌、丙酸杆菌、假单胞菌、荧光假单胞菌、脱氮假单胞杆菌、火球菌、激烈火球菌、堀野氏火球菌、根癌菌、米黑根毛霉、微小根毛霉、根霉、德氏根霉、东京根霉、雪白根霉、米根霉、少孢根霉、红球菌、酿酒酵母、Sclerotina libertina、多食鞘氨醇杆菌、鞘氨醇杆菌、鞘胺醇单胞菌、链球菌、嗜热链球菌Y-1、链霉菌、灰色链霉菌、变铅青链霉菌、鼠灰链霉菌、锈棕色链霉菌、紫红链霉菌、茂原链轮丝菌、四体球菌、栖热菌、泛养硫球菌、栓菌、木霉、长枝木霉、里氏木霉、绿色木霉、潘氏丝孢酵母、溶藻弧菌、黄单胞菌、酵母、鲁氏接合酵母、发酵单胞菌以及运动发酵单胞菌，都可以用作本文所提供的重组微生物，并且可以根据本发明的各种方法而使用。

以示例而非限制的方式提供了下述实施例。

实施例

实施例1

对大肠杆菌进行基因工程化使其生长于作为唯一碳源的藻酸盐上

野生型大肠杆菌不能利用藻酸盐多聚体或降解的藻酸盐作为其唯一的碳源(参阅图4)。然而，灿烂弧菌已知能代谢藻酸盐，维持生长。为了产生利用降解的藻酸盐作为其唯一碳源的重组大肠杆菌，构建灿烂弧菌的fosmid文库(fosmid library)，并将其克隆至大肠杆菌。

为了制备灿烂弧菌fosmid文库，利用DNeasy血液和组织试剂盒(DNeasy Blood and Tissue Kit，Qiagen，Valencia，CA)，从灿烂弧菌B01(由Martin Polz博士惠赠，MIT)分离基因组DNA。随后利用拷贝对照Fosmid文库产生试剂盒(Copy Control Fosmid Library Production Kit)(Epicentre，Madison，WI)，构建fosmid文库。这种文库由插入载体pCC1FOS(Epicentre，Madison，WI)的大约40kb的随机基因组片段组成。

将fosmid文库包装进噬菌体，并用噬菌体文库转染容纳pDONR221质粒(Invitrogen，Carlsbad，CA)的大肠杆菌DH10B细胞，该质粒携带某些灿烂弧菌基因(V12B01_02425至V12B01_02480；编码II型分泌器；参阅SEQ ID NO：1)。这种分泌蛋白质组区编码衍生于灿烂弧菌的II型分泌器，其被克隆至pDONR221质粒中，并导入大肠杆菌菌株DH10B(参阅实施例1)。

选择转化体的氯霉素抗性，随后针对生长于降解的藻酸盐上的能力，对其进行筛选。筛选生长于降解的藻酸盐培养基上的所得转化体。通过在室温下将2％藻酸盐(Sigma-Aldrich，St.Louis，MO)10mM磷酸钠缓冲液、50mM KCl、400mM NaCl与来自黄杆菌(Flavobacterium sp.)的藻酸盐裂解酶(Sigma-Aldrich，St.Louis，MO)一起孵育至少一周，制备降解的藻酸盐培养基。将该降解的藻酸盐稀释至0.8％的浓度，制备生长培养基，其终浓度为1X M9盐、2mM MgSO4、100μM CaCl2、0.007％亮氨酸、0.01％酪蛋白氨基酸、1.5％NaCl(这包括所有的钠来源：M9、稀释的藻酸盐和添加的NaCl)。

分离一个在这种培养基上生长良好的含有fosmid的大肠杆菌克隆。利用FosmidMAX DNA纯化试剂盒(Epicentre，Madison，WI)分离并制备来自这种克隆的fosmid DNA。将这种分离的fosmid转移回DH10B细胞，并检测这些细胞生长于藻酸盐上的能力。

结果示于图4中，其表明，某些含有fosmid的大肠杆菌克隆能生长于作为唯一碳源的藻酸盐上。根癌农杆菌提供了阳性对照(参见同心圆)。作为阴性对照，大肠杆菌DH10B细胞不能生长于藻酸盐上(参见阳性对照的紧邻左侧)。

这些结果也证明，含于该灿烂弧菌衍生fosmid的克隆内的序列足以赋予大肠杆菌生长于作为唯一碳源的降解的藻酸盐上的能力。因此，含于pDONR221载体内的II型分泌机制序列(secretion machinery sequences)(即SEQ ID NO：1)(为最初的DH10B细胞容纳)，不是生长于降解的藻酸盐上所必需的。

利用以下引物，通过Elim Biopharmaceuticals(Hayward，CA)，对足以赋予在作为唯一碳源的藻酸盐上生长的分离的fosmid进行测序：Uni R3-GGGCGGCCGCAAGGGGTTCGCGTTGGCCGA(SEQ ID NO：147)和PCC1FOS_uni_F-GGAGAAAATACCGCATCAGGCG(SEQ ID NO：148)。测序表明，载体含有基因组DNA部分，该部分含有全长基因V12B01_24189至V12B01_24249(参阅SEQ ID NOS：2-64)。SEQ ID NO：2表示V12B01_24189至V12B01_24249之间的整个区域的核苷酸序列。SEQ ID NOS：3-64表示含于SEQ ID NO：2内的单个推断的基因。在该序列中，在V12B01_24189前存在大基因，其在fosmid克隆中是截短的。大基因V12B01_24184是推断的蛋白，与自动转运蛋白具有相似性，并且属于COG321，其是一簇包括参与亚铁血红素利用或粘附的大外蛋白(exoprotein)的直系同源蛋白。在fosmid克隆中，V12B01_24184是N末端截短的，以便开始的5893bp从预测的可读框(经预测，其总共含有22889bp)丢失。

实施例2

对大肠杆菌进行基因工程化使其生长于作为唯一碳源的果胶上

野生型大肠杆菌不能生长于作为唯一碳源的果胶、二或三半乳糖醛酸盐上。为了鉴定赋予大肠杆菌生长于作为唯一碳源的果胶、二或三半乳糖醛酸盐上的能力的最小组分，对容纳pBBRGal3P质粒和pTrcogl-kdgR质粒的大肠杆菌菌株BL21(DE3)进行基因工程化，并检测其生长于这些多糖上的能力。

pBBRGal3P质粒经基因工程化，以含有胡萝卜软腐欧文氏菌马铃薯黑胫亚种(Erwinia carotovora subsp.Atroseptica)SCRI 1043的某些基因组区，其包括编码某些酶(kduI、kduD、ogl、pelW以及paeX)、转运蛋白(togM、togN、togA、togB以及kdgM)以及负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的几个基因(kdgF，kduI，kduD，pelW，togM，togN，togA，togB，kdgM以及paeX)。SEQ ID NO：65表示来自胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043的kdgF-PaeX区的核苷酸序列。

为了构建这种质粒，编码胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043的kdgF、kduI、kduD、pelW、togM、togN、togA、togB、kdgM、paeX、ogl以及kdgR的DNA序列，通过聚合酶链式反应(PCR)进行扩增：98℃10秒，60℃15秒，72℃6分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGGGATCCAAGTTGCAGGATATGACGAAAGCG-3’)(SEQ ID NO：149)和反向引物(5’-GCTCTAGAAGATTATCCCTGTCTGCGGAAGCGG-3’)(SEQ IDNO：150)、1U Phusion高保真DNA聚合酶(NEB)以及50ng胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043基因组(ATCC)，总体积50μl。

载体pBBR1MCS-2随后通过聚合酶链式反应(PCR)进行扩增：98℃10秒，60℃15秒，以及72℃2.5分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGGGTGCCTAATGAGTGAGCTAAC-3’)(SEQ ID NO：151)和反向引物(5’-CGGGATCCGCGTTAATATTTTGTTAAAATTCGC-3’)(SEQ IDNO：152)、1U Phusion高保真DNA聚合酶(NEB)以及50ng pBBR1MCS-2，总体积50μl。两个扩增DNA片段都用BamHI和XbaI消化，并连接。

pTrcogl-kdgR质粒经基因工程化以含有胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043的某些基因组区，包括编码酶(ogl)和负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的两个基因(ogl和kdgR)。SEQ IDNO：66表示来自胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043的ogl-kdgR的核苷酸序列。

为了制备这种构建体，编码胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043的ogl和kdgR的DNA序列，通过聚合酶链式反应(PCR)进行扩增：98℃10秒，60℃15秒以及72℃4分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGTTTATGTCGCACCCGCCGTTGG-3’)(SEQ ID NO：153)和反向引物(5’-CCCAAGCTTAGAAAGGGAAATTGTGGTAGCCC-3’)(SEQ ID NO：154)、1U Phusion高保真DNA聚合酶(NEB)以及50ng胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043基因组(ATCC)，总体积50μl。扩增的DNA片段用XbaI和HindIII消化，并连接于用相同的限制酶预消化的pTrc99A。

将质粒pBBRGal3P和pTrcogl-kdgR共转化于大肠杆菌菌株BL21(DE3)中。将单个菌落接种于含有50μg/ml卡那霉素和100μg/ml氨苄青霉素的LB培养基中，并将培养物在200rpm、37C下培养于摇床培养箱(incubation shaker)中。当培养物达到0.6的OD 600nm时，将500μl培养物转运至eppendorf离心管，并离心使细胞沉淀。将细胞重悬浮于50μl含有2mM MgSO₄、100uM CaCl₂、0.4％二或三半乳糖醛酸盐的M9培养基中，并将5μl这种溶液接种于500μl新鲜的含有2mM MgSO₄、100μM CaCl₂、0.4％二或三半乳糖醛酸盐/的M9培养基中。将培养物在200rpm、37℃下培养于摇床培养箱中。

图5A中的结果表示，这两种质粒足以提供大肠杆菌生长于作为唯一碳源的二或三半乳糖醛酸盐而非果胶上的能力。特别是，这些结果表明，kdgF-paeX和ogl-kdgR区足以赋予大肠杆菌这种能力。

基于上述实验所获得的信息，要考虑的是，引入果胶酸裂解酶、果胶酸乙酰酯酶以及甲酯酶是否可能赋予大肠杆菌生长于果胶上的能力。为了检测这种假设，大肠杆菌菌株DH5α细菌细胞经基因工程化而既含有pROU2质粒又含有pPEL74质粒。

pROU2质粒含有菊欧文氏菌的某些基因组区，包括编码酶(kduI、kduD、ogl、pelW以及paeX)、转运蛋白(togM、togN、togA、togB以及kdgM)以及负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的几个基因(kdgF、kduI、kduD、pelW、togM、togN、togA、togB、kdgM、paeX、ogl以及kdgR)。

pPEL74质粒含有菊欧文氏菌的某些基因组区，包括编码果胶酸裂解酶(pelA和pelE)、果胶酸乙酰酯酶(paeY)以及果胶酸甲酯酶(pem)的几个基因(pelA、pelE、paeY以及pem)。

如图5B所示，用pROU2和pPEL74进行基因工程化的大肠杆菌DH5α能生长于作为唯一碳源的果胶上，表明含于这些质粒中的基因足以赋予该生物这种特性，否则，不能生长于作为唯一碳源的果胶上。

实施例3

藻酸盐体外转化为丙酮酸盐和3-磷酸甘油醛

研究含有藻酸盐降解和代谢所需的所有酶的酶混合物的能力，研究其由藻酸盐产生丙酮酸盐的能力。另外，检测从根癌农杆菌分离的各种新的醇脱氢酶(ADHs)，如ADH1-12(参见SEQ ID NOS：69-92)催化DEHU或甘露糖醛酸盐氢化的能力。

藻酸盐降解和代谢的简化代谢途径示于图2中。藻酸盐可以被至少两种不同的方法降解：酶促方法和化学方法。

在酶促降解中，藻酸盐的降解被称为藻酸盐裂解酶的酶家族催化。对于本实验而言，使用Atu3025。Atu3025是在外裂解(exolytically)作用酶，并由藻酸盐多聚体产生DEHU。DEHU被转化为常见的己糖醛酸盐代谢物即KDG。这种反应为醇脱氢酶(如DEHU氢化酶)催化。

酸溶液如甲酸盐所催化的化学降解产生单糖甘露糖醛酸盐。甘露糖醛酸盐随后转化为甘露糖酸盐，这被具有甘露糖酸脱氢酶(甘露糖醛酸还原酶)活性的酶催化。在细菌中，甘露糖酸脱水酶(UxuA)催化甘露糖醛酸盐脱水形成KDG。

KDG易于代谢形成丙酮酸盐和3-磷酸甘油醛(G3P)。KGD首先磷酸化为KDG-6-磷酸(KDGP)，其被KDG激酶催化，随后分解成丙酮酸盐和G3P，这被KGDP醛缩酶催化。

衍生于根癌农杆菌C58的寡藻酸盐裂解酶Atu3025的制备：基于pET29质粒骨架(Novagen)，构建pETAtu3025。寡藻酸盐裂解酶Atu3025通过PCR扩增：98℃10秒，55℃15秒，以及72℃60秒，重复30次。反应混合物含有1×Phusion缓冲液、2mM dNTP、0.5μM正向引物(5’-GGAATTCCATATGCGTCCCTCTGCCCCGGCC-3’)(SEQ ID NO：155)和反向引物(5’-CGGGATCCTTAGAACTGCTTGGGAAGGGAG-3’)(SEQID NO：156)、2.5U Phusion DNA聚合酶(Finezyme)，以及等份根癌农杆菌C58(Eugene Nester教授惠赠，University of Washington)细胞作为模板，总体积100μl。扩增的片段用NdeI和BamHI消化，并用T4 DNA连接酶连接于用相同的酶预消化的pET29，形成pETAtu3025。对构建的质粒进行测序(Elim Biophamaceuticals)，并证实插入物的DNA序列。Atu3025插入物的核苷酸序列提供于SEQ ID NO：67中。Atu3025插入物所编码的多肽序列提供于SEQ ID NO：68中。

将pETAtu3025转化于大肠杆菌菌株BL21(DE3)中。将含有pETAtu3025的BL21(DE3)的菌落接种于50ml含有50μg/ml卡那霉素的(Km⁵⁰)LB培养中。将这种菌株在200rpm、37℃下培养于轨道摇床中。当OD_600nm达到0.6时，向培养物添加0.2mM IPTG，并将所诱导的培养物在200rpm、20℃下培养于轨道摇床中。诱导24小时后，通过4,000rpm×g下离心10分钟收获细胞，将沉淀重悬浮液2ml含有10μl ofLysonase^TM生物处理剂(Novagen)的Bugbuster(Novagen)中。将溶液在4,000rpm×g下再次离心10分钟，并获得上清液。

通过pETADH12构建pETADH1：根癌农杆菌C58的ADH1-12的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(表1)和反向引物(表1)、1U Phusion高保真DNA聚合酶(NEB)以及50ng根癌农杆菌C58基因组，总体积50μl。扩增的DNA片段用NdeI和BamHI消化，并连接于以相同的限制酶预消化的pET28。对于具有内NdeI或BamHI位点的DNA序列而言，首先利用所述方法扩增每个ADH的前半部分序列和后半部分序列。所得的两个DNA片段进行凝胶纯化，并通过重叠PCR进行剪接。

表1：用于从根癌农杆菌C58扩增ADH1-12的引物

ADH1-10的表达和纯化：将所有的质粒转化于大肠杆菌菌株BL21(DE3)中。将含有各醇脱氢酶(ADH)基因的单个BL21(DE3)菌落接种于50ml含有50μg/ml卡那霉素(Km⁵⁰)的LB培养基中。将这些菌株在200rpm、37℃下培养于轨道摇床。OD_600nm达到0.6时，向每个培养物中添加0.2mM IPTG，并将所诱导的培养物在200rpm、20℃下培养于轨道摇床中。诱导24小时后，通过4,000rpm×g下离心10分钟收获细胞，并将沉淀重悬浮于2ml含有Lysonase^TM生物处理剂(Novagen)的Bugbuster(Novagen)中。在4,000rpm×g下再次离心溶液10分钟，并获得上清液。

通过酶促降解制备～2％DEHU溶液：酶促制备DEHU溶液。向500ml 20mM Tris-HCl(pH7.5)溶液中添加10g低粘性藻酸盐，制备2％藻酸盐溶液。向藻酸盐溶液中添加约10mg衍生于黄杆菌(从Sigma-aldrich购买)的藻酸盐裂解酶。随后将250ml这种溶液转移至另一瓶中，并添加上节所制备的含有Atu30205的大肠杆菌细胞裂解物。藻酸盐降解在室温下过夜进行。所得的产物通过薄层层析进行分析，并证实DEHU的形成。

通过化学降解制备D-甘露糖醛酸盐溶液：基于Spoehr(Archive ofBiochemistry，14：pp153-155)之前所述操作方法，化学制备D-甘露糖醛酸盐溶液。将50mg藻酸盐溶解于800μL90％的甲酸盐中。溶液在100℃下过夜孵育。随后蒸发甲酸盐，并将残余的物质用无水乙醇洗涤两次。将残余的物质再次溶解于无水乙醇中并过滤。蒸发乙醇，并将残余的物质重悬浮于20mL 20mM Tris-HCl(pH 8.0)中，并过滤溶液，制备D-甘露糖醛酸盐溶液。将这种D-甘露糖醛酸盐溶液稀释5倍，并用于测定。

DEHU氢化酶的测定：为了鉴定DEHU氢化酶，进行NADPH依赖性DEHU氢化测定。将20μl含有每一ADH的所制备细胞裂解物添加于160μl 20倍稀释的上节所制备的DEHU溶液中。添加20μl 2.5mg/mlNADPH溶液(20mM Tris-HCl，pH 8.0)，启动氢化反应，因为用根癌农杆菌C58的细胞裂解物的初步研究已经表明，DEHU氢化需要NADPH作为辅因子。利用ThermoMA×96孔板读数器(Molecular Devises)的动力学模式，监控30分钟NADPH消耗的340nm下的吸光率。含有缺少N末端结构域部分的醇脱氢酶(ADH)10的大肠杆菌细胞裂解物被用于对照反应混合物中。

D-甘露糖醛酸氢化酶的测定：为了鉴定D-甘露糖醛酸氢化酶，进行NADPH依赖性D-甘露糖醛酸盐氢化测定。将20μl含有每一ADH的制备的细胞裂解物添加于160μl上节所制备的D-甘露糖醛酸盐溶液中。添加20μl 2.5mg/ml NADPH溶液(20mM Tris-HCl，pH 8.0)，启动氢化反应。利用ThermoMAX 96孔板读数器(Molecular Devises)的动力学模式，监控30分钟NADPH消耗的340nm下的吸光率。含有缺少N末端结构域部分的醇脱氢酶(ADH)10的大肠杆菌细胞裂解物被用于对照反应混合物中。

pETkdgK的构建：编码2-酮-脱氧葡糖酸激酶的大肠杆菌的kdgKDNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-AGGTACGGTGAAATAA AGGAGGATATACAT ATGTCCAAAAAGATTGCCGT-3’)(SEQ ID NO：157)和反向引物(5’-TTTTCCTTTTGCGGCCGCCCCGCTGGCATCGCCTCAC-3’)(SEQ ID NO：158)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌DH10B基因组，总体积50μl。扩增的DNA片段用NdeI和NotI消化，并连接于用相同的限制酶预消化的pET29中。

pETkdgA的构建：编码2-酮-脱氧葡糖酸-6-磷酸醛缩酶的大肠杆菌的kdgA的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GGCGATGCCAGCGTAAAGGAGGATATACATATGAAAAACTGGAAAACAAG-3’)(SEQ IDNO：159)和反向引物(5’-TTTTCCTTTTGCGGCCGCCCCAGCTTAGCGCCTTCTA-3’)(SEQ ID NO：160)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌DH10B基因组，总体积50μl。扩增的DNA片段用NdeI和NotI消化，并连接于用相同的限制酶预消化的pET29中。

蛋白的表达和纯化：将所有的质粒(pETAtu3025、pETADH11、pETADH12、pETkdgA、pETkdgK以及pETuxuA)转化于大肠杆菌菌株BL21(DE3)中。将含有各质粒的单个BL21(DE3)菌落接种于50ml含有50μg/ml卡那霉素(Km⁵⁰)的LB培养基中。将这些菌株在200rpm、37℃下培养于轨道摇床中。当OD_600nm达到0.6时，向每一培养物中添加0.2mMIPTG，并将诱导的培养物在200rpm、20℃下培养于轨道摇床中。诱导24小时后，通过4,000rpm×g下离心10分钟收获细胞，将沉淀重悬浮于2ml含有10μl Lysonase^TM生物处理剂(Novagen)和建议量的蛋白酶抑制剂混合物(SIGMA)的Bugbuster(Novagen)。将溶液再次在4,000rpm×g下离心10分钟，获得上清液。将上清液应用于Nickel-NTA旋转柱，纯化His标签蛋白。

ADH1-10的DEHU氢化酶活性和D-甘露糖醛酸氢化酶活性测定的结果显示于图7A和图7B。这些结果证明，新酶ADH1和ADH2表现出显著的DEHU氢化酶活性(图7A)，且新酶ADH3、ADH4和ADH9表现出显著的甘露糖醛酸氢化酶活性(图7B)。

丙酮酸盐的体外形成：反应混合物含有溶于pH7.0、20mM Tris-HCl中的1％藻酸盐或～0.5％甘露糖醛酸盐、～5μg纯化的Atu3026(ADH12)或Atu3027(ADH11)，和～5μg纯化的寡藻酸盐裂解酶(Atu3025)、UxuA、KdgK以及KdgA，2mM ATP，以及0.6mM NADPH。将反应过夜进行，并通过丙酮酸盐测定试剂盒(BioVision，Inc)监测丙酮酸盐的形成。

酶促和化学降解所介导的由藻酸盐体外形成丙酮酸盐的结果分别显示于图6B和图6C中。由这些图可以看出，藻酸盐经由分离的酶转化为丙酮酸盐。这些结果也表明，Atu3026(ADH12)和Atu3027(ADH11)中的每一个都能催化DEHU氢化酶和甘露糖醛酸氢化酶反应。

实施例4

生物合成途径的构建和生物活性

途径的构建：构建包含大肠杆菌的苏氨酸脱氨酶(ilvA)基因和乳酸乳球菌的酮-异戊酸脱羧酶(kivd)的丙醛生物合成途径，并检测其将L-苏氨酸转化为丙醛的能力。

在大肠杆菌中构建丁醛生物合成途径，该途径包含大肠杆菌的硫解酶(atoB)基因，拜氏丙酮丁醇梭菌ATCC 824的β-羟基丁酰辅酶A脱氢酶(hbd)基因、巴豆酸酶(crt)基因、丁酰辅酶A脱氢酶(bcd)基因、电子转移黄素蛋白A(etfA)基因和电子转移黄素蛋白B(etfB)基因，以及来自拜氏丙酮丁醇梭菌ATCC 824的辅酶A连接的丁醛脱氢酶(ald)基因，并检测该途径产生丁醛的能力。还用丙酮丁醇梭菌ATCC 824的辅酶A连接的醇脱氢酶(adhE2)基因作为ald的替代物，并检测其产生丁醇的能力。

构建异丁醛生物合成途径，该途径包含枯草芽孢杆菌(alsS)或肺炎克雷伯氏菌肺炎亚种MGH 78578(als)(优化密码子使用，用于大肠杆菌蛋白表达)的乙酰乳酸合酶，大肠杆菌的乙酰乳酸还原异构酶(ilvC)基因和2，3-二羟基异戊酸脱水酶(ilvD)基因，以及乳酸乳球菌的酮-异戊酸脱羧酶(kivd)，并检测其产生异丁醛的能力，这可通过异丁醛产生来测量。

构建3-甲基丁醛和2-甲基丁醛生物合成途径，该途径包含枯草芽孢杆菌(alsS)或肺炎克雷伯氏菌肺炎亚种MGH 78578(als)(优化密码子使用，用于大肠杆菌蛋白表达)的乙酰乳酸合酶，大肠杆菌的乙酰乳酸还原异构酶(ilcC)基因、2，3-二羟基异戊酸脱水酶(ilvD)基因、异丙基苹果酸合酶(LeuA)基因、异丙基苹果酸异构酶(LeuC和LeuD)基因和3-异丙基苹果酸脱氢酶(LeuB)基因，以及乳酸乳球菌的酮-异戊酸脱羧酶(kivd)，并检测该途径产生3-异戊醛和2-异戊醛的能力。

构建苯乙醛和4-羟基苯乙醛生物合成途径，该途径包含大肠杆菌的转酮醇酶(tktA)基因、3-脱氧-7-phosphoheptulonate合酶(aroF、aroG以及aroH)基因、3-脱氢奎尼酸合酶(aroB)基因、3-脱氢奎尼酸脱水酶(aroD)基因、脱氢莽草酸还原酶(aroE)基因、莽草酸激酶II(aroL)基因、莽草酸激酶I(aroK)基因、5-烯醇丙酮酰莽草酸-3-磷酸合成酶(aroA)基因、分支酸合酶(aroC)基因、融合的分支酸变位酶P/预苯酸脱水酶(pheA)基因以及融合的分支酸变位酶T/预苯酸脱氢酶(tyrA)基因，和乳酸乳球菌的酮-异戊酸脱羧酶(kivd)，并检测该途径产生苯乙醛和/或4-羟基苯乙醛的能力。

构建2-苯基乙醇、2-(4-羟苯基)乙醇以及2-(吲哚-3-)乙醇生物合成途径，该途径包含大肠杆菌的转酮醇酶(tktA)基因、3-脱氧-7-phosphoheptulonate合酶(aroF、aroG以及aroH)基因、3-脱氢奎尼酸合酶(aroB)基因、3-脱氢奎尼酸脱水酶(aroD)基因、脱氢莽草酸还原酶(aroE)基因、莽草酸激酶II(aroL)基因、莽草酸激酶I(aroK)基因、5-烯醇丙酮酰莽草酸-3-磷酸合成酶(aroA)基因、分支酸合酶(aroC)基因、融合的分支酸变位酶P/预苯酸脱水酶(pheA)基因以及融合的分支酸变位酶T/预苯酸脱氢酶(tyrA)基因，乳酸乳球菌的酮-异戊酸脱羧酶(kivd)，酿酒酵母的醇脱氢酶(adh2)，巴西固氮螺菌的吲哚-3-丙酮酸脱羧酶(ipdc)，红球菌ST-10的苯基乙醇还原酶(par)，以及荧光假单胞菌的苯甲醛裂解酶(bal)，并检测其产生2-苯基乙醇、2-(4-羟苯基)乙醇和/或2-(吲哚-3-)乙醇的能力。

pBADButP的构建：编码丙酮丁醇梭菌ATCC 824的hbd、crt、bcd、etfA以及etfB的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃3分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCTTAGGAGGATTAGTCATGGAAC-3’)(SEQ ID NO：161)和反向引物(5’-GCTCTAGATTATTTTGAATAATCGTAGA AACC-3’)(SEQ IDNO：162)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng丙酮丁醇梭菌ATCC 824基因组(ATCC)，总体积50μl。扩增的DNA片段用BamHI和XbaI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADButP-atoB的构建：编码大肠杆菌DH10B的atoB的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGAGGATATATATATGAAAAATTGTGTCATCGTC-3’)(SEQ ID NO：163)和反向引物(5’-AACTGCAGTTAATTCAACCGTTCAATCACC-3’)(SEQ ID NO：164)、1UPhusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌DH10B基因组，总体积50μl。扩增的DNA片段用XbaI和PstI消化，并连接于用相同的限制酶预消化的pBADButP。

pBADatoB-ald的构建：编码大肠杆菌DH10B的atoB和拜氏梭菌(Clostridium beijerinckii)的ald的DNA序列单独地通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM的正向引物，对于atoB为5’-CGAGCTC AGGAGGATATATATATGAAAAATTGTGTCATCGTCAGTG-3’)(SEQ ID NO：165)，对于ald为5’-GGTTGAATTAAGGAGGATATATATATGAATAAAGACACACTAATACCTAC-3’)(SEQ ID NO：166)和反向引物(对于atoB为5’-GTCTTTATTCATATATATATCCTCCTTAATTCAACCGTTCAATCACCATC-3’(SEQ ID NO：146)，对于ald为5’-CCCAAGCTTAGCCGGCAAGTACACATCTTC-3’)(SEQ ID NO：167)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌DH10B和拜氏梭菌基因组(ATCC)，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱至30μl的EB缓冲液(Qiagen)中。将5μl各DNA溶液合并，且通过另一轮PCR剪接每个DNA片段：98℃10秒，60℃15秒以及72℃2分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAAAAATTGTGTCATCGTCAGTG-3’)(SEQ ID NO：168)和反向引物(5’-CCCAAGCTTAGCCGGCAAGTACACATCTTC-3’)(SEQ ID NO：169)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和HindIII消化，并连接至用相同的限制酶预消化的pBADButP。

pBADButP-atoB-ALD的构建：编码氯霉素乙酰转移酶(CAT)、P15复制原点、araBAD启动子、大肠杆菌DH10B的atoB和拜氏梭菌的ald的DNA片段1，和编码araBAD启动子、丙酮丁醇梭菌ATCC 824的hbd、crt、bcd、etfA以及etfB的DNA片段2，单独地通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃4分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于片段1为5’-AAGGAAAAAAGCGGCCGCCCCTGAACCGACGACCGGGTCG-3’)(SEQ ID NO：170)以及对于片段2为5’-CGGGGTACCACTTTTCATACTCCCGCCATTCAG-3’(SEQ IDNO：274)和反向引物(对于片段1为5’-CGGGGTACCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO：171)以及(对于片段2为5’-AAGGAAAAAAGCGGCCGCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO：172))，1U Phusion高保真DNA聚合酶(NEB)，以及50ng pBADatoB-ald和pBADButP，总体积50μl。扩增的DNA片段用NotI和KpnI消化，并彼此连接。

pBADilvCD的构建：编码大肠杆菌DH10B的ilvC和ilvD的DNA片段单独地通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(对于ilvC为5’-GCTCTAGAGGAGGATATATATATGGCTAACTACTTCAATACAC-3’)(SEQ ID NO：173)以及对于ilvD为5’-TGCTGTTGCGGGTTAAGGAGGATATATATATGCCTAAGTACCGTTCCGCC-3’)(SEQ ID NO：174)和反向引物(对于ilvC为5’-AACGGTACTTAGGCATATATATATCCTCCTTAACCCGCAACAGCAATACG-3’)(SEQ ID NO：175)以及对于ilvD为5’-ACATGCATGCTTAACCCCCCAGTTTCGATT-3’)(SEQ ID NO：176))、1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌DH10B基因组(ATCC)，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱至30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液进行合并，每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒以及72℃2分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGAGGATATATATATGGCTAACTACTTCAATACAC-3’)(SEQ ID NO：177)和反向引物(5’-ACATGCATGCTTAACCCCCCAGTTTCGATT-3’)(SEQ ID NO：178)，1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用XbaI和SphI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADals-ilvCD的构建：编码肺炎克雷伯氏菌肺炎亚种MGH78578(其密码子使用被优化，用于在大肠杆菌中过表达)的als的DNA片段通过聚合酶链式反应(PCR)进行扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGGATAAACAGTATCCGGT-3’)(SEQ ID NO：179)和反向引物(5’-GCTCTAGATTACAGAATTTGACTCAGGT-3’)(SEQ ID NO：180)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng pETals，总体积50μl。扩增的DNA片段用SacI和XbaI消化，并连接于用相同的限制酶预消化的pBADilvCD。

pBADalsS-ilvCD的构建：编码枯草芽孢杆菌B26的alsS的前半部分和后半部分的DNA片段通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃0.5分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于前半部分为5’-CCCGAGCTCAGGAGGATATATATATGTTGACAAAAGCAACAAAAG-3’)(SEQ ID NO：181)以及对于后半部分为5’-CGGTACCCTTTCCAGAGATTTAGAG-3’(SEQ ID NO：275)和反向引物(对于前半部分为5’-CTCTAAATCTCTGGAAAGGGTACCG-3’)(SEQ ID NO：182)以及(对于后半部分为5’-GCTCTAGATTAGAGAGCTTTCGTTTTCATG-3’)(SEQ ID NO：183)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng枯草芽孢杆菌B26的基因组(ATCC)，总体积50μl。将扩增的DNA片段进行凝胶纯化并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液进行合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGTTGACAAAAGCAACAAAAG-3’)(SEQ ID NO：184)和反向引物(5’-GCTCTAGATTAGAGAGCTTTCGTTTTCATG-3’)(SEQ ID NO：185)，1U Phusion高保真DNA聚合酶(NEB)。剪接的片段内部无XbaI位点，因此用SacI和XbaI消化，并连接于用相同的限制酶预消化的pBADilvCD。

pBADLeuABCD的构建：编码大肠杆菌BL21(DE3)的leuA、leuB、leuC以及leuD的DNA片段通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃3分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO：186)和反向引物(5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ ID NO：187)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌BL21(DE3)基因组，总体积50μl。扩增的DNA片段用SacI和XbaI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADLeuABCD2的构建：编码leuA和leuB的DNA片段1，和编码大肠杆菌BL21(DE3)的leuC和leuD的DNA片段2通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(对于片段1为5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO：188)和(对于片段2为5’-AGGGGTGTAAGGAGGATATATATATGGCTAAGACGTTATACGAAAAATTG-3’)(SEQ ID NO：189)和反向引物(对于片段1为5’-CGTCTTAGCCATATATATATCCTCCTTACACCCCTTCTGCTACATAGCGG-3’)(SEQ ID NO：190)和(对于片段2为5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO：191)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌BL21(DE3)基因组，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒，以及72℃3分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO：192)和反向引物(5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO：193)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和XbaI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADLeuABCD4的构建：编码大肠杆菌BL21(DE3)的leuA、leuB、leuC以及leuD的DNA片段通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP，0.5μM正向引物(对于leuA为5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO：194)(对于leuB为5’-GAAACCGTGTGAGGAGGATATATATATGTCGAAGAATTACCATATTGCCG-3’)(SEQ ID NO：195)(对于leuC为5’-AGGGGTGTAAGGAGGATATATATATGGCTAAGACGTTATACGAAAAATTG-3’)(SEQ ID NO：196)和(对于leuD为5’-ACATTAAATAAGGAGGATATATATATGGCAGAGAAATTTATCAAACACAC-3’)(SEQ ID NO：197)和反向引物(对于leuA为5’-ATTCTTCGACATATATATATCCTCCTCACACGGTTTCCTTGTTGTTTTCG-3’)(SEQ ID NO：198)(对于leuB为5’-CGTCTTAGCCATATATATATCCTCCTTACACCCCTTCTGCTACATAGCGG-3’)(SEQ IDNO：199)(对于leuC为5’-TTTCTCTGCCATATATATATCCTCCTTATTTAATGTTGCGAATGTCGGCG-3’)(SEQ ID NO：200)和(对于leuD为5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO：201)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌BL21(DE3)基因组，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒，以及72℃3分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO：202)和反向引物(5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQID NO：203)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和XbaI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADals-ilvCD-leuABCD、pBADals-ilvCD-leuABCD2、pBADals-ilvCD-leuABCD4、pBADalsS-ilvCD-leuABCD、pBADalsS-ilvCD-leuABCD2、pBADalsS-ilvCD-leuABCD4的构建：编码氯霉素乙酰转移酶(CAT)、P15复制原点、araBAD启动子、肺炎克雷伯氏菌肺炎亚种MGH78578的als(其密码子使用被优化，用于在大肠杆菌中过表达)或枯草芽孢杆菌B26的alsS和大肠杆菌DH10B的ilvC和ilvD的DNA片段1(对于als)和DNA片段2(对于alsS)，被单独地通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒，以及72℃4分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-AAGGAAAAAAGCGGCCGCCCCTGAACCGACGACCGGGTCG-3’)(SEQ ID NO：204)和反向引物(5’-CGGGGTACCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO：205)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng pBADals-ilvCD和pBADalsS-ilvCD，总体积50μl。

为了从leuC中去除内部SphI限制酶位点，进行重叠PCR。编码araBAD启动子、大肠杆菌BL21(DE3)的leuA、leuB、leuC以及leuD的DNA片段3(对于leuABCD)、片段4(对于leuABCD2)以及片段5(对于leuABCD4)的前半部分和后半部分，被单独地通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒以及72℃4分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(对于前半部分为5’-AAGGAAAAAAGCGGCCGCACTTTTCATACTCCCGCCATTCAG-3’)(SEQ ID NO：206)和(对于后半部分为5’-CAAAGGCCGTCTGCACGCGCCGAAAGGCAAA-3’)(SEQ IDNO：207))和反向引物(对于前半部分为5’-TTTGCCTTTCGGCGCGTGCAGACGGCCTTTG-3’)(SEQ ID NO：208)和(对于后半部分为5’-ACATGCATGCCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO：209)、1U Phusion高保真DNA聚合酶(NEB)，以及50ngpBADleuABCD、pBADleuABCD2和pBADleuABCD4，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒，以及72℃4分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-AAGGAAAAAAGCGGCCGCACTTTTCATACTCCCGCCATTCAG-3’)(SEQ ID NO：210)和反向引物(5’-ACATGCATGCCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ ID NO：211)、1U Phusion高保真DNA聚合酶(NEB)。所得的片段3、4以及5用SphI和NotI消化，并连接于用相同的限制酶预消化的片段1和2两者。

pBADaroG-tktA-aroBDE的构建：编码大肠杆菌BL21(DE3)的aroG、tktA、aroB、aroD以及aroE的DNA片段通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于aroG为5’-CCCGAGCTCAGGAGGATATATATATGAATTATCAGAACGACGATTTAC-3’)(SEQ ID NO：212)，(对于tktA为5’-GCGTCGCGGGTAAGGAGG AAATTTTATGTCCTCACGTAAAGAGCTTGCC-3’)(SEQ IDNO：213)，(对于aroB为5’-GAACTGCTGTAAGGAGGTTAAATTATGGAGAGGATTGTCGTTACTCTCG-3’)(SEQ ID NO：214)}(对aroD为5’-CAATCAGCGTAAGGAGGTATATATAATGAAAACCGTAACTGTAAAAGATC-3’)(SEQ ID NO：215)和(对于aroE为5’-TACACCAGGCATAAGGAGGAATTAATTATGGAAACCTATGCTGTTTTTGG-3’)(SEQID NO：216)以及反向引物(对于aroG为5’-TACGTGAGGACATAAAATTTTCCTCCTTACCCGCGACGCGCTTTTACTGC-3’)(SEQ ID NO：217)，(对于tktA为5’-CAATCCTCTCCATAATTTTAACCTCCTTACAGCAGTTCTTTTGCTTTCGC-3’)(SEQ ID NO：218)，(对于aroB为5’-CAATCAGCGTAAGGAGGTATATATAATGAAAACCGTAACTGTAAAAGATC-3’)(SEQ ID NO：219)，(对于aroD为5’-TACGGTTTTCATTATATATACCTCCTTACGCTGATTGACAATCGGCAATG-3’)(SEQ ID NO：220)和(对于aroE为5’-ACATGCATGCTTACGCGGACAATTCCTCCTGCAA-3’)(SEQ ID NO：221)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌BL21(DE3)基因组，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒以及72℃3分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGAATTATCAGAACGACGATTTAC-3’)(SEQ ID NO：222)和反向引物(5’-ACATGCATGCTTACGCGGACAATTCCTCCTGCAA-3’)(SEQ ID NO：223)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和SphI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADpheA-aroLAC的构建：编码大肠杆菌DH10的pheA、aroL、aroA以及aroC的DNA片段通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于pheA为5’-CCCGAGCTCAGGAGGATATATATATGACATCGGAAAACCCGTTACTGG-3’)(SEQ ID NO：224)，(对于aroL为5’-GATCCAACCTAAGGAGGAAAATTTTATGACACAACCTCTTTTTCTGATCG-3’)(SEQ IDNO：225)，(对于aroA为5’-GATCAATTGTTAAGGAGGTATATATAATGGAATCCCTGACGTTACAACCC-3’)(SEQ ID NO：226)和(对aroC为5’-CAGGCAGCCTAAGGAGGAATTAATTATGGCTGGAAACACAATTGGACAAC-3’)(SEQ ID NO：227)和反向引物(对于pheA为5’-AGGTTGTGTCATAAAATTTTCCTCCTTAGGTTGGATCAACAGGCACTACG-3’)(SEQ ID NO：228)，(对于aroL为5’-CAGGGATTCCATTATATATACCTCCTTAACAATTGATCGTCTGTGCCAGG-3’)(SEQ IDNO：229)，(对于aroA 为5’-GTTTCCAGCCATAATTAATTCCTCCTTAGGCTGCCTGGCTAATCCGCGCC-3’)(SEQ ID NO：230)和(对于aroC为5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQ ID NO：231)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌BL21(DE3)基因组，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒以及72℃4分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGACATCGGAAAACCCGTTACTGG-3’)(SEQ ID NO：232)和反向引物(5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQID NO：233)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和SphI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADtyrA-aroLAC的构建：编码大肠杆菌DH10的pheA、aroL、aroA以及aroC的DNA片段通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于tyrA为5’-CCCGAGCTCAGGAGGATATATATATGGTTGCTGAATTGACCGCATTAC-3’)(SEQ ID NO：234)，(对于aroL为5’-AATCGCCAGTAAGGAGGAAAATTTTATGACACAACCTCTTTTTCTGATCG-3’)(SEQ IDNO：235)，(对于aroA为5’-GATCAATTGTTAAGGAGGTATATATAATGGAATCCCTGACGTTACAACCC-3’)(SEQ ID NO：236)和(对于aroC为5’-CAGGCAGCCTAAGGAGGAATTAATTATGGCTGGAAACACAATTGGACAAC-3’)(SEQ ID NO：237)，和反向引物(对于tyrA为5’-GAGGTTGTGTCATAAAATTTTCCTCCTTACTGGCGATTGTCATTCGCCTG-3’)(SEQ ID NO：238)，(对于aroL为5’-CAGGGATTCCATTATATATACCTCCTTAACAATTGATCGTCTGTGCCAGG-3’)(SEQ IDNO：239)，(对于aroA为5’-GTTTCCAGCCATAATTAATTCCTCCTTAGGCTGCCTGGCTAATCCGCGCC-3’)(SEQ ID NO：240)以及(对于aroC为5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQ ID NO：241)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng大肠杆菌BL21(DE3)基因组，总体积50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μl EB缓冲液(Qiagen)。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒，以及72℃4分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGGTTGCTGAATTGACCGCATTAC-3’)(SEQ ID NO：242)反向引物(5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQ IDNO：243)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和SphI消化，并连接于用相同的限制酶预消化的pBAD33。

pBADpheA-aroLAC-aroG-tktA-aroBDE 和pBADtyrA-aroLAC-aroG-tktA-aroBDE的构建：编码氯霉素乙酰转移酶(CAT)、P15复制原点、araBAD启动子，大肠杆菌DH10B的pheA或tyrA，aroL、aroA、aroC的DNA片段1(对于pheA)和2(对于tyrA)，和编码araBAD启动子、大肠杆菌DH10B的aroG、tktA、aroB、aroD以及aroE的DNA片段3，被单独地通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒，以及72℃4分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于片段1和2为5’-AAGGAAAAAAGCGGCCGCCCCTGAACCGACGACCGGGTCG-3’)(SEQ ID NO：244)和(对于片段3为5’-GCTCTAGAACTTTTCATACTCCCGCCATTCAG-3’)(SEQ ID NO：245)和反向引物(对于片段1和2为5’-GCTCTAGAGCGGATACATATTTGAATGTATTTAG-3’)(SEQ IDNO：246)和(对于片段3为5’-AAGGAAAAAAGCGGCCGCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO：247)，1U Phusion高保真DNA聚合酶(NEB)，以及50ng pBADpheA-aroLAC、pBADtyrA-aroLAC和pBADaroG-tktA-aroBDE，总体积50μl。扩增的DNA片段1和2用NotI和XbaI消化，并连接于用相同的限制酶预消化的片段3。

pTrcBAL的构建：编码苯荧光假单胞菌的乙醛裂解酶(bal)的DNA序列(优化其密码子使用，用于在大肠杆菌中过表达)通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGCTATGATTACTGGTGG-3’)(SEQ ID NO：248)和反向引物(5’-CCCCGAGCTCTTACGCGCCGGATTGGAAATACA-3’)(SEQID NO：249)、1U Phusion高保真DNA聚合酶(NEB)以及50ng pETBAL，总体积50μl。扩增的DNA片段用NcoI和SacI消化，并连接于用相同的限制酶预消化的pTrc99A。

pTrcAdhE2的构建：编码丙酮丁醇梭菌ATCC824的辅酶A连接的醇/醛脱氢酶(adhE2)的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGCCAAAGTTACAAATCAAAAAG-3’)(SEQ ID NO：250)和反向引物(5’-CGAGCTCTTAAAATGATTTTATATAGATATCC-3’)(SEQ IDNO：251)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng丙酮丁醇梭菌ATCC824基因组，总体积50μl。扩增的DNA片段用NcoI和SacI消化，并连接于用相同的限制酶预消化的pTrc99A。

pTrcAdh2的构建：编码酿酒酵母的醇脱氢酶(adh2)的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGGTATTCCAGAAACTCAAAAAG-3’)(SEQ ID NO：252)和反向引物(5’-CCCGAGCTCTTATTTAGAAGTGTCAACAACG-3’)(SEQ ID NO：253)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng酿酒酵母基因组，总体积50μl。扩增的DNA片段用NcoI和SacI消化，并连接于用相同的限制酶预消化的pTrc99A。

pTrcBALD的构建：编码拜氏梭菌的辅酶A连接的醛脱氢酶(ald)的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCCGAGCTCAGGAGGATATACATATGAATAAAGACACACTAATACC-3’)(SEQ ID NO：254)和反向引物(5’-CCCAAGCTTAGCCGGCAAGTACACATCTTC-3’)(SEQID NO：255)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng pETBAL，总体积50μl。扩增的DNA片段用SacI和HndIII消化，并连接于用相同的限制酶预消化的pTrcBAL。

pTrcBALK的构建：编码乳酸乳球菌的酮异戊酸脱羧酶(kivd)的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒，以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGTATACAGTAGGAGATTACC-3’)(SEQ ID NO：256)和反向引物(5’-GCTCTAGATTATGATTTATTTTGTTCAGCAAAT-3’)(SEQ IDNO：257)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng pETBAL，总体积50μl。扩增的DNA片段用SacI和XbaI消化，并连接于用相同的限制酶预消化的pTrcBAL。

pTrcAdh-Kivd的构建：编码乳酸乳球菌的酮异戊酸脱羧酶(kivd)的DNA序列通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGTATACAGTAGGAGATTACC-3’)(SEQ ID NO：258)和反向引物(5’-GCTCTAGATTATGATTTATTTTGTTCAGCAAAT-3’)(SEQ IDNO：259)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng pETBAL，总体积50μl。扩增的DNA片段用SacI和XbaI消化，并连接于用相同的限制酶预消化的pTrcAdh2。

pTrcBAL-DDH-2ADH的构建：为了去除内部NcoI位点，进行重叠PCR。编码肺炎克雷伯氏菌肺炎亚种MGH 78578的内消旋-2，3-丁二醇脱氢酶(ddh)以及荧光假单胞菌的次级醇脱氢酶(2adh)的前半部分和后半部分的DNA片段，被单独地通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)，2mM dNTP，0.5μM正向引物(对于ddh的前半部分为5’-CGAGCTCAGGAGGATATATATATGAAAAAAGTCGCACTTGTTACCG-3’)(SEQ ID NO：260)，(对于ddh的后半部分为5’-GGCCGGCGGC CGCGCGATGGCGGTGAAAGTG-3’)(SEQ IDNO：261)，(对于2adh的前半部分为5’-AACTAATCTAGAGGAGGATATATATATGAGCATGACGTTTTCCGGCCAGG-3’)(SEQ ID NO：262)和(对于2adh的后半部分为5’-CCTTGCGGAGGGCTCGATGGATGAGTTCGAC-3’)(SEQ ID NO：263)和反向引物(对于ddh的前半部分为5’-CACTTTCACCGCCATCGCGCGGCCGCCGGCC-3’)(SEQ IDNO：264)，(对于ddh的后半部分为5’-GCTCATATATATATCCTCCTCTAGATTAGTTAAACACCAT CCCGCCGTCG-3’)(SEQ ID NO：265)，(对于2adh的前半部分为5’-GTCGAACTCATCCATCGAGCCCTCCGCAAGG-3’)(SEQ ID NO：266)和(对于2adh的后半部分为5’-CCCAAGCTTAGATCGCGGTGGCCCCGCCGTCG-3’)(SEQ ID NO：267)，1UPhusion高保真DNA聚合酶(NEB)，以及对于ddh为50ng肺炎克雷伯氏菌肺炎亚种MGH 78578基因组，对于2adh为50ng荧光假单胞菌基因组，总体积为50μl。将扩增的DNA片段进行凝胶纯化，并洗脱于30μlEB缓冲液(Qiagen)中。将5μl各DNA溶液合并，并将每一DNA片段通过另一轮PCR进行剪接：98℃10秒，60℃15秒以及72℃2分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAAAAAAGTCGCACTTGTTACCG-3’)(SEQ ID NO：268)和反向引物(5’-CCCAAGCTTAGATCGCGGTGGCCCCGCCGTCG-3’)(SEQ ID NO：269)、1UPhusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和HindIII消化，并连接于用相同的限制酶预消化的pTrcBAL。

pBBRPduCDEGH的构建：编码肺炎克雷伯氏菌肺炎亚种MGH78578的丙二醇脱水酶中亚基(pduD)和小亚基(pduE)以及丙二醇脱水酶再激活大亚基(pduG)和小亚基(pduH)的DNA序列，通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒以及72℃2分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGAGGATTTAAAAATGGAAATTAACGAAACGCTGC-3’)(SEQ ID NO：270)和反向引物(5’-TCCCCGCGGTTAAGCATGGCGATCCCGAAATGGAATCCCTTTGAC-3’)(SEQ ID NO：271)、1UPhusion高保真DNA聚合酶(NEB)，以及50ng肺炎克雷伯氏菌肺炎亚种MGH 78578，总体积50μl。扩增的DNA片段用SacII和XbaI消化。并连接于用相同的限制酶预消化的pTrc99A，形成pBBRPduDEGH。

编码肺炎克雷伯氏菌肺炎亚种MGH 78578的丙二醇脱水酶大亚基(pduC)的DNA序列，通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCGCTCGAGGAGGATATATATATGAGATCGAAAAGATTTGAAGC-3’)(SEQ IDNO：272)和反向引物(5’-GCTCTAGATTAGCCAAGTTCATTGGGATCG-3’)(SEQ ID NO：273)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng肺炎克雷伯氏菌肺炎亚种MGH 78578，总体积50μl。扩增的DNA片段用XhoI和XbaI消化，并连接于用相同的限制酶预消化的pBBRPduDEGH。

pTrcIpdc-Par的构建：编码巴西固氮螺菌的吲哚-3-丙酮酸(ipdc)和红球菌ST-10的苯基乙醇还原酶(par)的DNA序列，通过聚合酶链式反应(PCR)而扩增：98℃10秒，60℃15秒以及72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGGACTGGCTGAGGCACTGCTGC-3’(对于ipdc为SEQ ID NO：314)和对于par为5’-CGAGCTCAGGAGGATATATATATGAAAGCTATCCAGTACACCCGTAT-3’(SEQ ID NO：315)和反向引物(对于ipdc为5’-CGAGCTCTTATTCGCGCGGTGCCGCGTGCAGG-3’(SEQ ID NO：316)和对于par为5’-GCTCTAGATTACAGGCCCGGAACCACAACGGCGC-3’(SEQ ID NO：317)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng pTrcIpdc和pTrcPar，总体积50μl。ipdc和par的扩增的DNA片段分别用NcoI/SacI和SacI/XbaI消化，并连接于用NcoI和XbaI预消化的pTrc99A。

检测和结果

为了检测丁醛生物合成途径，将容纳pBADButP-atoB/pTrcBALD和pBADButP-atoB-ALD/pTrcB2DH/pBBRpduCDEGH的DH10B在37℃、200rpm下，在LB培养基中培养过夜，该培养基含有50μg/ml氯霉素(Cm⁵⁰)和100μg/ml氨苄青霉素(Amp¹⁰⁰)。将每一种子培养物的等分试样接种于含有Cm⁵⁰和Amp¹⁰⁰的新鲜TB培养基中，并在37℃、200rpm下，培养于振荡培养箱中。接种3小时后，用13.3mM阿拉伯糖和1mM IPTG诱导培养物，并过夜培养。用等体积的乙酸乙酯提取700μl该培养物，并利用GC-MS分析。

为了检测异丁醛生物合成途径，将容纳pBADals-ilvCD/pTrcBALK或pBADalsS-ilvCD/pTrcBALK的DH10B细胞在37℃、200rpm下，过夜培养于含有50μg/ml氯霉素(Cm⁵⁰)和100μg/ml氨苄青霉素(Amp¹⁰⁰)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm⁵⁰和Amp¹⁰⁰的新鲜TB培养基中，并在37℃、200rpm下，培养于振荡培养箱中。接种3个小时后，用13.3mM阿拉伯糖和1mM IPTG诱导培养物，并过夜培养。用等体积的乙酸乙酯提取700μl该培养物，并利用GC-MS分析异丁醛的产生。图8B表示由这些培养物产生的异丁醛。

为了检测3-甲基丁醛和2-甲基丁醛生物合成途径，将容纳pBADals-ilvCD-LeuABCD/pTrcBALK、pBADals-ilvCD-LeuABCD2/pTrcBALK、pBADals-ilvCD-LeuABCD/pTrcBALK4、pBADalsS-LeuABCD/pTrcBALK、pBADalsS-LeuABCD2/pTrcBALK或pBADalsS-LeuABCD4/pTrcBALK的DH10B在37℃、200rpm下过夜培养于含有50μg/ml氯霉素(Cm⁵⁰)和100μg/ml氨苄青霉素(Amp¹⁰⁰)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm⁵⁰和Amp¹⁰⁰的新鲜TB培养基中，并在37℃、200rpm下，培养于振荡培养箱中。接种3个小时后，用13.3mM阿拉伯糖和1mM IPTG诱导培养物，并过夜培养。用等体积的乙酸乙酯提取700μl该培养物，并利用GC-MS分析。监测2-isovaleralcohol(2-甲基戊基)和3-isovaleralcohol(3-甲基戊醛)，因为3-异戊醛和2-异戊醛自发地转化为它们的相应的醇。图8B表示由这些培养物产生的2-甲基戊基和3-甲基戊醛。

为了检测苯乙醛和4-羟苯基乙醛的生物合成途径，将容纳pBADpheA-aroLAC/pTrcBALK、pBADtyrA-aroLAC/pTrcBALK、pBADaroG-tktA-aroBDE/pTrcBALK、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK以及pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK的DH10B细胞在37℃、200rpm下过夜培养于含有50μg/ml氯霉素(Cm⁵⁰)和100μg/ml氨苄青霉素(Amp¹⁰⁰)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm⁵⁰和Amp¹⁰⁰的新鲜TB培养基中，并在37℃、200rpm下，培养于振荡培养箱中。接种3个小时后，用13.3mM阿拉伯糖和1mM IPTG诱导培养物，并过夜培养。用等体积的乙酸乙酯提取700μl该培养物，并利用GC-MS分析。利用GC-MS，监测苯乙醛、4-羟基苯乙醛和其相应的醇的产生。图9B表示由这些培养物产生4-羟苯基乙醇。

为了检测2-苯基乙醇、2-(4-羟苯基)乙醇和2-(吲哚-3)乙醇生物合成途径，将容纳pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcAdh2-Kivd、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcAdh2-Kivd、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcIpdc-Par和pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcIpdc-Par的DH10B，在37℃、200rpm下过夜培养于含有50μg/ml氯霉素(Cm⁵⁰)和100μg/ml氨苄青霉素(Amp¹⁰⁰)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm⁵⁰和Amp¹⁰⁰的新鲜TB培养基中，并在37℃、200rpm下，培养于振荡培养箱中。接种3个小时后，用13.3mM阿拉伯糖和1mMIPTG诱导培养物，并培养过夜至一周。用等体积的乙酸乙酯提取700μl该培养物，并利用GC-MS分析。结果在下文进行了详述。

2-苯基乙醇、2-(4-羟苯基)乙醇和/或2-(吲哚-3-)乙醇的产生用GC-MS监测。图42A表示在24小时由这些培养物产生的2-苯基乙醇。图42B表示在24小时由这些培养物产生的2-(4-羟苯基)乙醇。图42C表示在24小时由这些培养物产生的2-(吲哚-3-)乙醇。

图43A表示一周时对照(pBAD33和pTrc99A)的GC-MS层析谱。图43B表示一周时由pBADpheA-aroLAC-aroG-tktA-aroBDE和pTrcBALK产生的2-苯基乙醇(5.97分钟)的GC-MS层析谱。图44表示一周时由pBADtyrA-aroLAC-aroG-tktA-aroBDE和pTrcBALK产生的2-(4-羟苯基)乙醇(9.36分钟)和2-(吲哚-3)乙醇(10.32分钟)的GC-MS层析谱。

实施例5

二醇脱氢酶的分离和生物活性

可用的底物，如3-羟基-2-丁酮(乙偶姻)、4-羟基-3-丁酮(propioin)、5-羟基-4-辛酮(丁偶姻)、6-羟基-5-癸酮(valeroin)以及1，2-环戊二醇，用于测量二醇脱氢酶(ddh)催化大的饱和的α-羟基酮还原产生二醇的能力。除非另有说明，所有的试剂均购买自Sigma-Aldrich Co.和TCI America。

为了克隆和分离DDH多肽，从ATCC获得几个细菌物种(短乳杆菌ATCC 367、恶臭假单胞菌KT2440以及肺炎克雷伯氏菌MGH78578)的基因组DNA，利用以下操作步骤，进行PCR-扩增(在50μL反应中，使用Phusioin聚合酶和1×Phusion缓冲液、0.2mM dNTP、0.5μL Phusion酶、1.5μM引物以及20pg模板DNA)：30个循环，98℃/10秒(变性)，60℃/15秒(退火)，72℃/30秒(延伸)。随后利用限制酶NdeI和BamHI，消化聚合酶链式反应产物，接着连接于NdeI/BamHI消化的pET28的载体。将含有ddh的载体克隆转化于BL21(DE3)感受态细胞，用于蛋白表达。将单个菌落接种于LB培养基中，在OD₆₀₀＝0.6下，用0.1mM IPTG诱导6×His标签目的蛋白的表达。允许表达在22℃下进行15小时。遵循QIAGEN所建议的操作步骤，利用Ni-NTA旋转柱，纯化6×His标签的酶，从而产生浓度范围为1.1-6.5mg/mL(经Bradford测定而测定)的纯化的蛋白。

从短乳杆菌ATCC 367中分离二醇脱氢酶ddh1，从恶臭假单胞菌KT2440中分离二醇脱氢酶ddh2，并从肺炎克雷伯氏菌MGH78578中分离二醇脱氢酶ddh3。编码ddh1的核苷酸序列和ddh1的多肽序列分别显示于SEQ ID NOS：97和98中。编码ddh2的核苷酸序列和ddh2的多肽序列分别显示于SEQ ID NOS：99和100中。编码ddh3的核苷酸序列和ddh3的多肽序列分别显示于SEQ ID NOS：101和102中。

测量DDH多肽生物活性的反应以200μL的终体积按如下进行：25mM底物、0.04mg/mL DDH多肽、0.25mg/mL烟碱辅因子、200mM咪唑、14mM Tris-HCl以及体积比为1.5％的DMSO。利用MolecularDevices Thermomax 96孔板读数器，进行生物活性测定，从而监测340nm的吸光率，其对应于NADH或NADPH的浓度。对于动力学研究，使用0.04mg/mL DDH多肽、0.25mg/mL NADH、20mM Tris HCl缓冲液pH6.5(red)或9.0(ox)、T＝25C，总体积为100μL。

图12A表示利用丁偶姻作为底物，ddh1、ddh2以及ddh3的生物活性(三角形表示ddh3的活性)。图12B表示ddh3对1，2-环戊二醇和1，2-环己二醇的氧化活性，这可以由NADH的产生测量。图13概括了在DDH多肽所催化的氧化反应中对各种底物的动力学研究结果。这些反应是NAD+依赖性的。

实施例6

CC-连接酶(裂解酶)和二醇脱氢酶的依次体内生物活性

在大肠杆菌中检测C-C裂解酶和二醇氢化酶进行下述依次反应的能力：

为了产生α-羟基酮和二醇，在大肠杆菌中构建包含分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子使用，用于大肠杆菌的蛋白表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的内消旋-2，3-丁二醇脱氢酶(ddh)基因的途径，并检测其缩合下文表2所详述的底物(如乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、苯乙醛以及4-羟基苯乙醛，或其相应的醇)，体内形成α-羟基酮和相应的二醇能力。各种α-羟基酮和二醇的产生通过气相色谱-质谱术(gas chromatography-massspectrometry，GC-MS)监测。

表2：底物和产物概要

底物	所产生的α-羟基酮	所产生的二醇	图
底物	所产生的α-羟基酮	所产生的二醇	图	丁醛	5-羟基-4-辛酮	4，5-辛二醇	17A&B
正-戊醛	6-羟基-5-癸酮	5，6-癸二醇	18A&B	丁醛	5-羟基-4-辛酮	4，5-辛二醇	17A&B
正-戊醛	6-羟基-5-癸酮	5，6-癸二醇	18A&B	3-甲基丁醛	2，7-二甲基-5-羟基-4-辛酮	2，7-二甲基-4，5-辛二醇	19A&B
正-己醛	7-羟基-6-十二碳酮	6，7-十二烷二醇	20A&B	3-甲基丁醛	2，7-二甲基-5-羟基-4-辛酮	2，7-二甲基-4，5-辛二醇	19A&B
正-己醛	7-羟基-6-十二碳酮	6，7-十二烷二醇	20A&B	4-甲基戊醛	2，9-二甲基-6-羟基-5-癸酮	2，9-二甲基-5，6-癸二醇	21A&B
正-辛醛	9-羟基-8-十六碳酮	8，9-十六烷二醇	22	4-甲基戊醛	2，9-二甲基-6-羟基-5-癸酮	2，9-二甲基-5，6-癸二醇	21A&B
正-辛醛	9-羟基-8-十六碳酮	8，9-十六烷二醇	22	乙醛	3-羟基-2-丁酮	2，3-丁二醇	23

底物	所产生的α-羟基酮	所产生的二醇	图
底物	所产生的α-羟基酮	所产生的二醇	图	正-丙醛	4-羟基-3-己酮	3，4-己二醇	24A&B
苯乙醛	1，4-二苯基-3-羟基-2-丁酮	1，4-二苯基-2，3-丁二醇	25	正-丙醛	4-羟基-3-己酮	3，4-己二醇	24A&B

对于小于等于C10的分析：将容纳pTrcBAL-DDH-2ADH的大肠杆菌过夜培养于含有50μg/ml卡那霉素(Km)的LB培养基中。将这种种子培养物接种于含有3％(v/v)甘油、0.5％(g/v)和50μg/ml Km的M9培养基中。将10mL培养物培养至O.D.₆₀₀＝0.7，随后用0.5mM IPTG诱导培养物。在加入各种醛至浓度为5-10mM前，允许细胞表达目的酶3小时。在加入醛后，将培养物加上盖子，并37℃下振荡孵育72小时。用2mL乙酸乙酯提取培养物，并利用下述操作步骤在GC-MS上分析：

1μL注射w/50∶1半品脱(split)

进口温度-150℃

初始炉温-50℃

温度斜坡1-10℃/分钟-150℃

温度斜坡2-50℃/分钟-300℃

GC向MS转移的温度-250℃

MS检测-全扫描MW 35-200

对于大于等于C12的分析：将容纳pTrc99A(对照载体)或pTrcBAL的大肠杆菌DH10B菌株接种于0.75×M9/0.5％LB，该培养基含有0.1mM CaCl₂、2mM MgSO₄、1mM KCl、1％半乳糖醛酸盐、5μg/mL硫胺、Amp。将该培养物培养至高达0.8的光密度(600n nm)，用0.25mMIPTG诱导。允许细胞在37℃下表达蛋白2.5小时，随后添加醛底物，至浓度为5mM，将培养瓶牢固地该上盖子，并在37℃w/振荡200rpm孵育72小时。用0.75mL乙酸乙酯提取1mL最终培养物，离心，促进相分离，随后利用下述方法经由GCMS分析：

1μL注射w/50∶1半品脱

进口温度-250℃

初始炉温-50℃

温度斜坡1-10℃/分钟至125℃

温度斜坡2-30℃/分钟至300℃

最终温度300℃-1分钟

GC向MS转移的温度-250℃

MS检测-全扫描MW 40-260。

结果绘示于图17-图25。图17表示丁醛依次转化为5-羟基-4-辛酮、随后是4，5-辛二醇。图18表示正-戊醛依次转化为6-羟基-5-癸酮和随后地5，6-癸二醇。图19表示3-甲基丁醛转化为2，7-二甲基-5-羟基-4-辛酮和随后地2，7-二甲基-4，5-辛二醇。图20表示正-己醛依次转化为7-羟基-6-十二碳酮和随后地6，7-十二烷二醇。图21表示4-甲基戊醛转化为2，9-二甲基-6-羟基-5-癸酮和随后地2，9-二甲基-5，6-癸二醇。图22表示正-辛醛转化为9-羟基-8-十六碳酮。图23表示乙醛转化为3-羟基-2-丁酮。图24表示正-丙醛依次转化为4-羟基-3-丁酮和随后地3，4-己二醇。图25表示苯乙醛转化为1，4-二苯基-3-羟基-2-丁酮。

与上文相似，在大肠杆菌中构建包含分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化密码子的使用，用于大肠杆菌蛋白的表达)的途径，并检测其催化产生各种α-羟基酮的能力。结果表示所检测的bal基因的广谱C-C连接酶活性，并示于图48-图55中。

实施例7

二醇脱氢酶和二醇脱水酶的依次生物活性

为了检测二醇脱氢酶和二醇脱水酶在脱水和还原途径中的依次生物活性，用丁偶姻作为产生4-辛酮的依次反应的底物。二醇脱氢酶(如ddh)催化α-羟基酮和其相应的二醇如5-羟基-4-辛酮和4，5-辛二醇的可逆的还原和氧化，二醇脱水酶(如pduCDE)催化二醇如4，5-辛二醇的不可逆脱水。

将肺炎克雷伯氏菌MGH 78578的二醇脱氢酶ddh和肺炎克雷伯氏菌MGH 78578的二醇脱水酶pduCDE克隆至细菌表达载体并表达，并且在Ni-NTA柱上纯化，如实施例X所述，除了在二醇脱水酶的表达和纯化过程中的所有时间添加1mM 1，2-丙二醇外。pduCDE多肽的大、中和小亚基分别为SEQ ID NOs：103、105和107的核苷酸序列编码，且多肽序列分别示于SEQ ID NOs：104、106和108中。

将ddh3和pduCDE多肽与丁偶姻和它们的适当辅因子一起孵育，随后用气相色谱质谱术(GC-MS)测定其进行依次反应产生4-辛酮产物的能力。下文的表3给出了反应条件。将反应混合物在37℃下，在0.6mL具有最小头部空间的eppendorf管中孵育40小时。用等体积的乙酸乙酯提取反应产物，储存于玻璃瓶，并送往Thermo Fischer ScientificInstruments Division，用于通过GC-MS的组成分析。

表3：反应条件
表3：反应条件		Rxn成分	浓度
5-羟基-4-辛酮(丁偶姻)	8.4mM	Rxn成分	浓度
5-羟基-4-辛酮(丁偶姻)	8.4mM	腺苷钴胺(辅酶B12)	33.5μM
KCl	9.6mM	腺苷钴胺(辅酶B12)	33.5μM
KCl	9.6mM	NADH	18mM
dDH3酶	0.19mg/mL	NADH	18mM
dDH3酶	0.19mg/mL	dDOH1酶混合物	0.15mg/mL
反应缓冲液	10mM Tris HCl pH 7.0	dDOH1酶混合物	0.15mg/mL

图26A表示GC-MS数据，该数据证实在样品提取物中存在4，5-辛二醇。在5.36分钟时的峰、滞留时间的质谱鉴定为丁偶姻(底物)，在6.01、6.09和6.12分钟时，鉴定为4，5-辛二醇的不同异构体。这种化合物是由丁偶姻通过ddh3的还原产生的期望的产物。

图26B表示GC-MS数据，其证实在样品提取物种存在4-辛酮。4.55时的峰、滞留时间的质谱鉴定为4-辛酮。这种化合物是由分别通过ddh3和pduCDE的依此的丁偶姻脱氢和4，5-辛二醇脱水而产生的期望的产物。

图27A和图27B表示样品提取物气相色谱/质谱和4-辛酮标准气相色谱/质谱间的比较。这些结果证明，利用二醇脱氢酶(ddh3)和二醇脱水酶(pduCDE)，4-辛酮由丁偶姻产生。孵育的反应混合物的GC-MS分析证实起始材料、中间物和产物，从而证明这些酶对这些特定底物是再适当的。

实施例8

次级醇脱氢酶的分离和生物活性

利用底物如4-辛酮、2，7-二甲基-4-辛酮、环戊酮和相应的醇，测量次级醇脱氢酶(2ADHs)催化大的饱和的酮还原为次级醇的能力。次级醇脱氢酶所催化的反应的实例示例于下文(表示4-辛酮还原为4-辛醇)：

除非另有说明，所有的酶和试剂均分别购买自New England Biolabs和Sigma。

各种次级醇脱氢酶(2ADHs)分离自恶臭假单胞菌KT2440、荧光假单胞菌Pf-5和肺炎克雷伯氏菌MGH 78578。所有的载体在BL21(DE3)感受态细胞中转化，用IPTG(经由T7启动子)诱导编码目的蛋白的基因的表达。裂解细胞，提取蛋白，随后在Ni-NTA柱上纯化。在测定前，将Ni-NTA洗脱物中终蛋白的浓度稀释为0.15mg/mL。

利用THERMOmax微量培养板读数器以动力学模式进行NADPH/NADPH消耗和产生测定，从而监测340nm下的NADPH的吸光率峰，直到反应到达平衡。在表2所述的测定中，检测2ADH-2、2ADH-5、2ADH-8以及2ADH-10催化4-辛醇的氧化或催化4-辛酮的还原的能力。这些反应条件见下文的表4：

如下文表5所述，进行其它检测，其中检测2ADH-2、2ADH-11、2ADH-12、2ADH-13、2ADH-14、2ADH-15、2ADH-16、2ADH-17和2ADH-18催化4-辛醇、2，7-二甲基-4-辛醇或环戊醇的氧化或催化4-辛酮、2，7-二甲基-4-辛酮或环戊酮的还原的能力。

表5：

图30A表示表3的NADH产生测定的结果，其中，在存在NAD+时，2ADH-2催化4-辛醇的氧化，这可由NADH的产生测量。图30B表示表3的NADPH产生测定的结果，其中，在存在NADP+时，2ADH-5、2ADH-8和2ADH-10催化4-辛醇的氧化，这可由NADPH的产生测量。

图31表示4-辛醇通过2ADH-11(图31A)和2ADH-16(图31B)的氧化，可分别由NADH和NADPH的产生测量。图32表示2，7-二甲基辛醇通过2ADH-11和其它(图32A)以及2ADH-16(图32B)的氧化，这分别可以由NADH和NADPH的产生测量。

图33A表示2，7-二甲基辛醇通过2ADH 11和2ADH16的还原，这可由NADPH消耗监测。图33B表示2ADH11和2ADH16两者对各种底物的还原活性。图34表示环戊醇通过2ADH-16的氧化(图34A)和还原(图34B)。

与上文相似，利用2ADH-16，对各种底物进行氧化和还原反应的动力学检测。这些研究的条件如下：0.04mg/mL酶，0.25mg/mL辅因子，20mM Tris HCl缓冲液pH 6.5(red)或9.0(ox)，T＝25C，总体积100μL。还原反应的计算的速率常数，以及底物的结构，概括于图35中。氧化反应的计算的速率常数，以及底物的结构，概括于图36。这些结果表明，2ADH-16能催化广泛种类底物的氧化和还原两者。

实施例9

不依赖辅酶B12的二醇脱水酶的分离和体外及体内活性

用底物，如1，2-丙二醇、内消旋-2，3-丁二醇以及反式-1，2-环戊二醇检测不依赖B12的二醇脱水酶在脱水和还原途径中的体外和体内生物活性。二醇脱水酶催化二醇如1，2-丙二醇的不可逆的脱水。

对于体外活性，将容纳pETPduCDE(二醇脱水酶亚基)的大肠杆菌BL21(DE3)接种于100mL LB培养基中，培养至OD₆₀₀＝0.7，用0.15mMIPTG诱导，并在22℃下孵育22小时。裂解细胞，并在Ni-NTA旋转柱上纯化目的蛋白。所有三种脱水酶亚基的纯化通过向裂解物和洗涤缓冲液添加5mM 1，2-丙二醇完成。Ni-NTA纯化产生约660μL浓度为2.2mg/mL的蛋白混合物。利用Bradford试剂操作步骤，进行蛋白浓度测定。

用纯化的PduCDE建立体外二醇脱水酶反应。用1，2-丙二醇和内消旋-2，3-丁二醇进行三个测定。还用添加的洗脱缓冲液取代纯化的PduCDE，建立对照反应。在半厌氧条件下，在2mL螺旋盖玻璃瓶中进行体外反应。反应组分和浓度在表6中给出。

48小时后，用0.5mL乙酸乙酯或己醇提取1mL反应混合物，并通过GCMS分析。

对于所有的实验，用下述GCMS操作步骤：

1μL注射w/50∶1半品脱

进口温度-250℃

初始炉温-50℃

温度斜坡1-10℃/分钟至125℃

温度斜坡2-30℃/分钟至300℃

最终温度300℃-1分钟

GC向MS转移的温度-250℃

MS检测-全扫描MW 40-260

结果显示于图45中。图45A证实由1，2-丙二醇形成1-丙醛，且图45B证实由内消旋-2，3-丁二醇形成2-丁酮，两者都被不依赖B12的二醇脱水酶催化。

对于体内活性，按如下构建pBBRDhaB1/2质粒：编码丁酸梭菌的不依赖B12的甘油脱水酶(dhaB1)和激活剂(dhaB2)的DNA序列，通过聚合酶链式反应(PCR)扩增：98℃10秒，60℃15秒以及对于dhaB1为72℃2分钟和对于dhaB2为72℃1分钟，重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(对于dhaB1为5’-CCGCTCGAGGAGGATATATATATGATTTCTAAAGGCTTTAGCACCC-3’(SEQ ID NO：318)和对于dhaB2为5’-ACGTGATGTAATCTAGAGGAGGATATATATATGAGCAAAGAAATTAAAGG-3’(SEQ ID NO：319)和反向引物(对于dhaB1为5’-TCTTTGCTCATATATATATCCTCCTCTAGATTACATCACGTGTTCAGTAC-3’(SEQID NO：320)和对于dhaB2为5’-CGAGCTCTTATTCGGCGCCAATGGTGCACGGG-3’(SEQ ID NO：321)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng pETdhaB1和pETdhaB2，总体积μl。扩增的片段进行凝胶纯化，并通过另一轮PCR进行剪接：98℃10秒，60℃15秒以及72℃2.5分钟，重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCGCTCGAGGAGGATATATATATGATTTCTAAAGGCTTTAGCACCC-3’)(SEQ ID NO：322)和反向引物(5’-CGAGCTCTTATTCGGCGCCAATGGTGCACGGG-3’)(SEQ IDNO：323)、1U Phusion高保真DNA聚合酶(NEB)，以及50ng每一片段，总体积50μl。扩增的DNA片段用XhoI和SacI消化，并连接于用相同的限制酶预消化的pBBR1MCS-2。

将两株容纳pBBR1MCS-2或pBBRDhaB1/2的大肠杆菌DH10B菌株接种于无甘油的TB培养基中。将培养物培养至OD₆₀₀＝0.5，将底物1，2-丙二醇、内消旋-2，3-丁二醇和反式-1，2-环戊二醇添加于各培养物，至浓度为10mM。在将培养物转移至无氧环境中之前，添加5μg/ml辅酶S-腺苷甲硫氨酸。将培养物在37℃下孵育48小时。

48小时后，用0.5mL乙酸乙酯或己醇提取1mL提取物，并通过GCMS分析，如上文所述。结果显示于图46中。图46A表示由1，2-丙二醇体内产生1-丙醇。图46B表示由内消旋-2，3丁二醇体内产生2-丁醇。图46C表示由反式-1，2-环戊二醇体内产生环戊酮。

实施例10

足以生长于作为唯一碳源的藻酸盐上的分泌的藻酸

盐裂解酶和基因组区的鉴定

为了鉴定分泌的或外部藻酸盐裂解酶，以及为了鉴定灿烂弧菌的足以赋予生长于作为唯一碳源的藻酸盐上的基因组区，利用Invitrogen(Carlsbad，CA)的gateway系统制备下列克隆。首先，通过将PCR片段TOPO克隆于pENTR/D/TOPO中，制备入门载体(entry vectors)。利用灿烂弧菌B01基因组DNA作为模板，产生PCR片段，并用下述引物对扩增：

Vs24214-24249：对应于V12B01_24214至V12B01_24249的基因标示符的基因组区(参阅实施例1)。

表7

24214F cacc caagcgatagtttatatagcgt(SEQ ID NO：324)

24249R gaaatgaacggatattacgt(SEQ ID NO：325)

Vs24189-24209：对应于V12B01_24189至V12B01_24209的基因标示符的基因组区(参阅实施例1)。

表8

24189R cggaacaggtgattgtggt(SEQ ID NO：326)

24209F cacc gcccacttcaagatgaagctgt(SEQ ID NO：327)

Vs24214-24239：对应于V12B01_24214至V12B01_24239的基因标示符的基因组区(参阅实施例1)。

表9

24214F cacc caagcgatagtttatatagcgt(SEQ ID NO：328)

24239R_1 gtggctaagtacatgccggt(SEQ ID NO：329)

利用LR重组酶(Invitrogen)，将入门载体与目的载体(destination vector)pET-DEST42(Invitrogen)重组。随后将这些目的载体放入电转感受态DH10B或BL21细胞中。

消化(利用酶Nde I和Bam HI)利用灿烂弧菌12B01基因组DNA作为模板而产生并用下述引物对扩增的PCR产物，制备藻酸盐裂解酶克隆：

表10

V12B01_24214的正向引物：GGAATTC CAT atgacaaagaatatgacgac

24214ndeF taaac(SEQ ID NO：330)

V12B01_24214的反向引物：CG GGATCC ttattatttcccctgccctgcagt

24214bamR (SEQ ID NO：331)

V12B01_24219的正向引物：GGAATTC CAT atgagctatcaaccacttttac

24219ndeF (SEQ ID NO：332)

V12B01_24219的反向引物：CG GGATCC ttacagttgagcaaatgatcc

24219bamR (SEQ ID NO：333)

随后将消化的PCR产物连接于切割的pET28载体。对于分泌的藻酸盐裂解酶的存在，检测灿烂弧菌B01的某些克隆的基因组区，检测上述构建体的各种组合赋予生长于作为唯一碳源的藻酸盐上的能力。

灿烂弧菌的Vs24254(SEQ ID NO：32)区编码功能性外部藻酸盐裂解酶。表达pET28载体的Vs24254的BL21细胞能分解生长培养基中的藻酸盐。当培养于LB+2％藻酸盐+0.1mM异丙基β-D-1-硫代半乳糖苷(IPTG)中时，仅表达Vs24254基因的细胞产生了粉红的阳性TBA测定结果。通过旋转培养于上述培养基上的过夜培养物，进行这种测定。随后将培养基与0.8％硫代巴比妥酸(TBA)按1∶1的比例混合，99摄氏度下加热10分钟，测定粉红着色。图47表示这种测定的结果。图47中左侧的试管表示取自表达Vs24254细胞的过夜培养物的培养基，而右手的试管表示使用表达Vs24259的细胞的培养基的TBA反应(阴性对照)。阴性对照缺少粉红着色表示没有发生藻酸盐多聚体的切割或者发生了很少的切割。不表达任何重组蛋白的野生型大肠杆菌细胞与作为阴性对照Vs24259表现相同着色(数据未显示)。

为了检测重组大肠杆菌生长于作为唯一碳源的藻酸盐上的能力，将转化的细胞在30摄氏度下在96孔板中温和震荡培养19小时。每一孔容纳222μl具有0.66％碳源的基本培养基(参见基本培养基说明的生长条件)，该碳源采用降解的藻酸盐或葡萄糖的形式(生长的阳性对照)。所有的细胞是无质粒的BL21(BL21-阴性对照)、具有1个质粒的BL21(Da或3a)或具有2个质粒的BL21(Dk3a和Da3k)。质粒以小写字母表示：“a”指质粒骨架pET-DEST42，“k”指pENTR/D/TOPO骨架。“D”表示质粒含有基因组区Vs24214-24249，而“3”表示质粒含有基因组区Vs24189-24209。因此，Da是pET-DEST42-Vs24214-24249，Da3k是pET-DEST42-Vs24214-24249以pENTR/D/TOPO-Vs24189-24209等。

如图56A所示，两个载体构建体pET-DEST42-Vs24214-24249和pENTR/D/TOPO-Vs24189-24209，当与大肠杆菌组合时，赋予在作为唯一碳源的降解的藻酸盐上的生长。当将这些基因组插入物转换至相反的载体(pET-DEST42-Vs24189-24209和pENTR/D/TOPO-Vs24214-24249)时，观察到这种相同的结果。图56B表示在作为阳性对照的葡萄糖上的生长。因此，组合的灿烂弧菌的基因组区Vs24214-24249和Vs24189-24209足以赋予大肠杆菌在作为唯一碳源的藻酸盐上生长的能力。

实施例11

乙醇由藻酸盐的产生

检测通过培养于作为碳源的藻酸盐上的重组大肠杆菌产生乙醇的能力。为了产生重组的大肠杆菌，将编码运动发酵单孢菌的丙酮酸脱羧酶(pdc)和两种醇脱氢酶(adhA和adhB)的DNA序列通过聚合酶链式反应(PCR)扩增。将这些扩增的片段进行凝胶纯化，并通过另一轮PCR剪接在一起。最终的扩增的DNA片段用BamHI和XbaI消化，并连接于用相同的限制酶预消化的pBBR1MCS-2。所得的质粒称为pBBRPdc-AdhA/B。

用pBBRPdc-AdhA/B或pBBRPdc-AdhA/B+1.5Fos(含有V12B01_24189至V12B01_24249的基因组区的fosmid克隆；这些序列赋予大肠杆菌利用藻酸盐作为唯一碳源的能力，参阅实施例1和10)转化大肠杆菌，将其培养于含有藻酸盐的m9培养基中，并检测乙醇的产生。结果显示于图57，其证明，容纳pBBRPdc-AdhA/B+1.5FOS的菌株，当生长于藻酸盐上时，表现出显著更高的乙醇产量。这些结果表明，pBBRPdc-AdhA/B+1.5FOS在产生乙醇时，能利用藻酸盐作为碳源。

将下述出版物的全部内容通过引用并入本文。

1.T.Y.Wong，L.A.Preston，N.L.Schiller，Annu Rev Microbiol 54，289(2000).

2.W.Hashimoto，O.Miyake，A.Ochiai，K.Murata，J Biosci Bioeng 99，48(Jan，2005).

3.M.Yamasaki，K.Ogura，W.Hashimoto，B.Mikami，K.Murata，J Mol Biol 352，11(Sep 9，2005).

4.M.Yamasaki et al.，Acta Crystallogr Sect F Struct Biol Cryst Commun 61，288(Mar 1，2005).

5.O.Miyake，A.Ochiai，W.Hashimoto，K.Murata，J Bacteriol 186，2891(May，2004).

6.O.Miyake，W.Hashimoto，K.Murata，Protein Expr Purif 29，33(May，2003).

7.H.J.Yoon，B.Mikami，W.Hashimoto，K.Murata，J Mol Biol 290，505(Jul 9，1999).

8.H.J.Yoon，W.Hashimoto，O.Miyake，K.Murata，B.Mikami，J Mol Biol 307，9(Mar 16，2001).

9.W.Hashimoto，O.Miyake，K.Momma，S.Kawai，K.Murata，J Bacteriol 182，4572(Aug，2000).

10.H.J.Yoon et al.，Protein Expr Purif 19，84(Jun，2000).

11.T.Osawa，Y.Matsubara，T.Muramatsu，M.Kimura，Y.Kakuta，J Mol Biol 345，1111(Feb 4，2005).

12.A.Ochiai，W.Hashimoto，K.Murata，Res Microbiol 157，642(Sep，2006).

13.F.J.Mergulhao，D.K.Summers，G.A.Monteiro，Biotechnol Adv 23，177(May，2005).

14.J.H.Choi，S.Y.Lee，Appl Microbiol Biotechnol 64，625(Jun，2004).

15.M.P.DeLisa，D.Tullman，G.Georgiou，Proc Natl Acad Sci U S A 100，6115(May 13，2003).

16.N.Blaudeck，G.A.Sprenger，R.Freudl，T.Wiegert，J Bacteriol 183，604(Jan，2001).

17.N.Pradel et al.，Biochem Biophys Res Commun 306，786(Jul 4，2003).

18.L.Masip et al.，Science 303，1185(Feb 20，2004).

19.C.M.Barrett，N.Ray，J.D.Thomas，C.Robinson，A.Bolhuis，Biochem BiophysRes Commun 304，279(May 2，2003).

20.R.Binet，S.Letoffe，J.M.Ghigo，P.Delepelaire，C.Wandersman，FoliaMicrobiol(Praha)42，179(1997).

21.I.Gentschev，G.Dietrich，W.Goebel，Trends Microbiol 10，39(Jan，2002).

22.V.Koronakis，FEBS Lett 555，66(Nov 27，2003).

23.J.Jose，Appl Microbiol Biotechnol 69，607(Feb，2006).

24.J.Jose，D.Betscheider，D.Zangen，Anal Biochem 346，258(Nov 15，2005).

25.M.Ashiuchi，H.Misono，Appl Microbiol Biotechnol 59，9(Jun，2002).

26.J.Narita et al.，Appl Microbiol Biotechnol 70，564(May，2006).

27.Y.Aso et al，Nat Biotechnol 24，188(Feb，2006).

28.W.Hashimoto et al.，Biosci Biotechnol Biochem 69，673(Apr，2005).

29.A.E.Lagarde，F.R.Stoeber，J Bacteriol 129，606(Feb，1977).

30.M.A.Mandrand-Berthelot，P.Ritzenthaler，M.Mata-Gilsinger，J Bacteriol 160，600(Nov，1984).

31.J.Pouyssegur，F.Stoeber，J Bacteriol 117，641(Feb，1974).

32.J.Preiss，G.Ashwell，J Biol Chem 237，309(Feb，1962).

33.J.Preiss，G.Ashwell，J Biol Chem 237，317(Feb，1962).

34.G.M.Bird，P.Haas，Biochemical Journal 25，403(1931).

35.L.H.Cretcher，W.L.Nelson，Science 67，537(May 25，1928).

36.W.L.Nelson，L.H.Cretcher，Journal of the American Chemical Society 51，1914(1929).

37.W.L.Nelson，L.H.Cretcher，Journal of the American Chemical Society 52，2130(1930).

38.W.L.Nelson，L.H.Cretcher，Journal of the American Chemical Society 54，3409(1932).

39.E.Schoeffel，K.P.Link，Journal of Biological Chemistry 95，213(1932).

40.E.Schoeffel，K.P.Link，Journal of Biological Chemistry 100，397(1933).

41.H.A.Spoehr，Archive of Biochemistry 14，153(1947).

42.J.J.Farmer，3rd，R.G.Eagon，J Bacteriol 97，97(Jan，1969).

43.R.L.Anderson，D.P.Allison，J Biol Chem 240，2367(Jun，1965).

44.W.J.Lennarz，R.J.Light，K.Bloch，Proc Natl Acad Sci U S A 48，840(May，1962).

45.S.A.Graham，Crit Rev Food Sci Nutr 28，139(1989).

46.E.Wiberg，P.Edwards，J.Byrne，S.Stymne，K.Dehesh，Planta 212，33(Dec，2000).

47.L.Yuan，T.A.Voelker，D.J.Hawkins，Proc Natl Acad Sci U S A 92，10639(Nov7，1995).

48.K.Dehesh，A.Jones，D.S.Knutzon，T.A.Voelker，Plant J 9，167(Feb，1996).

49.K.Dehesh，P.Edwards，T.Hayes，A.M.Cranmer，J.Fillatti，Plant Physiol 110，203(Jan，1996).

50.K.M.Mayer，J.Shanklin，BMC Plant Biol 7，1(2007).

51.J.K.Jha et al.，Plant Physiol Biochem 44，645(Nov-Dec，2006).

52.B.S.Schutt，M.Brummel，R.Schuch，F.Spener，Planta 205，263(Jun，1998).

53.K.Dehesh，P.Edwards，J.Fillatti，M.Slabaugh，J.Byrne，Plant J 15，383(Aug，1998).

54.J.M.Leonard，S.J.Knapp，M.B.Slabaugh，Plant J13，621(Mar，1998).

55.M.Vedadi，R.Szittner，L.Smillie，E.Meighen，Biochemistry 34，16725(Dec 26，1995).

56.M.O.Park，J Bacteriol 187，1426(Feb，2005).

57.M.O.Park，K.Heguri，K.Hirata，K.Miyamoto，J Appl Microbiol 98，324(2005).

58.M.O.Park，M.Tanabe，K.Hirata，K.Miyamoto，Appl Microbiol Biotechnol 56，448(Aug，2001).

59.M.Morikawa，T.Iwasa，S.Yanagida，T.Imanaka，Journal of Fermentation andBioengineering 85，243(1998).

60.M.Dennis，P.E.Kolattukudy，Proc Natl Acad Sci U S A 89，5306(Jun 15，1992).

61.T.M.Cheesbrough，P.E.Kolattukudy，J Biol Chem 263，2738(Feb 25，1988).

62.M.C.Chang，R.A.Eachus，W.Trieu，D.K.Ro，J.D.Keasling，Nat Chem Biol 3，274(May，2007).

63.R.J.Porra，B.D.Ross，Biochem J 94，557(Mar，1965).

64.X.Chen，W.Guo，L.Zhao，Q.Fu，Y.Ma，J Phys Chem A 111，3566(May 10，2007).

65.L.Zhao，W.Guo，R.Zhang，S.Wu，X.Lu，Chemphyschem 7，1345(Jun 12，2006).

66.L.Zhao，R.Zhang，W.Guo，S.Wu，X.Lu，Chemical Physics Letters 414，28(2005).

67.G.Gorgen，W.Boland，Eur J Biochem 185，237(Nov 6，1989).

68.P.Ney，W.Boland，Eur J Biochem 162，203(Jan 2，1987).

69.Z.L.Boynton，G.N.Bennett，F.B.Rudolph，Appl Environ Microbiol 62，2758(Aug，1996).

70.R.T.Yan，J.S.Chen，Appl Environ Microbiol 56，2591(Sep，1990).

71.R.V.Nair，G.N.Bennett，E.T.Papoutsakis，J Bacteriol 176，871(Feb，1994).

72.D.P.Wiesenborn，F.B.Rudolph，E.T.Papoutsakis，Appl Environ Microbiol 55，317(Feb，1989).

73.D.K.Thompson，J.S.Chen，Appl Environ Microbiol 56，607(Mar，1990).

74.M.G.Hartmanis，J Biol Chem 262，617(Jan 15，1987).

75.K.X.Huang，S.Huang，F.B.Rudolph，G.N.Bennett，J Mol MicrobiolBiotechnol 2，33(Jan，2000).

76.L.Fontaine et al.，J Bacteriol 184，821(Feb，2002).

77.B.McMahon，M.E.Gallagher，S.G.Mayhew，FEMS Microbiol Lett 250，121(Sep 1，2005).

78.M.Li，S.Yao，S.K.，Microbial Biotechnology 23，573(2007).

79.T.B.Causey，S.Zhou，K.T.Shanmugam，L.O.Ingram，Proc Natl Acad Sci U SA 100，825(Feb 4，2003).

80.D.E.Chang，S.Shin，J.S.Rhee，J.G.Pan，J Bacteriol 181，6656(Nov，1999).

81.C.R.Dittrich，R.V.Vadali，G.N.Bennett，K.Y.San，Botechnol Prog 21，627(Mar-Apr，2005).

82.H.Lin，N.M.Castro，G.N.Bennett，K.Y.San，Appl Microbiol Biotechnol 71，870(Aug，2006).

83.U.Schorken，G.A.Sprenger，Biochim Biophys Acta 1385，229(Jun 29，1998).

84.G.A.Sprenger，M.Pohl，Journal of Molecular Catalysis B：Enzymatic 6，145(1999).

85.G.A.Sprenger，M.Pohl，Journal of Molecular Catalysis B：Enzymic 6，145(1999).

86.B.Gonzalez，R.Vicuna，J Bacteriol 171，2401(May，1989).

87.P.Hinrichsen，I.Gomez，R.Vicuna，Gene 144，137(Jun 24，1994).

88.E.Janzen et al.，Bioorg Chem 34，345(Dec，2006).

89.M.M.Kneen，I.D.Pogozheva，G.L.Kenyon，M.J.McLeish，Biochim BiophysActa 1753，263(Dec 1，2005).

90.K.Yamada-Onodera，A.Nakajima，Y.Tani，J Biosci Bioeng 102，545(Dec，2006).

91.K.Yamada-Onodera，M.Fukui，Y.Tani，J Biosci Bioeng 103，174(Feb，2007).

92.T.Tobimatsu，M.Azuma，S.Hayashi，K.Nishimoto，T.Toraya，Biosci BiotechnolBiochem 62，1774(Sep，1998).

93.T.Tobimatsu et al.，J Biol Chem 271，22352(Sep 13，1996).

94.T.Toraya，T.Shirakashi，T.Kosuga，S.Fukui，Biochem Biophys Res Commun 69，475(Mar 22，1976).

95.M.Yamanishi et al.，Eur J Biochem 269，4484(Sep，2002).

96.J.R.O′Brien et al.，Biochemistry 43，4635(Apr 27，2004).

97.C.Raynaud，P.Sarcabal，I.Meynial-Salles，C.Croux，P.Soucaille，Proc NatlAcad Sci U S A 100，5010(Apr 29，2003).

98.B.Ludwig，A.Akundi，K.Kendall，Appl Environ Microbiol 61，3729(Oct，1995).

99.S.X.Xie，J.Ogawa，S.Shimizu，Biosci Biotechnol Biochem 63，1721(Oct，1999).

100.T.Zelinski，J.Peters，M.R.Kula，J Biotechnol 33，283(Apr 15，1994).

101.M.C.Hunt，A.Rautanen，M.A.Westin，L.T.Svensson，S.E.Alexson，Faseb J20，1855(Sep，2006).

102.M.A.Westin，S.E.Alexson，M.C.Hunt，J BiolChem 279，21841(May 21，2004).

103.M.A.Westin，M.C.Hunt，S.E.Alexson，J Biol Chem 280，38125(Nov 18，2005).

104.H.Iwaki，Y.Hasegawa，S.Wang，M.M.Kayser，P.C.Lau，Appl EnvironMicrobiol 68，5671(Nov，2002).

序列表

<110>生物结构实验室公司

Kashiyama，Yuki

Yoshikuni，Yasuo

Siegel，Justin B.

Baker，David

<120>生物燃料生产

<130>150097.40101

<140>PCT

<141>2008-10-03

<160>313

<170>FastSEQ for Windows Version 4.0

<210>1

<211>12066

<212>DNA

<213>灿烂弧菌

<400>1

ggggacaagt ttgtacaaaa aagcaggctt gacgcttatc acatttagta gaagcttatg 60

tggaggcgat tggctttttt ttcaaggaag attacaaaat agctcaggta atgccgattt 120

atagatttgc tatgatatag ttcaggatct tatgctttta ataagcagga acagaattta 180

tgaacaaaaa agctgatagt ttagtaggtt acagctttat tcgttataga aagggttagg 240

gaacgtgaac tttttagagc tcaaacttcg catggataac tctccggtgc tgagccgatt 300

tttagagaat ggatttttac tccagcagaa actgagcctt gttctttgtt gtgtgttgat 360

cgcagcttct gcatggattt taggacagct tgcatggttt attgaacctg ctgagcaaac 420

cgtcgtgcca tggacagcaa cggcttcctc gtcttcaacg cctcaatcga ctcttgatat 480

ctcttctttg cagcagagca acatgtttgg tgcttataac ccaaccacgc ctgctgtggt 540

tgagcagcaa gttatccaag atgcgccaaa gacgcgactg aacctcgttt tagtgggtgc 600

agtagccagt tctaatccaa agctgagctt ggctgtgatt gccaatcgcg gcacacaagc 660

aacctacggc attaatgaag agatcgaagg tacgcgagct aagttaaaag cggtattagt 720

cgatcgcgtg attattgata actcaggtcg agacgaaacc ttgatgcttg aaggcattga 780

gtacaagcgt ttgtctgtat cagcacctgc gccacctcgt acctcttctt ctgtgcgtgg 840

caacaaccca gcttctgcag aagagaagct agatgaaatt aaagcgaaga taatgaaaga 900

tccgcaacaa atcttccaat atgttcgact gtctcaggtg aaacgcgacg ataaagtgat 960

tggttatcgt gtgagccctg gcaaagattc agaacttttt aactctgttg ggctccaaaa 1020

cggagatatt gccactcagt taaatggaca agacctgaca gaccctgctg ctatgggcaa 1080

catattccgt tctatctcag agctgacaga gctaaacctc gtcgtcgaga gagatggtca 1140

acaacatgaa gtgtttattg aattttagaa ctttgcgtct aacgaaggac gaaagtgtag 1200

gagaagtacg tgaagcattg gtttaagaaa agtgcatggt tattggcagg aagcttaatc 1260

tgcacacccg cagccatcgc gagtgatttt agtgccagct ttaaaggcac tgatattcaa 1320

gagtttatta atattgttgg tcgtaaccta gagaagacga tcatcgttga cccttcggtg 1380

cgcggaaaaa tcgatgtacg cagctacgac gtactcaatg aagagcaata ctacagcttc 1440

ttcctaaacg tattggaagt gtatggctac gcggttgtcg aaatggactc gggtgttctt 1500

aagatcatca aggccaaaga ttcgaaaaca tcggcaattc cagtcgttgg agacagtgac 1560

acgatcaaag gcgacaatgt ggtgacacgt gttgtgacgg ttcgtaatgt ctcggtgcgt 1620

gaactttctc ctctgcttcg tcaactaaac gacaatgcag gcgcgggtaa cgttgtgcac 1680

tacgacccag ccaacatcat ccttattaca ggccgagcgg cggtagtaaa ccgtttagct 1740

gaaatcatca agcgtgttga ccaagcgggt gataaagaga ttgaagtcgt tgagctaaag 1800

aatgcttctg cggcagaaat ggtacgtatc gttgatgcgt taagcaaaac cactgatgcg 1860

aaaaacacac ctgcatttct acaacctaaa ttagttgccg atgaacgtac caatgcgatt 1920

cttatctcag gcgaccctaa agtacgtagc cgtttaagaa ggctgattga acagcttgat 1980

gttgaaatgg caaccaaggg caataaccaa gttatttacc ttaaatatgc aaaagccgaa 2040

gatctagttg atgtgctgaa aggcgtgtcg gacaacctac aatcagagaa gcagacatca 2100

accaaaggaa gttcatcgca gcgtaaccaa gtgatgatct cagctcacag tgacaccaac 2160

tctttagtga ttaccgcaca gccggacatc atgaatgcgc ttcaagatgt gatcgcacag 2220

ctggatattc gtcgtgctca agtattgatt gaagcactga ttgtcgaaat ggccgaaggt 2280

gacggcgtta accttggtgt gcagtggggt aaccttgaaa cgggtgccat gattcagtac 2340

agcaacactg gcgcttccat tggcggtgtg atggttggtt tagaagaagc gaaagacagc 2400

gaaacgacaa ccgctgttta tgattcagac ggtaaattct tacgtaatga aaccacgacg 2460

gaagaaggtg actattcaac attagcttcc gcactttctg gtgttaatgg tgcggcaatg 2520

agtgtggtaa tgggtgactg gaccgccttg atcagtgcag tagcgaccga ttcaaattca 2580

aatatcctat cttctccaag tatcaccgtg atggataacg gcgaagcgtc attcattgtg 2640

ggtgaagagg tgcctgttct aaccggttct acagcaggct caagtaacga caacccattc 2700

caaacagttg aacgtaaaga agtgggtatc aagcttaaag tggtgccgca aatcaatgaa 2760

ggtgattcgg ttcaactgca aatagaacaa gaagtatcga acgtattagg cgccaatggt 2820

gcggttgatg tgcgttttgc taagcgacag ctaaatacat cagtgattgt tcaagacggt 2880

caaatgctgg tgttgggtgg cttgattgac gagcgagcat tggaaagtga atctaaggtg 2940

ccgttcttgg gagatattcc tgtgcttgga cacttgttca aatcaaccag tactcaggtt 3000

gagaaaaaga acctaatggt cttcatcaaa ccaaccatta ttcgtgatgg tatgacagcc 3060

gatggtatca cgcagcgtaa atacaacttc atccgtgctg agcagttgta caaggctgag 3120

caaggactga agttaatggc agacgataac atcccagtat tgcctaaatt tggtgccgac 3180

atgaatcacc cggctgaaat tcaagccttc atcgatcaaa tggaacaaga ataatggctg 3240

aattggtagg ggcggcacgt acttatcagc gcttgccgtt tagctttgcg aatcgctaca 3300

agatggtgtt ggaataccaa catccagagc gcgcaccgat actttattat gttgagccac 3360

tgaaatcggc ggcgatcatt gaagtgagtc gtgttgtgaa aaatggtttc acgccacaag 3420

cgattactct cgatgagttt gataaaaaac taaccgatgc ttatcagcgt gactcgtcag 3480

aagctcgtca gctcatggaa gacattggtg ctgatagtga tgatttcttc tcactagcgg 3540

aagaactgcc tcaagacgaa gacttacttg aatcagaaga tgatgcacca atcatcaagt 3600

taatcaatgc gatgctgggt gaggcgatca aagagggtgc ttcggatata cacatcgaaa 3660

cctttgaaaa gtcactttgt atccgtttcc gagttgatgg tgtgctgcgt gatgttctag 3720

cgccaagccg taaactggct ccgctattgg tttcacgtgt caaggttatg gctaaactgg 3780

atattgcgga aaaacgcgtg ccacaagatg gtcgtatttc tctgcgtatt ggtggccgag 3840

cggttgatgt tcgtgtttca accatgcctt cttcgcatgg tgagcgtgtg gtaatgcgtc 3900

tgttggacaa aaatgccact cgtctagact tgcacagttt aggtatgaca gccgaaaacc 3960

atgaaaactt ccgtaagctg attcagcgcc cacatggcat tatcttggtg accggcccga 4020

caggttcagg taaatcgacg accttgtacg caggtctgca agaactcaac agcaatgaac 4080

gaaacatttt aaccgttgaa gacccaatcg aattcgatat cgatggcatt ggtcaaacac 4140

aagtgaaccc taaggttgat atgacctttg cgcgtggttt acgtgccatt cttcgtcaag 4200

atcctgatgt tgttatgatt ggtgagatcc gtgacttgga gaccgcagag attgctgtcc 4260

aggcctcttt gacaggtcac ttagttatgt cgactctgca taccaatact gccgtcggtg 4320

cgattacacg tctacgtgat atgggcattg aacctttctt gatctcttct tcgctgctgg 4380

gtgttttggc tcagcgcttg gttcgtactt tatgtaacga atgtaaagaa ccttatgaag 4440

ccgataaaga gcagaagaaa ctgtttgggt tgaagaagaa agaaagcttg acgctttacc 4500

atgccaaagg ttgtgaagag tgtggccata agggttatcg aggtcgtacg ggtattcatg 4560

agctgttgat gattgatgat tcagtacaag agctgattca cagtgaagcg ggtgagcagg 4620

cgattgataa agcaattcgt ggcacaacac caagtattcg agatgatggc ttgagcaaag 4680

ttctgaaagg ggtaacgtcc ctagaagaag tgatgcgcgt gaccaaggaa gtctagtatg 4740

gcggcatttg aatacaaagc actggatgcc aaaggcaaaa gtaaaaaagg ctcaattgaa 4800

gcagataatg ctcgtcaggc tcgccaaaga ataaaagagc ttggcttgat gccggttgag 4860

atgaccgagg ctaaagcaaa aacagcaaaa ggtgctcagc catcgaccag ctttaaacgc 4920

ggcatcagta cgcctgatct tgcgcttatt actcgtcaaa tatccacgct cgttcaatct 4980

ggtatgccgc tagaagagtg tttgaaagcc gttgccgaac agtctgagaa acctcgtatt 5040

cgcaccatgc tactcgcggt gagatctaag gtgactgaag gttattcgtt agcagacagc 5100

ttgtctgatt atccccatat cttcgatgag ctattcagag ccatggttgc tgctggtgag 5160

aagtcagggc atctagatgc ggtattggaa cgattggctg actacgcaga aaaccgtcag 5220

aagatgcgtt ctaagttgct gcaagcgatg atctacccca tcgtgctggt ggtgtttgcg 5280

gtgacgattg tgtcgttcct actggcaacg gtagtgccga agatcgttga gcctattatc 5340

caaatgggac aagagctccc tcagtcgaca caatttttat tagcatcgag tgaatttatc 5400

cagaattggg gcatccaatt actggtgttg accattggtg tgattgtgtt ggttaagact 5460

gcgctgaaaa agccgggcgt tcgcatgagc tgggatcgca aattattgag catcccgctg 5520

ataggcaaga tagcgaaagg gatcaacacc tctcgttttg cacgaacact ttctatctgt 5580

acctctagtg cgattcctat ccttgaaggg atgaaggtcg cggtagatgt gatgtcgaat 5640

catcacgtga aacaacaagt attacaggca tcagatagcg ttagagaagg ggcaagcctg 5700

cgtaaagcgc ttgatcaaac caaactcttt cccccgatga tgctgcatat gatcgccagt 5760

ggtgagcaga gtggccaatt ggaacagatg ctgacaagag cggcagataa tcaggatcaa 5820

agctttgaat cgaccgttaa tatcgcgtta ggcattttta ccccagcgct tattgcgttg 5880

atggctggct tagtgctgtt tatcgtgatg gcgacgctga tgccaatgct tgaaatgaac 5940

aatttaatga gtggttaacc tgccgctcat cagacgttag tttttggatt atcgagaaga 6000

aggacatcat tcccctcaac tcgctatctg taatttggag aaaataatga aaaataaaat 6060

gaaaaaacaa tcaggcttta ccctattaga agtcatggtt gttgtcgtta tccttggtgt 6120

tctagcaagt tttgttgtac ctaacctgtt gggcaacaaa gagaaggcgg atcaacaaaa 6180

agccatcact gatattgtgg cgctagagaa cgcgctcgac atgtacaaac tggataacag 6240

cgtttaccca acaacggatc aaggcctgga cgggttggtg acaaagccaa gcagtccaga 6300

gcctcgtaac taccgagacg gcggttacat caagcgtcta cctaacgacc catggggcaa 6360

tgagtaccaa tacctaagtc ctggtgataa cggcacaatt gatatcttca ctcttggcgc 6420

agatggtcaa gaaggtggtg aaggtattgc tgcagatatc ggcaactgga acatgcagga 6480

cttccaataa gcttcggctt gttgtcggtt gatacgttcc tgttgtttga ttcgttatcg 6540

ttgcttgata cgttattgat ggtagtacgc aaaaaatgga gtctacaagg tgaaaactaa 6600

gcaaacacag ccaggtttca ccttgattga gattcttttg gtgttggtat tactgtcagt 6660

atcggcggtc gcggtgatct cgaccatccc taccaatagc aaagatgttg ctaaaaaata 6720

cgctcaaagc ttttatcagc gaattcagct actcaatgaa gaggctattt tgagtggctt 6780

agattttggt gttcgtgttg atgaaaaaaa atcgacttac gttctgatga ctttgaagtc 6840

tgatggctgg caagaaacgg agttcgaaaa gatcccttct tcaactgaat taccggaaga 6900

actggcactg tcgctgacat taggtggtgg cgcgtgggaa gacgatgatc ggttgttcaa 6960

tccaggaagc ttatttgatg aagatatgtt tgctgatctt gaagaggaaa agaagccgaa 7020

accaccacag atctacatct tgtcgagtgc tgaaatgacg ccatttgtac tgtcgtttta 7080

cccaaatacc ggtgacacaa tacaagatgt ttggcgcatt cgagtattgg ataatggtgt 7140

gattcgatta ctcgagccgg gagaagaaga tgaagaagaa taaccgttct ccttatcgtt 7200

ctcgcggtat gcctcttggt tctcgaggaa tgactctgct tgaagtattg gttgcgctgg 7260

ctatcttcgc tacggcggcg atcagtgtga ttcgtgctgt cacccagcac atcaatacgc 7320

tcagttatct cgaagaaaaa accttcgcgg cgatggtcgt tgataatcaa atggccctag 7380

tcatgctaca tcctgagatg cttaaaaaag cgcagggcac gcaagagtta gcgggaagag 7440

aatggttctg gaaggtgact cccatcgata ccagcgataa tttattaaag gcgtttgatg 7500

tgagtgcggc aaccagtaag aaagcgtctc cagtcgttac ggtgcgcagt tatgtggtta 7560

attaagagaa tgtggtcaat taagagcatg ttattaatta agaacagctc gctaactaag 7620

agcgtgtcgc taactaagag catgtcggaa aataagcgta cgccgcgtaa acaaggtcta 7680

ccttcaaaag ggagaggctt taccttaatt gaagtcttgg tctcgattgc tatctttgcc 7740

acgctaagta tggcggctta tcaggtggtt aatcaggtgc agcgaagcaa cgagatctct 7800

attgagcgca gtgctcgttt gaaccaactg caacgcagtt tagtcatttt agataatgat 7860

tttcgccaga tggcggtgcg aaaatttcgt accaacggtg aagaagcatc atctaagctg 7920

atcttaatga aagagtattt attggactcc gacagtgtag gcatcatgtt tactcgtcta 7980

ggttggcaca acccacaaca gcagtttcct cgcggtgaag tcacgaaggt tggctaccgt 8040

attaaagaag aaacacttga gcgtgtatgg tggcgttatc ccgatacacc ttcaggccaa 8100

gaaggtgtga ttacccctct gcttgatgat gttgaaagct tggaattcga gttttatgac 8160

ggaagccgct gggggaaaga gtggcaaacc gataaatcac tgccgaaagc ggtgaggctt 8220

aagctgacac tgaaagacta tggtgagata gagcgtgttt atctcactcc cggtggcacc 8280

ctagatcagg ccgatgattc ttcaaacagt gactcttcag gcagtagtga ggggaataat 8340

gactcatcga actaataagc gtttagcgac aaggtcagcc ttgggacgta aacaacgtgg 8400

tgtcgcgctg atcattattt tgatgctatt ggcgatcatg gcaaccattg ctggcagcat 8460

gtccgagcgt ttgtttacgc aattcaagcg cgttggtaac caactgaatt accaacaggc 8520

ttactggtac agcattggtg tggaagcgct tgtgcaaaac ggtattaggc aaagttacaa 8580

agacagtgat accgtgaacc taagccaacc atgggcgtta gaagagcagg tatacccatt 8640

ggattatggc caagttaagg gccgcattgt tgatgctcag gcatgtttta atcttaatgc 8700

cttagccgga gtggcgacca cttcaagtaa ccagactcct tatttaatca cggtttggca 8760

aaccttattg gaaaaccaag acgttgagcc ttatcaggct gaggttatcg caaattcaac 8820

gtgggaattt gttgatgcgg atacacgaac cacctcttcg tctggtgtag aagacagcac 8880

gtatgaagcg atgaagccct cttatttggc ggcgaatggc ttaatggccg atgaatccga 8940

gctacgagcg gtttatcaag tcactggtga agtgatgaat aaggttcgcc cctttgtttg 9000

cgctctgcca accgatgatt tccgcttgaa tgtgaatact ctcacggaaa aacaagcacc 9060

gttattggaa gcgatgtttg cgccaggctt aagtgaatcg gatgccaaac agctgataga 9120

taaacgccca tttgatggct gggatacggt agatgctttc atggctgaac ctgccattgt 9180

tggtgtaagt gccgaagtca gcaagaaagc gaaagcatat ttaactgtag atagcgccta 9240

ttttgagcta gatgcagagg tattagttga gcagtcacgt gtacgtatac ggacgctttt 9300

ctatagtagt aatcgagaaa cagtgacggt agtacgccgt cgttttggag gaatcagtga 9360

gcgagtttct gaccgttcga ctgagtagcg aaccacaaag ccctgtgcag tggttagttt 9420

ggtcgacaag ccaacaagaa gtgatagcaa gcggtgaact gtctagctgg gaacagcttg 9480

acgagttaac gccttacgct gaaaagcgca gctgtatcgc tttattgccg ggaagtgaat 9540

gcttaattaa gcgtgttgag atcccgaaag gtgctgctcg ccagtttgat tctatgctgc 9600

cgttcttatt agaagacgaa gtcgcacaag atatcgaaga cttacacctg actattttag 9660

ataaagatgc cactcacgct accgtgtgtg gtgtggatcg tgaatggcta aaacaagctt 9720

tagacctgtt tcgcgaagcc aatataatct tccgtaaggt gctaccagat acactagccg 9780

tgccttttga agaacaaggc atcagtgcgt tgcagataga tcagcattgg ttattgcgcc 9840

aaggtcactc tcaacgtcaa ggtcactatc aagccgtatc gatcagtgaa gcatggttac 9900

cgatgttttt gcaaagtgat tgggttgtcg ctggtgagga agagcaagcg acgactatct 9960

tcagctatac cgcgatgccg agcgacgacg ttcaacagca aagcggcctc gagtggcaag 10020

caaagcctgc ggaattggtg atgtctttat tgagtcagca agcgatcaca agcggcgtaa 10080

atttactgac tggcaccttt aaaaccaaat cttcattcag taaatattgg cgtgtttggc 10140

agaaagtggc gattgctgct tgtttgctgg tggccgtgat tgtgactcag caagtgttga 10200

aggttcagca atacgaagcg caagcacaag cctaccgcat ggagagtgag cgtatcttta 10260

gagctgtgct gcctggcaaa caacgcattc cgaccgtgag ttacctcaag cgtcagatga 10320

atgatgaagc taagaaatac ggtggttcag gcgaaggtga ttctttactt ggttggttag 10380

ctttgctgcc tgaaacctta gggcaagtga agacgatcga agttgaaagc attcgctacg 10440

atggcaaccg ttctgaggtt cgactgcagg ctaaaagttc tgacttccaa cactttgaga 10500

ccgcaagggt gaagctcgaa gagaagtttg tcgttgagca agggccattg aaccgtaatg 10560

gcgatgccgt atttggcagt tttactctta aaccccatca ataacctgcg taaggagatc 10620

agtgatgaga aatatgattg aaccactcca agcgtggtgg gcttcaataa gtcagcggga 10680

acaacgatta gtcattggtt gttctatttt attgatactg ggcgttgtct attggggatt 10740

aatacaacca cttagccaac gagccgagct tgcacaaagc cgcattcaaa gtgagaagca 10800

acttctggct tgggtaacgg acaaagcgaa tcaagtggtt gaactacgag gcagtggtgg 10860

catcagtgcc agtcagcctt tgaaccaatc tgtgcctgct tctatgcgcc gttttaacat 10920

cgagctgata cgcgtgcaac cacgcggtga gatgctgcaa gtttggatta agcctgtgcc 10980

atttaataag ttcgttgact ggctgacata cctgaaagaa aagcagggtg ttgaggttga 11040

gtttatggat attgatcgct ctgatagccc tggggttatt gagatcaacc gactacagtt 11100

taaacgaggt taatgtgaaa cgcggtttat ctttcaaata cggcctgtta ttcagcgtca 11160

tttttatcgt ttttttctcg gtaagcttgt tgctgcattt gcctgccgct tttgctctca 11220

agcatgcacc cgtcgtgcgt ggtttaagca ttgaaggcgt tgagggcacc gtttggcaag 11280

gtcgcgctaa caatatcgcg tggcagcgtg tcaattacgg ctcagtgcag tgggacttcc 11340

agttctctaa actattccaa gccaaagcag aacttgcggt tcgctttggc cgcaacagcg 11400

acatgaactt atcaggtaaa ggacgtgtcg gatatagcat gagtggtgct tacgcggaaa 11460

acttagtggc atcaatgcca gccagcaacg tgatgaaata tgcgccagct atcccagtgc 11520

ctgtgtctat tgcagggcaa gttgaactga cgatcaaaca tgcggttcat gctcaacctt 11580

ggtgtcaatc aggtgaaggt acgcttgctt ggtctggtgc agcagtcgac tcgccagtgg 11640

gttcgttaga ccttggccct gtgattgcgg acataacgtg tgaagacagc acaattgcag 11700

ccaaaggcac tcagaagagc gatcaggtag acagcgagtt ctcagcgagc gtaacaccta 11760

accaacgcta cacctcggca gcatggttta agccaggcgc tgaattcccg ccagcaatgc 11820

agagtcagct taagtggttg ggcaatcctg atagccaagg taaataccaa tttacttatc 11880

aaggccgctt ttagcccggt atttacttca gagctagtat ctgaagtaaa tttggcgatc 11940

aaatcgcgaa ctataaaaaa cgggcacctc actgaggtgc ccgttttgtt tgttctgaga 12000

atctagagga tatctgacgg ttaaagagag caaactcacc cagctttctt gtacaaagtg 12060

gtcccc 12066

<210>2

<211>54080

<212>DNA

<213>灿烂弧菌

<400>2

gtgctttgtg acaacggggg atgtatggat attgaagttt cgcgccaggt tgcggtagtt 60

gaagctacga gtggagatgt cgtcgtagtt aagccagacg gcagcgcaag aaaagtttca 120

gttggcgata ccatccgtga aaatgagatc gtgattacgg ccaacaagtc agagcttgta 180

ttaggcgttc agaatgattc gattccggtt gcagagaatt gcgtcggttg tgttgatgaa 240

aacgctgcat gggtagatgc cccaatagct ggtgaggtta attttgactt acagcaagca 300

gacgcagaaa ccttcactga agacgacctt gctgcaattc aagaagccat tttaggtggt 360

gccgatccga ctcaaatctt agaagcaacg gctgctggtg gcggactagg ttctgcaaat 420

gctggctttg tgacgattga ctataactac actgaaactc atccatcgac tttctttgag 480

accgctggtc tagcagaaca aactgttgat gaagacagag aagaattcag atctatcact 540

cgttcatcag gtggccaatc aatcagtgaa acactgactg aaggctccat atctggcaat 600

acctatcccc aatctgtaac aacgacagaa acgattattg ctggtagttt agctctcgcc 660

cctaactctt tcattccaga aactttatcc ctcgcttcac tacttagtga attaaacagc 720

gacattactt caagtggtca gtccgttatc ttcacctatg acgcgacgac taattctatc 780

gttggtgttc aagataccga cgaagtatta cgtatcgaca ttgatgccgt cagtgttggc 840

aataacattg agctttctct aaccacaacg atttcccagc cgattgatca tgtaccgtcg 900

gttggcggtg gtcaggtttc ttacactggc gatcaaatag atattgcctt tgatattcaa 960

ggtgaagaca ccgctgggaa cccgctagca acacccgtta acgcacaagt ttcagtgttt 1020

gacgggatag atccgtctgt tgaaagtgtc aatatcacta acgttgaaac tagcagcgcg 1080

gcaatcgaag ggacgttctc aaatattggt agtgataacc ttcaatcagc cgtatttgat 1140

gcaagtgcac tggaccagtt tgatgggttg ctcagtgata atcaaaacac gcttgcgaga 1200

ctttctgatg atggaacaac gattactctg tccatccaag gtcgaggtga ggttgttctc 1260

actatctctc tagataccga tggcacctat aaattcgagc agtctaatcc gatagaacaa 1320

gtgggtaccg attcactgac gttcgctttg ccaatcacga ttaccgattt tgaccaagat 1380

gttgtaacca atacgatcaa cattgccatt actgatggcg atagccctgt tattactaat 1440

gttgacagta ttgatgttga tgaagcgggc attgttggcg gctcacaaga gggcacggcg 1500

ccagtgtctg gcactggcgg tatcaccgcg gacatttttg aaagtgacat cattgaccat 1560

tatgagctag aacccactga atttaatact aatggcacct tggtttcaaa tggcgaggct 1620

gtgctacttg agttgattga tgaaaccaac ggtgtaagaa cttacgaagg ttatgttgag 1680

gtcaatggtt cgagaattac ggtctttgac gttaaaattg atagcccttc attgggcaac 1740

tatgagttta atctttatga agaactttct catcaaggcg ctgaagatgc gctgttaact 1800

tttgcattgc caatttatgc tgttgatgca gatggcgacc gttctgcact gtctggaggt 1860

tcgaacacac cagaagctgc tgagatcctc gttaatgtta aagacgatgt cgttgaatta 1920

gttgataagg ttgaatcagt caccgagccg accttagcgg gcgatactat tgtttcgtat 1980

aacctgttca attttgaagg cgcagatggt tctacaattc aatcgtttaa ctacgacggt 2040

gttgattact cactcgatca aagcctgctc cccgatgcta cccagatttt cagttttact 2100

gaaggtgtcg tcactatctc attaaacggt gacttcagtt ttgaagtcgc tcgtgatatc 2160

gaccactcaa gcagtgaaac tatcgtcaaa cagttctcat ttttagccga agatggtgat 2220

ggggatactg atagttcgac gcttgagtta agtattaccg atggccaaga tccgatcatt 2280

gatttgatcc cgcctgtgac tctctctgaa accaacctta atgacggctc tgctcccagc 2340

ggaagtacag ttagcgcaac cgagacgatt acctttaccg caggcagcga cgatgtagca 2400

agtttccgta ttgaaccaac agagtttaat gtgggcggtg cacttaaatc gaatggattt 2460

tcggttgaga taaaagaaga ttcggctaat ccgggtactt acattggctt tattaccaac 2520

ggttcgggcg ctgaaatccc agtgtttacg attgctttct ctacgagcac attgggtgaa 2580

tacaccttta ctctgcttga agcgttagac catgtagatg gtttagataa gaacgatctg 2640

agctttgatc tgcctattta tgcggttgat acggacggcg acgattcatt ggtgtctcag 2700

cttaatgtga ctatcggtga tgatgttcaa atcatgcaag acggtacgtt agatatcacc 2760

gagccaaatc ttgctgacgg tacaatcaca accaacacca ttgatgtaat gccaaatcaa 2820

agtgctgatg gcgcgacgat cactcggttc acttatgacg gtgtcgtaaa cacactggat 2880

caaagtattt caggagaaca gcagttcagc ttcacagaag gcgaactgtt tatcaccctt 2940

gaaggtgaag tgcgctttga gcctaatcgc gatctagacc actcagtgag tgaagatatc 3000

gtgaagtcga ttgtggtgac ttcaagcgac ttcgataacg atccggtgac ttcaaccatt 3060

acgctgacga tcactgatgg tgataacccg acgattgatg ttattccaag tgttacgctt 3120

tctgaaatta acctgagcga tggctctgct ccaagtggca gcgcggtaag ctcgactcaa 3180

actattactt ttaccaatca aagtgatgat gtggttcgtt tccgtattga gtcaacggag 3240

ttcaatacta acgatgatct taaatcgaac ggtttagctg ttgagttacg tgaagacccg 3300

gcagggtcgg gtgactacat tggttttacg accagtgcga cgaacgtaga aactccagta 3360

ttcacattaa gctttaattc tggatcatta ggtgaataca cgttcacact catcgaagcg 3420

ttggaccacc aagatgcccg tggcaacaac gacctcagtt ttgatttacc tgtttacgcg 3480

gtagatagtg atggcgatga ttcattggtg tctccgttaa acgtcactat cggtgatgat 3540

gttcaaatca tgcaagatag tacgttagat atcgtcgagc caaccgtcgc agatttggcc 3600

gctggcacag tgacaactaa caccattgat gtgatgccaa atcaaagtgc cgatggcgca 3660

acggtgacgc aattcactta tgatggccag cttcgaacac ttgaccaaaa tgacaatggt 3720

gagcagcaat ttagcttcac agaaggtgaa ctgttcatca cgcttcaagg tgatgtgcgc 3780

tttgagccta atcgtaatct agaccacaca ctcagcgaag acatcgtgaa atcaatcgtg 3840

gtgacatcta gcgattccga taacgatgtg ttgacctcaa ccgtcactct gaccattacc 3900

gatggtgata tcccaaccat tgataatgtt ccaactgtga acttgtctga aactaatctg 3960

agtgatggct ctgcacctag cggaagcgcg gtgagttcaa ctcaaactat tacttacacc 4020

actcaaagtg atgatgtgac aagcttccgt attgaaccga ctgaatttaa tgttggtggc 4080

gctctcacat caaacggatt ggcagtcgag ttaaaagctg atccaaccac accgggtggc 4140

tacatcggtt ttgtgactga tggttcgaac gttgaaacta acgtgttcac gattagcttc 4200

tcagatacca atttaggcca gtacaccttc accttacttg aagcgttaga ccatgtggat 4260

ggtttagcga acaatgatct gacctttgat ctgcctgttt atgcagttga tagcgatggc 4320

gacgattcac tggtgtctca gttaaatgta accatcggtg atgatgttca aatcatgcaa 4380

ggtggtacgt tagatatcac tgagccaaat cttgcagacg gcacaattac aaccaatacc 4440

atcgatgtga tgccagagca aagcgccgat ggtgcgacga tcactcagtt cacttatgac 4500

ggtcaagttc gaacactgga tcaaacggac aatggtgagc agcaatttag cttcactgaa 4560

ggcgagttgt tcatcactct tcaaggtgac gtgcgtttcg aacccaatcg caacctagat 4620

cacacagcta gcgaagatat cgtgaagtcg atagtggtga cttcaagcga tttagataac 4680

gatgtggtga cgtcaacggt cactctgacg attactgatg gtgatatccc aaccattgat 4740

gcagtgccaa gcgttactct gtctgaaatc aatcttagtg acggctctgc gccaagtggc 4800

actgcagtta gtcaaactga gacgattacc ttcaccaatc aaagtgatga tgtgaccagt 4860

ttccgtattg agccaataga gttcaatgtg ggcggtgcac tgaaatcgaa tggatttgcg 4920

gttgagataa aagaagattc ggctaatccg ggtacttaca ttggctttat taccaacggt 4980

tcgggcgctg aaatcccagt gtttacgatt gctttctcta cgagctcatt gggtgaatac 5040

acctttactc tgcttgaagc gttagaccat gtagatggtt tagataagaa cgatctgagc 5100

ttcgatctgc ctgtttatgc ggtcgatacg gacggcgatg attcattggt gtctcagcta 5160

aacgtgacca tcggtgatga tgtccaaatc atgcaagacg gtacgttaga tatcatcgag 5220

ccaaatctgg ctgatggaac aatcacaacc agcactattg atgtgatgcc aaaccaaagt 5280

gctgatggtg cgacgatcac tcagtttact tatgacggtc agctaagaac gcttgatcaa 5340

aatgacactg gcgaacagca gttcagcttc acagaaggcg agttgtttat cacccttgaa 5400

ggtgaagtgc gctttgagcc aaaccgagac ctagaccaca ccgcgagtga agatattgtt 5460

aagtcgattg tggtcacttc aagtgatttc gataacgact ctctgacttc taccgtaacg 5520

ctgaccatta ctgatggtga taaccctacg atcgacgtca ttccaagcgt taccctttct 5580

gaaactaatc tgagtgatgg ctctgctcca agtggcagcg cggtaagctc gactcaaact 5640

attactttta ccaatcaaag tgatgatgtg gttcgtttcc gtattgagcc aacggagttc 5700

aatactaacg atgatcttaa atcgaacggt ttagccgttg agttacgtga agacccggct 5760

gggtcgggtg actacattgg ttttactact agtgcgacga atgtcgaaac cacggtattt 5820

acgctgagtt tttctagcac cacattaggt gaatatacct tcactttgct tgaagcgttg 5880

gaccaccaag atgcccgtgg caacaacgac ctcagttttg aactgcctgt ttatgcggta 5940

gacagtgatg gcgatgattc actgatgtct ccgttaaacg tcaccatcgg cgatgatgtt 6000

caaatcatgc aagacggtac gttagatatc gtcgagccaa ccgtcgcaga tttggccgct 6060

ggcattgtga caactaacac cattgatgtg atgccaaatc aaagtgccga tggcgcgacg 6120

atcactcaat tcacttatga tggccaactt cgaacacttg accaaaatga caatggcgaa 6180

caacagttta gcttcacgga aggtgaacta ttcatcactc ttgaaggtga agtgcgcttt 6240

gagcctaatc gtaatctaga ccacacgctg aacgaagaca tcgtgaaatc gatcgtggtg 6300

acgtctagtg actccgataa cgatgtgttg acctcaaccg tcactctgac cattaccgat 6360

ggtgatatcc caaccattga taatgtgcca acagtgagct tgtcagaaac aagtctgagt 6420

gacggctctt caccaagtgg cagcgcagtt agctcaactc aaaccatcac ttacaccact 6480

caaagtgatg atgtaaccag cttccgtatt gaaccgactg agttcaatgt tggcggtgct 6540

ctcaaatcaa atggattggc ggttgagctg aaggccgatc caaccactcc gggcggctac 6600

atcggctttg tgactgatgg ttcgaacgtt gaaactaacg tgttcacgat tagcttctcg 6660

gataccaatt taggtcaata caccttcacc ttgcttgaag cgttggatca tgcggatagc 6720

cttgcaaata acgatctgag ctttgatctg ccagtctacg ccgtcgatag tgatggcgat 6780

gattcactgg tgtctcaact caatgtaacc atcggtgatg atgttcaaat catgcaaggt 6840

ggtacgttag atatcactga gccaaacctt gcagacggca caaccacaac taacaccatc 6900

gatgtgatgc cagaacaaag tgccgatggt gcgacgatca ctcagtttac gtatgacggg 6960

caagttcgca ctctggatca aactgacaat ggtgagcagc aatttagctt cactgaaggc 7020

gagttgttca tcactcttca aggtgacgtg cgtttcgaac ccaatcgcaa cctagatcac 7080

acagctagcg aagacatcgt gaagtcgata gtggtgactt caagcgattc agataacgat 7140

gtggtgacgt caacggtcac tctgactatt actgatggtg atctcccaac cattgatgca 7200

gtgccaagcg ttactctgtc tgaaactaat cttagtgacg gctctgcgcc aagtggcagc 7260

gcagtcagtc aaactgagac catcaccttt accaatcaaa gtgatgatgt ggcgagtttc 7320

cgtattgagc caaccgagtt taatgtgggc ggtgcactga aatcgaatgg gtttgcggtt 7380

gagataaaag aagactctgc taatccgggt acttacattg gctttattgc caatggttcg 7440

agcgctgaaa tcccagtgtt cacgattgct ttctctacga gtacgttggg tgaatacacc 7500

tttactctgc ttgaagcgtt agaccatgcg gatggtttag ataagaacga tctgagcttt 7560

gagcttccgg tttacgcggt tgatacagac ggtgatgatt cattggtatc tcagcttaat 7620

gtgaccattg gtgatgatgt tcaaatcatg caagatggta cgttagacgt tatcgagcca 7680

aatcttgcag acggcacaat cacaaccaac accattgatg tgatgcccga gcaaagtgct 7740

gatggtgcga cgatcactca gtttacttat gacggtcagc taagaacgct tgatcaaaat 7800

gacactggtg aacagcagtt cagcttcaca gaaggcgagt tgtttatcac ccttgaaggt 7860

gaagtgcgct ttgaacctaa tcgcgatcta gaccattccg ttagcgaaga catcgtgaag 7920

tcgatagtag tgacttcaag cgacttcgat aacgatccgg tgacttcagc cattacgctg 7980

accattactg atggtgataa tccgactatc gattcggtac cgagcgttgt acttgaagaa 8040

gctgatttaa ctgatggctc atcgccaagt ggcagcgcgg ttagtcaaac ggaaaccatc 8100

actttcacta atcaaagtga cgatgttgag aaattccgtt tagaaccaag tgaatttaat 8160

actaacaacg cgctcaagtc cgatggcttg atcattgaga ttcgagagga accaacagga 8220

tccggcaatt atattggttt cacgaccgat atttcgaatg tcgaaaccac tgtgtttaca 8280

ctcgatttca gcagtaccac tttgggtgag tacaccttca cgcttctgga agcgattgac 8340

cacacgcctg ttcaaggcaa taacgatcta acattcaact tgccagtcta cgcggttgat 8400

agcgacggtg atgattcgct aatgtcatca ctatcggtga cgattactga tgatgttcaa 8460

gtgatggtga gtggttcgct tagtatcgaa gagcctactg ttgccgactt ggctgcaggc 8520

acgccaacaa catcagtatt tgatgtatta acatccgcga gtgctgatgg ggcgaccatt 8580

actcagttca cttatgatgg tggggcggta ttaacgcttg atcaaaacga tacaggtgag 8640

cagaagttcg tggttgctga tggggcatta tatatcactc tgcaaggcga tattcgtttc 8700

gaaccaagtc gtaaccttga ccatactggt ggcgatatcg tcaagtcgat agtcgtaact 8760

tcaagtgatt ccgatagcga tcttgtgtct tcaacggtaa cgctaaccat tactgatggc 8820

gatatcccaa cgattgacac ggtgccaagc gttactctgt cagaaacgaa tctgagcgac 8880

ggatctgctc cgaatgcaag tgcggtaagt tcaactcaaa ccattacctt tactaaccaa 8940

agtgatgacg tgacgagttt ccgtattgaa ccgactgatt ttaatgttgg tggtgctctg 9000

aaatcgaacg gattggcggt cgaactgaaa gcggacccaa ctacaccggg tggctacatc 9060

ggttttgtga ctgatggttc gaacgttgaa actaacgtgt ttacgattag cttctcggat 9120

accaatttag gtcaatacac cttcaccctg cttgaagcgt tggatcatgt agatggctta 9180

gtgaagaatg atctgacttt tgatcttcct gtttatgcgg ttgatagcga tggtgatgat 9240

tcactggtgt ctcaactgaa tgtgaccatt ggtgatgatg tacaggtcat gcaaaaccaa 9300

gcgcttaata ttattgagcc aacggttgct gatttggctg caggtactcc gacgacagcc 9360

actgttgatg tgatgcctag ccaaagtgcc gatggcgcga caatcactca gtttacttac 9420

gatggcgggg cggcaataac actcgaccaa aacgacaccg gtgaacagaa gtttgtattt 9480

actgaaggtt cactgtttat caccttgcaa ggtgaagtgc gtttcgagcc aaatcgcaat 9540

ctaaaccaca cagcgagcga agacatcgtg aagtcgattg tggtgacttc aagcgattta 9600

gataacgatg tactgacgtc aacggtcact ctgactatta ctgatggtga tatcccaacc 9660

attgatgcag tgccaagcgt tactctgtct gaaactaatc ttagtgacgg ctcagcgcca 9720

agcagcagtg ctgtaagtca aacagagacg attaccttca tcaatcaaag tgatgatgtg 9780

gcgagtttcc gtattgagcc aacagagttc aatgtgggcg gtgcactgaa atcgaatgga 9840

tttgcggttg agataaaaga agattcggct aatccgggta cttatatcgg ttttattacc 9900

gatggttcga atactgaagt tcctgtattc acgattgctt tctctacaag tacgttgggc 9960

gaatacacct tcaccttact tgaagcgcta gaccatgcaa atggcctaga taagaacgat 10020

ctgagttttg atcttcctgt ttatgcggta gacagtgatg gcgatgattc actggtgtct 10080

caactgaatg tgaccattgg tgatgatgtc caaataatgc aagacggtac gttagatatc 10140

actgagccaa atcttgcaga cggaacaatc acaaccaaca ccattgatgt gatgccaaat 10200

cagagtgccg atggtgcgac gatcactgaa ttctcatttg gcggtattgt caaaacactc 10260

gatcaaagca tcgtaggtga gcagcagttt agtttcaccg aaggtgagct attcatcact 10320

cttcaaggtc aagtgcgctt tgaaccaaat cgtgaccttg accactctgc cagcgaagac 10380

atcgtgaagt cgatagtggt tacttcaagt gattttgata acgatcctgt gacttcaacc 10440

gttacgctga ccattaccga tggtgatatt ccaactatcg atgcggtacc aagtgttacg 10500

ctttcagaaa caaacctagc tgatggttct gcgccaagtg gtagtgcggt tagtcaaacg 10560

gagacgatta cttttaccaa tcaaagtgat gatgtggttc gcttccgtct ggaaccaacc 10620

gagttcaata ctaacgatgc acttaaatcg aatggcttag cggtcgaact gcgcgaagaa 10680

cctcaaggct ctggtcagta cattggcttt accaccagtt cgtctaatgt tgagacaaca 10740

gtatttacgt tggactttaa ctccggaacc ttaggtgaat acacatttac tttaatcgaa 10800

gctctggatc atcaagatgc gcgtggcaac aacgatttaa gctttaatct acctgtgtat 10860

gcggtggata gtgatggcga tgactcgtta gtctctcagc ttggcgtgac cattggcgac 10920

gatgtgcagt tgatgcaaga cggcacaatc accagtcgtg agcctgcagc aagtgttgaa 10980

acatcaaata cctttgatgt gatgccaaac caaagtgctg atggagccaa agtcacttca 11040

tttgttttcg atggtaagac tgcagaaagt cttgatttga atgtgaatgg tgaacaagag 11100

ttcgtcttca cggaaggttc ggtatttatt acgacggaag gtgagatacg attcgagccg 11160

gtacgtaatc aaaatcatgc tggtggtgat attaccaagt cgattgaggt gacgtctgtt 11220

gacctcgatg gcgatattgt cacatcgaca gtgacactga agattgttga tggtgacctt 11280

cctactatcg accttgttcc cggaattacg ttatctgaag tggatctggc cgatggctct 11340

gtgccaaccg gtaatccagt gacaatgaca caaaccatta cctacacagc gggtagtgac 11400

gacgtaagcc atttcagaat tgaccctacg cagttcaata cttcaggggt tttgaaatcg 11460

aacggcctag atgtcgaaat aaaagagcag ccagctaatt ctggtaatta cattggcttc 11520

gtcaaagacg gttctaacgt agaaaccaac gtcttcacga tcagcttctc gacgagcaat 11580

ttagggcaat acacgttcac actacttgaa gcgttagatc atgtagatgg attgcaaaac 11640

aatatactaa gcttcgatgt ccctgtttta gcggttgatg cggatggtga tgattctgca 11700

atgtcgccta tgacggttgc gatcaccgat gacgtacaag gtgttcaaga tggcaccttg 11760

agtatcactg agccttcatt agctgatttg gcatcgggta cgccaccaac gacggcaatc 11820

attgatgtta tgccaacgca gagtgctgat ggcgcgaaag taacacagtt tacttacgat 11880

ggtggcacag ctgtaacgtt agacccaagc atcgccacag aacaagtctt taccgtaacc 11940

gatggcttac tgtacatcac cattgaaggg gaggttcgtt ttgagccgag ccgagatcta 12000

gaccattcat ctggcgatat cgtaagaacg attgtcgtca ccaccagtga ttttgataac 12060

gatacagata ccgcggatgt cactttgacg atcaaagacg gtatcaatcc cgttatcaat 12120

gtggttccag atgttaactt atcggaagtt aatctagcgg atggctcgac gccaagtggt 12180

tctgcagtca gttcgactca cacaatcact tacaccgaag gaagtgatga ttttagtcac 12240

tttagaattg cgaccaacga attcaatcct ggcgatctgt tgaaatcaag tggtcttgtt 12300

gttcaactaa aagaagatcc tgcttctgct ggtgattaca ttggttatac cgatgatggt 12360

atgggtaacg ttaccgatgt atttaccatt agctttgata gtgcaaacaa agctcagttt 12420

acatttacct tgattgaggc gcttgatcac cttgatggtg tgctttacaa cgatcttacg 12480

ttccgtttgc ctatctatgc tgttgataca gatgattctg aatcaacaaa gcgcgatgtg 12540

gtggttacga tagaagatga catccagcaa atgcaagatg gcttcttaac cattaccgag 12600

ccaaattctg gtactccaac aacaactacc gttgatgtga tgccaatacc aagtgcagac 12660

ggtgcgacta ttacgcagtt cacgtatgac ggtggttctc caattactct gaatcaaagc 12720

atcagcggcg aacaagagtt tgttttcact gaaggttcac tgtttgtgac actagatggt 12780

gatgtaaggt ttgagccaaa tagaaacctt gatcactctg cgggcgacat tgttaaatcg 12840

attgtgttca cgtcttcaga ctttgataac gacatcttct catcaaaagt cactctcacc 12900

attgttgatg gtgatgggcc aacaatcgac gttgtgccgg gtgtggcatt gtcagaaagc 12960

ttacttgcgg atggttcgac gcctagcgta aatcccgtga gtatgactca aaccattact 13020

tcacttgcaa gtagtgatga tattgctgaa atagtggtgg aagtcgggtt gttcaatacc 13080

aacggcgcgt tgaagtcgga tggtttgtca ctgagtttac gtgaagaccc tgtaaattca 13140

ggcgactaca ttgcatttac tactaatggt tcgggtgttg agaaagttat cttcactctg 13200

gattttgatg atacgaatcc gagtcaatat acgtttactc tgcttgaacg tttagaccat 13260

gttgatggct taggaaataa cgatctgagt tttgatcttt ctgtttatgc agaagatacc 13320

gatggtgata tttcagcgtc taaaccgctt acagtcacca tcaccgatga tgttcagctc 13380

atgcaatccg gtgcgctcaa cattactgag ccaaccacag gaacaccgac tacagcagtc 13440

tttgatgtga tgcctgcgca aagtgcagat ggcgcgacaa tcactaagtt tacctatggc 13500

agccaacctg aagagtctct ggtacaaacc gtcacgggtg agcaagaatt tgtgttcact 13560

gaaggttctc tgtttatcaa tcttgaaggt gatgtacgtt tcgaacctaa ccgtaatctc 13620

gatcattcgg gtggtaacat cgttaagacc attacggtga catcggaaga taaagatggc 13680

gatattgtca cttcaacagt gacgctgact attgtagatg gcgcgccacc agtaatagac 13740

acagtaccaa cggttgcatt ggaagaagcg aatctggtcg acggatcttc accgggttta 13800

cctgttagcc aaactgaaat cattactttc acagcaggaa gtgatgatgt gagccacttc 13860

cgtattgatc cggctcaatt caacacatca ggcgatctga aagcggatgg tttggtggtt 13920

cagttaaaag aagatcctct aaacagcgat aattatattg gttacgttga aagcggcggt 13980

gtccaaacgg atatcttcac catcaccttt agcagcgtgg ttctaggaga gtacacattc 14040

accttgttgg aagagttaga tcacctgcct gtacaaggta acaatgatca aatcttcacc 14100

ttgccagtga tcgcagtcga caaagacaac actgactcag cggtgaaacc tcttacggtg 14160

accattaccg atgatgttcc aaccattact gacaccaccg gcgccagtac gtttgtggtt 14220

gatgaagatg atttgggcac tctggcacaa gcgacgggtt cgtttgtaac cacagaaggt 14280

gcagatcaag tcgaggttta cgaactacgt aatatatcaa cgttggaagc aacgctatcg 14340

tcgggcagtg aaggtattaa gatcactgag atcacaggtg ctgctaacac gaccacctac 14400

caaggggcga ccgacccaag tggaacgcca attttcacat tagtgctgac tgatgatggt 14460

gcctacacct ttaccttgct tggccctctc aatcacgcta cgacaccgag taacctcgat 14520

acattaacaa taccatttga tgttgttgcc gttgacggtg atggcgatga ttctaaccaa 14580

tatgtattgc caatcgaggt gctagatgat gtgcctgtaa tgacggcgcc gacgggtgaa 14640

acggttgttg atgaagacga tcttactggc attggttccg atcaatctga agatacaatt 14700

atcaatggac tgttcaccgt tgatgaaggt gcggatggcg ttgtgctgta tgagctggtt 14760

gatgaagatt tggttctgac gggcttaacc tctgatggag aaagcttaga gtggctagct 14820

gtttcacaaa acggcacaac atttacttac gttgctcaaa ctgcaacgag taatgaagcg 14880

gtgttcgaga ttattttcga cacctcggat aacagctacc aatttgaatt atttaagcca 14940

ctgaagcacc ctgacggtgc aaacgagaac gcgatagatc ttgatttctc aatcgttgct 15000

gaagattttg atcaagacca atcggatgcg atcggtctaa aaattacggt aaccgatgat 15060

gttccgttag tgacaactca atcgattact cgtcttgaag gtcaggggta tggcaactct 15120

aaagtcgaca tgtttgccaa tgcaacagat gtgggggctg atggcgcggt actgagtcga 15180

attgagggta tctcaaataa tggtgcagat attgttttcc gtagcgggaa caatgggcca 15240

tatagtagcg gcttcgattt aaacagcggt agccaacaag ttcgagtcta cgagcaaaca 15300

aatggcggtg ctgatactcg tgaacttggc cgtctacgca tcaactcaaa tggtgaggtt 15360

gaattcagag ctaacggcta tctcgatcat gacggtgatg acaccatcga cttctcgatt 15420

aacgtgattg ccacagatgg agatttagac acctctgaaa caccgttaga tattacgatt 15480

actgataggg attctacaag aattgcgctg aaagtgacga ccttcgagga tgcgggtaga 15540

gactcaacca taccttacgc aacaggtgat gagccgactc ttgagaatgt tcaagataac 15600

caaaatggtt tgccgaatgc gccagcgcaa gttgcgctgc aagttagtct gtatgaccaa 15660

gataacgctg aatctattgg gcagttgacg attaaaagcc cgaacggagg tgatagtcat 15720

caaggtactt tttattactt tgatggtgct gactacatag aattagtgcc tgagtcaaat 15780

gggagcatta tatttggctc tcctgaactc gaacaaagct tcgctccaaa cccgagtgaa 15840

ccaagacaaa ctatcgcgac gatagacaac ctgttctttg ttccagacca acacgctagt 15900

tcggatgaaa ctggtgggcg agttcgttat gagcttgaaa ttgagaaaaa tggcagtacg 15960

gatcacaccg ttaattcaaa cttcagaatt gagattgaag ctgtagctga tattgcgact 16020

tgggatgatt ccaacagcac gtatcagtat caagtcaacg aagatgaaga caatgtcacg 16080

ttgcagctga acgcagagtc tcaagataac agtaatactg agacgattac ctatgaactt 16140

gaagccgttc aaggcgacgg gaagtttgag ttacttgatc aaaatggcaa tgtgttaacg 16200

cccgttaatg gtgtttatat catcgcatct gctgatatca atagcaccgt agttaaccct 16260

attgataact tctcagggca gattgagttc aaagcgacgg caattacgga agagacgctt 16320

aacccatacg atgattcaga caacggtgga gcaaacgata agacgacggc tcgttctgtg 16380

gaacaaagta ttgttattga tgtgaccgca gatgcggacc ctggcacatt cagtgttagt 16440

cgaattcaga tcaacgaaga caatatcgat gatccagatt acgtcgggcc tttggacaat 16500

aaagacgcgt tcacgttaga cgaagtcatc accatgacag ggtcggtcga ttctgacagt 16560

tctgaagaac tgtttgtgcg catcagtaat gttacggaag gagctgtgct ttacttctta 16620

ggcaccacga cagtcgttcc gaccatcacg atcaatggtg tggattatca agaaatcgcg 16680

tattccgatt tggctaacgt tgaggttgtt ccaaccaaac acagtaatgt cgatttcacc 16740

ttcgatgtta cgggagtggt caaagatacg gcaaatctat ccacgggcgc ccaaatcgat 16800

gaggagatac taggaactaa aaccgtcaac gttgaagtca aaggcgttgc cgatactcct 16860

tatggtggaa cgaatggcac ggcttggagt gcaattacag atggcactac atctggtgtt 16920

caaaccacga ttcaagagag ccaaaatggt gatacctttg ctgagcttga tttcaccgtg 16980

ttgtcgggag agagaagacc agatactggc actacaccat tagctgacga tgggtcagaa 17040

tcaataaccg ttattctatc gggtataccc gatggggttg ttctagaaga cggtgacggt 17100

acagtgattg accttaactt tgtcggttat gaaaccggac cgggcggtag tcctgactta 17160

tccaaaccta tctacgaagc gaacattact gaggcgggta aaacttcagg cattcgcatc 17220

agacctgtcg actcttcaac cgagaatatt cacattcaag gtaaagtgat tgtgactgag 17280

aacgatggtc acacgcttac gtttgatcaa gaaattcgag tgcttgttat acctcgaatc 17340

gacacatcag caacttatgt caatacgact aacggtgatg aagatacggc tatcaatatt 17400

gattggcacc ctgaaggcac ggattacatt gatgacgatg agcatttcac taagataact 17460

attaatggaa taccactggg tgttactgca gtagtcaacg gtgatgtgac cgttgatgac 17520

tcaaccccag gaacattgat tataacgcct aaagatgctt cccaaactcc tgaacaattt 17580

actcaaattg cattagctaa taacttcatt caaatgacgc ctccggctga ttctagtgca 17640

gattttacgt tgaccaccga acttaaaatg gaagagcgag atcatgagta tacgtctagc 17700

ggcctagagg atgaagatgg tggttatgtc gaagccgatc cagatataac cggaatcatt 17760

aacgttcaag tacgacctgt ggttgaacct ggagatgccg acaacaagat tgtcgtttca 17820

aacgaagatg gctctggaga tctcactacg attacggctg atgctaatgg tgtcattaaa 17880

tttacaacta acagtgataa ccaaacgact gatactaacg gagacgaaat ctgggacggt 17940

gaatacgtcg tccgatacca agaaacggat ttaagcacag tagaagagca agtcgacgaa 18000

gtgattgttc agctgactaa caccgatgga agcgcgttat ctgatgatat tttagggcaa 18060

cttttagtaa ctggtgcctc ttacgaaggc ggtggccgat gggttgtgac caatgaagat 18120

gcctttagcg tcagtgcgcc caatggatta gatttcaccc ctgccaatga tgcggatgat 18180

gtagctactg atttcaatga tatcaagatg acaattttca ctttggtctc agatcctggt 18240

gatgctaaca atgaaacgtc cgcccaagtg caacgcaccg gagaagtaac gctttcttat 18300

cctgaagtgc tgacggcacc tgacaaagtt gccgcagata ttgcgattgt gccagacagt 18360

gttatcgacg ctgttgagga tactcagctt gatctcggcg cggcactcaa cggcattttg 18420

agcttgacgg gtcgcgatga ttctactgac caagtgacgg tgatcatcga tggcactctg 18480

gtcattgatg ctacaacatc attcccaatt agcctgtcgg gaacaagtga tgttgacttt 18540

gtgaatggga aatatgttta cgagacgact gttgagcagg gcgtagccgt cgattcatcg 18600

ggtttgttat tgaatctgcc accaaactac tctggtgact ttaggttgcc aatgaccatc 18660

gtgaccaaag atttacaatc tggtgatgag aagaccttag tgactgaagt tatcatcaaa 18720

gtcgcaccag atgctgagac ggatccaacg attgaggtga atgtcgtggg ttcgcttgat 18780

gatgccttta atcctgttga taccgacggt caagctgggc aagatccggt gggttacgaa 18840

gacacctata ttcaactcga cttcaattcg accatttcgg atcaggtttc cggcgtcgaa 18900

ggcggccaag aagcgtttac gtccattact ttaacgttgg acgacccttc tataggtgca 18960

ttctatgaca acacgggtac ttcattaggt acatctgtta cgtttaatca ggctgaaata 19020

gcagcgggtg cactcgataa cgtgctcttt agggcaatcg aaaattaccc aacgggtaat 19080

gatattaacc aagtgcaggt taatgtcagc ggtacagtca cagataccgc aacctataat 19140

gatcctgctt ctcctgcggg tacggcaaca gactcagata ctttctctac gagtgtcagc 19200

tttgaagtcg ttcctgtggt cgatgacgtg tctgtcactg gaccgggtag cgatcctgat 19260

gttatcgaga ttactggcaa cgaagaccag ctcatttctt tgtcggggac agggcctgta 19320

tcgattgcac tgactgacct tgatggttca gaacagtttg tatcgattaa gttcacagat 19380

gtccctgatg gcttccaaat gcgtgcagat gctggctcga catataccgt gaaaaataat 19440

ggtaatggag agtggagtgt tcaactgcct caagcttcgg ggttgtcatt cgatttaagt 19500

gagatttcga tcttgccgcc taaaaacttc agtggtaccg ctgagtttgg tgtggaagtc 19560

ttcactcaag aatcgttgct gggtgtgcct actgcggcgg caaacttgcc aagcttcaaa 19620

ctgcatgtgg tacctgttgg tgacgatgtt gataccaatc cgactgattc tgtaacaggc 19680

aacgaaggcc aaaacattga tatcgaaatc aatgcgacta ttttggataa agaattgtct 19740

gcaacaggaa gcgggacgta taccgagaat gcgcccgaaa cgcttcgagt tgaagtggcg 19800

ggtgttcctc aagatgcttc tattttctat ccagatggca cgacattggc tagctacgat 19860

ccggcgacgc agctctggac tctcgatgtt ccagctcagt cgttagataa gatcgtattt 19920

aactctggcg aacataatag tgatacaggc aatgtactgg gtatcaatgg tccactgcag 19980

attacggtac gttcagtaga tactgatgct gataatacag agtacctagg tacgccaacc 20040

agcttcgatg tcgatctggt gattgatcct attaacgatc aaccgatctt tgtgaacgta 20100

acgaatattg aaacatcgga agacatcagt gttgccatcg acaactttag tatctacgac 20160

gtcgacgcaa actttgataa tccagatgct ccgtatgaac tgacgcttaa agtcgaccaa 20220

acactgccgg gagcgcaagg tgtgtttgag tttaccagct ctcctgacgt gacgtttgta 20280

ttgcaacctg acggctcatt ggtgattacc ggtaaagaag ccgacattaa taccgcattg 20340

actaatggag ctgtgacttt caaacccgac ccagaccaga actacctcaa ccagactggt 20400

ttagtcacaa tcaatgcaac gctcgatgat ggtggtaata acggtttgat tgacgcggtt 20460

gatccgaata ccgctcaaac caatcaaact accttcacca ttaaggtgac ggaagtgaat 20520

gacgctcctg tggcgactaa cgttgattta ggctcgattg cggaagacgc tcaaatcgtg 20580

attgttgaga gtgacttgat tgcagccagt tctgatctag aaaaccataa tctcacagta 20640

accggtgtga ctcttactca agggcaaggt cagcttacac gctatgaaaa tgctggtggt 20700

gctgatgacg cagcgattac ggggccattc tggatattca ttgcagataa tgatttcaac 20760

ggcgacgtta aattcaatta ctccattatc gatgatggta ccaccaacgg tgtggatgat 20820

tttaaaaccg atagcgctga aatcagcctt gtagttactg aagtcaatga ccagccagtg 20880

gcatcgaaca ttgatttggg caccatgctt gaagaaggac agctggtcat taaagaggaa 20940

gacctgattt ccgcaaccac tgatccggaa aacgacacga ttactgtgaa cagtttggtg 21000

ctcgatcaag gtcagggcca attacaacgc tttgagaacg tgggcggtgc tgatgatgct 21060

acgatcactg gcccgtactg ggtatttact gcagccaacg aatacaacgg tgatgttaag 21120

ttcacttata ccgttgagga cgatggtaca accaacggcg ctgatgattt cttaacagat 21180

accggcgaaa ttagcgttgt ggtaacggaa gtgaatgatc aaccggtggc aacggatatc 21240

gacttaggaa acatccttga agaagggcag ttgatcatca aagaggaaga cttaattgct 21300

gctacgagcg atccggaaaa cgacacgatt accgtgacca atctggtgct cgacgaaggc 21360

caaggccagt tacagcgctt tgagaacgtg ggcggtgctg atgacgctat gattactggc 21420

ccgtactgga tatttacggc tgctgatgaa tacaacggta acgttaagtt cacctatacc 21480

gtcgaggatg atggtacaac caacggcgct aatgatttcc taacggatac tgcagagatc 21540

acagcgattg tcgacggagt gaacgatacg cctgttgtta atggtgacag tgtcactacg 21600

attgttgacg aggatgctgg tcagctattg agtggtatca atgtcagtga cccagattat 21660

gtggatgcat tttctaatga cttgatgaca gtcacgctga cagtggatta cggtacattg 21720

aacgtatcac ttccggcagt gacgacagtg atggtcaacg gcaacaacac tggttcggtt 21780

atcttagttg gtactttgag tgacctgaat gcgctgattg atacgccaac cagtccaaac 21840

ggtgtctacc tcgatgcgag cttgtctcca accaatagca ttggcttaga agtaatcgcc 21900

aaagacagcg gtaacccttc tggtatcgcg attgaaactg caccagtggt ttataatatc 21960

gcagtgacac cagtcgctaa tgcgccaacc ttgtctattg atccggcatt taactatgtg 22020

agaaacatta cgaccagctc atctgtggtc gctaatagtg gagtcgcttt agttggaatt 22080

gtcgctgcat tgacggacat tactgaagag ttaacgttga agatcagcga tgttccggat 22140

ggtgttgatg taaccagtga tgtgggtacg gtttcgttgg tgggtgatac ttggatagcg 22200

accgctgatg cgatcgatag tctcagactc gtagagcagt catcattagg taaaccgttg 22260

accccgggta attacacctt gaaagttgag gcgctatctg aagagactga caacaacgat 22320

attgcgatat ctcaaaacat cgatctgaat ctcaatattg ttgccaatcc aatagatctc 22380

gatctgtctt ctgaaacaga cgatgtgcaa cttttagcga gtaactttga tactaacctc 22440

actggcggaa ctggaaatga ccgacttgta ggtggagcgg gtgacgatac gctggttggc 22500

ggtgacggta acgacacact cattggtggc ggcggttccg atattctaac cggtggcaat 22560

ggtatggatt cgtttgtatg gctcaatatt gaagatggcg ttgaagacac cattaccgat 22620

ttcagcctgt ctgaaggaga ccaaatcgac ctacgagaag tattacctga gttgaagaat 22680

acatctccag acatgtctgc attgctacaa cagatagacg cgaaagtgga aggggatgat 22740

attgagctta cgatcaagtc tgatggttta ggcactacgg aacaggtgat tgtggttgaa 22800

gaccttgctc ctcagctaac cttaagtggc accatgcctt cggatatttt ggatgcgtta 22860

gtgcaacaaa atgtcatcac tcacggttaa cgcctaattg gaggctagct attagaatct 22920

aacgattaaa ctaaaagcgg accatttaac cataacgaaa gaggccagca ttgctggcct 22980

cttttttgtc actgtataaa tcgtaaagag ttacttaaga gagttgtgga tcaggaactc 23040

ttcttcgacg cctttcaatt tcatctcatc cataatgaag ttcactgtgt tcaacaagcg 23100

ttgttcacct tttggtatca ggtaaccgaa ttgactgttg gtaaacggtg tttcacagcg 23160

tgccgcttca agacgttcgt ccgtcacttg atagaacaga ccttcaggag tttctgtcac 23220

cattacatca actttacctt ccgcaacggc ttgcggaacg tctaggttgt tctcgtaacg 23280

cgtaaagctc gcgtcttgca agttagcatc cgcaaacatc tcattagtcc caccgatatt 23340

gacgccaaca cgcacagaag agaggttcac tttctcaatg ctgttgtatt gttctgcttt 23400

gcctttcgca actaagaaac acttgccaaa ggtcatgtaa ccttgagttt gttctgcgtt 23460

taactgacgc tgcattttac gcgtgatacc gcccatcgcg atgtcgtatt tatcgctgtc 23520

tagatcggtc agtagatctt tccatgtggt acgaacaatc tgtaattcaa cgcccaactg 23580

ctctgcaaca tgtttggcta cgtcaatgtc ataaccagag taggttttgc cgtcgaagta 23640

agaaaaaggt ttgtagtcgc ctgtggtgcc gacgcgaagt gtgcctgatt tttgaatgtc 23700

ttctagctgg tcagcttgta ctacaccaga aagtgccaga gtaatggaag caagtaatag 23760

tgatgttttt ttcattgtaa ttatctgttg tgtttgtgtt gttattcaaa gtaacagaaa 23820

caatcagaga aagagatcaa accattggaa aggttgtaaa agaagataaa acgagggcag 23880

gagataggta acgctattga tttgtgaaca ttgataaaca tgtgtttcat attccatttt 23940

gataaaccgt agacaaacaa aaagcccatg ttatcgaata acatgggctt cattttggtt 24000

taacttgtta gctgcttatt tagctgctta tttagctgtt tagctgttta gctgtttagc 24060

tacttagcaa ctgactcgtt gttcatctta gccggagctt tagatgcgtt aaccagcagg 24120

ataccaacgg tgagtaccat cgaaccacat agtaggaaca acaagcgtcc tgttggttcg 24180

tttggaatca gagccattgc taggataccg aaacctgctg tgctgataag cttaccaagc 24240

attgaacgct gtttagtatc taggttctgc tgctcttcac cttccgctac tagcggcgta 24300

ttccagttag tgaatagttg gtcaacttct ttctcacgtt caggcgatag gcctttgtag 24360

aagcgagaag ttaggatgaa gtaaccacca gtaaacacta cgtgagcagc taagctaaga 24420

ccaactttca agtcgctcca ttcacggcca gtaagcgctg tttccatacc aaataggtgc 24480

tcgatgtctt ctgcttgaag cgagataccg aagatgtaag aaacgaagcc accaacgatt 24540

aacgtagacc aaccagccca gtcaggcgtc ttacgaatcc acataccaag tagtacaggg 24600

ataagcattg ggaagccaat taacgcacct acgttcatta cgatatcgaa caagctcaaa 24660

tgacgtagag agttaatgaa caagccaatc gcgatgatga taatacccat catgatagtg 24720

gttagcttac ttacaataac cagctctttc tgagttgcgt tttgacgtag aatagggctg 24780

tagaagttca ttacaaagat gccagcgtta cggttcaaac ctgaatccat agaagacatt 24840

gttgcagcga acattgctga cataagaaga ccaaccatac ctgctggcat tacgttctgt 24900

acgaatgcta ggtaagcagc atcaccagct ttatcaccca ttgaagcgta ctccaatgcg 24960

aaatcaggca tgaatgcact tacgtaccaa ggtggtagga accagattag tgggccaaca 25020

accataagga tacatgctag gcctgccgct ttacgtgcgt tttcactgtc tttcgcacat 25080

aggtaacggt aagcgttgat gctgttgttc attacaccga actgcttcac gaagatgaat 25140

acaacccaaa gaacgaagat gctcatgtag tttaggttat tacctaacat gaagtcgccg 25200

tcgaaatttg caacgatgtt agttaggcca ccaccgtgga agtaagctgc aaccgcacaa 25260

gtaatcgtaa ccgccatgat aacaagcatt tgcatgaagt cagaagcaac aaccgcccaa 25320

gagccgcctg ttactgccat caatactaga accatacccg ttaccacaat ggttgcttcc 25380

attgggatgt tgaataccgc tgctacgaag atagctagac catttagcca gatacccgca 25440

gagataaggc tgtcaggcat acctgcccat gtgaagaact gttcagacgt tttaccaaag 25500

cgctgacgaa tagcttcgat cgccgttacc acacgaagtt ggcggaactt tggagcgaag 25560

tacatatagt tcatgaagta gccaaaagca ttggctaaga ataggattac aataacgaaa 25620

ccgtcattga acgcgcgtcc tgcggcacct gtaaacgtcc atgctgaaaa ctgtgtcatg 25680

aaggcggttg caccaaccat ccaccacaac attttgccgc cccctctgaa gtaatcacta 25740

gtcgacgtgg tgaacttacg gaacatccaa ccaatagcga ttaaaaagaa gaagtaggcg 25800

agaacaacaa aagtatcgat agtcatcttt tcagcctttt aaatatcata attaactggg 25860

cttagattaa cgcgttcaaa ggtttatttg tactacaata tgtctttagt atgatctagg 25920

tcgcattgat ttttgggtgc acacgataag ttaatttaac ctactgtttt tattgatttt 25980

aattgttttt atgaattgct ctagatccaa gataaattga agttcaaatg tttatatgta 26040

ttacaatata agtaatgagg ctttagttta ccttatttat aagattttaa ttataaccgt 26100

aacaaatatg ctacaactga gcgtggttgt gcgacgacat tcacgttaat ttggaactct 26160

attctggaaa ttcttgtatt aggatttcaa gtgtagctca ttgttttcac ttcgctattt 26220

tgtgtttgtc tgcggttctg tcgcctttcc atgctattga ttaatttttt cgtgctagag 26280

agacgcgtat ttggaatgtt tgtcactgag tgggcgttaa actggacgac gggacactct 26340

ttcggctcac tttgtctatt gtggtcttca gtgcatgcta tgagaaatgt ttgacgacgt 26400

attgaaaagg aatattgtcg gataaaggga tgggtaagga gctggataag cggtagggag 26460

ccccagtaac gcttcgctag atgcatactg aggttgcttg aaagccttac atcactcgtt 26520

cttgcctgtc ttagtcacgg agctgtacga ggccataggg agaacggtga tagggtatgg 26580

ggaaacagaa cgttgattga gcgtgtttta cggttagtca gcgcaataaa cgccagataa 26640

taaaaagccc caccgaggtg aggctttatc acgaaatcta aaacagatta agcgttaacg 26700

tgatcaactg cgtcacgaac aagcttgcct agttcgtccc acttaccttc atcgataagg 26760

ttagttggaa ccatccaagt accgccacac gcaagaacag aagggatcga taggtattca 26820

tcaacattct tcaagcttac gccaccagta ggcatgaatt taacagggta aactgctgtt 26880

agtgctttaa gcatgccagt accgcctgaa ggctcagcag ggaagaactt caacgtgcga 26940

agacccattt ccattgcttg ctcaactagg cttgggttgt taacacccgg tacgattgca 27000

atacctttat cgatacagta ttgaacagta cgtgggttaa aacctgggct tacgatgaaa 27060

tcaacaccag cttcgataga tgcgtcaact tgctcgttag tcagtacagt acctgaaccg 27120

attagcatgt ctgggaattc tttacgcatg atgcgaatcg cttcgattgc acattctgta 27180

cgtagtgtaa tttctgcaca tggcatgcca ttttcaacca acgctttacc tagagggata 27240

gcgtcttcag cacggttgat cgcgattaca ggaattactt ttaggtttgc tagttgttca 27300

tttaatgtcg tcatgaattc tttctcacgt taaatgtggg cctgctttca actaagcaaa 27360

cccttgatta atagttaaag tgcgtaatta tagagacaga tcaggcgtcg cttctagagg 27420

aatgatagca cctggatgct gaatcacggt tcctgccaca atatgacctg caaatgcagc 27480

atcacgagca ctaccgccgc tcaagcgctt ggccaagaag cctgcactga acgagtcgcc 27540

agcggcagtc gtatcaacga tgttgtctac agggttgggt gcaacgtatt gagcgctttg 27600

gctttcaacc actaagcagt ctttcgcgcc acgtttaatg acgatctctt tcacaccaga 27660

ctctgacgta cgtgtaatac attgttcaat gctttcgtcg ccgtatagct cttgctcatc 27720

atcaaacgtc agcagagccg tatctgtgta cttaagcatt ttcaagtacc aagaaatcgc 27780

ttcttgttgg ctttcccaaa gtttaggtcg gtagttattg tcgaagaata cttggccgcc 27840

ttgagctttg aatttgtcta agaagttgaa tagctgcgtg cgaccatttt ctgtcaagat 27900

tgccagcgta ataccactta agtaaatcgc gtcaaaagag aacagcttat caagaagagc 27960

aggcgtgtct tcctgatcaa acatgaactt cgctgcagca tcactacgcc agtagtggaa 28020

actgcgttca ccagtttcat cggtctcgat gtagtaaagc cctggttgtt tgtggtccag 28080

ctgagcaatt aagctcgtgt cgataccttc cgcttgccaa ttttttaaca tgtcggtact 28140

gaatgggtca gtgcctagtg cagttacgta gctcgtgttg atatcttgct cttttgttaa 28200

gcgtgacaag taaagtgcag tattcagcgt atcgccacca aaactttgct taagcccgtc 28260

ttgtttcttt tgtagctcaa ccatgcactc gccaatgacc gcgatgttta atgatttcat 28320

atgcttacct tagcaactga ggttgcgcta gttattattt taggaaatct tcacgcgcag 28380

gattgaagat atcaagaagg atgctgtctt gttctagagc aactgcaccg tgcatcatgt 28440

gtttacgagc gaagtaagca tcgccttctt taagcacttt cttctcgccg tcgatttcag 28500

cttcgaagct accacgaaca acataaccga tttggtcgtg aatttcgtga gtatgagggt 28560

ggccaatcgc gcccttatca aagcataggt gtactgccat tagatcgtca gtgtaagcaa 28620

cgattttacg cttaatgccg ccaccaagtt cttcccatgg attttcatct aggataaaga 28680

aagagttcat tgtgtatctc ctaatctgtt taaatctttt aagtgttact taacttgcat 28740

ccatcataag ggaatgagtt caattgtaat acaatatatc taaatttgtg tgatattgat 28800

caagcgatag tttatatagc gtaaatgaat caacaactta agaattgctt ggtatctggc 28860

attagttagc tgcatcaatg gcttacggtg aattatgtga ctctactcat catttggcga 28920

cgaataggta taattaaagc tcatattgta ttactttata tggagtttga aaatttaatc 28980

aaagtttaag cagataaact ctttattgag ggtgacaaag aatatgacga ctaaaccagt 29040

attgttgact gaagctgaaa tcgaacagct tcatcttgaa gtgggccgtt ctagcttaat 29100

gggcaaaacc attgcagcga acgcgaaaga cctagaagca ttcatgcgtt tacctattga 29160

tgttccaggt cacggtgaag ctgggggtta cgaacataac cgccacaagc aaaattacac 29220

gtacatgaac ctagctggtc gcatgttctt gatcactaaa gagcaaaaat acgctgactt 29280

tgttacagaa ttactagaag agtacgcaga caaatatcta acgtttgatt accacgtaca 29340

gaaaaacacc aacccaacag gtcgtttgtt ccaccaaatc ctaaacgaac actgctggtt 29400

aatgttctca agcttagctt attcttgtgt tgcttcaaca ctgacacaag atcagcgtga 29460

caatattgag tctcgcattt ttgaacccat gctagaaatg ttcacggtta aatacgcaca 29520

cgacttcgac cgtattcaca atcacggtat ttgggcagta gccgctgtgg gtatctgtgg 29580

tcttgcttta ggcaaacgtg aatacctaga aatgtcagtg tacggcatcg accgtaatga 29640

tactggcggt ttcctagcgc aagtttctca gctatttgca ccttctggct actacatgga 29700

aggtccttac taccatcgtt atgcgattcg cccaacgtgt gtgttcgctg aagtgattca 29760

ccgtcatatg cctgaagttg atatctacaa ctacaaaggc ggcgtgattg gtaacacagt 29820

acaagctatg cttgcgacag cgtacccgaa cggcgagttc ccggctctga atgatgcttc 29880

tcgtactatg ggtatcacag acatgggtgt tcaggttgcg gtcagtgttt acagtaagca 29940

ttactcttct gaaaacggtg tagaccaaaa cattctgggt atggcgaaga ttcaagacgc 30000

agtatggatg catccatgtg gtcttgagct atctaaagca tacgaagccg catctgcaga 30060

gaaagaaatc ggcatgcctt tctggccaag tgttgaattg aatgaaggcc ctcaaggtca 30120

caacggcgcg caaggcttta tccgtatgca ggataagaaa ggcgacgttt ctcaacttgt 30180

gatgaactac ggccaacacg gcatgggtca cggcaacttt gatacgctgg gtatttcttt 30240

ctttaaccgc ggtcaagaag tgctacgtga atacggcttc tgtcgttggg ttaacgttga 30300

gccaaaattc ggcggccgtt acctagacga aaacaaatct tacgctcgtc aaacgattgc 30360

tcacaatgca gttacgattg atgaaaaatg tcagaacaac tttgacgttg aacgtgcaga 30420

ctcagtacat ggtttacctc acttctttaa agtagaagac gatcaaatca acggtatgag 30480

tgcatttgct aacgatcatt accaaggctt tgacatgcaa cgcagcgtgt tcatgctaaa 30540

tcttgaagaa ttagaatctc cgttattgtt agacctatac cgcttagatt ctacaaaagg 30600

cggcgaaggc gagcaccaat acgactattc acaccaatat gcgggtcaga ttgttcgcac 30660

taacttcgaa taccaagcga acaaagagct aaacactcta ggtgacgatt tcggttacca 30720

acatctatgg aacgtcgcaa gcggtgaagt gaagggcaca gcaattgtaa gttggctaca 30780

aaacaacacc tactacacat ggctaggtgc aacgtctaac gataatgctg aagtaatatt 30840

tactcgcact ggcgctaacg acccaagttt caatctacgt tcagagcctg cgttcattct 30900

acgcagcaaa ggcgaaacaa cactgtttgc ttctgttgtt gaaacgcacg gttatttcaa 30960

cgaagaattc gagcaatctg tcaatgcacg tggtgttgtg aaagacatca aagtcgtggc 31020

tcacaccaat gtcggttcgg tagttgagat caccacagag aaatcaaacg tgacagtgat 31080

gatcagcaac caacttggcg cgactgacag cactgaacac aaagtagaac tgaacggcaa 31140

agtatacagc tggaaaggct tctactcagt agagacaact ttacaagaaa cgaattcaga 31200

agaacttagc actgcagggc aggggaaata ataatgagct atcaaccact tttacttaac 31260

tttgatgaag cagctgaact tcgtaaagaa cttggcaagg atagcctatt aggtaacgca 31320

ctgactcgcg acattaaaca aactgacgct tacatggctg aagttggcat tgaagtacca 31380

ggtcacggtg aaggcggcgg ttacgagcac aaccgtcata agcaaaacta catccatatg 31440

gatctagcag gccgtttgtt ccttatcact gaggaaacaa aataccgaga ttacatcgtt 31500

gatatgctaa cagcgtacgc gacggtatac ccaacacttg aaagcaacgt aagccgtgac 31560

tctaaccctc cgggtaagct gttccaccaa acgttgaacg agaacatgtg gatgctttac 31620

gcttcttgtg cgtacagctg catctaccac acgatctctg aagagcaaaa gcgtctgatc 31680

gaagacgatc ttcttaagca aatgatcgaa atgttcgttg tgacttacgc acacgacttc 31740

gatatcgtac acaaccacgg cttatgggca gtggcagcag taggtatctg tggttacgca 31800

atcaacgatc aagagtctgt agacaaagca ctatacggcc tgaaactaga caaagtcagc 31860

ggcggtttct tagcgcaact agaccaactg ttttcgccag acggctacta catggaaggt 31920

ccttactacc accgtttctc tctgcgtcca atctacctgt tcgcagaagc gattgaacgt 31980

cgtcagcctg aagttggtat ctatgaattc aacgattcag tgatcaagac aacgtcttac 32040

tctgtattca aaacggcatt cccagacggt acattgcctg ctctgaacga ttcatcgaag 32100

acaatctcta tcaacgatga aggcgttatc atggcaacgt ctgtgtgtta ccaccgttac 32160

gagcaaactg aaactctact tggtatggct aaccaccagc aaaacgtttg ggttcatgct 32220

tcaggtaaaa cactgtctga cgcggttgat gcagcagacg acatcaaagc attcaactgg 32280

ggtagcctgt ttgtaaccga cggccctgaa ggcgaaaaag gcggcgtaag catccttcgt 32340

caccgtgacg aacaagatga cgacacgatg gcgttgatct ggtttggtca acacggttct 32400

gatcaccagt accactctgc tctagaccac ggtcactacg atggcctgca cctaagcgta 32460

tttaaccgtg gccacgaagt gctgcacgat ttcggcttcg gtcgctgggt aaacgttgag 32520

cctaagtttg gcggtcgtta catcccagag aacaagtctt actgtaagca gacggttgct 32580

cacaacacag taacggttga tcagaaaacg cagaacaact tcaacacagc attggctgag 32640

tctaagtttg gtcagaagca cttcttcgta gcagacgacc agtctctaca aggcatgagc 32700

ggcacaattt ctgagtacta cactggcgta gacatgcaac gcagcgtgat tcttgctgaa 32760

cttcctgagt tcgagaagcc acttgtaatc gacgtatacc gcatcgaagc tgacgctgaa 32820

caccagtacg acctacccgt tcaccactct ggtcagatca tccgtactga cttcgattac 32880

aacatggaaa aaacgcttaa gccgctaggt gaagacaacg gttaccagca cttatggaac 32940

gtggcttcag gcaaagtgaa cgaagaaggt tctctagtaa gctggctaca tgacagcagc 33000

tactacagcc tagtaaccag cgcgaatgcg ggcagcgaag tgatttttgc tcgcactggt 33060

gctaacgatc cagacttcaa ccttaagagt gagcctgcgt tcatcttacg tcagtctggt 33120

caaaaccacg tgtttgcttc tgtactagaa acgcatggtt actttaacga gtctatcgaa 33180

gcctctgtag gcgctcgtgg tctagttaaa tcagtatctg ttgtgggcca taacagtgtc 33240

gggactgttg ttcgcattca gactacttct ggcaacactt accactacgg tatctcaaac 33300

caagctgaag acacgcagca agcaactcac actgttgagt tcgcgggtga gacatactcg 33360

tgggaaggat catttgctca actgtaaatg attaacatac atgccgttta acgatggcat 33420

gtattgatgt ggtgctttgc gggaacgaag catcacattg aattcagtcg tgattgcaaa 33480

tcgttcgttg ataccaacaa cgactgaata catcgggaat aagtcaaacc gagtaactca 33540

ctgcgagttg ctcggttttt ttatgcgtgc tgcttttata agaaggggga aagaggatgg 33600

ggcaacggag cttccctttt ccttcgaatc ttacagagtg ggctaaagta taatttagga 33660

tttaaaaata aagggattca aggatgaagt ggttattggc aatagttgcg atgtctggtg 33720

tcgcattggc ggcagaaaat aagaatgttg aggtgagcag tgagcatttc gtccgttatc 33780

aataccaaga caaaatcagc tatggaaagc tagacaatga cgcagtgtta ccggtcagcg 33840

gcgatctctt tggcgaatat tcggtagcaa aaaattcgat cccgttagag tcggttgagg 33900

tgttactacc gacaaaacca gagaaagtct tcgccgtcgg gatgaacttc gctagccact 33960

tagcctcacc tgccgatgca ccaccgccga tgtttcttaa acttccttct tctttgattc 34020

tcacgggcga agtgattcaa gtgccaccaa aagcaagaaa tgttcatttt gaaggcgagc 34080

tggtggttgt gattggtaga gagctcagtc aagccagtga agaagaagcc gaacaagcga 34140

tctttggcgt cacggtgggc aacgatatta ctgaaagaag ttggcaaggc gccgatttac 34200

aatggctccg agcgaaagct tccgatggtt ttggcccggt tggcaacaca attgtgcgcg 34260

gcattgatta caacaatatt gagttaacca ctcgtgttaa cggtaaagtg gttcaacaag 34320

aaaatacttc gttcatgatc cacaagccaa gaaaagtcgt gagctatttg agctattatt 34380

ttaccctcaa accgggcgat ctaattttca tgggcacgcc aggtagaact tatgctctgt 34440

ccgacaaaga tcaagtgagt gtcacgattg aaggggtagg gactgtggta aatgaagtgc 34500

ggttctgatg gaattgaatt agcgttggga gctacagagc ttatgtctga atttgcagta 34560

cgtagacgac ttgaacctat taatttgaac taggttaact tgtgtagtga ataaactaac 34620

cgtttttcgg ttccattatt ttagcccaat tgagtgatgt ttttggaagc gagcagagaa 34680

aacgagaatg acgaacctac atgctcggcg agggttttgt tagtggtgta acacagtgtt 34740

tctagctaag agaaattaga tgctttctaa gtgtttgatt aattgaataa attaacaggt 34800

actatccgct ttgattttac tcaattggct gtaggtttaa atactgttat agtgttcctt 34860

aaataataca taaacataac atataaataa gcgaacttat ggctagcact tttaattcaa 34920

tttcgggctc gaagcgtagc ctgcacgtgc aagtagcacg cgaaatcgct cgaggaattt 34980

tgtctggtga tctgccgcaa ggttctatta ttcctggtga aatggcgttg tgtgaacagt 35040

ttggtatcag ccgaacggca cttcgtgaag cagttaaact actgacctct aaaggtctgt 35100

tagagtctcg ccctaaaatt ggtactcgcg tagtcgaccg cgcatactgg aacttccttg 35160

atcctcaact gattgaatgg atggacggac taaccgacgt agaccaattc tgttctcagt 35220

ttttaggcct tcgccgtgcg atcgagcctg aagcgtgtgc actggcggca aaatttgcga 35280

cagctgaaca acgtatcgag ctttcagaga tcttccaaaa gatggtcgaa gtggatgaag 35340

ctgaagtgtt tgaccaagaa cgttggacag acattgatac tcgtttccat agcttgatct 35400

tcaatgcgac cggtaacgac ttctatctac cgttcggtaa tattctgact actatgttcg 35460

ttaacttcat agtgcattct tctgaagagg gaagcacatg catcaatgaa caccgcagaa 35520

tctatgaagc tatcatggcc ggtgattgtg acaaggctag aattgcttct gctgttcact 35580

tgcaagatgc caaccaccgt ttggcaacag cataatagaa atgatttaaa gcgcacctga 35640

gccatctcac atcgagatga acaccctcac gttcggataa acgactttaa aaggtatgcc 35700

tagtgcatgc cttttttggt ttttagaccg cgtgttgcac tatctgtagc actattttgg 35760

gtcagtcttt tcgctacgtc tgttaagcta ttcttccacg ttacaacccg ccttgttttt 35820

aacgtctacg taacaatccc caagcatcgt tctaaacaca tttttagact gtctgtacct 35880

gacaagtagt tatgcgacag ccgggatttt tcacctctca gtattctaaa tctgggatta 35940

aacaaacagg gttctcggat ttaatattta gatatttaaa tcgaattcta atgatattac 36000

ccactcgatt tcgtaaaaaa cactggttta ttgtgtgatg aatgatgtgg gtttggtcaa 36060

ggattctctt ttattatttt tgagaacttt atgtttatat gtgtttgatt gtatttgtta 36120

ataagtgtgc aaagtctcac ttttatttta agttgttgtt tttaatgttt aatttatttt 36180

gagtgtttga tcttttgggt ttttacctaa aaccctaaca atttccttaa tggattagcc 36240

atattccatc ctatgtcata tatataatta acttaatcaa tcaaaataag atcaccatca 36300

cttatttgga ttattgtact acaaataaag agtcgaattt cctatagtcc tcgtaacaaa 36360

ttaaaacgga caaaggatac acgatggaac tcaacacgat tattgtcggc atttatttcc 36420

tattcttgat tgcgataggt tggatgttta gaacatttac aagtactact agtgactact 36480

tccgcggggg cggtaacatg ttgtggtgga tggttggtgc aaccgccttt atgacccagt 36540

ttagtgcatg gacattcacc ggtgcagcag gtaaagcgta taacgatggt ttcgctgtag 36600

cggtcatctt cgtagccaac gcatttggtt acttcatgaa ctacgcgtac ttcgcgccga 36660

aattccgtca acttcgcgtt gttacggtaa tcgaagcgat tcgtatgcgt tttggtgcga 36720

ccaacgaaca agtattcact tggtcttcaa tgccaaactc agtggtatct gcgggtgtgt 36780

ggttaaacgc attggcaatc atcgcttcgg gtatcttcgg tttcgacatg aacatgacta 36840

tctgggtgac tggcctagtg gtattggcaa tgtcggtaac aggtggttca tgggcggtaa 36900

tcgcatctga cttcatgcag atggttatca tcatggcggt aacggtaact tgtgcggttg 36960

tagcggttgt tcaaggtggc ggtgttggtg agattgttaa caacttccca gtacaagatg 37020

gtggttcgtt cctttggggc aacaacatca actacctaag catctttacg atttgggcat 37080

tcttcatctt cgttaagcag ttctcaatca cgaacaacat gcttaactct taccgttacc 37140

tagcggctaa agactcaaag aacgctaaga aagctgcact gcttgcttgt gtgttgatgt 37200

tgtgtggtgt gtttatttgg ttcatgcctt cttggttcat tgcaggccaa ggtgttgatt 37260

tatcagcggc ttacccgaat gcaggtaaaa aagcgggtga ctttgcttac ctatacttcg 37320

tacaagagta catgccagca ggtatggttg gtctattagt tgccgcgatg tttgcagcga 37380

caatgtcttc aatggactca ggtctaaacc gtaactcagg tatttttgtt aagaacttct 37440

acgaaacaat cgttcgtaaa ggtcaagcat cagagaaaga gctagtaacc gtatctaaaa 37500

ttacttcagc ggtatttggt ttcgctatta tcctaatcgc acagttcatc aactcattaa 37560

aaggcttaag cctgtttgat acgatgatgt acgtaggtgc gttaatcggc ttccctatga 37620

cgattcctgc attccttggt ttcttcatca agaagactcc ggactgggct ggttggggaa 37680

cgctagttgt tggtggtatc gtatcttatg tggttggttt tgttatcaac gcggagatgg 37740

tagcagcggc gtttggtctt gatactctaa caggacgtga atggtctgat gttaaagttg 37800

cgattggtct gattgctcac atcacgctaa ccggtggctt cttcgtacta tctacgatgt 37860

tctacaagcc tctatcaaaa gaacgtcaag cggatgttga taagttcttt ggcaacttag 37920

ataccccatt agtagctgaa tcggcagagc aaaaagtgtt ggataacaaa caacgtcaaa 37980

tgcttggtaa actgattgcg gtagcgggtg ttggtattat gctgatggct cttctgacta 38040

acccaatgtg ggggcgccta gtcttcatct tatgtggtgt gatagtgggt ggtgtcggta 38100

ttctacttgt gaaagcggtc gatgacggcg gcaagcaagc gaaagcagta accgaaagct 38160

aatacataga aaacgtttat aatagaatgc gacgactcga aagggcgtcg cattttttat 38220

tctgcggaac tggaaaaccg tcaggtgaaa gatatctgac ctaaatcacg aaaactgtac 38280

aaagtggttc aatcgaatcg aaatatattc aattgtccta caataagacg tatattgttg 38340

ctaattcctt tcaatcaact tgaaaaataa gtgagttaga atgagcgacc aaaaatctct 38400

tgatgcaatc aggaagatga agctggaaaa cgatacttca gcaggtaatc ttgtagacct 38460

actccctatc gaagttcaaa cacgtgactt cgacctatca ttcctagaca ccttgagcga 38520

agcacgtccg cgtcttcttg ttcaagctga tcagctagaa gaattcaaag caaaagtgaa 38580

agctgatcaa gctcactgta tgtttgatga tttctacaac aactctaccg ttaagttcct 38640

tgagactgct cctttcgaag agcctcaagc gtacccagct gagacggtag gtaaagcttc 38700

tctatggcgt ccttattggc gtcaaatgta cgttgattgc caaatggcac tgaacgcgac 38760

acgtaaccta gcgattgctg gtgttgtaaa agaagacgaa gcgctcattg cgaaagcaaa 38820

agcttggact ctaaaactgt ctacgtacga tccagaaggc gtgacttctc gtggctataa 38880

cgatgaagcg gctttccgtg ttatcgctgc tatggcttgg ggttacgatt ggctacacgg 38940

ctacttcacc gatgaagaac gccagcaagt tcaagatgct ttgattgagc gtctagacga 39000

aatcatgcac cacctgaaag tgacggttga tctattgaac aacccactaa atagccacgg 39060

tgttcgttct atctcttctg ctatcatccc aacgtgtatc gcgctttacc acgatcaccc 39120

gaaagcaggc gagtacattg catacgcgct agaatactac gcagtacatt acccaccatg 39180

gggcggtgta gacggcggtt gggctgaagg tcctgattac tggaacacgc aaactgcatt 39240

cctaggcgaa gcattcgacc tattgaaagc atactgtggt gtagacatgt ttaacaaaac 39300

attctacgaa aacacaggtg atttcccgct ttactgcatg ccagttcact ctaagcgcgc 39360

gagcttctgt gaccagtctt caatcggcga tttcccaggt ttaaaactgg cttacaacat 39420

caagcactac gcaggtgtta accagaagcc tgagtacgtt tggtactata accagcttaa 39480

aggccgtgat actgaagcac acaccaaatt ctacaacttc ggttggtggg acttcggtta 39540

tgacgatctt cgttttaact tcctttggga tgcacctgaa gagaaagccc catcgaacga 39600

tccactgttg aaagtattcc caatcacggg ttgggctgca ttccacaaca agatgactga 39660

gcgtgataac catattcaca tggtattcaa atgttctccg tttggctcaa tcagccactc 39720

tcacggtgac caaaacgcat ttacgcttca cgcatttggt gaaacgctag cgtcagtaac 39780

aggttactat ggtggtttcg gtgtagacat gcacacgaaa tggcgtcgtc aaacgttctc 39840

taaaaacctg ccactatttg gcggtaaagg tcagtacggc gagaacaaga acacaggcta 39900

cgaaaaccac caagatcgct tttgtatcga agcgggcggc actatctctg acttcgacac 39960

tgaatctgat gtgaagatgg ttgaaggtga tgcaacggca tcttacaagt acttcgttcc 40020

tgaaatcgaa tcttacaagc gtaaagtctg gttcgttcaa ggtaaagtct tcgtaatgca 40080

agacaaggca acgctttctg aagagaaaga catgacttgg ctaatgcaca caactttcgc 40140

aaacgaagtg gcagacaagt ctttcactat ccgtggcgaa gttgcgcacc tagacgtaaa 40200

cttcatcaac gagtctgctg ataacatcac gtcagttaag aacgttgaag gctttggcga 40260

agttgaccca tacgagttca aagatcttga gatccaccgt cacgtggaag tggaattcaa 40320

gccatcgaaa gagcacaaca tcctgacgct tcttgttcct aataagaatg aaggcgagca 40380

agttgaagtg tttcacaagc ttgaaggcaa cacgctactg ctaaatgttg acggcgaaac 40440

ggtttcaatc gaactgtaat ccgctgaagt aacagaagtt agatactaaa aactccgagt 40500

gaaagctcgg agtttttttg tttggctagc caattaagtt ggagttggat aagtcagtta 40560

agttgtatta gttgacaacg ttggcaaacc gatcaggttg aaagaaaact taattggcca 40620

gagataaata gcttctcgat gccaagtcag tggctgaggg ctaaatctgg acattgatgc 40680

acataaagac cggcatgtac ttagccacta tgctcaatga aatgtgcagg agtcgtataa 40740

gagactcgta tatatcgctc tgttagaaga acagggcgcc aacgcctgtt tcctagcaat 40800

tgttatgact tacttttccg tgaacagtct tatcactggc tgagtaaggg agtagtgaac 40860

tatacatagg taaaggcgta gcttgttctt actaatcgta tgacatttaa cgtacgttat 40920

tcgttattat aatgaacata taatcataca atactatatt tggagtttga acatgactaa 40980

acctgtaatc ggtttcattg gcctaggtct tatgggcggc aacatggttg aaaacctaca 41040

aaagcgcggc taccacgtaa acgtaatgga tctaagcgct gaagctgttg ctcgcgtaac 41100

agatcgcggc aacgcaactg cattcacttc tgctaaagaa ctagctgctg caagtgacat 41160

cgttcagttt tgtctgacaa cttctgctgt tgttgaaaaa atcgtttacg gcgaagacgg 41220

cgttctagcg ggcatcaaag aaggcgcagt actagtagac ttcggtactt ctatccctgc 41280

ttctactaag aaaatcggcg cagctcttgc tgaaaaaggc gcgggcatga tcgacgcacc 41340

tctaggtcgt actcctgcac acgctaaaga tggtcttctg aacatcatgg ctgctggcga 41400

catggaaact ttcaacaaag ttaaacctgt tcttgaagag caaggcgaaa acgtattcca 41460

cctaggggct ctaggttctg gtcacgtgac taagcttgta aacaacttca tgggtatgac 41520

gactgttgcg actatgtctc aagctttcgc tgttgctcaa cgcgctggtg ttgatggcca 41580

acaactgttt gacatcatgt ctgcaggtcc atctaactct ccgttcatgc aattctgtaa 41640

gttctacgcg gtagacggcg aagagaagct aggtttctct gttgctaacg caaacaaaga 41700

ccttggttac ttccttgcac tttgtgaaga gctaggtact gagtctctaa tcgctcaagg 41760

tactgcaaca agcctacaag ctgctgttga tgcaggcatg ggtaacaacg acgtaccagt 41820

aatcttcgac tacttcgcta aactagagaa gtaatcgacg tacgacctcg ctagggtatt 41880

gcttgtcttc taggcggcga tacctcagcg aggttcgttt ttatctgcca tacccaaccc 41940

tttgttccct tgttaaaatc ttctacttct acttctactt ctacttcaat ttcctcagtt 42000

acacctaatc aaaactctgt ttaactctgt tactgcctca attcctattt ttttctatat 42060

ctatttctaa cggtaaattc aaaaccttct agcaccaact cattcactca tttttcctcg 42120

caagctcaaa ctcaacgcgc ttacatgatt gttggtgatg gcttaacacc gctcgtatat 42180

cggtcctgaa aagaaagtaa aaaaaaagcc cacacagctg gtgactgtat gggcatgttc 42240

ggacgagccg tctggacaaa caaatgagca atagtaagtg aaaaaacgaa taacgagatc 42300

ccccgacagt ttctacgtta aacgcgttca atgaccttaa agcggctgct tcaattatca 42360

ctttgaattg aacaaaagca tccagaaaga acttaagtta tgattcaaat acaccatagt 42420

acaagactta ttgtattaca aataaatttt aagattgaat gcctttagtg aatggttagt 42480

tggtagaagt gtgagttaag actcattttt tcactcagct gggtgaggta aagaagaaga 42540

gttttcgaaa agatgttatc ggaaaaatga tgagctaatt atctaaaaat cgatctattt 42600

taatgtgtta tgcgtcaatg tttaacttcg aacaaaatcc aaactcataa atgataccta 42660

tgtcacaggg cggttttagc cagttttaat atatcaagat cgctcacaga atgtctggtc 42720

aattaaacat acaatattaa ttaagttgat ggttgtgacg atggatcggc atgaacaagt 42780

ttcgctttcc gtatcttcga aaatgtaaaa aatggccatt tcattcggat gaaaataata 42840

gacataggtt gatatggatg atgagtttta tgaattcaaa attgtctcta gggtttaaag 42900

gaaaattgat tttaatggta gcggtcgtca gttctagtgc tttggcattt acgaactggt 42960

ttacgcttaa cttggccact gaacaggtaa accaaacgat ttataacgag attgatcact 43020

cgcttacgat agaaatcaat caaatagaaa gtaccgttca gcgcaccatc gataccgtta 43080

actctgttgc acaagagttc atgaaatccc cttaccaagt gccgaatgaa gcactcatgc 43140

attatgccgc taagcttggt ggcattgaca agattgtggt gggttttgac gacggccgtt 43200

cttatacctc tcgcccttca gagtctttcc ctaacggtgt tggaataaaa gaaaaataca 43260

atccaaccac tcgaccttgg tatcaacaag cgaaattgaa atcaggctta tcttttagtg 43320

gtctgttttt cactaagagt actcaagtgc ctatgatcgg tgtgacctac tcataccaag 43380

atcgtgtcat catggccgat atacgctttg acgatttgga aacgcagctt gaacagctgg 43440

acagcatcta cgaagccaaa ggcattatca tcgacgaaaa ggggatggtg gtcgcttcaa 43500

caatcgaaaa cgtgcttccg caaaccaata tatcttctgc agacactcaa atgaaactca 43560

acagtgccat tgaacagcct gatcaattca ttgagggtgt gattgatggt aaccagagaa 43620

tcttgatggc caagaaagtg gatattggca gccagaaaga gtggttcatg atctccagta 43680

ttgaccctga actcgcgctc aatcagctga atggcgtgat gtcgagtgcg cgcatcctta 43740

tcgtcgcttg tgtacttggc tcggtgatat tgatgatttt acttctgaat cgtttctacc 43800

gcccaatcgt gtcactgcgc aaaatcgtcc acgatctatc acaaggtaac ggagacctca 43860

ctcaaaggct tgctgagaag gggaatgatg acttagggca tatcgccaaa gacatcaact 43920

tgttcattat cggcttacaa gagatggtta aggatgtgaa atacaagaac tcggatctcg 43980

ataccaaggt actgagtatt cgcgaaggtt gtaaagaaac cagcgatgta ctgaaagttc 44040

atactgatga aacggttcaa gtggtctctg cgattaacgg cttgtctgaa gcatcaaacg 44100

aagtagagaa gagttctcag tcggcggcag aagcagcaag agaggccgct gtgttcagtg 44160

atgagacgaa acagattaac acggtgacgg aaacctatat cagtgatctt gagaagcaag 44220

tctgcaccac ttctgatgac attcgctcaa tggccaatga aacgcagagc atccagtcta 44280

tcgtgtctgt gattggcgga attgcggaac aaactaattt gctggcattg aatgcgtcaa 44340

ttgaagcggc gagggcgggt gaacatggtc gaggtttcgc ggtggttgct gatgaagtcc 44400

gtgcgctagc caaccgaacg caaatcagta cctctgaaat tgatgaagcg ttatctggct 44460

tgcagtctaa atcagatggt ttggttaaat ctattgagtt gaccaaaagt aactgtgaac 44520

tgactcgcgc tcaagttgtt caagctgtaa acatgttggc gaagctaacc gagcagatgg 44580

aaacagtaag tcgttttaat aatgacattt cgggttcgtc tgttgagcaa aacgccctta 44640

ttcagagcat tgctaagaac atgcataaga ttgaaagctt tgttgaggag cttaataaac 44700

taagccaaga tcagttaact gaatcagcag aaatcaaaac acttaacggt agcgttagtg 44760

aattgatgag cagctttaag gtttaatgtt tctaatattt atacctaaaa atcaacatgt 44820

taagtttagt tgttgatctg aaggccactc aataactgtc gagtttagag tggcttttct 44880

gcgttgttct tgagtctaac tctacgtaat atccgttcat ttcacttcat ttgccgcatc 44940

tcacattctg ataaatagac aattgacata aaatagtaca aatatacatt gtcactctac 45000

tcttatggat aagtgagata aatgtgaata agccaatctt tgtcgtcgta ctcgcttcgc 45060

ttacgtatgg ctgcggtgga agcagctcca gtgactctag tgacccttct gataccaata 45120

actcaggagc atcttatggt gttgttgctc cctatgatat tgccaagtat caaaacatcc 45180

tttccagctc agatcttcag gtgtctgatc ctaatggaga ggagggcaat aaaacctctg 45240

aagtcaaaga tggtaacttc gatggttatg tcagtgatta tttttatgct gacgaagaga 45300

cggaaaatct gatcttcaaa atggcgaact acaagatgcg ctctgaagtt cgtgaaggag 45360

aaaacttcga tatcaatgaa gcaggcgtaa gacgcagtct acatgcggaa ataagcctac 45420

ctgatattga gcatgtaatg gcgagttctc ccgcagatca cgatgaagtg accgtgctac 45480

agatccacaa taaaggtaca gacgagagtg gcacgggtta tatccctcat ccgctattgc 45540

gtgtggtttg ggagcaagaa cgagatggcc tcacaggtca ctactgggca gtcatgaaaa 45600

ataatgccat tgactgtagc agtgccgctg actcttcgga ttgttatgcc acttcatata 45660

atcgctacga tttgggagag gcggatctcg ataacttcac caagtttgat ctttctgttt 45720

atgaaaatac cctttcgatc aaagtgaacg atgaagttaa agtcgacgaa gacatcacct 45780

actggcagca tctactgagt tactttaaag cgggtatcta caatcaattt gaaaatggtg 45840

aagccacggc tcactttcag gcactgcgat acaccaccac acaggtcaac ggctcaaacg 45900

attgggatat taatgattgg aagttgacga ttcctgcgag taaagacact tggtatggaa 45960

gtgggggtga cagtgcggct gaactagaac ctgagcgctg cgaatcgagc aaagaccttc 46020

tcgccaacga cagtgatgtc tacgacagcg atattggtct ttcttatttc aataccgatg 46080

aagggagagt gcactttaga gcggatatgg gatatggcac ctctaccgaa aattctagct 46140

atattcgctc tgagctcagg gagttgtatc aaagcagtgt tcaaccggat tgtagcacca 46200

gcgatgaaga tacaagttgg tatttggacg acactagaac gaacgctacc agtcacgagt 46260

taaccgcaag cttacgaatt gaagactacc cgaacattaa taaccaagac ccgaaagtgg 46320

tgcttgggca aatacacggt tggaagatca atcaagcatt ggtgaagttg ttatgggaag 46380

gcgagagtaa gccagtaaga gtgatactga actctgattt tgagcgcaac aaccaagact 46440

gtaaccattg tgacccgttc agtgtcgagt taggtactta ttcggcaagt gaagagtggc 46500

gatatacgat tcgagccaat caagacggta tctacttagc gactcatgat ttagatggaa 46560

ctaatacggt ttctcattta atcccttggg gacaagatta cacagataaa gatggggaca 46620

cggtctcgtt gacgtcagat tggacatcga cagacatcgc tttctatttc aaagcgggca 46680

tctacccaca atttaagcct gatagcgact atgcgggtga agtgtttgat gtgagcttta 46740

gttctctaag agcagagcat aactgagttc tctgatgttt ggttagccat gtcggtaatg 46800

aagaagacca tattgatgcc tacaatgtgg tctttttttg tttttggaca cttacagtga 46860

tgtgttttga aggacaaatg ttctgctcga atcatgcaaa tacacacgat tacagctcgc 46920

ttgttctgcc cttgctagct catttcgcat tccaaattct tatatattgt cttttatcaa 46980

taggaaatgt gatccagtta aagtatggaa aaatcggaaa gtgttcctag tctcatttat 47040

ccaacgaagt gttttatttg tattataaga ttacgtaata ttttcgtgtt atcgcaaata 47100

ctgataggtg aatcgcctta tagctcgtgt ttgctgattt agctttcact tacgaacgct 47160

gtctttgtat tataataatg gattaaatat gaaacaaatt actctaaaaa ctttactcgc 47220

ttcttctatt ctacttgcgg ttggttgtgc gagcacgagc acgcctactg ctgattttcc 47280

aaataacaaa gaaactggtg aagcgcttct gacgccagtt gctgtttccg ctagtagcca 47340

tgatggtaac ggacctgatc gtctcgttga ccaagaccta actacacgtt ggtcatctgc 47400

gggtgacggc gagtgggcaa cgctagacta tggttcagta caggagtttg acgcggttca 47460

ggcatctttc agtaaaggta atcagcgcca atctaaattt gatatccaag tgagtgttga 47520

tggcgaaagc tggacaacgg tactagaaaa ccaactaagc tcaggtaaag cgatcggcct 47580

agagcgtttc caatttgagc cagtagtgca agcacgctac gtaagatacg ttggtcacgg 47640

taacaccaaa aacggttgga acagtgtgac tggattagcg gcggttaact gtagcattaa 47700

cgcatgtcct gctagccata tcatcacttc agacgtggtt gcagcagaag ccgtgattat 47760

tgctgaaatg aaagcggcag aaaaagcacg taaagatgcg cgcaaagatc tacgctctgg 47820

taacttcggt gtagcagcgg tttacccttg tgagacgacc gttgaatgtg acactcgcag 47880

tgcacttcca gttccgacag gcctgccagc gacaccagtt gcaggtaact cgccaagcga 47940

aaactttgac atgacgcatt ggtacctatc tcaaccattt gaccatgaca aaaatggcaa 48000

acctgatgat gtgtctgagt ggaaccttgc aaacggttac caacaccctg aaatcttcta 48060

cacagctgat gacggcggcc tagtattcaa agcttacgtg aaaggtgtac gtacctctaa 48120

aaacactaag tacgcgcgta cagagcttcg tgaaatgatg cgtcgtggtg atcagtctat 48180

tagcactaaa ggtgttaata agaataactg ggtattctca agcgctcctg aatctgactt 48240

agagtcggca gcgggtattg acggcgttct agaagcgacg ttgaaaatcg accatgcaac 48300

aacgacgggt aatgcgaatg aagtaggtcg ctttatcatt ggtcagattc acgatcaaaa 48360

cgatgaacca attcgtttgt actaccgtaa actgccaaac caagaaacgg gtgcggttta 48420

cttcgcacat gaaagccaag acgcaactaa agaggacttc taccctctag tgggcgacat 48480

gacggctgaa gtgggtgacg atggtatcgc gcttggcgaa gtgttcagct accgtattga 48540

cgttaaaggc aacacgatga ctgtaacgct aatacgtgaa ggcaaagacg atgttgtaca 48600

agtggttgat atgagcaaca gcggctacga cgcaggcggc aagtacatgt acttcaaagc 48660

cggtgtttac aaccaaaaca tcagcggcga cctagacgat tactcacaag cgactttcta 48720

tcagctagat gtatcgcacg atcaatacaa aaagtaatct aatcgaataa cacttaatat 48780

taaaggtatt gcaatagcct ccagccttag ggtttggagg cttttttgtg cctgctgttg 48840

gttgggctta agcgtatgat ttaattgagt aggagagggg tagttatcag ttgcacagag 48900

tttaagacat tatcattaag ctcattcagt attaacttta gtcattatca gtcactatta 48960

ccccccaagc gccgatcaca attaacctag ctcatgatta atctcagtta ccaataggct 49020

agcctgtagc ggattcaaac ccaaataatg tcgtgatgtt tatcggaatc accatagctc 49080

gaaaactttg accttgttct caaggctttg ccaatgcacg aacgtattat gtgcgtggtt 49140

tactaataag cgttagctcg gctgactact catactgttc ttgaaaccgt tactcttggg 49200

ttgtttagct agactcctag caacagccat aaatagtgct ctaactcttt cataattaga 49260

agggtagggt tagccattct attggttcca atgctttatg aaatactagg cgggctcaag 49320

tcgatgatca aacgactcta acagcttaag gttatgcgct tttgcgttag ttacctgcag 49380

gccgtaaatg ccctgattgt agttgtacgg tgacgctgaa taataatttg taggattagt 49440

atagaactga gagactttgt ctatctatga tcgatacagg ctttgagagg gctggatcag 49500

tagaaagaca gaatgacaat tagcactaga gttattttgg tttttaatta gagttaataa 49560

aatagatatt tggtttgtta aatttaatcg tgtcataagc tctgtgtttt aaaaaataaa 49620

aaaagccata gcagttgcta tggctttgaa taagtcaggt tctaaggtaa gcaaacagca 49680

agtcaacttg tctgttttga tattcttagt cttagttcaa gatattttct ttacctgccg 49740

cagtgttcac tgcagatggt tgtgcgtaga tggctgtatt tcttatatct ttaccgttgt 49800

cagctgaaag tagggttttg taaccattga acgtattgct ttcaatagtg acattacagc 49860

caaggttatc atcactattc tttatgacgg cactgctaga atcaccaact ttaattccgc 49920

ccacatcact accaccagag ttaatagtga atgtattatt tgtgatttgt gaaccaaatc 49980

gcccgttgtc actactacag ttaatacgaa ttgcattatt ttggaaactg ccacttaaac 50040

cgacaaattc gctattgtct aatgtaaagt aacctcgaga gaataaccaa cttgcttttt 50100

tagtacctag atcatcttcg gtaatgccgt ttgcatcgaa ctttaggttt tcaagtgcta 50160

caggatctga atctttacca attttaccaa taacgatcgc accagtttca ttatctgaag 50220

taccagctga ctccctacca aaacacccgg ccaaattgtc gttagcaaaa gtcatgtttt 50280

tgatacctgc accgggtgca gtgacatcaa tacaagcatc tccggtaatg gttgctaaac 50340

cagcaccatc aattgtgaca gctttattta gctcaataac accggtatca aacgtacctt 50400

cagatgataa atcaataatc gcgccatctt ctgctgatgc aatcgcagcg ttcacatcat 50460

cgactgattt aggttttcca tcatcggcat tttctaatgc agttataaca gattcatctg 50520

taatctctgt tgctgagtaa gctgtttcta cgtcatcttt ttcacaggtc atatctagct 50580

gttgctcagt cactgtgtaa gtacagtcct taccttcaaa ggaaacaaca ccttcttctt 50640

cagcagtata tattgaactc tcaaaagtga agccattagc tacgtctcca ctgtaaatgc 50700

ttagagcacg agtaccttcc tcattattat caaagcgata tggtgaagtt ccgctgagtg 50760

actgtgcagc aacagcacca cctgtcagat cccaatagac gttttctata gagtaaactt 50820

caacaggttc aacagggtct gttccgcctg gatctgttgg aataggtaaa ccatcactgt 50880

tacaaccaaa taataaacct gtcgaaagag cgacagctgt agcgacttta gaaatttgca 50940

taaaatattc tctttatgat attaaatcca tatgtaaatc acataagaaa tagataatga 51000

atagtcgtta aatatttatt aggatgaagc taattctgat tagaacatcc tattatttaa 51060

aataaagtaa ttaaaatatg cccaaataaa ttacaagagg agagggctat tttatatttt 51120

gactatttta ttattagaat gagtaagcaa taccaacacg gtatttagct tcacgatctt 51180

ttgaagatga actgatatca gaagaccaga tttcagcaaa aggtttccaa gaaccgaact 51240

tgtagtttac ctttaagcca gcatcccatt cccagtcatc actattataa agaagtacgt 51300

tatccaaaga ttttacatag tttgcttcgt aagaaaggcc aagcttaggt agagattcaa 51360

ttttgtaaga gcccgtcagt gtaactttag acttttgagc tgattctaaa cgctcgccag 51420

tttcagaatc tttgtcgcca aattgtgtgt ggttacggaa gtcagcatat tcatgacggt 51480

aacgaatagc agttgttaaa cccatatctg ctttatagcc aacgcggaac tgaggtttaa 51540

acgtaacctt tttcatcttc cagtcgccat cgttagcatt aggctcatcc caatcccaag 51600

caataggcat acccatttgt agataccaat tattgtctat tttgtatgtc gcagtgttat 51660

cgatctccat accatagatg taccaattgc catcgtaaaa actctggctg tttgctgatt 51720

taacagaacc tgaatcttca tcatagtaag agtcatcacc gtggaactta agttctagac 51780

cagtagagtg cttccacttg tctgacagct taaagctttc acctagctta actcggtgtt 51840

gatggcgagc gtctacgtga gccgtatcac cattagtctt tgtataatcc gtcgcagcac 51900

gatactcgta acgataatca agagatgcac cagcagctgt gcccgctaaa agagtacatg 51960

caacagctgc agcaattttt gtaacagaat tcataccttt gtctcactat tattttttta 52020

ttttggatac atccaatgta cccctgactc acaaaccaat accttacatg gtattaaatt 52080

aatgtatgac aaatatggta tttattccta gggtagattt ctgtgagatc tatcaaaagt 52140

tccgactaat ggcctattta tatagctaaa tgttatgaat atctcaattt aaggcttacc 52200

aatcaaatca atcatgactc agttctcata ttaacaaacc ttgtaagctc agttggttgt 52260

atgtgttaaa ataatacaaa tataagaata ttcccacact ttcatatcga tgttctagtt 52320

gttgtggttt aaacataacg gcgcatgttg agggatatag atataaacca ccgccaaatg 52380

tttggtaaaa gttaaaagat ggcgaaatgt aaattctatt tattggttgg tttatttaag 52440

tcgaagagaa aatatttagt actaattcgt gttcaaaagt agtttctgtg ctgagagtgt 52500

actcagtatc tgttaacaat aaaggatgag tcatgtttaa gaaaaacata ttagcagtgg 52560

cgttattagc gactgtgcca atggttactt tcgcaaataa cggtgtttct taccccgtac 52620

ctgccgataa attcgatatg cataattgga aaataaccat accttcagat attaatgaag 52680

atggtcgcgt tgatgaaata gaaggggtcg ctatgatgag ctactcacat agtgatttct 52740

tccatcttga taaagacggc aaccttgtat ttgaagtgca gaaccaagcg attacgacga 52800

aaaactcgaa gaatgcgcgt tctgagttac gccagatgcc aagaggcgca gatttctcta 52860

tcgatacggc tgataaagga aaccagtggg cactgtcgag tcacccagcg gctagtgaat 52920

acagtgctgt gggcggaaca ttagaagcga cattaaaagt gaatcacgtc tcagttaacg 52980

ctaagttccc agaaaaatac ccagctcatt ctgttgtggt tggtcagatt catgctaaaa 53040

aacacaacga gctaatcaaa gctggaaccg gttatgggca tggtaatgaa ccactaaaga 53100

tcttctataa gaagtttcct gaccaagaaa tgggttcagt attctggaac tatgaacgta 53160

acctagagaa aaaagatcct aaccgtgccg atatcgctta tccagtgtgg ggtaacacgt 53220

gggaaaaccc tgcagagccg ggtgaagccg gtattgctct tggtgaagag tttagctaca 53280

aagtggaagt gaaaggcacc atgatgtacc taacgtttga aaccgagcgt cacgataccg 53340

ttaagtatga aatcgacctg agtaagggca tcgatgaact tgactcacca acgggctatg 53400

ctgaagatga tttttactac aaagcgggcg catacggcca atgtagcgtg agcgattctc 53460

accctgtatg ggggcctggt tgtggcggta ctggcgattt cgctgtcgat aaaaagaatg 53520

gcgattacaa cagtgtgact ttctctgcgc ttaagttaaa cggtaaatag cacatagcat 53580

aaccaatagt ctagctagac gcagtcctta aggaatattt tcgaagacca cttaaccgaa 53640

tgttgagtgg tctttttgtt ttatatgagt tttaagatga acttggtatt aatgtgacct 53700

tggtatcaat gagggtgtac gtgaagccta ccaatgaaag gtacagctaa aacaatacaa 53760

ccttgtcaaa agacaaggtt gcattcagaa agcgtaggaa gattttagga cgacaactcg 53820

atacggagtt tagtcataca tcaactcttt ggctttgtcg gcatcaaact ctttaagaga 53880

ctttcgagcc aagtgacgga atgggaaagc tttcacgact tcttcgaatg gttggatggc 53940

aaatgcccaa aagatagaac cgtctaatcc aaagatgatc aatgcacaca atggaattga 54000

aattacccat tgaccagtaa agttgatttt gaagactgcg gtcgtttttc ctagggctct 54060

taatacattc ccatgaaccg 54080

<210>3

<211>22890

<212>DNA

<213>灿烂弧菌

<400>3

gtgctttgtg acaacggggg atgtatggat attgaagttt cgcgccaggt tgcggtagtt 60

gaagctacga gtggagatgt cgtcgtagtt aagccagacg gcagcgcaag aaaagtttca 120

gttggcgata ccatccgtga aaatgagatc gtgattacgg ccaacaagtc agagcttgta 180

ttaggcgttc agaatgattc gattccggtt gcagagaatt gcgtcggttg tgttgatgaa 240

aacgctgcat gggtagatgc cccaatagct ggtgaggtta attttgactt acagcaagca 300

gacgcagaaa ccttcactga agacgacctt gctgcaattc aagaagccat tttaggtggt 360

gccgatccga ctcaaatctt agaagcaacg gctgctggtg gcggactagg ttctgcaaat 420

gctggctttg tgacgattga ctataactac actgaaactc atccatcgac tttctttgag 480

accgctggtc tagcagaaca aactgttgat gaagacagag aagaattcag atctatcact 540

cgttcatcag gtggccaatc aatcagtgaa acactgactg aaggctccat atctggcaat 600

acctatcccc aatctgtaac aacgacagaa acgattattg ctggtagttt agctctcgcc 660

cctaactctt tcattccaga aactttatcc ctcgcttcac tacttagtga attaaacagc 720

gacattactt caagtggtca gtccgttatc ttcacctatg acgcgacgac taattctatc 780

gttggtgttc aagataccga cgaagtatta cgtatcgaca ttgatgccgt cagtgttggc 840

aataacattg agctttctct aaccacaacg atttcccagc cgattgatca tgtaccgtcg 900

gttggcggtg gtcaggtttc ttacactggc gatcaaatag atattgcctt tgatattcaa 960

ggtgaagaca ccgctgggaa cccgctagca acacccgtta acgcacaagt ttcagtgttt 1020

gacgggatag atccgtctgt tgaaagtgtc aatatcacta acgttgaaac tagcagcgcg 1080

gcaatcgaag ggacgttctc aaatattggt agtgataacc ttcaatcagc cgtatttgat 1140

gcaagtgcac tggaccagtt tgatgggttg ctcagtgata atcaaaacac gcttgcgaga 1200

ctttctgatg atggaacaac gattactctg tccatccaag gtcgaggtga ggttgttctc 1260

actatctctc tagataccga tggcacctat aaattcgagc agtctaatcc gatagaacaa 1320

gtgggtaccg attcactgac gttcgctttg ccaatcacga ttaccgattt tgaccaagat 1380

gttgtaacca atacgatcaa cattgccatt actgatggcg atagccctgt tattactaat 1440

gttgacagta ttgatgttga tgaagcgggc attgttggcg gctcacaaga gggcacggcg 1500

ccagtgtctg gcactggcgg tatcaccgcg gacatttttg aaagtgacat cattgaccat 1560

tatgagctag aacccactga atttaatact aatggcacct tggtttcaaa tggcgaggct 1620

gtgctacttg agttgattga tgaaaccaac ggtgtaagaa cttacgaagg ttatgttgag 1680

gtcaatggtt cgagaattac ggtctttgac gttaaaattg atagcccttc attgggcaac 1740

tatgagttta atctttatga agaactttct catcaaggcg ctgaagatgc gctgttaact 1800

tttgcattgc caatttatgc tgttgatgca gatggcgacc gttctgcact gtctggaggt 1860

tcgaacacac cagaagctgc tgagatcctc gttaatgtta aagacgatgt cgttgaatta 1920

gttgataagg ttgaatcagt caccgagccg accttagcgg gcgatactat tgtttcgtat 1980

aacctgttca attttgaagg cgcagatggt tctacaattc aatcgtttaa ctacgacggt 2040

gttgattact cactcgatca aagcctgctc cccgatgcta cccagatttt cagttttact 2100

gaaggtgtcg tcactatctc attaaacggt gacttcagtt ttgaagtcgc tcgtgatatc 2160

gaccactcaa gcagtgaaac tatcgtcaaa cagttctcat ttttagccga agatggtgat 2220

ggggatactg atagttcgac gcttgagtta agtattaccg atggccaaga tccgatcatt 2280

gatttgatcc cgcctgtgac tctctctgaa accaacctta atgacggctc tgctcccagc 2340

ggaagtacag ttagcgcaac cgagacgatt acctttaccg caggcagcga cgatgtagca 2400

agtttccgta ttgaaccaac agagtttaat gtgggcggtg cacttaaatc gaatggattt 2460

tcggttgaga taaaagaaga ttcggctaat ccgggtactt acattggctt tattaccaac 2520

ggttcgggcg ctgaaatccc agtgtttacg attgctttct ctacgagcac attgggtgaa 2580

tacaccttta ctctgcttga agcgttagac catgtagatg gtttagataa gaacgatctg 2640

agctttgatc tgcctattta tgcggttgat acggacggcg acgattcatt ggtgtctcag 2700

cttaatgtga ctatcggtga tgatgttcaa atcatgcaag acggtacgtt agatatcacc 2760

gagccaaatc ttgctgacgg tacaatcaca accaacacca ttgatgtaat gccaaatcaa 2820

agtgctgatg gcgcgacgat cactcggttc acttatgacg gtgtcgtaaa cacactggat 2880

caaagtattt caggagaaca gcagttcagc ttcacagaag gcgaactgtt tatcaccctt 2940

gaaggtgaag tgcgctttga gcctaatcgc gatctagacc actcagtgag tgaagatatc 3000

gtgaagtcga ttgtggtgac ttcaagcgac ttcgataacg atccggtgac ttcaaccatt 3060

acgctgacga tcactgatgg tgataacccg acgattgatg ttattccaag tgttacgctt 3120

tctgaaatta acctgagcga tggctctgct ccaagtggca gcgcggtaag ctcgactcaa 3180

actattactt ttaccaatca aagtgatgat gtggttcgtt tccgtattga gtcaacggag 3240

ttcaatacta acgatgatct taaatcgaac ggtttagctg ttgagttacg tgaagacccg 3300

gcagggtcgg gtgactacat tggttttacg accagtgcga cgaacgtaga aactccagta 3360

ttcacattaa gctttaattc tggatcatta ggtgaataca cgttcacact catcgaagcg 3420

ttggaccacc aagatgcccg tggcaacaac gacctcagtt ttgatttacc tgtttacgcg 3480

gtagatagtg atggcgatga ttcattggtg tctccgttaa acgtcactat cggtgatgat 3540

gttcaaatca tgcaagatag tacgttagat atcgtcgagc caaccgtcgc agatttggcc 3600

gctggcacag tgacaactaa caccattgat gtgatgccaa atcaaagtgc cgatggcgca 3660

acggtgacgc aattcactta tgatggccag cttcgaacac ttgaccaaaa tgacaatggt 3720

gagcagcaat ttagcttcac agaaggtgaa ctgttcatca cgcttcaagg tgatgtgcgc 3780

tttgagccta atcgtaatct agaccacaca ctcagcgaag acatcgtgaa atcaatcgtg 3840

gtgacatcta gcgattccga taacgatgtg ttgacctcaa ccgtcactct gaccattacc 3900

gatggtgata tcccaaccat tgataatgtt ccaactgtga acttgtctga aactaatctg 3960

agtgatggct ctgcacctag cggaagcgcg gtgagttcaa ctcaaactat tacttacacc 4020

actcaaagtg atgatgtgac aagcttccgt attgaaccga ctgaatttaa tgttggtggc 4080

gctctcacat caaacggatt ggcagtcgag ttaaaagctg atccaaccac accgggtggc 4140

tacatcggtt ttgtgactga tggttcgaac gttgaaacta acgtgttcac gattagcttc 4200

tcagatacca atttaggcca gtacaccttc accttacttg aagcgttaga ccatgtggat 4260

ggtttagcga acaatgatct gacctttgat ctgcctgttt atgcagttga tagcgatggc 4320

gacgattcac tggtgtctca gttaaatgta accatcggtg atgatgttca aatcatgcaa 4380

ggtggtacgt tagatatcac tgagccaaat cttgcagacg gcacaattac aaccaatacc 4440

atcgatgtga tgccagagca aagcgccgat ggtgcgacga tcactcagtt cacttatgac 4500

ggtcaagttc gaacactgga tcaaacggac aatggtgagc agcaatttag cttcactgaa 4560

ggcgagttgt tcatcactct tcaaggtgac gtgcgtttcg aacccaatcg caacctagat 4620

cacacagcta gcgaagatat cgtgaagtcg atagtggtga cttcaagcga tttagataac 4680

gatgtggtga cgtcaacggt cactctgacg attactgatg gtgatatccc aaccattgat 4740

gcagtgccaa gcgttactct gtctgaaatc aatcttagtg acggctctgc gccaagtggc 4800

actgcagtta gtcaaactga gacgattacc ttcaccaatc aaagtgatga tgtgaccagt 4860

ttccgtattg agccaataga gttcaatgtg ggcggtgcac tgaaatcgaa tggatttgcg 4920

gttgagataa aagaagattc ggctaatccg ggtacttaca ttggctttat taccaacggt 4980

tcgggcgctg aaatcccagt gtttacgatt gctttctcta cgagctcatt gggtgaatac 5040

acctttactc tgcttgaagc gttagaccat gtagatggtt tagataagaa cgatctgagc 5100

ttcgatctgc ctgtttatgc ggtcgatacg gacggcgatg attcattggt gtctcagcta 5160

aacgtgacca tcggtgatga tgtccaaatc atgcaagacg gtacgttaga tatcatcgag 5220

ccaaatctgg ctgatggaac aatcacaacc agcactattg atgtgatgcc aaaccaaagt 5280

gctgatggtg cgacgatcac tcagtttact tatgacggtc agctaagaac gcttgatcaa 5340

aatgacactg gcgaacagca gttcagcttc acagaaggcg agttgtttat cacccttgaa 5400

ggtgaagtgc gctttgagcc aaaccgagac ctagaccaca ccgcgagtga agatattgtt 5460

aagtcgattg tggtcacttc aagtgatttc gataacgact ctctgacttc taccgtaacg 5520

ctgaccatta ctgatggtga taaccctacg atcgacgtca ttccaagcgt taccctttct 5580

gaaactaatc tgagtgatgg ctctgctcca agtggcagcg cggtaagctc gactcaaact 5640

attactttta ccaatcaaag tgatgatgtg gttcgtttcc gtattgagcc aacggagttc 5700

aatactaacg atgatcttaa atcgaacggt ttagccgttg agttacgtga agacccggct 5760

gggtcgggtg actacattgg ttttactact agtgcgacga atgtcgaaac cacggtattt 5820

acgctgagtt tttctagcac cacattaggt gaatatacct tcactttgct tgaagcgttg 5880

gaccaccaag atgcccgtgg caacaacgac ctcagttttg aactgcctgt ttatgcggta 5940

gacagtgatg gcgatgattc actgatgtct ccgttaaacg tcaccatcgg cgatgatgtt 6000

caaatcatgc aagacggtac gttagatatc gtcgagccaa ccgtcgcaga tttggccgct 6060

ggcattgtga caactaacac cattgatgtg atgccaaatc aaagtgccga tggcgcgacg 6120

atcactcaat tcacttatga tggccaactt cgaacacttg accaaaatga caatggcgaa 6180

caacagttta gcttcacgga aggtgaacta ttcatcactc ttgaaggtga agtgcgcttt 6240

gagcctaatc gtaatctaga ccacacgctg aacgaagaca tcgtgaaatc gatcgtggtg 6300

acgtctagtg actccgataa cgatgtgttg acctcaaccg tcactctgac cattaccgat 6360

ggtgatatcc caaccattga taatgtgcca acagtgagct tgtcagaaac aagtctgagt 6420

gacggctctt caccaagtgg cagcgcagtt agctcaactc aaaccatcac ttacaccact 6480

caaagtgatg atgtaaccag cttccgtatt gaaccgactg agttcaatgt tggcggtgct 6540

ctcaaatcaa atggattggc ggttgagctg aaggccgatc caaccactcc gggcggctac 6600

atcggctttg tgactgatgg ttcgaacgtt gaaactaacg tgttcacgat tagcttctcg 6660

gataccaatt taggtcaata caccttcacc ttgcttgaag cgttggatca tgcggatagc 6720

cttgcaaata acgatctgag ctttgatctg ccagtctacg ccgtcgatag tgatggcgat 6780

gattcactgg tgtctcaact caatgtaacc atcggtgatg atgttcaaat catgcaaggt 6840

ggtacgttag atatcactga gccaaacctt gcagacggca caaccacaac taacaccatc 6900

gatgtgatgc cagaacaaag tgccgatggt gcgacgatca ctcagtttac gtatgacggg 6960

caagttcgca ctctggatca aactgacaat ggtgagcagc aatttagctt cactgaaggc 7020

gagttgttca tcactcttca aggtgacgtg cgtttcgaac ccaatcgcaa cctagatcac 7080

acagctagcg aagacatcgt gaagtcgata gtggtgactt caagcgattc agataacgat 7140

gtggtgacgt caacggtcac tctgactatt actgatggtg atctcccaac cattgatgca 7200

gtgccaagcg ttactctgtc tgaaactaat cttagtgacg gctctgcgcc aagtggcagc 7260

gcagtcagtc aaactgagac catcaccttt accaatcaaa gtgatgatgt ggcgagtttc 7320

cgtattgagc caaccgagtt taatgtgggc ggtgcactga aatcgaatgg gtttgcggtt 7380

gagataaaag aagactctgc taatccgggt acttacattg gctttattgc caatggttcg 7440

agcgctgaaa tcccagtgtt cacgattgct ttctctacga gtacgttggg tgaatacacc 7500

tttactctgc ttgaagcgtt agaccatgcg gatggtttag ataagaacga tctgagcttt 7560

gagcttccgg tttacgcggt tgatacagac ggtgatgatt cattggtatc tcagcttaat 7620

gtgaccattg gtgatgatgt tcaaatcatg caagatggta cgttagacgt tatcgagcca 7680

aatcttgcag acggcacaat cacaaccaac accattgatg tgatgcccga gcaaagtgct 7740

gatggtgcga cgatcactca gtttacttat gacggtcagc taagaacgct tgatcaaaat 7800

gacactggtg aacagcagtt cagcttcaca gaaggcgagt tgtttatcac ccttgaaggt 7860

gaagtgcgct ttgaacctaa tcgcgatcta gaccattccg ttagcgaaga catcgtgaag 7920

tcgatagtag tgacttcaag cgacttcgat aacgatccgg tgacttcagc cattacgctg 7980

accattactg atggtgataa tccgactatc gattcggtac cgagcgttgt acttgaagaa 8040

gctgatttaa ctgatggctc atcgccaagt ggcagcgcgg ttagtcaaac ggaaaccatc 8100

actttcacta atcaaagtga cgatgttgag aaattccgtt tagaaccaag tgaatttaat 8160

actaacaacg cgctcaagtc cgatggcttg atcattgaga ttcgagagga accaacagga 8220

tccggcaatt atattggttt cacgaccgat atttcgaatg tcgaaaccac tgtgtttaca 8280

ctcgatttca gcagtaccac tttgggtgag tacaccttca cgcttctgga agcgattgac 8340

cacacgcctg ttcaaggcaa taacgatcta acattcaact tgccagtcta cgcggttgat 8400

agcgacggtg atgattcgct aatgtcatca ctatcggtga cgattactga tgatgttcaa 8460

gtgatggtga gtggttcgct tagtatcgaa gagcctactg ttgccgactt ggctgcaggc 8520

acgccaacaa catcagtatt tgatgtatta acatccgcga gtgctgatgg ggcgaccatt 8580

actcagttca cttatgatgg tggggcggta ttaacgcttg atcaaaacga tacaggtgag 8640

cagaagttcg tggttgctga tggggcatta tatatcactc tgcaaggcga tattcgtttc 8700

gaaccaagtc gtaaccttga ccatactggt ggcgatatcg tcaagtcgat agtcgtaact 8760

tcaagtgatt ccgatagcga tcttgtgtct tcaacggtaa cgctaaccat tactgatggc 8820

gatatcccaa cgattgacac ggtgccaagc gttactctgt cagaaacgaa tctgagcgac 8880

ggatctgctc cgaatgcaag tgcggtaagt tcaactcaaa ccattacctt tactaaccaa 8940

agtgatgacg tgacgagttt ccgtattgaa ccgactgatt ttaatgttgg tggtgctctg 9000

aaatcgaacg gattggcggt cgaactgaaa gcggacccaa ctacaccggg tggctacatc 9060

ggttttgtga ctgatggttc gaacgttgaa actaacgtgt ttacgattag cttctcggat 9120

accaatttag gtcaatacac cttcaccctg cttgaagcgt tggatcatgt agatggctta 9180

gtgaagaatg atctgacttt tgatcttcct gtttatgcgg ttgatagcga tggtgatgat 9240

tcactggtgt ctcaactgaa tgtgaccatt ggtgatgatg tacaggtcat gcaaaaccaa 9300

gcgcttaata ttattgagcc aacggttgct gatttggctg caggtactcc gacgacagcc 9360

actgttgatg tgatgcctag ccaaagtgcc gatggcgcga caatcactca gtttacttac 9420

gatggcgggg cggcaataac actcgaccaa aacgacaccg gtgaacagaa gtttgtattt 9480

actgaaggtt cactgtttat caccttgcaa ggtgaagtgc gtttcgagcc aaatcgcaat 9540

ctaaaccaca cagcgagcga agacatcgtg aagtcgattg tggtgacttc aagcgattta 9600

gataacgatg tactgacgtc aacggtcact ctgactatta ctgatggtga tatcccaacc 9660

attgatgcag tgccaagcgt tactctgtct gaaactaatc ttagtgacgg ctcagcgcca 9720

agcagcagtg ctgtaagtca aacagagacg attaccttca tcaatcaaag tgatgatgtg 9780

gcgagtttcc gtattgagcc aacagagttc aatgtgggcg gtgcactgaa atcgaatgga 9840

tttgcggttg agataaaaga agattcggct aatccgggta cttatatcgg ttttattacc 9900

gatggttcga atactgaagt tcctgtattc acgattgctt tctctacaag tacgttgggc 9960

gaatacacct tcaccttact tgaagcgcta gaccatgcaa atggcctaga taagaacgat 10020

ctgagttttg atcttcctgt ttatgcggta gacagtgatg gcgatgattc actggtgtct 10080

caactgaatg tgaccattgg tgatgatgtc caaataatgc aagacggtac gttagatatc 10140

actgagccaa atcttgcaga cggaacaatc acaaccaaca ccattgatgt gatgccaaat 10200

cagagtgccg atggtgcgac gatcactgaa ttctcatttg gcggtattgt caaaacactc 10260

gatcaaagca tcgtaggtga gcagcagttt agtttcaccg aaggtgagct attcatcact 10320

cttcaaggtc aagtgcgctt tgaaccaaat cgtgaccttg accactctgc cagcgaagac 10380

atcgtgaagt cgatagtggt tacttcaagt gattttgata acgatcctgt gacttcaacc 10440

gttacgctga ccattaccga tggtgatatt ccaactatcg atgcggtacc aagtgttacg 10500

ctttcagaaa caaacctagc tgatggttct gcgccaagtg gtagtgcggt tagtcaaacg 10560

gagacgatta cttttaccaa tcaaagtgat gatgtggttc gcttccgtct ggaaccaacc 10620

gagttcaata ctaacgatgc acttaaatcg aatggcttag cggtcgaact gcgcgaagaa 10680

cctcaaggct ctggtcagta cattggcttt accaccagtt cgtctaatgt tgagacaaca 10740

gtatttacgt tggactttaa ctccggaacc ttaggtgaat acacatttac tttaatcgaa 10800

gctctggatc atcaagatgc gcgtggcaac aacgatttaa gctttaatct acctgtgtat 10860

gcggtggata gtgatggcga tgactcgtta gtctctcagc ttggcgtgac cattggcgac 10920

gatgtgcagt tgatgcaaga cggcacaatc accagtcgtg agcctgcagc aagtgttgaa 10980

acatcaaata cctttgatgt gatgccaaac caaagtgctg atggagccaa agtcacttca 11040

tttgttttcg atggtaagac tgcagaaagt cttgatttga atgtgaatgg tgaacaagag 11100

ttcgtcttca cggaaggttc ggtatttatt acgacggaag gtgagatacg attcgagccg 11160

gtacgtaatc aaaatcatgc tggtggtgat attaccaagt cgattgaggt gacgtctgtt 11220

gacctcgatg gcgatattgt cacatcgaca gtgacactga agattgttga tggtgacctt 11280

cctactatcg accttgttcc cggaattacg ttatctgaag tggatctggc cgatggctct 11340

gtgccaaccg gtaatccagt gacaatgaca caaaccatta cctacacagc gggtagtgac 11400

gacgtaagcc atttcagaat tgaccctacg cagttcaata cttcaggggt tttgaaatcg 11460

aacggcctag atgtcgaaat aaaagagcag ccagctaatt ctggtaatta cattggcttc 11520

gtcaaagacg gttctaacgt agaaaccaac gtcttcacga tcagcttctc gacgagcaat 11580

ttagggcaat acacgttcac actacttgaa gcgttagatc atgtagatgg attgcaaaac 11640

aatatactaa gcttcgatgt ccctgtttta gcggttgatg cggatggtga tgattctgca 11700

atgtcgccta tgacggttgc gatcaccgat gacgtacaag gtgttcaaga tggcaccttg 11760

agtatcactg agccttcatt agctgatttg gcatcgggta cgccaccaac gacggcaatc 11820

attgatgtta tgccaacgca gagtgctgat ggcgcgaaag taacacagtt tacttacgat 11880

ggtggcacag ctgtaacgtt agacccaagc atcgccacag aacaagtctt taccgtaacc 11940

gatggcttac tgtacatcac cattgaaggg gaggttcgtt ttgagccgag ccgagatcta 12000

gaccattcat ctggcgatat cgtaagaacg attgtcgtca ccaccagtga ttttgataac 12060

gatacagata ccgcggatgt cactttgacg atcaaagacg gtatcaatcc cgttatcaat 12120

gtggttccag atgttaactt atcggaagtt aatctagcgg atggctcgac gccaagtggt 12180

tctgcagtca gttcgactca cacaatcact tacaccgaag gaagtgatga ttttagtcac 12240

tttagaattg cgaccaacga attcaatcct ggcgatctgt tgaaatcaag tggtcttgtt 12300

gttcaactaa aagaagatcc tgcttctgct ggtgattaca ttggttatac cgatgatggt 12360

atgggtaacg ttaccgatgt atttaccatt agctttgata gtgcaaacaa agctcagttt 12420

acatttacct tgattgaggc gcttgatcac cttgatggtg tgctttacaa cgatcttacg 12480

ttccgtttgc ctatctatgc tgttgataca gatgattctg aatcaacaaa gcgcgatgtg 12540

gtggttacga tagaagatga catccagcaa atgcaagatg gcttcttaac cattaccgag 12600

ccaaattctg gtactccaac aacaactacc gttgatgtga tgccaatacc aagtgcagac 12660

ggtgcgacta ttacgcagtt cacgtatgac ggtggttctc caattactct gaatcaaagc 12720

atcagcggcg aacaagagtt tgttttcact gaaggttcac tgtttgtgac actagatggt 12780

gatgtaaggt ttgagccaaa tagaaacctt gatcactctg cgggcgacat tgttaaatcg 12840

attgtgttca cgtcttcaga ctttgataac gacatcttct catcaaaagt cactctcacc 12900

attgttgatg gtgatgggcc aacaatcgac gttgtgccgg gtgtggcatt gtcagaaagc 12960

ttacttgcgg atggttcgac gcctagcgta aatcccgtga gtatgactca aaccattact 13020

tcacttgcaa gtagtgatga tattgctgaa atagtggtgg aagtcgggtt gttcaatacc 13080

aacggcgcgt tgaagtcgga tggtttgtca ctgagtttac gtgaagaccc tgtaaattca 13140

ggcgactaca ttgcatttac tactaatggt tcgggtgttg agaaagttat cttcactctg 13200

gattttgatg atacgaatcc gagtcaatat acgtttactc tgcttgaacg tttagaccat 13260

gttgatggct taggaaataa cgatctgagt tttgatcttt ctgtttatgc agaagatacc 13320

gatggtgata tttcagcgtc taaaccgctt acagtcacca tcaccgatga tgttcagctc 13380

atgcaatccg gtgcgctcaa cattactgag ccaaccacag gaacaccgac tacagcagtc 13440

tttgatgtga tgcctgcgca aagtgcagat ggcgcgacaa tcactaagtt tacctatggc 13500

agccaacctg aagagtctct ggtacaaacc gtcacgggtg agcaagaatt tgtgttcact 13560

gaaggttctc tgtttatcaa tcttgaaggt gatgtacgtt tcgaacctaa ccgtaatctc 13620

gatcattcgg gtggtaacat cgttaagacc attacggtga catcggaaga taaagatggc 13680

gatattgtca cttcaacagt gacgctgact attgtagatg gcgcgccacc agtaatagac 13740

acagtaccaa cggttgcatt ggaagaagcg aatctggtcg acggatcttc accgggttta 13800

cctgttagcc aaactgaaat cattactttc acagcaggaa gtgatgatgt gagccacttc 13860

cgtattgatc cggctcaatt caacacatca ggcgatctga aagcggatgg tttggtggtt 13920

cagttaaaag aagatcctct aaacagcgat aattatattg gttacgttga aagcggcggt 13980

gtccaaacgg atatcttcac catcaccttt agcagcgtgg ttctaggaga gtacacattc 14040

accttgttgg aagagttaga tcacctgcct gtacaaggta acaatgatca aatcttcacc 14100

ttgccagtga tcgcagtcga caaagacaac actgactcag cggtgaaacc tcttacggtg 14160

accattaccg atgatgttcc aaccattact gacaccaccg gcgccagtac gtttgtggtt 14220

gatgaagatg atttgggcac tctggcacaa gcgacgggtt cgtttgtaac cacagaaggt 14280

gcagatcaag tcgaggttta cgaactacgt aatatatcaa cgttggaagc aacgctatcg 14340

tcgggcagtg aaggtattaa gatcactgag atcacaggtg ctgctaacac gaccacctac 14400

caaggggcga ccgacccaag tggaacgcca attttcacat tagtgctgac tgatgatggt 14460

gcctacacct ttaccttgct tggccctctc aatcacgcta cgacaccgag taacctcgat 14520

acattaacaa taccatttga tgttgttgcc gttgacggtg atggcgatga ttctaaccaa 14580

tatgtattgc caatcgaggt gctagatgat gtgcctgtaa tgacggcgcc gacgggtgaa 14640

acggttgttg atgaagacga tcttactggc attggttccg atcaatctga agatacaatt 14700

atcaatggac tgttcaccgt tgatgaaggt gcggatggcg ttgtgctgta tgagctggtt 14760

gatgaagatt tggttctgac gggcttaacc tctgatggag aaagcttaga gtggctagct 14820

gtttcacaaa acggcacaac atttacttac gttgctcaaa ctgcaacgag taatgaagcg 14880

gtgttcgaga ttattttcga cacctcggat aacagctacc aatttgaatt atttaagcca 14940

ctgaagcacc ctgacggtgc aaacgagaac gcgatagatc ttgatttctc aatcgttgct 15000

gaagattttg atcaagacca atcggatgcg atcggtctaa aaattacggt aaccgatgat 15060

gttccgttag tgacaactca atcgattact cgtcttgaag gtcaggggta tggcaactct 15120

aaagtcgaca tgtttgccaa tgcaacagat gtgggggctg atggcgcggt actgagtcga 15180

attgagggta tctcaaataa tggtgcagat attgttttcc gtagcgggaa caatgggcca 15240

tatagtagcg gcttcgattt aaacagcggt agccaacaag ttcgagtcta cgagcaaaca 15300

aatggcggtg ctgatactcg tgaacttggc cgtctacgca tcaactcaaa tggtgaggtt 15360

gaattcagag ctaacggcta tctcgatcat gacggtgatg acaccatcga cttctcgatt 15420

aacgtgattg ccacagatgg agatttagac acctctgaaa caccgttaga tattacgatt 15480

actgataggg attctacaag aattgcgctg aaagtgacga ccttcgagga tgcgggtaga 15540

gactcaacca taccttacgc aacaggtgat gagccgactc ttgagaatgt tcaagataac 15600

caaaatggtt tgccgaatgc gccagcgcaa gttgcgctgc aagttagtct gtatgaccaa 15660

gataacgctg aatctattgg gcagttgacg attaaaagcc cgaacggagg tgatagtcat 15720

caaggtactt tttattactt tgatggtgct gactacatag aattagtgcc tgagtcaaat 15780

gggagcatta tatttggctc tcctgaactc gaacaaagct tcgctccaaa cccgagtgaa 15840

ccaagacaaa ctatcgcgac gatagacaac ctgttctttg ttccagacca acacgctagt 15900

tcggatgaaa ctggtgggcg agttcgttat gagcttgaaa ttgagaaaaa tggcagtacg 15960

gatcacaccg ttaattcaaa cttcagaatt gagattgaag ctgtagctga tattgcgact 16020

tgggatgatt ccaacagcac gtatcagtat caagtcaacg aagatgaaga caatgtcacg 16080

ttgcagctga acgcagagtc tcaagataac agtaatactg agacgattac ctatgaactt 16140

gaagccgttc aaggcgacgg gaagtttgag ttacttgatc aaaatggcaa tgtgttaacg 16200

cccgttaatg gtgtttatat catcgcatct gctgatatca atagcaccgt agttaaccct 16260

attgataact tctcagggca gattgagttc aaagcgacgg caattacgga agagacgctt 16320

aacccatacg atgattcaga caacggtgga gcaaacgata agacgacggc tcgttctgtg 16380

gaacaaagta ttgttattga tgtgaccgca gatgcggacc ctggcacatt cagtgttagt 16440

cgaattcaga tcaacgaaga caatatcgat gatccagatt acgtcgggcc tttggacaat 16500

aaagacgcgt tcacgttaga cgaagtcatc accatgacag ggtcggtcga ttctgacagt 16560

tctgaagaac tgtttgtgcg catcagtaat gttacggaag gagctgtgct ttacttctta 16620

ggcaccacga cagtcgttcc gaccatcacg atcaatggtg tggattatca agaaatcgcg 16680

tattccgatt tggctaacgt tgaggttgtt ccaaccaaac acagtaatgt cgatttcacc 16740

ttcgatgtta cgggagtggt caaagatacg gcaaatctat ccacgggcgc ccaaatcgat 16800

gaggagatac taggaactaa aaccgtcaac gttgaagtca aaggcgttgc cgatactcct 16860

tatggtggaa cgaatggcac ggcttggagt gcaattacag atggcactac atctggtgtt 16920

caaaccacga ttcaagagag ccaaaatggt gatacctttg ctgagcttga tttcaccgtg 16980

ttgtcgggag agagaagacc agatactggc actacaccat tagctgacga tgggtcagaa 17040

tcaataaccg ttattctatc gggtataccc gatggggttg ttctagaaga cggtgacggt 17100

acagtgattg accttaactt tgtcggttat gaaaccggac cgggcggtag tcctgactta 17160

tccaaaccta tctacgaagc gaacattact gaggcgggta aaacttcagg cattcgcatc 17220

agacctgtcg actcttcaac cgagaatatt cacattcaag gtaaagtgat tgtgactgag 17280

aacgatggtc acacgcttac gtttgatcaa gaaattcgag tgcttgttat acctcgaatc 17340

gacacatcag caacttatgt caatacgact aacggtgatg aagatacggc tatcaatatt 17400

gattggcacc ctgaaggcac ggattacatt gatgacgatg agcatttcac taagataact 17460

attaatggaa taccactggg tgttactgca gtagtcaacg gtgatgtgac cgttgatgac 17520

tcaaccccag gaacattgat tataacgcct aaagatgctt cccaaactcc tgaacaattt 17580

actcaaattg cattagctaa taacttcatt caaatgacgc ctccggctga ttctagtgca 17640

gattttacgt tgaccaccga acttaaaatg gaagagcgag atcatgagta tacgtctagc 17700

ggcctagagg atgaagatgg tggttatgtc gaagccgatc cagatataac cggaatcatt 17760

aacgttcaag tacgacctgt ggttgaacct ggagatgccg acaacaagat tgtcgtttca 17820

aacgaagatg gctctggaga tctcactacg attacggctg atgctaatgg tgtcattaaa 17880

tttacaacta acagtgataa ccaaacgact gatactaacg gagacgaaat ctgggacggt 17940

gaatacgtcg tccgatacca agaaacggat ttaagcacag tagaagagca agtcgacgaa 18000

gtgattgttc agctgactaa caccgatgga agcgcgttat ctgatgatat tttagggcaa 18060

cttttagtaa ctggtgcctc ttacgaaggc ggtggccgat gggttgtgac caatgaagat 18120

gcctttagcg tcagtgcgcc caatggatta gatttcaccc ctgccaatga tgcggatgat 18180

gtagctactg atttcaatga tatcaagatg acaattttca ctttggtctc agatcctggt 18240

gatgctaaca atgaaacgtc cgcccaagtg caacgcaccg gagaagtaac gctttcttat 18300

cctgaagtgc tgacggcacc tgacaaagtt gccgcagata ttgcgattgt gccagacagt 18360

gttatcgacg ctgttgagga tactcagctt gatctcggcg cggcactcaa cggcattttg 18420

agcttgacgg gtcgcgatga ttctactgac caagtgacgg tgatcatcga tggcactctg 18480

gtcattgatg ctacaacatc attcccaatt agcctgtcgg gaacaagtga tgttgacttt 18540

gtgaatggga aatatgttta cgagacgact gttgagcagg gcgtagccgt cgattcatcg 18600

ggtttgttat tgaatctgcc accaaactac tctggtgact ttaggttgcc aatgaccatc 18660

gtgaccaaag atttacaatc tggtgatgag aagaccttag tgactgaagt tatcatcaaa 18720

gtcgcaccag atgctgagac ggatccaacg attgaggtga atgtcgtggg ttcgcttgat 18780

gatgccttta atcctgttga taccgacggt caagctgggc aagatccggt gggttacgaa 18840

gacacctata ttcaactcga cttcaattcg accatttcgg atcaggtttc cggcgtcgaa 18900

ggcggccaag aagcgtttac gtccattact ttaacgttgg acgacccttc tataggtgca 18960

ttctatgaca acacgggtac ttcattaggt acatctgtta cgtttaatca ggctgaaata 19020

gcagcgggtg cactcgataa cgtgctcttt agggcaatcg aaaattaccc aacgggtaat 19080

gatattaacc aagtgcaggt taatgtcagc ggtacagtca cagataccgc aacctataat 19140

gatcctgctt ctcctgcggg tacggcaaca gactcagata ctttctctac gagtgtcagc 19200

tttgaagtcg ttcctgtggt cgatgacgtg tctgtcactg gaccgggtag cgatcctgat 19260

gttatcgaga ttactggcaa cgaagaccag ctcatttctt tgtcggggac agggcctgta 19320

tcgattgcac tgactgacct tgatggttca gaacagtttg tatcgattaa gttcacagat 19380

gtccctgatg gcttccaaat gcgtgcagat gctggctcga catataccgt gaaaaataat 19440

ggtaatggag agtggagtgt tcaactgcct caagcttcgg ggttgtcatt cgatttaagt 19500

gagatttcga tcttgccgcc taaaaacttc agtggtaccg ctgagtttgg tgtggaagtc 19560

ttcactcaag aatcgttgct gggtgtgcct actgcggcgg caaacttgcc aagcttcaaa 19620

ctgcatgtgg tacctgttgg tgacgatgtt gataccaatc cgactgattc tgtaacaggc 19680

aacgaaggcc aaaacattga tatcgaaatc aatgcgacta ttttggataa agaattgtct 19740

gcaacaggaa gcgggacgta taccgagaat gcgcccgaaa cgcttcgagt tgaagtggcg 19800

ggtgttcctc aagatgcttc tattttctat ccagatggca cgacattggc tagctacgat 19860

ccggcgacgc agctctggac tctcgatgtt ccagctcagt cgttagataa gatcgtattt 19920

aactctggcg aacataatag tgatacaggc aatgtactgg gtatcaatgg tccactgcag 19980

attacggtac gttcagtaga tactgatgct gataatacag agtacctagg tacgccaacc 20040

agcttcgatg tcgatctggt gattgatcct attaacgatc aaccgatctt tgtgaacgta 20100

acgaatattg aaacatcgga agacatcagt gttgccatcg acaactttag tatctacgac 20160

gtcgacgcaa actttgataa tccagatgct ccgtatgaac tgacgcttaa agtcgaccaa 20220

acactgccgg gagcgcaagg tgtgtttgag tttaccagct ctcctgacgt gacgtttgta 20280

ttgcaacctg acggctcatt ggtgattacc ggtaaagaag ccgacattaa taccgcattg 20340

actaatggag ctgtgacttt caaacccgac ccagaccaga actacctcaa ccagactggt 20400

ttagtcacaa tcaatgcaac gctcgatgat ggtggtaata acggtttgat tgacgcggtt 20460

gatccgaata ccgctcaaac caatcaaact accttcacca ttaaggtgac ggaagtgaat 20520

gacgctcctg tggcgactaa cgttgattta ggctcgattg cggaagacgc tcaaatcgtg 20580

attgttgaga gtgacttgat tgcagccagt tctgatctag aaaaccataa tctcacagta 20640

accggtgtga ctcttactca agggcaaggt cagcttacac gctatgaaaa tgctggtggt 20700

gctgatgacg cagcgattac ggggccattc tggatattca ttgcagataa tgatttcaac 20760

ggcgacgtta aattcaatta ctccattatc gatgatggta ccaccaacgg tgtggatgat 20820

tttaaaaccg atagcgctga aatcagcctt gtagttactg aagtcaatga ccagccagtg 20880

gcatcgaaca ttgatttggg caccatgctt gaagaaggac agctggtcat taaagaggaa 20940

gacctgattt ccgcaaccac tgatccggaa aacgacacga ttactgtgaa cagtttggtg 21000

ctcgatcaag gtcagggcca attacaacgc tttgagaacg tgggcggtgc tgatgatgct 21060

acgatcactg gcccgtactg ggtatttact gcagccaacg aatacaacgg tgatgttaag 21120

ttcacttata ccgttgagga cgatggtaca accaacggcg ctgatgattt cttaacagat 21180

accggcgaaa ttagcgttgt ggtaacggaa gtgaatgatc aaccggtggc aacggatatc 21240

gacttaggaa acatccttga agaagggcag ttgatcatca aagaggaaga cttaattgct 21300

gctacgagcg atccggaaaa cgacacgatt accgtgacca atctggtgct cgacgaaggc 21360

caaggccagt tacagcgctt tgagaacgtg ggcggtgctg atgacgctat gattactggc 21420

ccgtactgga tatttacggc tgctgatgaa tacaacggta acgttaagtt cacctatacc 21480

gtcgaggatg atggtacaac caacggcgct aatgatttcc taacggatac tgcagagatc 21540

acagcgattg tcgacggagt gaacgatacg cctgttgtta atggtgacag tgtcactacg 21600

attgttgacg aggatgctgg tcagctattg agtggtatca atgtcagtga cccagattat 21660

gtggatgcat tttctaatga cttgatgaca gtcacgctga cagtggatta cggtacattg 21720

aacgtatcac ttccggcagt gacgacagtg atggtcaacg gcaacaacac tggttcggtt 21780

atcttagttg gtactttgag tgacctgaat gcgctgattg atacgccaac cagtccaaac 21840

ggtgtctacc tcgatgcgag cttgtctcca accaatagca ttggcttaga agtaatcgcc 21900

aaagacagcg gtaacccttc tggtatcgcg attgaaactg caccagtggt ttataatatc 21960

gcagtgacac cagtcgctaa tgcgccaacc ttgtctattg atccggcatt taactatgtg 22020

agaaacatta cgaccagctc atctgtggtc gctaatagtg gagtcgcttt agttggaatt 22080

gtcgctgcat tgacggacat tactgaagag ttaacgttga agatcagcga tgttccggat 22140

ggtgttgatg taaccagtga tgtgggtacg gtttcgttgg tgggtgatac ttggatagcg 22200

accgctgatg cgatcgatag tctcagactc gtagagcagt catcattagg taaaccgttg 22260

accccgggta attacacctt gaaagttgag gcgctatctg aagagactga caacaacgat 22320

attgcgatat ctcaaaacat cgatctgaat ctcaatattg ttgccaatcc aatagatctc 22380

gatctgtctt ctgaaacaga cgatgtgcaa cttttagcga gtaactttga tactaacctc 22440

actggcggaa ctggaaatga ccgacttgta ggtggagcgg gtgacgatac gctggttggc 22500

ggtgacggta acgacacact cattggtggc ggcggttccg atattctaac cggtggcaat 22560

ggtatggatt cgtttgtatg gctcaatatt gaagatggcg ttgaagacac cattaccgat 22620

ttcagcctgt ctgaaggaga ccaaatcgac ctacgagaag tattacctga gttgaagaat 22680

acatctccag acatgtctgc attgctacaa cagatagacg cgaaagtgga aggggatgat 22740

attgagctta cgatcaagtc tgatggttta ggcactacgg aacaggtgat tgtggttgaa 22800

gaccttgctc ctcagctaac cttaagtggc accatgcctt cggatatttt ggatgcgtta 22860

gtgcaacaaa atgtcatcac tcacggttaa 22890

<210>4

<211>7629

<212>PRT

<213>灿烂弧菌

<400>4

Met Leu Cys Asp Asn Gly Gly Cys Met Asp Ile Glu Val Ser Arg Gln

1 5 10 15

Val Ala Val Val Glu Ala Thr Ser Gly Asp Val Val Val Val Lys Pro

20 25 30

Asp Gly Ser Ala Arg Lys Val Ser Val Gly Asp Thr Ile Arg Glu Asn

35 40 45

Glu Ile Val Ile Thr Ala Asn Lys Ser Glu Leu Val Leu Gly Val Gln

50 55 60

Asn Asp Ser Ile Pro Val Ala Glu Asn Cys Val Gly Cys Val Asp Glu

65 70 75 80

Asn Ala Ala Trp Val Asp Ala Pro Ile Ala Gly Glu Val Asn Phe Asp

85 90 95

Leu Gln Gln Ala Asp Ala Glu Thr Phe Thr Glu Asp Asp Leu Ala Ala

100 105 110

Ile Gln Glu Ala Ile Leu Gly Gly Ala Asp Pro Thr Gln Ile Leu Glu

115 120 125

Ala Thr Ala Ala Gly Gly Gly Leu Gly Ser Ala Asn Ala Gly Phe Val

130 135 140

Thr Ile Asp Tyr Asn Tyr Thr Glu Thr His Pro Ser Thr Phe Phe Glu

145 150 155 160

Thr Ala Gly Leu Ala Glu Gln Thr Val Asp Glu Asp Arg Glu Glu Phe

165 170 175

Arg Ser Ile Thr Arg Ser Ser Gly Gly Gln Ser Ile Ser Glu Thr Leu

180 185 190

Thr Glu Gly Ser Ile Ser Gly Asn Thr Tyr Pro Gln Ser Val Thr Thr

195 200 205

Thr Glu Thr Ile Ile Ala Gly Ser Leu Ala Leu Ala Pro Asn Ser Phe

210 215 220

Ile Pro Glu Thr Leu Ser Leu Ala Ser Leu Leu Ser Glu Leu Asn Ser

225 230 235 240

Asp Ile Thr Ser Ser Gly Gln Ser Val Ile Phe Thr Tyr Asp Ala Thr

245 250 255

Thr Asn Ser Ile Val Gly Val Gln Asp Thr Asp Glu Val Leu Arg Ile

260 265 270

Asp Ile Asp Ala Val Ser Val Gly Asn Asn Ile Glu Leu Ser Leu Thr

275 280 285

Thr Thr Ile Ser Gln Pro Ile Asp His Val Pro Ser Val Gly Gly Gly

290 295 300

Gln Val Ser Tyr Thr Gly Asp Gln Ile Asp Ile Ala Phe Asp Ile Gln

305 310 315 320

Gly Glu Asp Thr Ala Gly Asn Pro Leu Ala Thr Pro Val Asn Ala Gln

325 330 335

Val Ser Val Phe Asp Gly Ile Asp Pro Ser Val Glu Ser Val Asn Ile

340 345 350

Thr Asn Val Glu Thr Ser Ser Ala Ala Ile Glu Gly Thr Phe Ser Asn

355 360 365

Ile Gly Ser Asp Asn Leu Gln Ser Ala Val Phe Asp Ala Ser Ala Leu

370 375 380

Asp Gln Phe Asp Gly Leu Leu Ser Asp Asn Gln Asn Thr Leu Ala Arg

385 390 395 400

Leu Ser Asp Asp Gly Thr Thr Ile Thr Leu Ser Ile Gln Gly Arg Gly

405 410 415

Glu Val Val Leu Thr Ile Ser Leu Asp Thr Asp Gly Thr Tyr Lys Phe

420 425 430

Glu Gln Ser Asn Pro Ile Glu Gln Val Gly Thr Asp Ser Leu Thr Phe

435 440 445

Ala Leu Pro Ile Thr Ile Thr Asp Phe Asp Gln Asp Val Val Thr Asn

450 455 460

Thr Ile Asn Ile Ala Ile Thr Asp Gly Asp Ser Pro Val Ile Thr Asn

465 470 475 480

Val Asp Ser Ile Asp Val Asp Glu Ala Gly Ile Val Gly Gly Ser Gln

485 490 495

Glu Gly Thr Ala Pro Val Ser Gly Thr Gly Gly Ile Thr Ala Asp Ile

500 505 510

Phe Glu Ser Asp Ile Ile Asp His Tyr Glu Leu Glu Pro Thr Glu Phe

515 520 525

Asn Thr Asn Gly Thr Leu Val Ser Asn Gly Glu Ala Val Leu Leu Glu

530 535 540

Leu Ile Asp Glu Thr Asn Gly Val Arg Thr Tyr Glu Gly Tyr Val Glu

545 550 555 560

Val Asn Gly Ser Arg Ile Thr Val Phe Asp Val Lys Ile Asp Ser Pro

565 570 575

Ser Leu Gly Asn Tyr Glu Phe Asn Leu Tyr Glu Glu Leu Ser His Gln

580 585 590

Gly Ala Glu Asp Ala Leu Leu Thr Phe Ala Leu Pro Ile Tyr Ala Val

595 600 605

Asp Ala Asp Gly Asp Arg Ser Ala Leu Ser Gly Gly Ser Asn Thr Pro

610 615 620

Glu Ala Ala Glu Ile Leu Val Asn Val Lys Asp Asp Val Val Glu Leu

625 630 635 640

Val Asp Lys Val Glu Ser Val Thr Glu Pro Thr Leu Ala Gly Asp Thr

645 650 655

Ile Val Ser Tyr Asn Leu Phe Asn Phe Glu Gly Ala Asp Gly Ser Thr

660 665 670

Ile Gln Ser Phe Asn Tyr Asp Gly Val Asp Tyr Ser Leu Asp Gln Ser

675 680 685

Leu Leu Pro Asp Ala Thr Gln Ile Phe Ser Phe Thr Glu Gly Val Val

690 695 700

Thr Ile Ser Leu Asn Gly Asp Phe Ser Phe Glu Val Ala Arg Asp Ile

705 710 715 720

Asp His Ser Ser Ser Glu Thr Ile Val Lys Gln Phe Ser Phe Leu Ala

725 730 735

Glu Asp Gly Asp Gly Asp Thr Asp Ser Ser Thr Leu Glu Leu Ser Ile

740 745 750

Thr Asp Gly Gln Asp Pro Ile Ile Asp Leu Ile Pro Pro Val Thr Leu

755 760 765

Ser Glu Thr Asn Leu Asn Asp Gly Ser Ala Pro Ser Gly Ser Thr Val

770 775 780

Ser Ala Thr Glu Thr Ile Thr Phe Thr Ala Gly Ser Asp Asp Val Ala

785 790 795 800

Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn Val Gly Gly Ala Leu Lys

805 810 815

Ser Asn Gly Phe Ser Val Glu Ile Lys Glu Asp Ser Ala Asn Pro Gly

820 825 830

Thr Tyr Ile Gly Phe Ile Thr Asn Gly Ser Gly Ala Glu Ile Pro Val

835 840 845

Phe Thr Ile Ala Phe Ser Thr Ser Thr Leu Gly Glu Tyr Thr Phe Thr

850 855 860

Leu Leu Glu Ala Leu Asp His Val Asp Gly Leu Asp Lys Asn Asp Leu

865 870 875 880

Ser Phe Asp Leu Pro Ile Tyr Ala Val Asp Thr Asp Gly Asp Asp Ser

885 890 895

Leu Val Ser Gln Leu Asn Val Thr Ile Gly Asp Asp Val Gln Ile Met

900 905 910

Gln Asp Gly Thr Leu Asp Ile Thr Glu Pro Asn Leu Ala Asp Gly Thr

915 920 925

Ile Thr Thr Asn Thr Ile Asp Val Met Pro Asn Gln Ser Ala Asp Gly

930 935 940

Ala Thr Ile Thr Arg Phe Thr Tyr Asp Gly Val Val Asn Thr Leu Asp

945 950 955 960

Gln Ser Ile Ser Gly Glu Gln Gln Phe Ser Phe Thr Glu Gly Glu Leu

965 970 975

Phe Ile Thr Leu Glu Gly Glu Val Arg Phe Glu Pro Asn Arg Asp Leu

980 985 990

Asp His Ser Val Ser Glu Asp Ile Val Lys Ser Ile Val Val Thr Ser

995 1000 1005

Ser Asp Phe Asp Asn Asp Pro Val Thr Ser Thr Ile Thr Leu Thr Ile

1010 1015 1020

Thr Asp Gly Asp Asn Pro Thr Ile Asp Val Ile Pro Ser Val Thr Leu

1025 1030 1035 1040

Ser Glu Ile Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly Ser Ala Val

1045 1050 1055

Ser Ser Thr Gln Thr Ile Thr Phe Thr Asn Gln Ser Asp Asp Val Val

1060 1065 1070

Arg Phe Arg Ile Glu Ser Thr Glu Phe Asn Thr Asn Asp Asp Leu Lys

1075 1080 1085

Ser Asn Gly Leu Ala Val Glu Leu Arg Glu Asp Pro Ala Gly Ser Gly

1090 1095 1100

Asp Tyr Ile Gly Phe Thr Thr Ser Ala Thr Asn Val Glu Thr Pro Val

1105 1110 1115 1120

Phe Thr Leu Ser Phe Asn Ser Gly Ser Leu Gly Glu Tyr Thr Phe Thr

1125 1130 1135

Leu Ile Glu Ala Leu Asp His Gln Asp Ala Arg Gly Asn Asn Asp Leu

1140 1145 1150

Ser Phe Asp Leu Pro Val Tyr Ala Val Asp Ser Asp Gly Asp Asp Ser

1155 1160 1165

Leu Val Ser Pro Leu Asn Val Thr Ile Gly Asp Asp Val Gln Ile Met

1170 1175 1180

Gln Asp Ser Thr Leu Asp Ile Val Glu Pro Thr Val Ala Asp Leu Ala

1185 1190 1195 1200

Ala Gly Thr Val Thr Thr Asn Thr Ile Asp Val Met Pro Asn Gln Ser

1205 1210 1215

Ala Asp Gly Ala Thr Val Thr Gln Phe Thr Tyr Asp Gly Gln Leu Arg

1220 1225 1230

Thr Leu Asp Gln Asn Asp Asn Gly Glu Gln Gln Phe Ser Phe Thr Glu

1235 1240 1245

Gly Glu Leu Phe Ile Thr Leu Gln Gly Asp Val Arg Phe Glu Pro Asn

1250 1255 1260

Arg Asn Leu Asp His Thr Leu Ser Glu Asp Ile Val Lys Ser Ile Val

1265 1270 1275 1280

Val Thr Ser Ser Asp Ser Asp Asn Asp Val Leu Thr Ser Thr Val Thr

1285 1290 1295

Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr Ile Asp Asn Val Pro Thr

1300 1305 1310

Val Asn Leu Ser Glu Thr Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly

1315 1320 1325

Ser Ala Val Ser Ser Thr Gln Thr Ile Thr Tyr Thr Thr Gln Ser Asp

1330 1335 1340

Asp Val Thr Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn Val Gly Gly

1345 1350 1355 1360

Ala Leu Thr Ser Asn Gly Leu Ala Val Glu Leu Lys Ala Asp Pro Thr

1365 1370 1375

Thr Pro Gly Gly Tyr Ile Gly Phe Val Thr Asp Gly Ser Asn Val Glu

1380 1385 1390

Thr Asn Val Phe Thr Ile Ser Phe Ser Asp Thr Asn Leu Gly Gln Tyr

1395 1400 1405

Thr Phe Thr Leu Leu Glu Ala Leu Asp His Val Asp Gly Leu Ala Asn

1410 1415 1420

Asn Asp Leu Thr Phe Asp Leu Pro Val Tyr Ala Val Asp Ser Asp Gly

1425 1430 1435 1440

Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly Asp Asp Val

1445 1450 1455

Gln Ile Met Gln Gly Gly Thr Leu Asp Ile Thr Glu Pro Asn Leu Ala

1460 1465 1470

Asp Gly Thr Ile Thr Thr Asn Thr Ile Asp Val Met Pro Glu Gln Ser

1475 1480 1485

Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly Gln Val Arg

1490 1495 1500

Thr Leu Asp Gln Thr Asp Asn Gly Glu Gln Gln Phe Ser Phe Thr Glu

1505 1510 1515 1520

Gly Glu Leu Phe Ile Thr Leu Gln Gly Asp Val Arg Phe Glu Pro Asn

1525 1530 1535

Arg Asn Leu Asp His Thr Ala Ser Glu Asp Ile Val Lys Ser Ile Val

1540 1545 1550

Val Thr Ser Ser Asp Leu Asp Asn Asp Val Val Thr Ser Thr Val Thr

1555 1560 1565

Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr Ile Asp Ala Val Pro Ser

1570 1575 1580

Val Thr Leu Ser Glu Ile Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly

1585 1590 1595 1600

Thr Ala Val Ser Gln Thr Glu Thr Ile Thr Phe Thr Asn Gln Ser Asp

1605 1610 1615

Asp Val Thr Ser Phe Arg Ile Glu Pro Ile Glu Phe Asn Val Gly Gly

1620 1625 1630

Ala Leu Lys Ser Asn Gly Phe Ala Val Glu Ile Lys Glu Asp Ser Ala

1635 1640 1645

Asn Pro Gly Thr Tyr Ile Gly Phe Ile Thr Asn Gly Ser Gly Ala Glu

1650 1655 1660

Ile Pro Val Phe Thr Ile Ala Phe Ser Thr Ser Ser Leu Gly Glu Tyr

1665 1670 1675 1680

Thr Phe Thr Leu Leu Glu Ala Leu Asp His Val Asp Gly Leu Asp Lys

1685 1690 1695

Asn Asp Leu Ser Phe Asp Leu Pro Val Tyr Ala Val Asp Thr Asp Gly

1700 1705 1710

Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly Asp Asp Val

1715 1720 1725

Gln Ile Met Gln Asp Gly Thr Leu Asp Ile Ile Glu Pro Asn Leu Ala

1730 1735 1740

Asp Gly Thr Ile Thr Thr Ser Thr Ile Asp Val Met Pro Asn Gln Ser

1745 1750 1755 1760

Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly Gln Leu Arg

1765 1770 1775

Thr Leu Asp Gln Asn Asp Thr Gly Glu Gln Gln Phe Ser Phe Thr Glu

1780 1785 1790

Gly Glu Leu Phe Ile Thr Leu Glu Gly Glu Val Arg Phe Glu Pro Asn

1795 1800 1805

Arg Asp Leu Asp His Thr Ala Ser Glu Asp Ile Val Lys Ser Ile Val

1810 1815 1820

Val Thr Ser Ser Asp Phe Asp Asn Asp Ser Leu Thr Ser Thr Val Thr

1825 1830 1835 1840

Leu Thr Ile Thr Asp Gly Asp Asn Pro Thr Ile Asp Val Ile Pro Ser

1845 1850 1855

Val Thr Leu Ser Glu Thr Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly

1860 1865 1870

Ser Ala Val Ser Ser Thr Gln Thr Ile Thr Phe Thr Asn Gln Ser Asp

1875 1880 1885

Asp Val Val Arg Phe Arg Ile Glu Pro Thr Glu Phe Asn Thr Asn Asp

1890 1895 1900

Asp Leu Lys Ser Asn Gly Leu Ala Val Glu Leu Arg Glu Asp Pro Ala

1905 1910 1915 1920

Gly Ser Gly Asp Tyr Ile Gly Phe Thr Thr Ser Ala Thr Asn Val Glu

1925 1930 1935

Thr Thr Val Phe Thr Leu Ser Phe Ser Ser Thr Thr Leu Gly Glu Tyr

1940 1945 1950

Thr Phe Thr Leu Leu Glu Ala Leu Asp His Gln Asp Ala Arg Gly Asn

1955 1960 1965

Asn Asp Leu Ser Phe Glu Leu Pro Val Tyr Ala Val Asp Ser Asp Gly

1970 1975 1980

Asp Asp Ser Leu Met Ser Pro Leu Asn Val Thr Ile Gly Asp Asp Val

1985 1990 1995 2000

Gln Ile Met Gln Asp Gly Thr Leu Asp Ile Val Glu Pro Thr Val Ala

2005 2010 2015

Asp Leu Ala Ala Gly Ile Val Thr Thr Asn Thr Ile Asp Val Met Pro

2020 2025 2030

Asn Gln Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly

2035 2040 2045

Gln Leu Arg Thr Leu Asp Gln Asn Asp Asn Gly Glu Gln Gln Phe Ser

2050 2055 2060

Phe Thr Glu Gly Glu Leu Phe Ile Thr Leu Glu Gly Glu Val Arg Phe

2065 2070 2075 2080

Glu Pro Asn Arg Asn Leu Asp His Thr Leu Asn Glu Asp Ile Val Lys

2085 2090 2095

Ser Ile Val Val Thr Ser Ser Asp Ser Asp Asn Asp Val Leu Thr Ser

2100 2105 2110

Thr Val Thr Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr Ile Asp Asn

2115 2120 2125

Val Pro Thr Val Ser Leu Ser Glu Thr Ser Leu Ser Asp Gly Ser Ser

2130 2135 2140

Pro Ser Gly Ser Ala Val Ser Ser Thr Gln Thr Ile Thr Tyr Thr Thr

2145 2150 2155 2160

Gln Ser Asp Asp Val Thr Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn

2165 2170 2175

Val Gly Gly Ala Leu Lys Ser Asn Gly Leu Ala Val Glu Leu Lys Ala

2180 2185 2190

Asp Pro Thr Thr Pro Gly Gly Tyr Ile Gly Phe Val Thr Asp Gly Ser

2195 2200 2205

Asn Val Glu Thr Asn Val Phe Thr Ile Ser Phe Ser Asp Thr Asn Leu

2210 2215 2220

Gly Gln Tyr Thr Phe Thr Leu Leu Glu Ala Leu Asp His Ala Asp Ser

2225 2230 2235 2240

Leu Ala Asn Asn Asp Leu Ser Phe Asp Leu Pro Val Tyr Ala Val Asp

2245 2250 2255

Ser Asp Gly Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly

2260 2265 2270

Asp Asp Val Gln Ile Met Gln Gly Gly Thr Leu Asp Ile Thr Glu Pro

2275 2280 2285

Asn Leu Ala Asp Gly Thr Thr Thr Thr Asn Thr Ile Asp Val Met Pro

2290 2295 2300

Glu Gln Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly

2305 2310 2315 2320

Gln Val Arg Thr Leu Asp Gln Thr Asp Asn Gly Glu Gln Gln Phe Ser

2325 2330 2335

Phe Thr Glu Gly Glu Leu Phe Ile Thr Leu Gln Gly Asp Val Arg Phe

2340 2345 2350

Glu Pro Asn Arg Asn Leu Asp His Thr Ala Ser Glu Asp Ile Val Lys

2355 2360 2365

Ser Ile Val Val Thr Ser Ser Asp Ser Asp Asn Asp Val Val Thr Ser

2370 2375 2380

Thr Val Thr Leu Thr Ile Thr Asp Gly Asp Leu Pro Thr Ile Asp Ala

2385 2390 2395 2400

Val Pro Ser Val Thr Leu Ser Glu Thr Asn Leu Ser Asp Gly Ser Ala

2405 2410 2415

Pro Ser Gly Ser Ala Val Ser Gln Thr Glu Thr Ile Thr Phe Thr Asn

2420 2425 2430

Gln Ser Asp Asp Val Ala Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn

2435 2440 2445

Val Gly Gly Ala Leu Lys Ser Asn Gly Phe Ala Val Glu Ile Lys Glu

2450 2455 2460

Asp Ser Ala Asn Pro Gly Thr Tyr Ile Gly Phe Ile Ala Asn Gly Ser

2465 2470 2475 2480

Ser Ala Glu Ile Pro Val Phe Thr Ile Ala Phe Ser Thr Ser Thr Leu

2485 2490 2495

Gly Glu Tyr Thr Phe Thr Leu Leu Glu Ala Leu Asp His Ala Asp Gly

2500 2505 2510

Leu Asp Lys Asn Asp Leu Ser Phe Glu Leu Pro Val Tyr Ala Val Asp

2515 2520 2525

Thr Asp Gly Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly

2530 2535 2540

Asp Asp Val Gln Ile Met Gln Asp Gly Thr Leu Asp Val Ile Glu Pro

2545 2550 2555 2560

Asn Leu Ala Asp Gly Thr Ile Thr Thr Asn Thr Ile Asp Val Met Pro

2565 2570 2575

Glu Gln Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly

2580 2585 2590

Gln Leu Arg Thr Leu Asp Gln Asn Asp Thr Gly Glu Gln Gln Phe Ser

2595 2600 2605

Phe Thr Glu Gly Glu Leu Phe Ile Thr Leu Glu Gly Glu Val Arg Phe

2610 2615 2620

Glu Pro Asn Arg Asp Leu Asp His Ser Val Ser Glu Asp Ile Val Lys

2625 2630 2635 2640

Ser Ile Val Val Thr Ser Ser Asp Phe Asp Asn Asp Pro Val Thr Ser

2645 2650 2655

Ala Ile Thr Leu Thr Ile Thr Asp Gly Asp Asn Pro Thr Ile Asp Ser

2660 2665 2670

Val Pro Ser Val Val Leu Glu Glu Ala Asp Leu Thr Asp Gly Ser Ser

2675 2680 2685

Pro Ser Gly Ser Ala Val Ser Gln Thr Glu Thr Ile Thr Phe Thr Asn

2690 2695 2700

Gln Ser Asp Asp Val Glu Lys Phe Arg Leu Glu Pro Ser Glu Phe Asn

2705 2710 2715 2720

Thr Asn Asn Ala Leu Lys Ser Asp Gly Leu Ile Ile Glu Ile Arg Glu

2725 2730 2735

Glu Pro Thr Gly Ser Gly Asn Tyr Ile Gly Phe Thr Thr Asp Ile Ser

2740 2745 2750

Asn Val Glu Thr Thr Val Phe Thr Leu Asp Phe Ser Ser Thr Thr Leu

2755 2760 2765

Gly Glu Tyr Thr Phe Thr Leu Leu Glu Ala Ile Asp His Thr Pro Val

2770 2775 2780

Gln Gly Asn Asn Asp Leu Thr Phe Asn Leu Pro Val Tyr Ala Val Asp

2785 2790 2795 2800

Ser Asp Gly Asp Asp Ser Leu Met Ser Ser Leu Ser Val Thr Ile Thr

2805 2810 2815

Asp Asp Val Gln Val Met Val Ser Gly Ser Leu Ser Ile Glu Glu Pro

2820 2825 2830

Thr Val Ala Asp Leu Ala Ala Gly Thr Pro Thr Thr Ser Val Phe Asp

2835 2840 2845

Val Leu Thr Ser Ala Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr

2850 2855 2860

Tyr Asp Gly Gly Ala Val Leu Thr Leu Asp Gln Asn Asp Thr Gly Glu

2865 2870 2875 2880

Gln Lys Phe Val Val Ala Asp Gly Ala Leu Tyr Ile Thr Leu Gln Gly

2885 2890 2895

Asp Ile Arg Phe Glu Pro Ser Arg Asn Leu Asp His Thr Gly Gly Asp

2900 2905 2910

Ile Val Lys Ser Ile Val Val Thr Ser Ser Asp Ser Asp Ser Asp Leu

2915 2920 2925

Val Ser Ser Thr Val Thr Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr

2930 2935 2940

Ile Asp Thr Val Pro Ser Val Thr Leu Ser Glu Thr Asn Leu Ser Asp

2945 2950 2955 2960

Gly Ser Ala Pro Asn Ala Ser Ala Val Ser Ser Thr Gln Thr Ile Thr

2965 2970 2975

Phe Thr Asn Gln Ser Asp Asp Val Thr Ser Phe Arg Ile Glu Pro Thr

2980 2985 2990

Asp Phe Asn Val Gly Gly Ala Leu Lys Ser Asn Gly Leu Ala Val Glu

2995 3000 3005

Leu Lys Ala Asp Pro Thr Thr Pro Gly Gly Tyr Ile Gly Phe Val Thr

3010 3015 3020

Asp Gly Ser Asn Val Glu Thr Asn Val Phe Thr Ile Ser Phe Ser Asp

3025 3030 3035 3040

Thr Asn Leu Gly Gln Tyr Thr Phe Thr Leu Leu Glu Ala Leu Asp His

3045 3050 3055

Val Asp Gly Leu Val Lys Asn Asp Leu Thr Phe Asp Leu Pro Val Tyr

3060 3065 3070

Ala Val Asp Ser Asp Gly Asp Asp Ser Leu Val Ser Gln Leu Asn Val

3075 3080 3085

Thr Ile Gly Asp Asp Val Gln Val Met Gln Asn Gln Ala Leu Asn Ile

3090 3095 3100

Ile Glu Pro Thr Val Ala Asp Leu Ala Ala Gly Thr Pro Thr Thr Ala

3105 3110 3115 3120

Thr Val Asp Val Met Pro Ser Gln Ser Ala Asp Gly Ala Thr Ile Thr

3125 3130 3135

Gln Phe Thr Tyr Asp Gly Gly Ala Ala Ile Thr Leu Asp Gln Asn Asp

3140 3145 3150

Thr Gly Glu Gln Lys Phe Val Phe Thr Glu Gly Ser Leu Phe Ile Thr

3155 3160 3165

Leu Gln Gly Glu Val Arg Phe Glu Pro Asn Arg Asn Leu Asn His Thr

3170 3175 3180

Ala Ser Glu Asp Ile Val Lys Ser Ile Val Val Thr Ser Ser Asp Leu

3185 3190 3195 3200

Asp Asn Asp Val Leu Thr Ser Thr Val Thr Leu Thr Ile Thr Asp Gly

3205 3210 3215

Asp Ile Pro Thr Ile Asp Ala Val Pro Ser Val Thr Leu Ser Glu Thr

3220 3225 3230

Asn Leu Ser Asp Gly Ser Ala Pro Ser Ser Ser Ala Val Ser Gln Thr

3235 3240 3245

Glu Thr Ile Thr Phe Ile Asn Gln Ser Asp Asp Val Ala Ser Phe Arg

3250 3255 3260

Ile Glu Pro Thr Glu Phe Asn Val Gly Gly Ala Leu Lys Ser Asn Gly

3265 3270 3275 3280

Phe Ala Val Glu Ile Lys Glu Asp Ser Ala Asn Pro Gly Thr Tyr Ile

3285 3290 3295

Gly Phe Ile Thr Asp Gly Ser Asn Thr Glu Val Pro Val Phe Thr Ile

3300 3305 3310

Ala Phe Ser Thr Ser Thr Leu Gly Glu Tyr Thr Phe Thr Leu Leu Glu

3315 3320 3325

Ala Leu Asp His Ala Asn Gly Leu Asp Lys Asn Asp Leu Ser Phe Asp

3330 3335 3340

Leu Pro Val Tyr Ala Val Asp Ser Asp Gly Asp Asp Ser Leu Val Ser

3345 3350 3355 3360

Gln Leu Asn Val Thr Ile Gly Asp Asp Val Gln Ile Met Gln Asp Gly

3365 3370 3375

Thr Leu Asp Ile Thr Glu Pro Asn Leu Ala Asp Gly Thr Ile Thr Thr

3380 3385 3390

Asn Thr Ile Asp Val Met Pro Asn Gln Ser Ala Asp Gly Ala Thr Ile

3395 3400 3405

Thr Glu Phe Ser Phe Gly Gly Ile Val Lys Thr Leu Asp Gln Ser Ile

3410 3415 3420

Val Gly Glu Gln Gln Phe Ser Phe Thr Glu Gly Glu Leu Phe Ile Thr

3425 3430 3435 3440

Leu Gln Gly Gln Val Arg Phe Glu Pro Asn Arg Asp Leu Asp His Ser

3445 3450 3455

Ala Ser Glu Asp Ile Val Lys Ser Ile Val Val Thr Ser Ser Asp Phe

3460 3465 3470

Asp Asn Asp Pro Val Thr Ser Thr Val Thr Leu Thr Ile Thr Asp Gly

3475 3480 3485

Asp Ile Pro Thr Ile Asp Ala Val Pro Ser Val Thr Leu Ser Glu Thr

3490 3495 3500

Asn Leu Ala Asp Gly Ser Ala Pro Ser Gly Ser Ala Val Ser Gln Thr

3505 3510 3515 3520

Glu Thr Ile Thr Phe Thr Asn Gln Ser Asp Asp Val Val Arg Phe Arg

3525 3530 3535

Leu Glu Pro Thr Glu Phe Asn Thr Asn Asp Ala Leu Lys Ser Asn Gly

3540 3545 3550

Leu Ala Val Glu Leu Arg Glu Glu Pro Gln Gly Ser Gly Gln Tyr Ile

3555 3560 3565

Gly Phe Thr Thr Ser Ser Ser Asn Val Glu Thr Thr Val Phe Thr Leu

3570 3575 3580

Asp Phe Asn Ser Gly Thr Leu Gly Glu Tyr Thr Phe Thr Leu Ile Glu

3585 3590 3595 3600

Ala Leu Asp His Gln Asp Ala Arg Gly Asn Asn Asp Leu Ser Phe Asn

3605 3610 3615

Leu Pro Val Tyr Ala Val Asp Ser Asp Gly Asp Asp Ser Leu Val Ser

3620 3625 3630

Gln Leu Gly Val Thr Ile Gly Asp Asp Val Gln Leu Met Gln Asp Gly

3635 3640 3645

Thr Ile Thr Ser Arg Glu Pro Ala Ala Ser Val Glu Thr Ser Asn Thr

3650 3655 3660

Phe Asp Val Met Pro Asn Gln Ser Ala Asp Gly Ala Lys Val Thr Ser

3665 3670 3675 3680

Phe Val Phe Asp Gly Lys Thr Ala Glu Ser Leu Asp Leu Asn Val Asn

3685 3690 3695

Gly Glu Gln Glu Phe Val Phe Thr Glu Gly Ser Val Phe Ile Thr Thr

3700 3705 3710

Glu Gly Glu Ile Arg Phe Glu Pro Val Arg Asn Gln Asn His Ala Gly

3715 3720 3725

Gly Asp Ile Thr Lys Ser Ile Glu Val Thr Ser Val Asp Leu Asp Gly

3730 3735 3740

Asp Ile Val Thr Ser Thr Val Thr Leu Lys Ile Val Asp Gly Asp Leu

3745 3750 3755 3760

Pro Thr Ile Asp Leu Val Pro Gly Ile Thr Leu Ser Glu Val Asp Leu

3765 3770 3775

Ala Asp Gly Ser Val Pro Thr Gly Asn Pro Val Thr Met Thr Gln Thr

3780 3785 3790

Ile Thr Tyr Thr Ala Gly Ser Asp Asp Val Ser His Phe Arg Ile Asp

3795 3800 3805

Pro Thr Gln Phe Asn Thr Ser Gly Val Leu Lys Ser Asn Gly Leu Asp

3810 3815 3820

Val Glu Ile Lys Glu Gln Pro Ala Asn Ser Gly Asn Tyr Ile Gly Phe

3825 3830 3835 3840

Val Lys Asp Gly Ser Asn Val Glu Thr Asn Val Phe Thr Ile Ser Phe

3845 3850 3855

Ser Thr Ser Asn Leu Gly Gln Tyr Thr Phe Thr Leu Leu Glu Ala Leu

3860 3865 3870

Asp His Val Asp Gly Leu Gln Asn Asn Ile Leu Ser Phe Asp Val Pro

3875 3880 3885

Val Leu Ala Val Asp Ala Asp Gly Asp Asp Ser Ala Met Ser Pro Met

3890 3895 3900

Thr Val Ala Ile Thr Asp Asp Val Gln Gly Val Gln Asp Gly Thr Leu

3905 3910 3915 3920

Ser Ile Thr Glu Pro Ser Leu Ala Asp Leu Ala Ser Gly Thr Pro Pro

3925 3930 3935

Thr Thr Ala Ile Ile Asp Val Met Pro Thr Gln Ser Ala Asp Gly Ala

3940 3945 3950

Lys Val Thr Gln Phe Thr Tyr Asp Gly Gly Thr Ala Val Thr Leu Asp

3955 3960 3965

Pro Ser Ile Ala Thr Glu Gln Val Phe Thr Val Thr Asp Gly Leu Leu

3970 39753 980

Tyr Ile Thr Ile Glu Gly Glu Val Arg Phe Glu Pro Ser Arg Asp Leu

3985 3990 3995 4000

Asp His Ser Ser Gly Asp Ile Val Arg Thr Ile Val Val Thr Thr Ser

4005 4010 4015

Asp Phe Asp Asn Asp Thr Asp Thr Ala Asp Val Thr Leu Thr Ile Lys

4020 4025 4030

Asp Gly Ile Asn Pro Val Ile Asn Val Val Pro Asp Val Asn Leu Ser

4035 4040 4045

Glu Val Asn Leu Ala Asp Gly Ser Thr Pro Ser Gly Ser Ala Val Ser

4050 4055 4060

Ser Thr His Thr Ile Thr Tyr Thr Glu Gly Ser Asp Asp Phe Ser His

4065 4070 4075 4080

Phe Arg Ile Ala Thr Asn Glu Phe Asn Pro Gly Asp Leu Leu Lys Ser

4085 4090 4095

Ser Gly Leu Val Val Gln Leu Lys Glu Asp Pro Ala Ser Ala Gly Asp

4100 4105 4110

Tyr Ile Gly Tyr Thr Asp Asp Gly Met Gly Asn Val Thr Asp Val Phe

4115 4120 4125

Thr Ile Ser Phe Asp Ser Ala Asn Lys Ala Gln Phe Thr Phe Thr Leu

4130 4135 4140

Ile Glu Ala Leu Asp His Leu Asp Gly Val Leu Tyr Asn Asp Leu Thr

4145 4150 4155 4160

Phe Arg Leu Pro Ile Tyr Ala Val Asp Thr Asp Asp Ser Glu Ser Thr

4165 4170 4175

Lys Arg Asp Val Val Val Thr Ile Glu Asp Asp Ile Gln Gln Met Gln

4180 4185 4190

Asp Gly Phe Leu Thr Ile Thr Glu Pro Asn Ser Gly Thr Pro Thr Thr

4195 4200 4205

Thr Thr Val Asp Val Met Pro Ile Pro Ser Ala Asp Gly Ala Thr Ile

4210 4215 4220

Thr Gln Phe Thr Tyr Asp Gly Gly Ser Pro Ile Thr Leu Asn Gln Ser

4225 4230 4235 4240

Ile Ser Gly Glu Gln Glu Phe Val Phe Thr Glu Gly Ser Leu Phe Val

4245 4250 4255

Thr Leu Asp Gly Asp Val Arg Phe Glu Pro Asn Arg Asn Leu Asp His

4260 4265 4270

Ser Ala Gly Asp Ile Val Lys Ser Ile Val Phe Thr Ser Ser Asp Phe

4275 4280 4285

Asp Asn Asp Ile Phe Ser Ser Lys Val Thr Leu Thr Ile Val Asp Gly

4290 4295 4300

Asp Gly Pro Thr Ile Asp Val Val Pro Gly Val Ala Leu Ser Glu Ser

4305 4310 4315 4320

Leu Leu Ala Asp Gly Ser Thr Pro Ser Val Asn Pro Val Ser Met Thr

4325 4330 4335

Gln Thr Ile Thr Ser Leu Ala Ser Ser Asp Asp Ile Ala Glu Ile Val

4340 4345 4350

Val Glu Val Gly Leu Phe Asn Thr Asn Gly Ala Leu Lys Ser Asp Gly

4355 4360 4365

Leu Ser Leu Ser Leu Arg Glu Asp Pro Val Asn Ser Gly Asp Tyr Ile

4370 4375 4380

Ala Phe Thr Thr Asn Gly Ser Gly Val Glu Lys Val Ile Phe Thr Leu

4385 4390 4395 4400

Asp Phe Asp Asp Thr Asn Pro Ser Gln Tyr Thr Phe Thr Leu Leu Glu

4405 4410 4415

Arg Leu Asp His Val Asp Gly Leu Gly Asn Asn Asp Leu Ser Phe Asp

4420 4425 4430

Leu Ser Val Tyr Ala Glu Asp Thr Asp Gly Asp Ile Ser Ala Ser Lys

4435 4440 4445

Pro Leu Thr Val Thr Ile Thr Asp Asp Val Gln Leu Met Gln Ser Gly

4450 4455 4460

Ala Leu Asn Ile Thr Glu Pro Thr Thr Gly Thr Pro Thr Thr Ala Val

4465 4470 4475 4480

Phe Asp Val Met Pro Ala Gln Ser Ala Asp Gly Ala Thr Ile Thr Lys

4485 4490 4495

Phe Thr Tyr Gly Ser Gln Pro Glu Glu Ser Leu Val Gln Thr Val Thr

4500 4505 4510

Gly Glu Gln Glu Phe Val Phe Thr Glu Gly Ser Leu Phe Ile Asn Leu

4515 4520 4525

Glu Gly Asp Val Arg Phe Glu Pro Asn Arg Asn Leu Asp His Ser Gly

4530 4535 4540

Gly Asn Ile Val Lys Thr Ile Thr Val Thr Ser Glu Asp Lys Asp Gly

4545 4550 4555 4560

Asp Ile Val Thr Ser Thr Val Thr Leu Thr Ile Val Asp Gly Ala Pro

4565 4570 4575

Pro Val Ile Asp Thr Val Pro Thr Val Ala Leu Glu Glu Ala Asn Leu

4580 4585 4590

Val Asp Gly Ser Ser Pro Gly Leu Pro Val Ser Gln Thr Glu Ile Ile

4595 4600 4605

Thr Phe Thr Ala Gly Ser Asp Asp Val Ser His Phe Arg Ile Asp Pro

4610 4615 4620

Ala Gln Phe Asn Thr Ser Gly Asp Leu Lys Ala Asp Gly Leu Val Val

4625 4630 4635 4640

Gln Leu Lys Glu Asp Pro Leu Asn Ser Asp Asn Tyr Ile Gly Tyr Val

4645 4650 4655

Glu Ser Gly Gly Val Gln Thr Asp Ile Phe Thr Ile Thr Phe Ser Ser

4660 4665 4670

Val Val Leu Gly Glu Tyr Thr Phe Thr Leu Leu Glu Glu Leu Asp His

4675 4680 4685

Leu Pro Val Gln Gly Asn Asn Asp Gln Ile Phe Thr Leu Pro Val Ile

4690 4695 4700

Ala Val Asp Lys Asp Asn Thr Asp Ser Ala Val Lys Pro Leu Thr Val

4705 4710 4715 4720

Thr Ile Thr Asp Asp Val Pro Thr Ile Thr Asp Thr Thr Gly Ala Ser

4725 4730 4735

Thr Phe Val Val Asp Glu Asp Asp Leu Gly Thr Leu Ala Gln Ala Thr

4740 4745 4750

Gly Ser Phe Val Thr Thr Glu Gly Ala Asp Gln Val Glu Val Tyr Glu

4755 4760 4765

Leu Arg Asn Ile Ser Thr Leu Glu Ala Thr Leu Ser Ser Gly Ser Glu

4770 4775 4780

Gly Ile Lys Ile Thr Glu Ile Thr Gly Ala Ala Asn Thr Thr Thr Tyr

4785 4790 4795 4800

Gln Gly Ala Thr Asp Pro Ser Gly Thr Pro Ile Phe Thr Leu Val Leu

4805 4810 4815

Thr Asp Asp Gly Ala Tyr Thr Phe Thr Leu Leu Gly Pro Leu Asn His

4820 4825 4830

Ala Thr Thr Pro Ser Asn Leu Asp Thr Leu Thr Ile Pro Phe Asp Val

4835 4840 4845

Val Ala Val Asp Gly Asp Gly Asp Asp Ser Asn Gln Tyr Val Leu Pro

4850 4855 4860

Ile Glu Val Leu Asp Asp Val Pro Val Met Thr Ala Pro Thr Gly Glu

4865 4870 4875 4880

Thr Val Val Asp Glu Asp Asp Leu Thr Gly Ile Gly Ser Asp Gln Ser

4885 4890 4895

Glu Asp Thr Ile Ile Asn Gly Leu Phe Thr Val Asp Glu Gly Ala Asp

4900 4905 4910

Gly Val Val Leu Tyr Glu Leu Val Asp Glu Asp Leu Val Leu Thr Gly

4915 4920 4925

Leu Thr Ser Asp Gly Glu Ser Leu Glu Trp Leu Ala Val Ser Gln Asn

4930 4935 4940

Gly Thr Thr Phe Thr Tyr Val Ala Gln Thr Ala Thr Ser Asn Glu Ala

4945 4950 4955 4960

Val Phe Glu Ile Ile Phe Asp Thr Ser Asp Asn Ser Tyr Gln Phe Glu

4965 4970 4975

Leu Phe Lys Pro Leu Lys His Pro Asp Gly Ala Asn Glu Asn Ala Ile

4980 4985 4990

Asp Leu Asp Phe Ser Ile Val Ala Glu Asp Phe Asp Gln Asp Gln Ser

4995 5000 5005

Asp Ala Ile Gly Leu Lys Ile Thr Val Thr Asp Asp Val Pro Leu Val

5010 5015 5020

Thr Thr Gln Ser Ile Thr Arg Leu Glu Gly Gln Gly Tyr Gly Asn Ser

5025 5030 5035 5040

Lys Val Asp Met Phe Ala Asn Ala Thr Asp Val Gly Ala Asp Gly Ala

5045 5050 5055

Val Leu Ser Arg Ile Glu Gly Ile Ser Asn Asn Gly Ala Asp Ile Val

5060 5065 5070

Phe Arg Ser Gly Asn Asn Gly Pro Tyr Ser Ser Gly Phe Asp Leu Asn

5075 5080 5085

Ser Gly Ser Gln Gln Val Arg Val Tyr Glu Gln Thr Asn Gly Gly Ala

5090 5095 5100

Asp Thr Arg Glu Leu Gly Arg Leu Arg Ile Asn Ser Asn Gly Glu Val

5105 5110 5115 5120

Glu Phe Arg Ala Asn Gly Tyr Leu Asp His Asp Gly Asp Asp Thr Ile

5125 5130 5135

Asp Phe Ser Ile Asn Val Ile Ala Thr Asp Gly Asp Leu Asp Thr Ser

5140 5145 5150

Glu Thr Pro Leu Asp Ile Thr Ile Thr Asp Arg Asp Ser Thr Arg Ile

5155 5160 5165

Ala Leu Lys Val Thr Thr Phe Glu Asp Ala Gly Arg Asp Ser Thr Ile

5170 5175 5180

Pro Tyr Ala Thr Gly Asp Glu Pro Thr Leu Glu Asn Val Gln Asp Asn

5185 5190 5195 5200

Gln Asn Gly Leu Pro Asn Ala Pro Ala Gln Val Ala Leu Gln Val Ser

5205 5210 5215

Leu Tyr Asp Gln Asp Asn Ala Glu Ser Ile Gly Gln Leu Thr Ile Lys

5220 5225 5230

Ser Pro Asn Gly Gly Asp Ser His Gln Gly Thr Phe Tyr Tyr Phe Asp

5235 5240 5245

Gly Ala Asp Tyr Ile Glu Leu Val Pro Glu Ser Asn Gly Ser Ile Ile

5250 5255 5260

Phe Gly Ser Pro Glu Leu Glu Gln Ser Phe Ala Pro Asn Pro Ser Glu

5265 5270 5275 5280

Pro Arg Gln Thr Ile Ala Thr Ile Asp Asn Leu Phe Phe Val Pro Asp

5285 5290 5295

Gln His Ala Ser Ser Asp Glu Thr Gly Gly Arg Val Arg Tyr Glu Leu

5300 5305 5310

Glu Ile Glu Lys Asn Gly Ser Thr Asp His Thr Val Asn Ser Asn Phe

5315 5320 5325

Arg Ile Glu Ile Glu Ala Val Ala Asp Ile Ala Thr Trp Asp Asp Ser

5330 5335 5340

Asn Ser Thr Tyr Gln Tyr Gln Val Asn Glu Asp Glu Asp Asn Val Thr

5345 5350 5355 5360

Leu Gln Leu Asn Ala Glu Ser Gln Asp Asn Ser Asn Thr Glu Thr Ile

5365 5370 5375

Thr Tyr Glu Leu Glu Ala Val Gln Gly Asp Gly Lys Phe Glu Leu Leu

5380 5385 5390

Asp Gln Asn Gly Asn Val Leu Thr Pro Val Asn Gly Val Tyr Ile Ile

5395 5400 5405

Ala Ser Ala Asp Ile Asn Ser Thr Val Val Asn Pro Ile Asp Asn Phe

5410 5415 5420

Ser Gly Gln Ile Glu Phe Lys Ala Thr Ala Ile Thr Glu Glu Thr Leu

5425 5430 5435 5440

Asn Pro Tyr Asp Asp Ser Asp Asn Gly Gly Ala Asn Asp Lys Thr Thr

5445 5450 5455

Ala Arg Ser Val Glu Gln Ser Ile Val Ile Asp Val Thr Ala Asp Ala

5460 5465 5470

Asp Pro Gly Thr Phe Ser Val Ser Arg Ile Gln Ile Asn Glu Asp Asn

5475 5480 5485

Ile Asp Asp Pro Asp Tyr Val Gly Pro Leu Asp Asn Lys Asp Ala Phe

5490 5495 5500

Thr Leu Asp Glu Val Ile Thr Met Thr Gly Ser Val Asp Ser Asp Ser

5505 5510 5515 5520

Ser Glu Glu Leu Phe Val Arg Ile Ser Asn Val Thr Glu Gly Ala Val

5525 5530 5535

Leu Tyr Phe Leu Gly Thr Thr Thr Val Val Pro Thr Ile Thr Ile Asn

5540 5545 5550

Gly Val Asp Tyr Gln Glu Ile Ala Tyr Ser Asp Leu Ala Asn Val Glu

5555 5560 5565

Val Val Pro Thr Lys His Ser Asn Val Asp Phe Thr Phe Asp Val Thr

5570 5575 5580

Gly Val Val Lys Asp Thr Ala Asn Leu Ser Thr Gly Ala Gln Ile Asp

5585 5590 5595 5600

Glu Glu Ile Leu Gly Thr Lys Thr Val Asn Val Glu Val Lys Gly Val

5605 5610 5615

Ala Asp Thr Pro Tyr Gly Gly Thr Asn Gly Thr Ala Trp Ser Ala Ile

5620 5625 5630

Thr Asp Gly Thr Thr Ser Gly Val Gln Thr Thr Ile Gln Glu Ser Gln

5635 5640 5645

Asn Gly Asp Thr Phe Ala Glu Leu Asp Phe Thr Val Leu Ser Gly Glu

5650 5655 5660

Arg Arg Pro Asp Thr Gly Thr Thr Pro Leu Ala Asp Asp Gly Ser Glu

5665 5670 5675 5680

Ser Ile Thr Val Ile Leu Ser Gly Ile Pro Asp Gly Val Val Leu Glu

5685 5690 5695

Asp Gly Asp Gly Thr Val Ile Asp Leu Asn Phe Val Gly Tyr Glu Thr

5700 5705 5710

Gly Pro Gly Gly Ser Pro Asp Leu Ser Lys Pro Ile Tyr Glu Ala Asn

5715 5720 5725

Ile Thr Glu Ala Gly Lys Thr Ser Gly Ile Arg Ile Arg Pro Val Asp

5730 5735 5740

Ser Ser Thr Glu Asn Ile His Ile Gln Gly Lys Val Ile Val Thr Glu

5745 5750 5755 5760

Asn Asp Gly His Thr Leu Thr Phe Asp Gln Glu Ile Arg Val Leu Val

5765 5770 5775

Ile Pro Arg Ile Asp Thr Ser Ala Thr Tyr Val Asn Thr Thr Asn Gly

5780 5785 5790

Asp Glu Asp Thr Ala Ile Asn Ile Asp Trp His Pro Glu Gly Thr Asp

5795 5800 5805

Tyr Ile Asp Asp Asp Glu His Phe Thr Lys Ile Thr Ile Asn Gly Ile

5810 5815 5820

Pro Leu Gly Val Thr Ala Val Val Asn Gly Asp Val Thr Val Asp Asp

5825 5830 5835 5840

Ser Thr Pro Gly Thr Leu Ile Ile Thr Pro Lys Asp Ala Ser Gln Thr

5845 5850 5855

Pro Glu Gln Phe Thr Gln Ile Ala Leu Ala Asn Asn Phe Ile Gln Met

5860 5865 5870

Thr Pro Pro Ala Asp Ser Ser Ala Asp Phe Thr Leu Thr Thr Glu Leu

5875 5880 5885

Lys Met Glu Glu Arg Asp His Glu Tyr Thr Ser Ser Gly Leu Glu Asp

5890 5895 5900

Glu Asp Gly Gly Tyr Val Glu Ala Asp Pro Asp Ile Thr Gly Ile Ile

5905 5910 5915 5920

Asn Val Gln Val Arg Pro Val Val Glu Pro Gly Asp Ala Asp Asn Lys

5925 5930 5935

Ile Val Val Ser Asn Glu Asp Gly Ser Gly Asp Leu Thr Thr Ile Thr

5940 5945 5950

Ala Asp Ala Asn Gly Val Ile Lys Phe Thr Thr Asn Ser Asp Asn Gln

5955 5960 5965

Thr Thr Asp Thr Asn Gly Asp Glu Ile Trp Asp Gly Glu Tyr Val Val

5970 5975 5980

Arg Tyr Gln Glu Thr Asp Leu Ser Thr Val Glu Glu Gln Val Asp Glu

5985 5990 5995 6000

Val Ile Val Gln Leu Thr Asn Thr Asp Gly Ser Ala Leu Ser Asp Asp

6005 6010 6015

Ile Leu Gly Gln Leu Leu Val Thr Gly Ala Ser Tyr Glu Gly Gly Gly

6020 6025 6030

Arg Trp Val Val Thr Asn Glu Asp Ala Phe Ser Val Ser Ala Pro Asn

6035 6040 6045

Gly Leu Asp Phe Thr Pro Ala Asn Asp Ala Asp Asp Val Ala Thr Asp

6050 6055 6060

Phe Asn Asp Ile Lys Met Thr Ile Phe Thr Leu Val Ser Asp Pro Gly

6065 6070 6075 6080

Asp Ala Asn Asn Glu Thr Ser Ala Gln Val Gln Arg Thr Gly Glu Val

6085 6090 6095

Thr Leu Ser Tyr Pro Glu Val Leu Thr Ala Pro Asp Lys Val Ala Ala

6100 6105 6110

Asp Ile Ala Ile Val Pro Asp Ser Val Ile Asp Ala Val Glu Asp Thr

6115 6120 6125

Gln Leu Asp Leu Gly Ala Ala Leu Asn Gly Ile Leu Ser Leu Thr Gly

6130 6135 6140

Arg Asp Asp Ser Thr Asp Gln Val Thr Val Ile Ile Asp Gly Thr Leu

6145 6150 6155 6160

Val Ile Asp Ala Thr Thr Ser Phe Pro Ile Ser Leu Ser Gly Thr Ser

6165 6170 6175

Asp Val Asp Phe Val Asn Gly Lys Tyr Val Tyr Glu Thr Thr Val Glu

6180 6185 6190

Gln Gly Val Ala Val Asp Ser Ser Gly Leu Leu Leu Asn Leu Pro Pro

6195 6200 6205

Asn Tyr Ser Gly Asp Phe Arg Leu Pro Met Thr Ile Val Thr Lys Asp

6210 6215 6220

Leu Gln Ser Gly Asp Glu Lys Thr Leu Val Thr Glu Val Ile Ile Lys

6225 6230 6235 6240

Val Ala Pro Asp Ala Glu Thr Asp Pro Thr Ile Glu Val Asn Val Val

6245 6250 6255

Gly Ser Leu Asp Asp Ala Phe Asn Pro Val Asp Thr Asp Gly Gln Ala

6260 6265 6270

Gly Gln Asp Pro Val Gly Tyr Glu Asp Thr Tyr Ile Gln Leu Asp Phe

6275 6280 6285

Asn Ser Thr Ile Ser Asp Gln Val Ser Gly Val Glu Gly Gly Gln Glu

6290 6295 6300

Ala Phe Thr Ser Ile Thr Leu Thr Leu Asp Asp Pro Ser Ile Gly Ala

6305 6310 6315 6320

Phe Tyr Asp Asn Thr Gly Thr Ser Leu Gly Thr Ser Val Thr Phe Asn

6325 6330 6335

Gln Ala Glu Ile Ala Ala Gly Ala Leu Asp Asn Val Leu Phe Arg Ala

6340 6345 6350

Ile Glu Asn Tyr Pro Thr Gly Asn Asp Ile Asn Gln Val Gln Val Asn

6355 6360 6365

Val Ser Gly Thr Val Thr Asp Thr Ala Thr Tyr Asn Asp Pro Ala Ser

6370 6375 6380

Pro Ala Gly Thr Ala Thr Asp Ser Asp Thr Phe Ser Thr Ser Val Ser

6385 6390 6395 6400

Phe Glu Val Val Pro Val Val Asp Asp Val Ser Val Thr Gly Pro Gly

6405 6410 6415

Ser Asp Pro Asp Val Ile Glu Ile Thr Gly Agn Glu Asp Gln Leu Ile

6420 6425 6430

Ser Leu Ser Gly Thr Gly Pro Val Ser Ile Ala Leu Thr Asp Leu Asp

6435 6440 6445

Gly Ser Glu Gln Phe Val Ser Ile Lys Phe Thr Asp Val Pro Asp Gly

6450 6455 6460

Phe Gln Met Arg Ala Asp Ala Gly Ser Thr Tyr Thr Val Lys Asn Asn

6465 6470 6475 6480

Gly Asn Gly Glu Trp Ser Val Gln Leu Pro Gln Ala Ser Gly Leu Ser

6485 6490 6495

Phe Asp Leu Ser Glu Ile Ser Ile Leu Pro Pro Lys Asn Phe Ser Gly

6500 6505 6510

Thr Ala Glu Phe Gly Val Glu Val Phe Thr Gln Glu Ser Leu Leu Gly

6515 6520 6525

Val Pro Thr Ala Ala Ala Asn Leu Pro Ser Phe Lys Leu His Val Val

6530 6535 6540

Pro Val Gly Asp Asp Val Asp Thr Asn Pro Thr Asp Ser Val Thr Gly

6545 6550 6555 6560

Asn Glu Gly Gln Asn Ile Asp Ile Glu Ile Asn Ala Thr Ile Leu Asp

6565 6570 6575

Lys Glu Leu Ser Ala Thr Gly Ser Gly Thr Tyr Thr Glu Asn Ala Pro

6580 6585 6590

Glu Thr Leu Arg Val Glu Val Ala Gly Val Pro Gln Asp Ala Ser Ile

6595 6600 6605

Phe Tyr Pro Asp Gly Thr Thr Leu Ala Ser Tyr Asp Pro Ala Thr Gln

6610 6615 6620

Leu Trp Thr Leu Asp Val Pro Ala Gln Ser Leu Asp Lys Ile Val Phe

6625 6630 6635 6640

Asn Ser Gly Glu His Asn Ser Asp Thr Gly Asn Val Leu Gly Ile Asn

6645 6650 6655

Gly Pro Leu Gln Ile Thr Val Arg Ser Val Asp Thr Asp Ala Asp Asn

6660 6665 6670

Thr Glu Tyr Leu Gly Thr Pro Thr Ser Phe Asp Val Asp Leu Val Ile

6675 6680 6685

Asp Pro Ile Asn Asp Gln Pro Ile Phe Val Asn Val Thr Asn Ile Glu

6690 6695 6700

Thr Ser Glu Asp Ile Ser Val Ala Ile Asp Asn Phe Ser Ile Tyr Asp

6705 6710 6715 6720

Val Asp Ala Asn Phe Asp Asn Pro Asp Ala Pro Tyr Glu Leu Thr Leu

6725 6730 6735

Lys Val Asp Gln Thr Leu Pro Gly Ala Gln Gly Val Phe Glu Phe Thr

6740 6745 6750

Ser Ser Pro Asp Val Thr Phe Val Leu Gln Pro Asp Gly Ser Leu Val

6755 6760 6765

Ile Thr Gly Lys Glu Ala Asp Ile Asn Thr Ala Leu Thr Asn Gly Ala

6770 6775 6780

Val Thr Phe Lys Pro Asp Pro Asp Gln Asn Tyr Leu Asn Gln Thr Gly

6785 6790 6795 6800

Leu Val Thr Ile Asn Ala Thr Leu Asp Asp Gly Gly Asn Asn Gly Leu

6805 6810 6815

Ile Asp Ala Val Asp Pro Asn Thr Ala Gln Thr Asn Gln Thr Thr Phe

6820 6825 6830

Thr Ile Lys Val Thr Glu Val Asn Asp Ala Pro Val Ala Thr Asn Val

6835 6840 6845

Asp Leu Gly Ser Ile Ala Glu Asp Ala Gln Ile Val Ile Val Glu Ser

6850 6855 6860

Asp Leu Ile Ala Ala Ser Ser Asp Leu Glu Asn His Asn Leu Thr Val

6865 6870 6875 6880

Thr Gly Val Thr Leu Thr Gln Gly Gln Gly Gln Leu Thr Arg Tyr Glu

6885 6890 6895

Asn Ala Gly Gly Ala Asp Asp Ala Ala Ile Thr Gly Pro Phe Trp Ile

6900 6905 6910

Phe Ile Ala Asp Asn Asp Phe Asn Gly Asp Val Lys Phe Asn Tyr Ser

6915 6920 6925

Ile Ile Asp Asp Gly Thr Thr Asn Gly Val Asp Asp Phe Lys Thr Asp

6930 6935 6940

Ser Ala Glu Ile Ser Leu Val Val Thr Glu Val Asn Asp Gln Pro Val

6945 6950 6955 6960

Ala Ser Asn Ile Asp Leu Gly Thr Met Leu Glu Glu Gly Gln Leu Val

6965 6970 6975

Ile Lys Glu Glu Asp Leu Ile Ser Ala Thr Thr Asp Pro Glu Asn Asp

6980 6985 6990

Thr Ile Thr Val Asn Ser Leu Val Leu Asp Gln Gly Gln Gly Gln Leu

6995 7000 7005

Gln Arg Phe Glu Asn Val Gly Gly Ala Asp Asp Ala Thr Ile Thr Gly

7010 7015 7020

Pro Tyr Trp Val Phe Thr Ala Ala Asn Glu Tyr Asn Gly Asp Val Lys

7025 7030 7035 7040

Phe Thr Tyr Thr Val Glu Asp Asp Gly Thr Thr Asn Gly Ala Asp Asp

7045 7050 7055

Phe Leu Thr Asp Thr Gly Glu Ile Ser Val Val Val Thr Glu Val Asn

7060 7065 7070

Asp Gln Pro Val Ala Thr Asp Ile Asp Leu Gly Asn Ile Leu Glu Glu

7075 7080 7085

Gly Gln Leu Ile Ile Lys Glu Glu Asp Leu Ile Ala Ala Thr Ser Asp

7090 7095 7100

Pro Glu Asn Asp Thr Ile Thr Val Thr Asn Leu Val Leu Asp Glu Gly

7105 7110 7115 7120

Gln Gly Gln Leu Gln Arg Phe Glu Asn Val Gly Gly Ala Asp Asp Ala

7125 7130 7135

Met Ile Thr Gly Pro Tyr Trp Ile Phe Thr Ala Ala Asp Glu Tyr Asn

7140 7145 7150

Gly Asn Val Lys Phe Thr Tyr Thr Val Glu Asp Asp Gly Thr Thr Asn

7155 7160 7165

Gly Ala Asn Asp Phe Leu Thr Asp Thr Ala Glu Ile Thr Ala Ile Val

7170 7175 7180

Asp Gly Val Asn Asp Thr Pro Val Val Asn Gly Asp Ser Val Thr Thr

7185 7190 7195 7200

Ile Val Asp Glu Asp Ala Gly Gln Leu Leu Ser Gly Ile Asn Val Ser

7205 7210 7215

Asp Pro Asp Tyr Val Asp Ala Phe Ser Asn Asp Leu Met Thr Val Thr

7220 7225 7230

Leu Thr Val Asp Tyr Gly Thr Leu Asn Val Ser Leu Pro Ala Val Thr

7235 7240 7245

Thr Val Met Val Asn Gly Asn Asn Thr Gly Ser Val Ile Leu Val Gly

7250 7255 7260

Thr Leu Ser Asp Leu Asn Ala Leu Ile Asp Thr Pro Thr Ser Pro Asn

7265 7270 7275 7280

Gly Val Tyr Leu Asp Ala Ser Leu Ser Pro Thr Asn Ser Ile Gly Leu

7285 7290 7295

Glu Val Ile Ala Lys Asp Ser Gly Asn Pro Ser Gly Ile Ala Ile Glu

7300 7305 7310

Thr Ala Pro Val Val Tyr Asn Ile Ala Val Thr Pro Val Ala Asn Ala

7315 7320 7325

Pro Thr Leu Ser Ile Asp Pro Ala Phe Asn Tyr Val Arg Asn Ile Thr

7330 7335 7340

Thr Ser Ser Ser Val Val Ala Asn Ser Gly Val Ala Leu Val Gly Ile

7345 7350 7355 7360

Val Ala Ala Leu Thr Asp Ile Thr Glu Glu Leu Thr Leu Lys Ile Ser

7365 7370 7375

Asp Val Pro Asp Gly Val Asp Val Thr Ser Asp Val Gly Thr Val Ser

7380 7385 7390

Leu Val Gly Asp Thr Trp Ile Ala Thr Ala Asp Ala Ile Asp Ser Leu

7395 7400 7405

Arg Leu Val Glu Gln Ser Ser Leu Gly Lys Pro Leu Thr Pro Gly Asn

7410 7415 7420

Tyr Thr Leu Lys Val Glu Ala Leu Ser Glu Glu Thr Asp Asn Asn Asp

7425 7430 7435 7440

Ile Ala Ile Ser Gln Asn Ile Asp Leu Asn Leu Asn Ile Val Ala Asn

7445 7450 7455

Pro Ile Asp Leu Asp Leu Ser Ser Glu Thr Asp Asp Val Gln Leu Leu

7460 7465 7470

Ala Ser Asn Phe Asp Thr Asn Leu Thr Gly Gly Thr Gly Asn Asp Arg

7475 7480 7485

Leu Val Gly Gly Ala Gly Asp Asp Thr Leu Val Gly Gly Asp Gly Asn

7490 7495 7500

Asp Thr Leu Ile Gly Gly Gly Gly Ser Asp Ile Leu Thr Gly Gly Asn

7505 7510 7515 7520

Gly Met Asp Ser Phe Val Trp Leu Asn Ile Glu Asp Gly Val Glu Asp

7525 7530 7535

Thr Ile Thr Asp Phe Ser Leu Ser Glu Gly Asp Gln Ile Asp Leu Arg

7540 7545 7550

Glu Val Leu Pro Glu Leu Lys Asn Thr Ser Pro Asp Met Ser Ala Leu

7555 7560 7565

Leu Gln Gln Ile Asp Ala Lys Val Glu Gly Asp Asp Ile Glu Leu Thr

7570 7575 7580

Ile Lys Ser Asp Gly Leu Gly Thr Thr Glu Gln Val Ile Val Val Glu

7585 7590 7595 7600

Asp Leu Ala Pro Gln Leu Thr Leu Ser Gly Thr Met Pro Ser Asp Ile

7605 7610 7615

Leu Asp Ala Leu Val Gln Gln Asn Val Ile Thr His Gly

7620 7625

<210>5

<211>765

<212>DNA

<213>灿烂弧菌

<400>5

atgaaaaaaa catcactatt acttgcttcc attactctgg cactttctgg tgtagtacaa 60

gctgaccagc tagaagacat tcaaaaatca ggcacacttc gcgtcggcac cacaggcgac 120

tacaaacctt tttcttactt cgacggcaaa acctactctg gttatgacat tgacgtagcc 180

aaacatgttg cagagcagtt gggcgttgaa ttacagattg ttcgtaccac atggaaagat 240

ctactgaccg atctagacag cgataaatac gacatcgcga tgggcggtat cacgcgtaaa 300

atgcagcgtc agttaaacgc agaacaaact caaggttaca tgacctttgg caagtgtttc 360

ttagttgcga aaggcaaagc agaacaatac aacagcattg agaaagtgaa cctctcttct 420

gtgcgtgttg gcgtcaatat cggtgggact aatgagatgt ttgcggatgc taacttgcaa 480

gacgcgagct ttacgcgtta cgagaacaac ctagacgttc cgcaagccgt tgcggaaggt 540

aaagttgatg taatggtgac agaaactcct gaaggtctgt tctatcaagt gacggacgaa 600

cgtcttgaag cggcacgctg tgaaacaccg tttaccaaca gtcaattcgg ttacctgata 660

ccaaaaggtg aacaacgctt gttgaacaca gtgaacttca ttatggatga gatgaaattg 720

aaaggcgtcg aagaagagtt cctgatccac aactctctta agtaa 765

<210>6

<211>254

<212>PRT

<213>灿烂弧菌

<400>6

Met Lys Lys Thr Ser Leu Leu Leu Ala Ser Ile Thr Leu Ala Leu Ser

1 5 10 15

Gly Val Val Gln Ala Asp Gln Leu Glu Asp Ile Gln Lys Ser Gly Thr

20 25 30

Leu Arg Val Gly Thr Thr Gly Asp Tyr Lys Pro Phe Ser Tyr Phe Asp

35 40 45

Gly Lys Thr Tyr Ser Gly Tyr Asp Ile Asp Val Ala Lys His Val Ala

50 55 60

Glu Gln Leu Gly Val Glu Leu Gln Ile Val Arg Thr Thr Trp Lys Asp

65 70 75 80

Leu Leu Thr Asp Leu Asp Ser Asp Lys Tyr Asp Ile Ala Met Gly Gly

85 90 95

Ile Thr Arg Lys Met Gln Arg Gln Leu Asn Ala Glu Gln Thr Gln Gly

100 105 110

Tyr Met Thr Phe Gly Lys Cys Phe Leu Val Ala Lys Gly Lys Ala Glu

115 120 125

Gln Tyr Asn Ser Ile Glu Lys Val Asn Leu Ser Ser Val Arg Val Gly

130 135 140

Val Asn Ile Gly Gly Thr Asn Glu Met Phe Ala Asp Ala Asn Leu Gln

145 150 155 160

Asp Ala Ser Phe Thr Arg Tyr Glu Asn Asn Leu Asp Val Pro Gln Ala

165 170 175

Val Ala Glu Gly Lys Val Asp Val Met Val Thr Glu Thr Pro Glu Gly

180 185 190

Leu Phe Tyr Gln Val Thr Asp Glu Arg Leu Glu Ala Ala Arg Cys Glu

195 200 205

Thr Pro Phe Thr Asn Ser Gln Phe Gly Tyr Leu Ile Pro Lys Gly Glu

210 215 220

Gln Arg Leu Leu Asn Thr Val Asn Phe Ile Met Asp Glu Met Lys Leu

225 230 235 240

Lys Gly Val Glu Glu Glu Phe Leu Ile His Asn Ser Leu Lys

245 250

<210>7

<211>765

<212>DNA

<213>灿烂弧菌

<400>7

atgaaaaaaa catcactatt acttgcttcc attactctgg cactttctgg tgtagtacaa 60

gctgaccagc tagaagacat tcaaaaatca ggcacacttc gcgtcggcac cacaggcgac 120

tacaaacctt tttcttactt cgacggcaaa acctactctg gttatgacat tgacgtagcc 180

aaacatgttg cagagcagtt gggcgttgaa ttacagattg ttcgtaccac atggaaagat 240

ctactgaccg atctagacag cgataaatac gacatcgcga tgggcggtat cacgcgtaaa 300

atgcagcgtc agttaaacgc agaacaaact caaggttaca tgacctttgg caagtgtttc 360

ttagttgcga aaggcaaagc agaacaatac aacagcattg agaaagtgaa cctctcttct 420

gtgcgtgttg gcgtcaatat cggtgggact aatgagatgt ttgcggatgc taacttgcaa 480

gacgcgagct ttacgcgtta cgagaacaac ctagacgttc cgcaagccgt tgcggaaggt 540

aaagttgatg taatggtgac agaaactcct gaaggtctgt tctatcaagt gacggacgaa 600

cgtcttgaag cggcacgctg tgaaacaccg tttaccaaca gtcaattcgg ttacctgata 660

ccaaaaggtg aacaacgctt gttgaacaca gtgaacttca ttatggatga gatgaaattg 720

aaaggcgtcg aagaagagtt cctgatccac aactctctta agtaa 765

<210>8

<211>588

<212>PRT

<213>灿烂弧菌

<400>8

Met Thr Ile Asp Thr Phe Val Val Leu Ala Tyr Phe Phe Phe Leu Ile

1 5 10 15

Ala Ile Gly Trp Met Phe Arg Lys Phe Thr Thr Ser Thr Ser Asp Tyr

20 25 30

Phe Arg Gly Gly Gly Lys Met Leu Trp Trp Met Val Gly Ala Thr Ala

35 40 45

Phe Met Thr Gln Phe Ser Ala Trp Thr Phe Thr Gly Ala Ala Gly Arg

50 55 60

Ala Phe Asn Asp Gly Phe Val Ile Val Ile Leu Phe Leu Ala Asn Ala

65 70 75 80

Phe Gly Tyr Phe Met Asn Tyr Met Tyr Phe Ala Pro Lys Phe Arg Gln

85 90 95

Leu Arg Val Val Thr Ala Ile Glu Ala Ile Arg Gln Arg Phe Gly Lys

100 105 110

Thr Ser Glu Gln Phe Phe Thr Trp Ala Gly Met Pro Asp Ser Leu Ile

115 120 125

Ser Ala Gly Ile Trp Leu Asn Gly Leu Ala Ile Phe Val Ala Ala Val

130 135 140

Phe Asn Ile Pro Met Glu Ala Thr Ile Val Val Thr Gly Met Val Leu

145 150 155 160

Val Leu Met Ala Val Thr Gly Gly Ser Trp Ala Val Val Ala Ser Asp

165 170 175

Phe Met Gln Met Leu Val Ile Met Ala Val Thr Ile Thr Cys Ala Val

180 185 190

Ala Ala Tyr Phe His Gly Gly Gly Leu Thr Asn Ile Val Ala Asn Phe

195 200 205

Asp Gly Asp Phe Met Leu Gly Asn Asn Leu Asn Tyr Met Ser Ile Phe

210 215 220

Val Leu Trp Val Val Phe Ile Phe Val Lys Gln Phe Gly Val Met Asn

225 230 235 240

Asn Ser Ile Asn Ala Tyr Arg Tyr Leu Cys Ala Lys Asp Ser Glu Asn

245 250 255

Ala Arg Lys Ala Ala Gly Leu Ala Cys Ile Leu Met Val Val Gly Pro

260 265 270

Leu Ile Trp Phe Leu Pro Pro Trp Tyr Val Ser Ala Phe Met Pro Asp

275 280 285

Phe Ala Leu Glu Tyr Ala Ser Met Gly Asp Lys Ala Gly Asp Ala Ala

290 295 300

Tyr Leu Ala Phe Val Gln Asn Val Met Pro Ala Gly Met Val Gly Leu

305 310 315 320

Leu Met Ser Ala Met Phe Ala Ala Thr Met Ser Ser Met Asp Ser Gly

325 330 335

Leu Asn Arg Asn Ala Gly Ile Phe Val Met Asn Phe Tyr Ser Pro Ile

340 345 350

Leu Arg Gln Asn Ala Thr Gln Lys Glu Leu Val Ile Val Ser Lys Leu

355 360 365

Thr Thr Ile Met Met Gly Ile Ile Ile Ile Ala Ile Gly Leu Phe Ile

370 375 380

Asn Ser Leu Arg His Leu Ser Leu Phe Asp Ile Val Met Asn Val Gly

385 390 395 400

Ala Leu Ile Gly Phe Pro Met Leu Ile Pro Val Leu Leu Gly Met Trp

405 410 415

Ile Arg Lys Thr Pro Asp Trp Ala Gly Trp Ser Thr Leu Ile Val Gly

420 425 430

Gly Phe Val Ser Tyr Ile Phe Gly Ile Ser Leu Gln Ala Glu Asp Ile

435 440 445

Glu His Leu Phe Gly Met Glu Thr Ala Leu Thr Gly Arg Glu Trp Ser

450 455 460

Asp Leu Lys Val Gly Leu Ser Leu Ala Ala His Val Val Phe Thr Gly

465 470 475 480

Gly Tyr Phe Ile Leu Thr Ser Arg Phe Tyr Lys Gly Leu Ser Pro Glu

485 490 495

Arg Glu Lys Glu Val Asp Gln Leu Phe Thr Asn Trp Asn Thr Pro Leu

500 505 510

Val Ala Glu Gly Glu Glu Gln Gln Asn Leu Asp Thr Lys Gln Arg Ser

515 520 525

Met Leu Gly Lys Leu Ile Ser Thr Ala Gly Phe Gly Ile Leu Ala Met

530 535 540

Ala Leu Ile Pro Asn Glu Pro Thr Gly Arg Leu Leu Phe Leu Leu Cys

545 550 555 560

Gly Ser Met Val Leu Thr Val Gly Ile Leu Leu Val Asn Ala Ser Lys

565 570 575

Ala Pro Ala Lys Met Asn Asn Glu Ser Val Ala Lys

580 585

<210>9

<211>627

<212>DNA

<213>灿烂弧菌

<400>9

atgacgacat taaatgaaca actagcaaac ctaaaagtaa ttcctgtaat cgcgatcaac 60

cgtgctgaag acgctatccc tctaggtaaa gcgttggttg aaaatggcat gccatgtgca 120

gaaattacac tacgtacaga atgtgcaatc gaagcgattc gcatcatgcg taaagaattc 180

ccagacatgc taatcggttc aggtactgta ctgactaacg agcaagttga cgcatctatc 240

gaagctggtg ttgatttcat cgtaagccca ggttttaacc cacgtactgt tcaatactgt 300

atcgataaag gtattgcaat cgtaccgggt gttaacaacc caagcctagt tgagcaagca 360

atggaaatgg gtcttcgcac gttgaagttc ttccctgctg agccttcagg cggtactggc 420

atgcttaaag cactaacagc agtttaccct gttaaattca tgcctactgg tggcgtaagc 480

ttgaagaatg ttgatgaata cctatcgatc ccttctgttc ttgcgtgtgg cggtacttgg 540

atggttccaa ctaaccttat cgatgaaggt aagtgggacg aactaggcaa gcttgttcgt 600

gacgcagttg atcacgttaa cgcttaa 627

<210>10

<211>208

<212>PRT

<213>灿烂弧菌

<400>10

Met Thr Thr Leu Asn Glu Gln Leu Ala Asn Leu Lys Val Ile Pro Val

1 5 10 15

Ile Ala Ile Asn Arg Ala Glu Asp Ala Ile Pro Leu Gly Lys Ala Leu

20 25 30

Val Glu Asn Gly Met Pro Cys Ala Glu Ile Thr Leu Arg Thr Glu Cys

35 40 45

Ala Ile Glu Ala Ile Arg Ile Met Arg Lys Glu Phe Pro Asp Met Leu

50 55 60

Ile Gly Ser Gly Thr Val Leu Thr Asn Glu Gln Val Asp Ala Ser Ile

65 70 75 80

Glu Ala Gly Val Asp Phe Ile Val Ser Pro Gly Phe Asn Pro Arg Thr

85 90 95

Val Gln Tyr Cys Ile Asp Lys Gly Ile Ala Ile Val Pro Gly Val Asn

100 105 110

Asn Pro Ser Leu Val Glu Gln Ala Met Glu Met Gly Leu Arg Thr Leu

115 120 125

Lys Phe Phe Pro Ala Glu Pro Ser Gly Gly Thr Gly Met Leu Lys Ala

130 135 140

Leu Thr Ala Val Tyr Pro Val Lys Phe Met Pro Thr Gly Gly Val Ser

145 150 155 160

Leu Lys Asn Val Asp Glu Tyr Leu Ser Ile Pro Ser Val Leu Ala Cys

165 170 175

Gly Gly Thr Trp Met Val Pro Thr Asn Leu Ile Asp Glu Gly Lys Trp

180 185 190

Asp Glu Leu Gly Lys Leu Val Arg Asp Ala Val Asp His Val Asn Ala

195 200 205

<210>11

<211>933

<212>DNA

<213>灿烂弧菌

<400>11

atgaaatcat taaacatcgc ggtcattggc gagtgcatgg ttgagctaca aaagaaacaa 60

gacgggctta agcaaagttt tggtggcgat acgctgaata ctgcacttta cttgtcacgc 120

ttaacaaaag agcaagatat caacacgagc tacgtaactg cactaggcac tgacccattc 180

agtaccgaca tgttaaaaaa ttggcaagcg gaaggtatcg acacgagctt aattgctcag 240

ctggaccaca aacaaccagg gctttactac atcgagaccg atgaaactgg tgaacgcagt 300

ttccactact ggcgtagtga tgctgcagcg aagttcatgt ttgatcagga agacacgcct 360

gctcttcttg ataagctgtt ctcttttgac gcgatttact taagtggtat tacgctggca 420

atcttgacag aaaatggtcg cacgcagcta ttcaacttct tagacaaatt caaagctcaa 480

ggcggccaag tattcttcga caataactac cgacctaaac tttgggaaag ccaacaagaa 540

gcgatttctt ggtacttgaa aatgcttaag tacacagata cggctctgct gacgtttgat 600

gatgagcaag agctatacgg cgacgaaagc attgaacaat gtattacacg tacgtcagag 660

tctggtgtga aagagatcgt cattaaacgt ggcgcgaaag actgcttagt ggttgaaagc 720

caaagcgctc aatacgttgc acccaaccct gtagacaaca tcgttgatac gactgccgct 780

ggcgactcgt tcagtgcagg cttcttggcc aagcgcttga gcggcggtag tgctcgtgat 840

gctgcatttg caggtcatat tgtggcagga accgtgattc agcatccagg tgctatcatt 900

cctctagaag cgacgcctga tctgtctcta taa 933

<210>12

<211>310

<212>PRT

<213>灿烂弧菌

<400>12

Met Lys Ser Leu Asn Ile Ala Val Ile Gly Glu Cys Met Val Glu Leu

1 5 10 15

Gln Lys Lys Gln Asp Gly Leu Lys Gln Ser Phe Gly Gly Asp Thr Leu

20 25 30

Asn Thr Ala Leu Tyr Leu Ser Arg Leu Thr Lys Glu Gln Asp Ile Asn

35 40 45

Thr Ser Tyr Val Thr Ala Leu Gly Thr Asp Pro Phe Ser Thr Asp Met

50 55 60

Leu Lys Asn Trp Gln Ala Glu Gly Ile Asp Thr Ser Leu Ile Ala Gln

65 70 75 80

Leu Asp His Lys Gln Pro Gly Leu Tyr Tyr Ile Glu Thr Asp Glu Thr

85 90 95

Gly Glu Arg Ser Phe His Tyr Trp Arg Ser Asp Ala Ala Ala Lys Phe

100 105 110

Met Phe Asp Gln Glu Asp Thr Pro Ala Leu Leu Asp Lys Leu Phe Ser

115 120 125

Phe Asp Ala Ile Tyr Leu Ser Gly Ile Thr Leu Ala Ile Leu Thr Glu

130 135 140

Asn Gly Arg Thr Gln Leu Phe Asn Phe Leu Asp Lys Phe Lys Ala Gln

145 150 155 160

Gly Gly Gln Val Phe Phe Asp Asn Asn Tyr Arg Pro Lys Leu Trp Glu

165 170 175

Ser Gln Gln Glu Ala Ile Ser Trp Tyr Leu Lys Met Leu Lys Tyr Thr

180 185 190

Asp Thr Ala Leu Leu Thr Phe Asp Asp Glu Gln Glu Leu Tyr Gly Asp

195 200 205

Glu Ser Ile Glu Gln Cys Ile Thr Arg Thr Ser Glu Ser Gly Val Lys

210 215 220

Glu Ile Val Ile Lys Arg Gly Ala Lys Asp Cys Leu Val Val Glu Ser

225 230 235 240

Gln Ser Ala Gln Tyr Val Ala Pro Asn Pro Val Asp Asn Ile Val Asp

245 250 255

Thr Thr Ala Ala Gly Asp Ser Phe Ser Ala Gly Phe Leu Ala Lys Arg

260 265 270

Leu Ser Gly Gly Ser Ala Arg Asp Ala Ala Phe Ala Gly His Ile Val

275 280 285

Ala Gly Thr Val Ile Gln His Pro Gly Ala Ile Ile Pro Leu Glu Ala

290 295 300

Thr Pro Asp Leu Ser Leu

305 310

<210>13

<211>336

<212>DNA

<213>灿烂弧菌

<400>13

atgaactctt tctttatcct agatgaaaat ccatgggaag aacttggtgg cggcattaag 60

cgtaaaatcg ttgcttacac tgacgatcta atggcagtac acctatgctt tgataagggc 120

gcgattggcc accctcatac tcacgaaatt cacgaccaaa tcggttatgt tgttcgtggt 180

agcttcgaag ctgaaatcga cggcgagaag aaagtgctta aagaaggcga tgcttacttc 240

gctcgtaaac acatgatgca cggtgcagtt gctctagaac aagacagcat ccttcttgat 300

atcttcaatc ctgcgcgtga agatttccta aaataa 336

<210>14

<211>111

<212>PRT

<213>灿烂弧菌

<400>14

Met Asn Ser Phe Phe Ile Leu Asp Glu Asn Pro Trp Glu Glu Leu Gly

1 5 10 15

Gly Gly Ile Lys Arg Lys Ile Val Ala Tyr Thr Asp Asp Leu Met Ala

20 25 30

Val His Leu Cys Phe Asp Lys Gly Ala Ile Gly His Pro His Thr His

35 40 45

Glu Ile His Asp Gln Ile Gly Tyr Val Val Arg Gly Ser Phe Glu Ala

50 55 60

Glu Ile Asp Gly Glu Lys Lys Val Leu Lys Glu Gly Asp Ala Tyr Phe

65 70 75 80

Ala Arg Lys His Met Met His Gly Ala Val Ala Leu Glu Gln Asp Ser

85 90 95

Ile Leu Leu Asp Ile Phe Asn Pro Ala Arg Glu Asp Phe Leu Lys

100 105 110

<210>15

<211>2208

<212>DNA

<213>灿烂弧菌

<400>15

atgacgacta aaccagtatt gttgactgaa gctgaaatcg aacagcttca tcttgaagtg 60

ggccgttcta gcttaatggg caaaaccatt gcagcgaacg cgaaagacct agaagcattc 120

atgcgtttac ctattgatgt tccaggtcac ggtgaagctg ggggttacga acataaccgc 180

cacaagcaaa attacacgta catgaaccta gctggtcgca tgttcttgat cactaaagag 240

caaaaatacg ctgactttgt tacagaatta ctagaagagt acgcagacaa atatctaacg 300

tttgattacc acgtacagaa aaacaccaac ccaacaggtc gtttgttcca ccaaatccta 360

aacgaacact gctggttaat gttctcaagc ttagcttatt cttgtgttgc ttcaacactg 420

acacaagatc agcgtgacaa tattgagtct cgcatttttg aacccatgct agaaatgttc 480

acggttaaat acgcacacga cttcgaccgt attcacaatc acggtatttg ggcagtagcc 540

gctgtgggta tctgtggtct tgctttaggc aaacgtgaat acctagaaat gtcagtgtac 600

ggcatcgacc gtaatgatac tggcggtttc ctagcgcaag tttctcagct atttgcacct 660

tctggctact acatggaagg tccttactac catcgttatg cgattcgccc aacgtgtgtg 720

ttcgctgaag tgattcaccg tcatatgcct gaagttgata tctacaacta caaaggcggc 780

gtgattggta acacagtaca agctatgctt gcgacagcgt acccgaacgg cgagttcccg 840

gctctgaatg atgcttctcg tactatgggt atcacagaca tgggtgttca ggttgcggtc 900

agtgtttaca gtaagcatta ctcttctgaa aacggtgtag accaaaacat tctgggtatg 960

gcgaagattc aagacgcagt atggatgcat ccatgtggtc ttgagctatc taaagcatac 1020

gaagccgcat ctgcagagaa agaaatcggc atgcctttct ggccaagtgt tgaattgaat 1080

gaaggccctc aaggtcacaa cggcgcgcaa ggctttatcc gtatgcagga taagaaaggc 1140

gacgtttctc aacttgtgat gaactacggc caacacggca tgggtcacgg caactttgat 1200

acgctgggta tttctttctt taaccgcggt caagaagtgc tacgtgaata cggcttctgt 1260

cgttgggtta acgttgagcc aaaattcggc ggccgttacc tagacgaaaa caaatcttac 1320

gctcgtcaaa cgattgctca caatgcagtt acgattgatg aaaaatgtca gaacaacttt 1380

gacgttgaac gtgcagactc agtacatggt ttacctcact tctttaaagt agaagacgat 1440

caaatcaacg gtatgagtgc atttgctaac gatcattacc aaggctttga catgcaacgc 1500

agcgtgttca tgctaaatct tgaagaatta gaatctccgt tattgttaga cctataccgc 1560

ttagattcta caaaaggcgg cgaaggcgag caccaatacg actattcaca ccaatatgcg 1620

ggtcagattg ttcgcactaa cttcgaatac caagcgaaca aagagctaaa cactctaggt 1680

gacgatttcg gttaccaaca tctatggaac gtcgcaagcg gtgaagtgaa gggcacagca 1740

attgtaagtt ggctacaaaa caacacctac tacacatggc taggtgcaac gtctaacgat 1800

aatgctgaag taatatttac tcgcactggc gctaacgacc caagtttcaa tctacgttca 1860

gagcctgcgt tcattctacg cagcaaaggc gaaacaacac tgtttgcttc tgttgttgaa 1920

acgcacggtt atttcaacga agaattcgag caatctgtca atgcacgtgg tgttgtgaaa 1980

gacatcaaag tcgtggctca caccaatgtc ggttcggtag ttgagatcac cacagagaaa 2040

tcaaacgtga cagtgatgat cagcaaccaa cttggcgcga ctgacagcac tgaacacaaa 2100

gtagaactga acggcaaagt atacagctgg aaaggcttct actcagtaga gacaacttta 2160

caagaaacga attcagaaga acttagcact gcagggcagg ggaaataa 2208

<210>16

<211>735

<212>PRT

<213>灿烂弧菌

<400>16

Met Thr Thr Lys Pro Val Leu Leu Thr Glu Ala Glu Ile Glu Gln Leu

1 5 10 15

His Leu Glu Val Gly Arg Ser Ser Leu Met Gly Lys Thr Ile Ala Ala

20 25 30

Asn Ala Lys Asp Leu Glu Ala Phe Met Arg Leu Pro Ile Asp Val Pro

35 40 45

Gly His Gly Glu Ala Gly Gly Tyr Glu His Asn Arg His Lys Gln Asn

50 55 60

Tyr Thr Tyr Met Asn Leu Ala Gly Arg Met Phe Leu Ile Thr Lys Glu

65 70 75 80

Gln Lys Tyr Ala Asp Phe Val Thr Glu Leu Leu Glu Glu Tyr Ala Asp

85 90 95

Lys Tyr Leu Thr Phe Asp Tyr His Val Gln Lys Asn Thr Asn Pro Thr

100 105 110

Gly Arg Leu Phe His Gln Ile Leu Asn Glu His Cys Trp Leu Met Phe

115 120 125

Ser Ser Leu Ala Tyr Ser Cys Val Ala Ser Thr Leu Thr Gln Asp Gln

130 135 140

Arg Asp Asn Ile Glu Ser Arg Ile Phe Glu Pro Met Leu Glu Met Phe

145 150 155 160

Thr Val Lys Tyr Ala His Asp Phe Asp Arg Ile His Asn His Gly Ile

165 170 175

Trp Ala Val Ala Ala Val Gly Ile Cys Gly Leu Ala Leu Gly Lys Arg

180 185 190

Glu Tyr Leu Glu Met Ser Val Tyr Gly Ile Asp Arg Asn Asp Thr Gly

195 200 205

Gly Phe Leu Ala Gln Val Ser Gln Leu Phe Ala Pro Ser Gly Tyr Tyr

210 215 220

Met Glu Gly Pro Tyr Tyr His Arg Tyr Ala Ile Arg Pro Thr Cys Val

225 230 235 240

Phe Ala Glu Val Ile His Arg His Met Pro Glu Val Asp Ile Tyr Asn

245 250 255

Tyr Lys Gly Gly Val Ile Gly Asn Thr Val Gln Ala Met Leu Ala Thr

260 265 270

Ala Tyr Pro Asn Gly Glu Phe Pro Ala Leu Asn Asp Ala Ser Arg Thr

275 280 285

Met Gly Ile Thr Asp Met Gly Val Gln Val Ala Val Ser Val Tyr Ser

290 295 300

Lys His Tyr Ser Ser Glu Asn Gly Val Asp Gln Asn Ile Leu Gly Met

305 310 315 320

Ala Lys Ile Gln Asp Ala Val Trp Met His Pro Cys Gly Leu Glu Leu

325 330 335

Ser Lys Ala Tyr Glu Ala Ala Ser Ala Glu Lys Glu Ile Gly Met Pro

340 345 350

Phe Trp Pro Ser Val Glu Leu Asn Glu Gly Pro Gln Gly His Asn Gly

355 360 365

Ala Gln Gly Phe Ile Arg Met Gln Asp Lys Lys Gly Asp Val Ser Gln

370 375 380

Leu Val Met Asn Tyr Gly Gln His Gly Met Gly His Gly Asn Phe Asp

385 390 395 400

Thr Leu Gly Ile Ser Phe Phe Asn Arg Gly Gln Glu Val Leu Arg Glu

405 410 415

Tyr Gly Phe Cys Arg Trp Val Asn Val Glu Pro Lys Phe Gly Gly Arg

420 425 430

Tyr Leu Asp Glu Asn Lys Ser Tyr Ala Arg Gln Thr Ile Ala His Asn

435 440 445

Ala Val Thr Ile Asp Glu Lys Cys Gln Asn Asn Phe Asp Val Glu Arg

450 455 460

Ala Asp Ser Val His Gly Leu Pro His Phe Phe Lys Val Glu Asp Asp

465 470 475 480

Gln Ile Asn Gly Met Ser Ala Phe Ala Asn Asp His Tyr Gln Gly Phe

485 490 495

Asp Met Gln Arg Ser Val Phe Met Leu Asn Leu Glu Glu Leu Glu Ser

500 505 510

Pro Leu Leu Leu Asp Leu Tyr Arg Leu Asp Ser Thr Lys Gly Gly Glu

515 520 525

Gly Glu His Gln Tyr Asp Tyr Ser His Gln Tyr Ala Gly Gln Ile Val

530 535 540

Arg Thr Asn Phe Glu Tyr Gln Ala Asn Lys Glu Leu Asn Thr Leu Gly

545 550 555 560

Asp Asp Phe Gly Tyr Gln His Leu Trp Asn Val Ala Ser Gly Glu Val

565 570 575

Lys Gly Thr Ala Ile Val Ser Trp Leu Gln Asn Asn Thr Tyr Tyr Thr

580 585 590

Trp Leu Gly Ala Thr Ser Asn Asp Asn Ala Glu ValIle Phe Thr Arg

595 600 605

Thr Gly Ala Asn Asp Pro Ser Phe Asn Leu Arg Ser Glu Pro Ala Phe

610 615 620

Ile Leu Arg Ser Lys Gly Glu Thr Thr Leu Phe Ala Ser Val Val Glu

625 630 635 640

Thr His Gly Tyr Phe Asn Glu Glu Phe Glu Gln Ser Val Asn Ala Arg

645 650 655

Gly Val Val Lys Asp Ile Lys Val Val Ala His Thr Asn Val Gly Ser

660 665 670

Val Val Glu Ile Thr Thr Glu Lys Ser Asn Val Thr Val Met Ile Ser

675 680 685

Asn Gln Leu Gly Ala Thr Asp Ser Thr Glu His Lys Val Glu Leu Asn

690 695 700

Gly Lys Val Tyr Ser Trp Lys Gly Phe Tyr Ser Val Glu Thr Thr Leu

705 710 715 720

Gln Glu Thr Asn Ser Glu Glu Leu Ser Thr Ala Gly Gln Gly Lys

725 730 735

<210>17

<211>2154

<212>DNA

<213>灿烂弧菌

<400>17

atgagctatc aaccactttt acttaacttt gatgaagcag ctgaacttcg taaagaactt 60

ggcaaggata gcctattagg taacgcactg actcgcgaca ttaaacaaac tgacgcttac 120

atggctgaag ttggcattga agtaccaggt cacggtgaag gcggcggtta cgagcacaac 180

cgtcataagc aaaactacat ccatatggat ctagcaggcc gtttgttcct tatcactgag 240

gaaacaaaat accgagatta catcgttgat atgctaacag cgtacgcgac ggtataccca 300

acacttgaaa gcaacgtaag ccgtgactct aaccctccgg gtaagctgtt ccaccaaacg 360

ttgaacgaga acatgtggat gctttacgct tcttgtgcgt acagctgcat ctaccacacg 420

atctctgaag agcaaaagcg tctgatcgaa gacgatcttc ttaagcaaat gatcgaaatg 480

ttcgttgtga cttacgcaca cgacttcgat atcgtacaca accacggctt atgggcagtg 540

gcagcagtag gtatctgtgg ttacgcaatc aacgatcaag agtctgtaga caaagcacta 600

tacggcctga aactagacaa agtcagcggc ggtttcttag cgcaactaga ccaactgttt 660

tcgccagacg gctactacat ggaaggtcct tactaccacc gtttctctct gcgtccaatc 720

tacctgttcg cagaagcgat tgaacgtcgt cagcctgaag ttggtatcta tgaattcaac 780

gattcagtga tcaagacaac gtcttactct gtattcaaaa cggcattccc agacggtaca 840

ttgcctgctc tgaacgattc atcgaagaca atctctatca acgatgaagg cgttatcatg 900

gcaacgtctg tgtgttacca ccgttacgag caaactgaaa ctctacttgg tatggctaac 960

caccagcaaa acgtttgggt tcatgcttca ggtaaaacac tgtctgacgc ggttgatgca 1020

gcagacgaca tcaaagcatt caactggggt agcctgtttg taaccgacgg ccctgaaggc 1080

gaaaaaggcg gcgtaagcat ccttcgtcac cgtgacgaac aagatgacga cacgatggcg 1140

ttgatctggt ttggtcaaca cggttctgat caccagtacc actctgctct agaccacggt 1200

cactacgatg gcctgcacct aagcgtattt aaccgtggcc acgaagtgct gcacgatttc 1260

ggcttcggtc gctgggtaaa cgttgagcct aagtttggcg gtcgttacat cccagagaac 1320

aagtcttact gtaagcagac ggttgctcac aacacagtaa cggttgatca gaaaacgcag 1380

aacaacttca acacagcatt ggctgagtct aagtttggtc agaagcactt cttcgtagca 1440

gacgaccagt ctctacaagg catgagcggc acaatttctg agtactacac tggcgtagac 1500

atgcaacgca gcgtgattct tgctgaactt cctgagttcg agaagccact tgtaatcgac 1560

gtataccgca tcgaagctga cgctgaacac cagtacgacc tacccgttca ccactctggt 1620

cagatcatcc gtactgactt cgattacaac atggaaaaaa cgcttaagcc gctaggtgaa 1680

gacaacggtt accagcactt atggaacgtg gcttcaggca aagtgaacga agaaggttct 1740

ctagtaagct ggctacatga cagcagctac tacagcctag taaccagcgc gaatgcgggc 1800

agcgaagtga tttttgctcg cactggtgct aacgatccag acttcaacct taagagtgag 1860

cctgcgttca tcttacgtca gtctggtcaa aaccacgtgt ttgcttctgt actagaaacg 1920

catggttact ttaacgagtc tatcgaagcc tctgtaggcg ctcgtggtct agttaaatca 1980

gtatctgttg tgggccataa cagtgtcggg actgttgttc gcattcagac tacttctggc 2040

aacacttacc actacggtat ctcaaaccaa gctgaagaca cgcagcaagc aactcacact 2100

gttgagttcg cgggtgagac atactcgtgg gaaggatcat ttgctcaact gtaa 2154

<210>18

<211>717

<212>PRT

<213>灿烂弧菌

<400>18

Met Ser Tyr Gln Pro Leu Leu Leu Asn Phe Asp Glu Ala Ala Glu Leu

1 5 10 15

Arg Lys Glu Leu Gly Lys Asp Ser Leu Leu Gly Asn Ala Leu Thr Arg

20 25 30

Asp Ile Lys Gln Thr Asp Ala Tyr Met Ala Glu Val Gly Ile Glu Val

35 40 45

Pro Gly His Gly Glu Gly Gly Gly Tyr Glu His Asn Arg His Lys Gln

50 55 60

Asn Tyr Ile His Met Asp Leu Ala Gly Arg Leu Phe Leu Ile Thr Glu

65 70 75 80

Glu Thr Lys Tyr Arg Asp Tyr Ile Val Asp Met Leu Thr Ala Tyr Ala

85 90 95

Thr Val Tyr Pro Thr Leu Glu Ser Asn Val Ser Arg Asp Ser Asn Pro

100 105 110

Pro Gly Lys Leu Phe His Gln Thr Leu Asn Glu Asn Met Trp Met Leu

115 120 125

Tyr Ala Ser Cys Ala Tyr Ser Cys Ile Tyr His Thr Ile Ser Glu Glu

130 135 140

Gln Lys Arg Leu Ile Glu Asp Asp Leu Leu Lys Gln Met Ile Glu Met

145 150 155 160

Phe Val Val Thr Tyr Ala His Asp Phe Asp Ile Val His Asn His Gly

165 170 175

Leu Trp Ala Val Ala Ala Val Gly Ile Cys Gly Tyr Ala Ile Asn Asp

180 185 190

Gln Glu Ser Val Asp Lys Ala Leu Tyr Gly Leu Lys Leu Asp Lys Val

195 200 205

Ser Gly Gly Phe Leu Ala Gln Leu Asp Gln Leu Phe Ser Pro Asp Gly

210 215 220

Tyr Tyr Met Glu Gly Pro Tyr Tyr His Arg Phe Ser Leu Arg Pro Ile

225 230 235 240

Tyr Leu Phe Ala Glu Ala Ile Glu Arg Arg Gln Pro Glu Val Gly Ile

245 250 255

Tyr Glu Phe Asn Asp Ser Val Ile Lys Thr Thr Ser Tyr Ser Val Phe

260 265 270

Lys Thr Ala Phe Pro Asp Gly Thr Leu Pro Ala Leu Asn Asp Ser Ser

275 280 285

Lys Thr Ile Ser Ile Asn Asp Glu Gly Val Ile Met Ala Thr Ser Val

290 295 300

Cys Tyr His Arg Tyr Glu Gln Thr Glu Thr Leu Leu Gly Met Ala Asn

305 310 315 320

His Gln Gln Asn Val Trp Val His Ala Ser Gly Lys Thr Leu Ser Asp

325 330 335

Ala Val Asp Ala Ala Asp Asp Ile Lys Ala Phe Asn Trp Gly Ser Leu

340 345 350

Phe Val Thr Asp Gly Pro Glu Gly Glu Lys Gly Gly Val Ser Ile Leu

355 360 365

Arg His Arg Asp Glu Gln Asp Asp Asp Thr Met Ala Leu Ile Trp Phe

370 375 380

Gly Gln His Gly Ser Asp His Gln Tyr His Ser Ala Leu Asp His Gly

385 390 395 400

His Tyr Asp Gly Leu His Leu Ser Val Phe Asn Arg Gly His Glu Val

405 410 415

Leu His Asp Phe Gly Phe Gly Arg Trp Val Asn Val Glu Pro Lys Phe

420 425 430

Gly Gly Arg Tyr Ile Pro Glu Asn Lys Ser Tyr Cys Lys Gln Thr Val

435 440 445

Ala His Asn Thr Val Thr Val Asp Gln Lys Thr Gln Asn Asn Phe Asn

450 455 460

Thr Ala Leu Ala Glu Ser Lys Phe Gly Gln Lys His Phe Phe Val Ala

465 470 475 480

Asp Asp Gln Ser Leu Gln Gly Met Ser Gly Thr Ile Ser Glu Tyr Tyr

485 490 495

Thr Gly Val Asp Met Gln Arg Ser Val Ile Leu Ala Glu Leu Pro Glu

500 505 510

Phe Glu Lys Pro Leu Val Ile Asp Val Tyr Arg Ile Glu Ala Asp Ala

515 520 525

Glu His Gln Tyr Asp Leu Pro Val His His Ser Gly Gln Ile Ile Arg

530 535 540

Thr Asp Phe Asp Tyr Asn Met Glu Lys Thr Leu Lys Pro Leu Gly Glu

545 550 555 560

Asp Asn Gly Tyr Gln His Leu Trp Asn Val Ala Ser Gly Lys Val Asn

565 570 575

Glu Glu Gly Ser Leu Val Ser Trp Leu His Asp Ser Ser Tyr Tyr Ser

580 585 590

Leu Val Thr Ser Ala Asn Ala Gly Ser Glu Val Ile Phe Ala Arg Thr

595 600 605

Gly Ala Asn Asp Pro Asp Phe Asn Leu Lys Ser Glu Pro Ala Phe Ile

610 615 620

Leu Arg Gln Ser Gly Gln Asn His Val Phe Ala Ser Val Leu Glu Thr

625 630 635 640

His Gly Tyr Phe Asn Glu Ser Ile Glu Ala Ser Val Gly Ala Arg Gly

645 650 655

Leu Val Lys Ser Val Ser Val Val Gly His Asn Ser Val Gly Thr Val

660 665 670

Val Arg Ile Gln Thr Thr Ser Gly Asn Thr Tyr His Tyr Gly Ile Ser

675 680 685

Asn Gln Ala Glu Asp Thr Gln Gln Ala Thr His Thr Val Glu Phe Ala

690 695 700

Gly Glu Thr Tyr Ser Trp Glu Gly Ser Phe Ala Gln Leu

705 710 715

<210>19

<211>825

<212>DNA

<213>灿烂弧菌

<400>19

atgaagtggt tattggcaat agttgcgatg tctggtgtcg cattggcggc agaaaataag 60

aatgttgagg tgagcagtga gcatttcgtc cgttatcaat accaagacaa aatcagctat 120

ggaaagctag acaatgacgc agtgttaccg gtcagcggcg atctctttgg cgaatattcg 180

gtagcaaaaa attcgatccc gttagagtcg gttgaggtgt tactaccgac aaaaccagag 240

aaagtcttcg ccgtcgggat gaacttcgct agccacttag cctcacctgc cgatgcacca 300

ccgccgatgt ttcttaaact tccttcttct ttgattctca cgggcgaagt gattcaagtg 360

ccaccaaaag caagaaatgt tcattttgaa ggcgagctgg tggttgtgat tggtagagag 420

ctcagtcaag ccagtgaaga agaagccgaa caagcgatct ttggcgtcac ggtgggcaac 480

gatattactg aaagaagttg gcaaggcgcc gatttacaat ggctccgagc gaaagcttcc 540

gatggttttg gcccggttgg caacacaatt gtgcgcggca ttgattacaa caatattgag 600

ttaaccactc gtgttaacgg taaagtggtt caacaagaaa atacttcgtt catgatccac 660

aagccaagaa aagtcgtgag ctatttgagc tattatttta ccctcaaacc gggcgatcta 720

attttcatgg gcacgccagg tagaacttat gctctgtccg acaaagatca agtgagtgtc 780

acgattgaag gggtagggac tgtggtaaat gaagtgcggt tctga 825

<210>20

<211>274

<212>PRT

<213>灿烂弧菌

<400>20

Met Lys Trp Leu Leu Ala Ile Val Ala Met Ser Gly Val Ala Leu Ala

1 5 10 15

Ala Glu Asn Lys Asn Val Glu Val Ser Ser Glu His Phe Val Arg Tyr

20 25 30

Gln Tyr Gln Asp Lys Ile Ser Tyr Gly Lys Leu Asp Asn Asp Ala Val

35 40 45

Leu Pro Val Ser Gly Asp Leu Phe Gly Glu Tyr Ser Val Ala Lys Asn

50 55 60

Ser Ile Pro Leu Glu Ser Val Glu Val Leu Leu Pro Thr Lys Pro Glu

65 70 75 80

Lys Val Phe Ala Val Gly Met Asn Phe Ala Ser His Leu Ala Ser Pro

85 90 95

Ala Asp Ala Pro Pro Pro Met Phe Leu Lys Leu Pro Ser Ser Leu Ile

100 105 110

Leu Thr Gly Glu Val Ile Gln Val Pro Pro Lys Ala Arg Asn Val His

115 120 125

Phe Glu Gly Glu Leu Val Val Val Ile Gly Arg Glu Leu Ser Gln Ala

130 135 140

Ser Glu Glu Glu Ala Glu Gln Ala Ile Phe Gly Val Thr Val Gly Asn

145 150 155 160

Asp Ile Thr Glu Arg Ser Trp Gln Gly Ala Asp Leu Gln Trp Leu Arg

165 170 175

Ala Lys Ala Ser Asp Gly Phe Gly Pro Val Gly Asn Thr Ile Val Arg

180 185 190

Gly Ile Asp Tyr Asn Asn Ile Glu Leu Thr Thr Arg Val Asn Gly Lys

195 200 205

Val Val Gln Gln Glu Asn Thr Ser Phe Met Ile His Lys Pro Arg Lys

210 215 220

Val Val Ser Tyr Leu Ser Tyr Tyr Phe Thr Leu Lys Pro Gly Asp Leu

225 230 235 240

Ile Phe Met Gly Thr Pro Gly Arg Thr Tyr Ala Leu Ser Asp Lys Asp

245 250 255

Gln Val Ser Val Thr Ile Glu Gly Val Gly Thr Val Val Asn Glu Val

260 265 270

Arg Phe

<210>21

<211>717

<212>DNA

<213>灿烂弧菌

<400>21

atggctagca cttttaattc aatttcgggc tcgaagcgta gcctgcacgt gcaagtagca 60

cgcgaaatcg ctcgaggaat tttgtctggt gatctgccgc aaggttctat tattcctggt 120

gaaatggcgt tgtgtgaaca gtttggtatc agccgaacgg cacttcgtga agcagttaaa 180

ctactgacct ctaaaggtct gttagagtct cgccctaaaa ttggtactcg cgtagtcgac 240

cgcgcatact ggaacttcct tgatcctcaa ctgattgaat ggatggacgg actaaccgac 300

gtagaccaat tctgttctca gtttttaggc cttcgccgtg cgatcgagcc tgaagcgtgt 360

gcactggcgg caaaatttgc gacagctgaa caacgtatcg agctttcaga gatcttccaa 420

aagatggtcg aagtggatga agctgaagtg tttgaccaag aacgttggac agacattgat 480

actcgtttcc atagcttgat cttcaatgcg accggtaacg acttctatct accgttcggt 540

aatattctga ctactatgtt cgttaacttc atagtgcatt cttctgaaga gggaagcaca 600

tgcatcaatg aacaccgcag aatctatgaa gctatcatgg ccggtgattg tgacaaggct 660

agaattgctt ctgctgttca cttgcaagat gccaaccacc gtttggcaac agcataa 717

<210>22

<211>238

<212>PRT

<213>灿烂弧菌

<400>22

Met Ala Ser Thr Phe Asn Ser Ile Ser Gly Ser Lys Arg Ser Leu His

1 5 10 15

Val Gln Val Ala Arg Glu Ile Ala Arg Gly Ile Leu Ser Gly Asp Leu

20 25 30

Pro Gln Gly Ser Ile Ile Pro Gly Glu Met Ala Leu Cys Glu Gln Phe

35 40 45

Gly Ile Ser Arg Thr Ala Leu Arg Glu Ala Val Lys Leu Leu Thr Ser

50 55 60

Lys Gly Leu Leu Glu Ser Arg Pro Lys Ile Gly Thr Arg Val Val Asp

65 70 75 80

Arg Ala Tyr Trp Asn Phe Leu Asp Pro Gln Leu Ile Glu Trp Met Asp

85 90 95

Gly Leu Thr Asp Val Asp Gln Phe Cys Ser Gln Phe Leu Gly Leu Arg

100 105 110

Arg Ala Ile Glu Pro Glu Ala Cys Ala Leu Ala Ala Lys Phe Ala Thr

115 120 125

Ala Glu Gln Arg Ile Glu Leu Ser Glu Ile Phe Gln Lys Met Val Glu

130 135 140

Val Asp Glu Ala Glu Val Phe Asp Gln Glu Arg Trp Thr Asp Ile Asp

145 150 155 160

Thr Arg Phe His Ser Leu Ile Phe Asn Ala Thr Gly Asn Asp Phe Tyr

165 170 175

Leu Pro Phe Gly Asn Ile Leu Thr Thr Met Phe Val Asn Phe Ile Val

180 185 190

His Ser Ser Glu Glu Gly Ser Thr Cys Ile Asn Glu His Arg Arg Ile

195 200 205

Tyr Glu Ala Ile Met Ala Gly Asp Cys Asp Lys Ala Arg Ile Ala Ser

210 215 220

Ala Val His Leu Gln Asp Ala Asn His Arg Leu Ala Thr Ala

225 230 235

<210>23

<211>1779

<212>DNA

<213>灿烂弧菌

<400>23

atggaactca acacgattat tgtcggcatt tatttcctat tcttgattgc gataggttgg 60

atgtttagaa catttacaag tactactagt gactacttcc gcgggggcgg taacatgttg 120

tggtggatgg ttggtgcaac cgcctttatg acccagttta gtgcatggac attcaccggt 180

gcagcaggta aagcgtataa cgatggtttc gctgtagcgg tcatcttcgt agccaacgca 240

tttggttact tcatgaacta cgcgtacttc gcgccgaaat tccgtcaact tcgcgttgtt 300

acggtaatcg aagcgattcg tatgcgtttt ggtgcgacca acgaacaagt attcacttgg 360

tcttcaatgc caaactcagt ggtatctgcg ggtgtgtggt taaacgcatt ggcaatcatc 420

gcttcgggta tcttcggttt cgacatgaac atgactatct gggtgactgg cctagtggta 480

ttggcaatgt cggtaacagg tggttcatgg gcggtaatcg catctgactt catgcagatg 540

gttatcatca tggcggtaac ggtaacttgt gcggttgtag cggttgttca aggtggcggt 600

gttggtgaga ttgttaacaa cttcccagta caagatggtg gttcgttcct ttggggcaac 660

aacatcaact acctaagcat ctttacgatt tgggcattct tcatcttcgt taagcagttc 720

tcaatcacga acaacatgct taactcttac cgttacctag cggctaaaga ctcaaagaac 780

gctaagaaag ctgcactgct tgcttgtgtg ttgatgttgt gtggtgtgtt tatttggttc 840

atgccttctt ggttcattgc aggccaaggt gttgatttat cagcggctta cccgaatgca 900

ggtaaaaaag cgggtgactt tgcttaccta tacttcgtac aagagtacat gccagcaggt 960

atggttggtc tattagttgc cgcgatgttt gcagcgacaa tgtcttcaat ggactcaggt 1020

ctaaaccgta actcaggtat ttttgttaag aacttctacg aaacaatcgt tcgtaaaggt 1080

caagcatcag agaaagagct agtaaccgta tctaaaatta cttcagcggt atttggtttc 1140

gctattatcc taatcgcaca gttcatcaac tcattaaaag gcttaagcct gtttgatacg 1200

atgatgtacg taggtgcgtt aatcggcttc cctatgacga ttcctgcatt ccttggtttc 1260

ttcatcaaga agactccgga ctgggctggt tggggaacgc tagttgttgg tggtatcgta 1320

tcttatgtgg ttggttttgt tatcaacgcg gagatggtag cagcggcgtt tggtcttgat 1380

actctaacag gacgtgaatg gtctgatgtt aaagttgcga ttggtctgat tgctcacatc 1440

acgctaaccg gtggcttctt cgtactatct acgatgttct acaagcctct atcaaaagaa 1500

cgtcaagcgg atgttgataa gttctttggc aacttagata ccccattagt agctgaatcg 1560

gcagagcaaa aagtgttgga taacaaacaa cgtcaaatgc ttggtaaact gattgcggta 1620

gcgggtgttg gtattatgct gatggctctt ctgactaacc caatgtgggg gcgcctagtc 1680

ttcatcttat gtggtgtgat agtgggtggt gtcggtattc tacttgtgaa agcggtcgat 1740

gacggcggca agcaagcgaa agcagtaacc gaaagctaa 1779

<210>24

<211>592

<212>PRT

<213>灿烂弧菌

<400>24

Met Glu Leu Asn Thr Ile Ile Val Gly Ile Tyr Phe Leu Phe Leu Ile

1 5 10 15

Ala Ile Gly Trp Met Phe Arg Thr Phe Thr Ser Thr Thr Ser Asp Tyr

20 25 30

Phe Arg Gly Gly Gly Asn Met Leu Trp Trp Met Val Gly Ala Thr Ala

35 40 45

Phe Met Thr Gln Phe Ser Ala Trp Thr Phe Thr Gly Ala Ala Gly Lys

50 55 60

Ala Tyr Asn Asp Gly Phe Ala Val Ala Val Ile Phe Val Ala Asn Ala

65 70 75 80

Phe Gly Tyr Phe Met Asn Tyr Ala Tyr Phe Ala Pro Lys Phe Arg Gln

85 90 95

Leu Arg Val Val Thr Val Ile Glu Ala Ile Arg Met Arg Phe Gly Ala

100 105 110

Thr Asn Glu Gln Val Phe Thr Trp Ser Ser Met Pro Asn Ser Val Val

115 120 125

Ser Ala Gly Val Trp Leu Asn Ala Leu Ala Ile Ile Ala Ser Gly Ile

130 135 140

Phe Gly Phe Asp Met Asn Met Thr Ile Trp Val Thr Gly Leu Val Val

145 150 155 160

Leu Ala Met Ser Val Thr Gly Gly Ser Trp Ala Val Ile Ala Ser Asp

165 170 175

Phe Met Gln Met Val Ile Ile Met Ala Val Thr Val Thr Cys Ala Val

180 185 190

Val Ala Val Val Gln Gly Gly Gly Val Gly Glu Ile Val Asn Asn Phe

195 200 205

Pro Val Gln Asp Gly Gly Ser Phe Leu Trp Gly Asn Asn Ile Asn Tyr

210 215 220

Leu Ser Ile Phe Thr Ile Trp Ala Phe Phe Ile Phe Val Lys Gln Phe

225 230 235 240

Ser Ile Thr Asn Asn Met Leu Asn Ser Tyr Arg Tyr Leu Ala Ala Lys

245 250 255

Asp Ser Lys Asn Ala Lys Lys Ala Ala Leu Leu Ala Cys Val Leu Met

260 265 270

Leu Cys Gly Val Phe Ile Trp Phe Met Pro Ser Trp Phe Ile Ala Gly

275 280 285

Gln Gly Val Asp Leu Ser Ala Ala Tyr Pro Asn Ala Gly Lys Lys Ala

290 295 300

Gly Asp Phe Ala Tyr Leu Tyr Phe Val Gln Glu Tyr Met Pro Ala Gly

305 310 315 320

Met Val Gly Leu Leu Val Ala Ala Met Phe Ala Ala Thr Met Ser Ser

325 330 335

Met Asp Ser Gly Leu Asn Arg Asn Ser Gly Ile Phe Val Lys Asn Phe

340 345 350

Tyr Glu Thr Ile Val Arg Lys Gly Gln Ala Ser Glu Lys Glu Leu Val

355 360 365

Thr Val Ser Lys Ile Thr Ser Ala Val Phe Gly Phe Ala Ile Ile Leu

370 375 380

Ile Ala Gln Phe Ile Asn Ser Leu Lys Gly Leu Ser Leu Phe Asp Thr

385 390 395 400

Met Met Tyr Val Gly Ala Leu Ile Gly Phe Pro Met Thr Ile Pro Ala

405 410 415

Phe Leu Gly Phe Phe Ile Lys Lys Thr Pro Asp Trp Ala Gly Trp Gly

420 425 430

Thr Leu Val Val Gly Gly Ile Val Ser Tyr Val Val Gly Phe Val Ile

435 440 445

Asn Ala Glu Met Val Ala Ala Ala Phe Gly Leu Asp Thr Leu Thr Gly

450 455 460

Arg Glu Trp Ser Asp Val Lys Val Ala Ile Gly Leu Ile Ala His Ile

465 470 475 480

Thr Leu Thr Gly Gly Phe Phe Val Leu Ser Thr Met Phe Tyr Lys Pro

485 490 495

Leu Ser Lys Glu Arg Gln Ala Asp Val Asp Lys Phe Phe Gly Asn Leu

500 505 510

Asp Thr Pro Leu Val Ala Glu Ser Ala Glu Gln Lys Val Leu Asp Asn

515 520 525

Lys Gln Arg Gln Met Leu Gly Lys Leu Ile Ala Val Ala Gly Val Gly

530 535 540

Ile Met Leu Met Ala Leu Leu Thr Asn Pro Met Trp Gly Arg Leu Val

545 550 555 560

Phe Ile Leu Cys Gly Val Ile Val Gly Gly Val Gly Ile Leu Leu Val

565 570 575

Lys Ala Val Asp Asp Gly Gly Lys Gln Ala Lys Ala Val Thr Glu Ser

580 585 590

<210>25

<211>2079

<212>DNA

<213>灿烂弧菌

<400>25

atgagcgacc aaaaatctct tgatgcaatc aggaagatga agctggaaaa cgatacttca 60

gcaggtaatc ttgtagacct actccctatc gaagttcaaa cacgtgactt cgacctatca 120

ttcctagaca ccttgagcga agcacgtccg cgtcttcttg ttcaagctga tcagctagaa 180

gaattcaaag caaaagtgaa agctgatcaa gctcactgta tgtttgatga tttctacaac 240

aactctaccg ttaagttcct tgagactgct cctttcgaag agcctcaagc gtacccagct 300

gagacggtag gtaaagcttc tctatggcgt ccttattggc gtcaaatgta cgttgattgc 360

caaatggcac tgaacgcgac acgtaaccta gcgattgctg gtgttgtaaa agaagacgaa 420

gcgctcattg cgaaagcaaa agcttggact ctaaaactgt ctacgtacga tccagaaggc 480

gtgacttctc gtggctataa cgatgaagcg gctttccgtg ttatcgctgc tatggcttgg 540

ggttacgatt ggctacacgg ctacttcacc gatgaagaac gccagcaagt tcaagatgct 600

ttgattgagc gtctagacga aatcatgcac cacctgaaag tgacggttga tctattgaac 660

aacccactaa atagccacgg tgttcgttct atctcttctg ctatcatccc aacgtgtatc 720

gcgctttacc acgatcaccc gaaagcaggc gagtacattg catacgcgct agaatactac 780

gcagtacatt acccaccatg gggcggtgta gacggcggtt gggctgaagg tcctgattac 840

tggaacacgc aaactgcatt cctaggcgaa gcattcgacc tattgaaagc atactgtggt 900

gtagacatgt ttaacaaaac attctacgaa aacacaggtg atttcccgct ttactgcatg 960

ccagttcact ctaagcgcgc gagcttctgt gaccagtctt caatcggcga tttcccaggt 1020

ttaaaactgg cttacaacat caagcactac gcaggtgtta accagaagcc tgagtacgtt 1080

tggtactata accagcttaa aggccgtgat actgaagcac acaccaaatt ctacaacttc 1140

ggttggtggg acttcggtta tgacgatctt cgttttaact tcctttggga tgcacctgaa 1200

gagaaagccc catcgaacga tccactgttg aaagtattcc caatcacggg ttgggctgca 1260

ttccacaaca agatgactga gcgtgataac catattcaca tggtattcaa atgttctccg 1320

tttggctcaa tcagccactc tcacggtgac caaaacgcat ttacgcttca cgcatttggt 1380

gaaacgctag cgtcagtaac aggttactat ggtggtttcg gtgtagacat gcacacgaaa 1440

tggcgtcgtc aaacgttctc taaaaacctg ccactatttg gcggtaaagg tcagtacggc 1500

gagaacaaga acacaggcta cgaaaaccac caagatcgct tttgtatcga agcgggcggc 1560

actatctctg acttcgacac tgaatctgat gtgaagatgg ttgaaggtga tgcaacggca 1620

tcttacaagt acttcgttcc tgaaatcgaa tcttacaagc gtaaagtctg gttcgttcaa 1680

ggtaaagtct tcgtaatgca agacaaggca acgctttctg aagagaaaga catgacttgg 1740

ctaatgcaca caactttcgc aaacgaagtg gcagacaagt ctttcactat ccgtggcgaa 1800

gttgcgcacc tagacgtaaa cttcatcaac gagtctgctg ataacatcac gtcagttaag 1860

aacgttgaag gctttggcga agttgaccca tacgagttca aagatcttga gatccaccgt 1920

cacgtggaag tggaattcaa gccatcgaaa gagcacaaca tcctgacgct tcttgttcct 1980

aataagaatg aaggcgagca agttgaagtg tttcacaagc ttgaaggcaa cacgctactg 2040

ctaaatgttg acggcgaaac ggtttcaatc gaactgtaa 2079

<210>26

<211>692

<212>PRT

<213>灿烂弧菌

<400>26

Met Ser Asp Gln Lys Ser Leu Asp Ala Ile Arg Lys Met Lys Leu Glu

1 5 10 15

Asn Asp Thr Ser Ala Gly Asn Leu Val Asp Leu Leu Pro Ile Glu Val

20 25 30

Gln Thr Arg Asp Phe Asp Leu Ser Phe Leu Asp Thr Leu Ser Glu Ala

35 40 45

Arg Pro Arg Leu Leu Val Gln Ala Asp Gln Leu Glu Glu Phe Lys Ala

50 55 60

Lys Val Lys Ala Asp Gln Ala His Cys Met Phe Asp Asp Phe Tyr Asn

65 70 75 80

Asn Ser Thr Val Lys Phe Leu Glu Thr Ala Pro Phe Glu Glu Pro Gln

85 90 95

Ala Tyr Pro Ala Glu Thr Val Gly Lys Ala Ser Leu Trp Arg Pro Tyr

100 105 110

Trp Arg Gln Met Tyr Val Asp Cys Gln Met Ala Leu Asn Ala Thr Arg

115 120 125

Asn Leu Ala Ile Ala Gly Val Val Lys Glu Asp Glu Ala Leu Ile Ala

130 135 140

Lys Ala Lys Ala Trp Thr Leu Lys Leu Ser Thr Tyr Asp Pro Glu Gly

145 150 155 160

Val Thr Ser Arg Gly Tyr Asn Asp Glu Ala Ala Phe Arg Val Ile Ala

165 170 175

Ala Met Ala Trp Gly Tyr Asp Trp Leu His Gly Tyr Phe Thr Asp Glu

180 185 190

Glu Arg Gln Gln Val Gln Asp Ala Leu Ile Glu Arg Leu Asp Glu Ile

195 200 205

Met His His Leu Lys Val Thr Val Asp Leu Leu Asn Asn Pro Leu Asn

210 215 220

Ser His Gly Val Arg Ser Ile Ser Ser Ala Ile Ile Pro Thr Cys Ile

225 230 235 240

Ala Leu Tyr His Asp His Pro Lys Ala Gly Glu Tyr Ile Ala Tyr Ala

245 250 255

Leu Glu Tyr Tyr Ala Val His Tyr Pro Pro Trp Gly Gly Val Asp Gly

260 265 270

Gly Trp Ala Glu Gly Pro Asp Tyr Trp Asn Thr Gln Thr Ala Phe Leu

275 280 285

Gly Glu Ala Phe Asp Leu Leu Lys Ala Tyr Cys Gly Val Asp Met Phe

290 295 300

Asn Lys Thr Phe Tyr Glu Asn Thr Gly Asp Phe Pro Leu Tyr Cys Met

305 310 315 320

Pro Val His Ser Lys Arg Ala Ser Phe Cys Asp Gln Ser Ser Ile Gly

325 330 335

Asp Phe Pro Gly Leu Lys Leu Ala Tyr Asn Ile Lys His Tyr Ala Gly

340 345 350

Val Asn Gln Lys Pro Glu Tyr Val Trp Tyr Tyr Asn Gln Leu Lys Gly

355 360 365

Arg Asp Thr Glu Ala His Thr Lys Phe Tyr Asn Phe Gly Trp Trp Asp

370 375 380

Phe Gly Tyr Asp Asp Leu Arg Phe Asn Phe Leu Trp Asp Ala Pro Glu

385 390 395 400

Glu Lys Ala Pro Ser Asn Asp Pro Leu Leu Lys Val Phe Pro Ile Thr

405 410 415

Gly Trp Ala Ala Phe His Asn Lys Met Thr Glu Arg Asp Asn His Ile

420 425 430

His Met Val Phe Lys Cys Ser Pro Phe Gly Ser Ile Ser His Ser His

435 440 445

Gly Asp Gln Asn Ala Phe Thr Leu His Ala Phe Gly Glu Thr Leu Ala

450 455 460

Ser Val Thr Gly Tyr Tyr Gly Gly Phe Gly Val Asp Met His Thr Lys

465 470 475 480

Trp Arg Arg Gln Thr Phe Ser Lys Asn Leu Pro Leu Phe Gly Gly Lys

485 490 495

Gly Gln Tyr Gly Glu Asn Lys Asn Thr Gly Tyr Glu Asn His Gln Asp

500 505 510

Arg Phe Cys Ile Glu Ala Gly Gly Thr Ile Ser Asp Phe Asp Thr Glu

515 520 525

Ser Asp Val Lys Met Val Glu Gly Asp Ala Thr Ala Ser Tyr Lys Tyr

530 535 540

Phe Val Pro Glu Ile Glu Ser Tyr Lys Arg Lys Val Trp Phe Val Gln

545 550 555 560

Gly Lys Val Phe Val Met Gln Asp Lys Ala Thr Leu Ser Glu Glu Lys

565 570 575

Asp Met Thr Trp Leu Met His Thr Thr Phe Ala Asn Glu Val Ala Asp

580 585 590

Lys Ser Phe Thr Ile Arg Gly Glu Val Ala His Leu Asp Val Asn Phe

595 600 605

Ile Asn Glu Ser Ala Asp Asn Ile Thr Ser Val Lys Asn Val Glu Gly

610 615 620

Phe Gly Glu Val Asp Pro Tyr Glu Phe Lys Asp Leu Glu Ile His Arg

625 630 635 640

His Val Glu Val Glu Phe Lys Pro Ser Lys Glu His Asn Ile Leu Thr

645 650 655

Leu Leu Val Pro Asn Lys Asn Glu Gly Glu Gln Val Glu Val Phe His

660 665 670

Lys Leu Glu Gly Asn Thr Leu Leu Leu Asn Val Asp Gly Glu Thr Val

675 680 685

Ser Ile Glu Leu

690

<210>27

<211>882

<212>DNA

<213>灿烂弧菌

<400>27

atgactaaac ctgtaatcgg tttcattggc ctaggtctta tgggcggcaa catggttgaa 60

aacctacaaa agcgcggcta ccacgtaaac gtaatggatc taagcgctga agctgttgct 120

cgcgtaacag atcgcggcaa cgcaactgca ttcacttctg ctaaagaact agctgctgca 180

agtgacatcg ttcagttttg tctgacaact tctgctgttg ttgaaaaaat cgtttacggc 240

gaagacggcg ttctagcggg catcaaagaa ggcgcagtac tagtagactt cggtacttct 300

atccctgctt ctactaagaa aatcggcgca gctcttgctg aaaaaggcgc gggcatgatc 360

gacgcacctc taggtcgtac tcctgcacac gctaaagatg gtcttctgaa catcatggct 420

gctggcgaca tggaaacttt caacaaagtt aaacctgttc ttgaagagca aggcgaaaac 480

gtattccacc taggggctct aggttctggt cacgtgacta agcttgtaaa caacttcatg 540

ggtatgacga ctgttgcgac tatgtctcaa gctttcgctg ttgctcaacg cgctggtgtt 600

gatggccaac aactgtttga catcatgtct gcaggtccat ctaactctcc gttcatgcaa 660

ttctgtaagt tctacgcggt agacggcgaa gagaagctag gtttctctgt tgctaacgca 720

aacaaagacc ttggttactt ccttgcactt tgtgaagagc taggtactga gtctctaatc 780

gctcaaggta ctgcaacaag cctacaagct gctgttgatg caggcatggg taacaacgac 840

gtaccagtaa tcttcgacta cttcgctaaa ctagagaagt aa 882

<210>28

<211>293

<212>PRT

<213>灿烂弧菌

<400>28

Met Thr Lys Pro Val Ile Gly Phe Ile Gly Leu Gly Leu Met Gly Gly

1 5 10 15

Asn Met Val Glu Asn Leu Gln Lys Arg Gly Tyr His Val Asn Val Met

20 25 30

Asp Leu Ser Ala Glu Ala Val Ala Arg Val Thr Asp Arg Gly Asn Ala

35 40 45

Thr Ala Phe Thr Ser Ala Lys Glu Leu Ala Ala Ala Ser Asp Ile Val

50 55 60

Gln Phe Cys Leu Thr Thr Ser Ala Val Val Glu Lys Ile Val Tyr Gly

65 70 75 80

Glu Asp Gly Val Leu Ala Gly Ile Lys Glu Gly Ala Val Leu Val Asp

85 90 95

Phe Gly Thr Ser Ile Pro Ala Ser Thr Lys Lys Ile Gly Ala Ala Leu

100 105 110

Ala Glu Lys Gly Ala Gly Met Ile Asp Ala Pro Leu Gly Arg Thr Pro

115 120 125

Ala His Ala Lys Asp Gly Leu Leu Asn Ile Met Ala Ala Gly Asp Met

130 135 140

Glu Thr Phe Asn Lys Val Lys Pro Val Leu Glu Glu Gln Gly Glu Asn

145 150 155 160

Val Phe His Leu Gly Ala Leu Gly Ser Gly His Val Thr Lys Leu Val

165 170 175

Asn Asn Phe Met Gly Met Thr Thr Val Ala Thr Met Ser Gln Ala Phe

180 185 190

Ala Val Ala Gln Arg Ala Gly Val Asp Gly Gln Gln Leu Phe Asp Ile

195 200 205

Met Ser Ala Gly Pro Ser Asn Ser Pro Phe Met Gln Phe Cys Lys Phe

210 215 220

Tyr Ala Val Asp Gly Glu Glu Lys Leu Gly Phe Ser Val Ala Asn Ala

225 230 235 240

Asn Lys Asp Leu Gly Tyr Phe Leu Ala Leu Cys Glu Glu Leu Gly Thr

245 250 255

Glu Ser Leu Ile Ala Gln Gly Thr Ala Thr Ser Leu Gln Ala Ala Val

260 265 270

Asp Ala Gly Met Gly Asn Asn Asp Val Pro Val Ile Phe Asp Tyr Phe

275 280 285

Ala Lys Leu Glu Lys

290

<210>29

<211>1872

<212>DNA

<213>灿烂弧菌

<400>29

atggtagcgg tcgtcagttc tagtgctttg gcatttacga actggtttac gcttaacttg 60

gccactgaac aggtaaacca aacgatttat aacgagattg atcactcgct tacgatagaa 120

atcaatcaaa tagaaagtac cgttcagcgc accatcgata ccgttaactc tgttgcacaa 180

gagttcatga aatcccctta ccaagtgccg aatgaagcac tcatgcatta tgccgctaag 240

cttggtggca ttgacaagat tgtggtgggt tttgacgacg gccgttctta tacctctcgc 300

ccttcagagt ctttccctaa cggtgttgga ataaaagaaa aatacaatcc aaccactcga 360

ccttggtatc aacaagcgaa attgaaatca ggcttatctt ttagtggtct gtttttcact 420

aagagtactc aagtgcctat gatcggtgtg acctactcat accaagatcg tgtcatcatg 480

gccgatatac gctttgacga tttggaaacg cagcttgaac agctggacag catctacgaa 540

gccaaaggca ttatcatcga cgaaaagggg atggtggtcg cttcaacaat cgaaaacgtg 600

cttccgcaaa ccaatatatc ttctgcagac actcaaatga aactcaacag tgccattgaa 660

cagcctgatc aattcattga gggtgtgatt gatggtaacc agagaatctt gatggccaag 720

aaagtggata ttggcagcca gaaagagtgg ttcatgatct ccagtattga ccctgaactc 780

gcgctcaatc agctgaatgg cgtgatgtcg agtgcgcgca tccttatcgt cgcttgtgta 840

cttggctcgg tgatattgat gattttactt ctgaatcgtt tctaccgccc aatcgtgtca 900

ctgcgcaaaa tcgtccacga tctatcacaa ggtaacggag acctcactca aaggcttgct 960

gagaagggga atgatgactt agggcatatc gccaaagaca tcaacttgtt cattatcggc 1020

ttacaagaga tggttaagga tgtgaaatac aagaactcgg atctcgatac caaggtactg 1080

agtattcgcg aaggttgtaa agaaaccagc gatgtactga aagttcatac tgatgaaacg 1140

gttcaagtgg tctctgcgat taacggcttg tctgaagcat caaacgaagt agagaagagt 1200

tctcagtcgg cggcagaagc agcaagagag gccgctgtgt tcagtgatga gacgaaacag 1260

attaacacgg tgacggaaac ctatatcagt gatcttgaga agcaagtctg caccacttct 1320

gatgacattc gctcaatggc caatgaaacg cagagcatcc agtctatcgt gtctgtgatt 1380

ggcggaattg cggaacaaac taatttgctg gcattgaatg cgtcaattga agcggcgagg 1440

gcgggtgaac atggtcgagg tttcgcggtg gttgctgatg aagtccgtgc gctagccaac 1500

cgaacgcaaa tcagtacctc tgaaattgat gaagcgttat ctggcttgca gtctaaatca 1560

gatggtttgg ttaaatctat tgagttgacc aaaagtaact gtgaactgac tcgcgctcaa 1620

gttgttcaag ctgtaaacat gttggcgaag ctaaccgagc agatggaaac agtaagtcgt 1680

tttaataatg acatttcggg ttcgtctgtt gagcaaaacg cccttattca gagcattgct 1740

aagaacatgc ataagattga aagctttgtt gaggagctta ataaactaag ccaagatcag 1800

ttaactgaat cagcagaaat caaaacactt aacggtagcg ttagtgaatt gatgagcagc 1860

tttaaggttt aa 1872

<210>30

<211>623

<212>PRT

<213>灿烂弧菌

<400>30

Met Val Ala Val Val Ser Ser Ser Ala Leu Ala Phe Thr Asn Trp Phe

1 5 10 15

Thr Leu Asn Leu Ala Thr Glu Gln Val Asn Gln Thr Ile Tyr Asn Glu

20 25 30

Ile Asp His Ser Leu Thr Ile Glu Ile Asn Gln Ile Glu Ser Thr Val

35 40 45

Gln Arg Thr Ile Asp Thr Val Asn Ser Val Ala Gln Glu Phe Met Lys

50 55 60

Ser Pro Tyr Gln Val Pro Asn Glu Ala Leu Met His Tyr Ala Ala Lys

65 70 75 80

Leu Gly Gly Ile Asp Lys Ile Val Val Gly Phe Asp Asp Gly Arg Ser

85 90 95

Tyr Thr Ser Arg Pro Ser Glu Ser Phe Pro Asn Gly Val Gly Ile Lys

100 105 110

Glu Lys Tyr Asn Pro Thr Thr Arg Pro Trp Tyr Gln Gln Ala Lys Leu

115 120 125

Lys Ser Gly Leu Ser Phe Ser Gly Leu Phe Phe Thr Lys Ser Thr Gln

130 135 140

Val Pro Met Ile Gly Val Thr Tyr Ser Tyr Gln Asp Arg Val Ile Met

145 150 155 160

Ala Asp Ile Arg Phe Asp Asp Leu Glu Thr Gln Leu Glu Gln Leu Asp

165 170 175

Ser Ile Tyr Glu Ala Lys Gly Ile Ile Ile Asp Glu Lys Gly Met Val

180 185 190

Val Ala Ser Thr Ile Glu Asn Val Leu Pro Gln Thr Asn Ile Ser Ser

195 200 205

Ala Asp Thr Gln Met Lys Leu Asn Ser Ala Ile Glu Gln Pro Asp Gln

210 215 220

Phe Ile Glu Gly Val Ile Asp Gly Asn Gln Arg Ile Leu Met Ala Lys

225 230 235 240

Lys Val Asp Ile Gly Ser Gln Lys Glu Trp Phe Met Ile Ser Ser Ile

245 250 255

Asp Pro Glu Leu Ala Leu Asn Gln Leu Asn Gly Val Met Ser Ser Ala

260 265 270

Arg Ile Leu Ile Val Ala Cys Val Leu Gly Ser Val Ile Leu Met Ile

275 280 285

Leu Leu Leu Asn Arg Phe Tyr Arg Pro Ile Val Ser Leu Arg Lys Ile

290 295 300

Val His Asp Leu Ser Gln Gly Asn Gly Asp Leu Thr Gln Arg Leu Ala

305 310 315 320

Glu Lys Gly Asn Asp Asp Leu Gly His Ile Ala Lys Asp Ile Asn Leu

325 330 335

Phe Ile Ile Gly Leu Gln Glu Met Val Lys Asp Val Lys Tyr Lys Asn

340 345 350

Ser Asp Leu Asp Thr Lys Val Leu Ser Ile Arg Glu Gly Cys Lys Glu

355 360 365

Thr Ser Asp Val Leu Lys Val His Thr Asp Glu Thr Val Gln Val Val

370 375 380

Ser Ala Ile Asn Gly Leu Ser Glu Ala Ser Asn Glu Val Glu Lys Ser

385 390 395 400

Ser Gln Ser Ala Ala Glu Ala Ala Arg Glu Ala Ala Val Phe Ser Asp

405 410 415

Glu Thr Lys Gln Ile Asn Thr Val Thr Glu Thr Tyr Ile Ser Asp Leu

420 425 430

Glu Lys Gln Val Cys Thr Thr Ser Asp Asp Ile Arg Ser Met Ala Asn

435 440 445

Glu Thr Gln Ser Ile Gln Ser Ile Val Ser Val Ile Gly Gly Ile Ala

450 455 460

Glu Gln Thr Asn Leu Leu Ala Leu Asn Ala Ser Ile Glu Ala Ala Arg

465 470 475 480

Ala Gly Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg

485 490 495

Ala Leu Ala Asn Arg Thr Gln Ile Ser Thr Ser Glu Ile Asp Glu Ala

500 505 510

Leu Ser Gly Leu Gln Ser Lys Ser Asp Gly Leu Val Lys Ser Ile Glu

515 520 525

Leu Thr Lys Ser Asn Cys Glu Leu Thr Arg Ala Gln Val Val Gln Ala

530 535 540

Val Asn Met Leu Ala Lys Leu Thr Glu Gln Met Glu Thr Val Ser Arg

545 550 555 560

Phe Asn Asn Asp Ile Ser Gly Ser Ser Val Glu Gln Asn Ala Leu Ile

565 570 575

Gln Ser Ile Ala Lys Asn Met His Lys Ile Glu Ser Phe Val Glu Glu

580 585 590

Leu Asn Lys Leu Ser Gln Asp Gln Leu Thr Glu Ser Ala Glu Ile Lys

595 600 605

Thr Leu Asn Gly Ser Val Ser Glu Leu Met Ser Ser Phe Lys Val

610 615 620

<210>31

<211>1743

<212>DNA

<213>灿烂弧菌

<400>31

gtgaataagc caatctttgt cgtcgtactc gcttcgctta cgtatggctg cggtggaagc 60

agctccagtg actctagtga cccttctgat accaataact caggagcatc ttatggtgtt 120

gttgctccct atgatattgc caagtatcaa aacatccttt ccagctcaga tcttcaggtg 180

tctgatccta atggagagga gggcaataaa acctctgaag tcaaagatgg taacttcgat 240

ggttatgtca gtgattattt ttatgctgac gaagagacgg aaaatctgat cttcaaaatg 300

gcgaactaca agatgcgctc tgaagttcgt gaaggagaaa acttcgatat caatgaagca 360

ggcgtaagac gcagtctaca tgcggaaata agcctacctg atattgagca tgtaatggcg 420

agttctcccg cagatcacga tgaagtgacc gtgctacaga tccacaataa aggtacagac 480

gagagtggca cgggttatat ccctcatccg ctattgcgtg tggtttggga gcaagaacga 540

gatggcctca caggtcacta ctgggcagtc atgaaaaata atgccattga ctgtagcagt 600

gccgctgact cttcggattg ttatgccact tcatataatc gctacgattt gggagaggcg 660

gatctcgata acttcaccaa gtttgatctt tctgtttatg aaaataccct ttcgatcaaa 720

gtgaacgatg aagttaaagt cgacgaagac atcacctact ggcagcatct actgagttac 780

tttaaagcgg gtatctacaa tcaatttgaa aatggtgaag ccacggctca ctttcaggca 840

ctgcgataca ccaccacaca ggtcaacggc tcaaacgatt gggatattaa tgattggaag 900

ttgacgattc ctgcgagtaa agacacttgg tatggaagtg ggggtgacag tgcggctgaa 960

ctagaacctg agcgctgcga atcgagcaaa gaccttctcg ccaacgacag tgatgtctac 1020

gacagcgata ttggtctttc ttatttcaat accgatgaag ggagagtgca ctttagagcg 1080

gatatgggat atggcacctc taccgaaaat tctagctata ttcgctctga gctcagggag 1140

ttgtatcaaa gcagtgttca accggattgt agcaccagcg atgaagatac aagttggtat 1200

ttggacgaca ctagaacgaa cgctaccagt cacgagttaa ccgcaagctt acgaattgaa 1260

gactacccga acattaataa ccaagacccg aaagtggtgc ttgggcaaat acacggttgg 1320

aagatcaatc aagcattggt gaagttgtta tgggaaggcg agagtaagcc agtaagagtg 1380

atactgaact ctgattttga gcgcaacaac caagactgta accattgtga cccgttcagt 1440

gtcgagttag gtacttattc ggcaagtgaa gagtggcgat atacgattcg agccaatcaa 1500

gacggtatct acttagcgac tcatgattta gatggaacta atacggtttc tcatttaatc 1560

ccttggggac aagattacac agataaagat ggggacacgg tctcgttgac gtcagattgg 1620

acatcgacag acatcgcttt ctatttcaaa gcgggcatct acccacaatt taagcctgat 1680

agcgactatg cgggtgaagt gtttgatgtg agctttagtt ctctaagagc agagcataac 1740

tga 1743

<210>32

<211>580

<212>PRT

<213>灿烂弧菌

<400>32

Met Asn Lys Pro Ile Phe Val Val Val Leu Ala Ser Leu Thr Tyr Gly

1 5 10 15

Cys Gly Gly Ser Ser Ser Ser Asp Ser Ser Asp Pro Ser Asp Thr Asn

20 25 30

Asn Ser Gly Ala Ser Tyr Gly Val Val Ala Pro Tyr Asp Ile Ala Lys

35 40 45

Tyr Gln Asn Ile Leu Ser Ser Ser Asp Leu Gln Val Ser Asp Pro Asn

50 55 60

Gly Glu Glu Gly Asn Lys Thr Ser Glu Val Lys Asp Gly Asn Phe Asp

65 70 75 80

Gly Tyr Val Ser Asp Tyr Phe Tyr Ala Asp Glu Glu Thr Glu Asn Leu

85 90 95

Ile Phe Lys Met Ala Asn Tyr Lys Met Arg Ser Glu Val Arg Glu Gly

100 105 110

Glu Asn Phe Asp Ile Asn Glu Ala Gly Val Arg Arg Ser Leu His Ala

115 120 125

Glu Ile Ser Leu Pro Asp Ile Glu His Val Met Ala Ser Ser Pro Ala

130 135 140

Asp His Asp Glu Val Thr Val Leu Gln Ile His Asn Lys Gly Thr Asp

145 150 155 160

Glu Ser Gly Thr Gly Tyr Ile Pro His Pro Leu Leu Arg Val Val Trp

165 170 175

Glu Gln Glu Arg Asp Gly Leu Thr Gly His Tyr Trp Ala Val Met Lys

180 185 190

Asn Asn Ala Ile Asp Cys Ser Ser Ala Ala Asp Ser Ser Asp Cys Tyr

195 200 205

Ala Thr Ser Tyr Asn Arg Tyr Asp Leu Gly Glu Ala Asp Leu Asp Asn

210 215 220

Phe Thr Lys Phe Asp Leu Ser Val Tyr Glu Asn Thr Leu Ser Ile Lys

225 230 235 240

Val Asn Asp Glu Val Lys Val Asp Glu Asp Ile Thr Tyr Trp Gln His

245 250 255

Leu Leu Ser Tyr Phe Lys Ala Gly Ile Tyr Asn Gln Phe Glu Asn Gly

260 265 270

Glu Ala Thr Ala His Phe Gln Ala Leu Arg Tyr Thr Thr Thr Gln Val

275 280 285

Asn Gly Ser Asn Asp Trp Asp Ile Asn Asp Trp Lys Leu Thr Ile Pro

290 295 300

Ala Ser Lys Asp Thr Trp Tyr Gly Ser Gly Gly Asp Ser Ala Ala Glu

305 310 315 320

Leu Glu Pro Glu Arg Cys Glu Ser Ser Lys Asp Leu Leu Ala Asn Asp

325 330 335

Ser Asp Val Tyr Asp Ser Asp Ile Gly Leu Ser Tyr Phe Asn Thr Asp

340 345 350

Glu Gly Arg Val His Phe Arg Ala Asp Met Gly Tyr Gly Thr Ser Thr

355 360 365

Glu Asn Ser Ser Tyr Ile Arg Ser Glu Leu Arg Glu Leu Tyr Gln Ser

370 375 380

Ser Val Gln Pro Asp Cys Ser Thr Ser Asp Glu Asp Thr Ser Trp Tyr

385 390 395 400

Leu Asp Asp Thr Arg Thr Asn Ala Thr Ser His Glu Leu Thr Ala Ser

405 410 415

Leu Arg Ile Glu Asp Tyr Pro Asn Ile Asn Asn Gln Asp Pro Lys Val

420 425 430

Val Leu Gly Gln Ile His Gly Trp Lys Ile Asn Gln Ala Leu Val Lys

435 440 445

Leu Leu Trp Glu Gly Glu Ser Lys Pro Val Arg Val Ile Leu Asn Ser

450 455 460

Asp Phe Glu Arg Asn Asn Gln Asp Cys Asn His Cys Asp Pro Phe Ser

465 470 475 480

Val Glu Leu Gly Thr Tyr Ser Ala Ser Glu Glu Trp Arg Tyr Thr Ile

485 490 495

Arg Ala Asn Gln Asp Gly Ile Tyr Leu Ala Thr His Asp Leu Asp Gly

500 505 510

Thr Asn Thr Val Ser His Leu Ile Pro Trp Gly Gln Asp Tyr Thr Asp

515 520 525

Lys Asp Gly Asp Thr Val Ser Leu Thr Ser Asp Trp Thr Ser Thr Asp

530 535 540

Ile Ala Phe Tyr Phe Lys Ala Gly Ile Tyr Pro Gln Phe Lys Pro Asp

545 550 555 560

Ser Asp Tyr Ala Gly Glu Val Phe Asp Val Ser Phe Ser Ser Leu Arg

565 570 575

Ala Glu His Asn

580

<210>33

<211>1569

<212>DNA

<213>灿烂弧菌

<400>33

atgaaacaaa ttactctaaa aactttactc gcttcttcta ttctacttgc ggttggttgt 60

gcgagcacga gcacgcctac tgctgatttt ccaaataaca aagaaactgg tgaagcgctt 120

ctgacgccag ttgctgtttc cgctagtagc catgatggta acggacctga tcgtctcgtt 180

gaccaagacc taactacacg ttggtcatct gcgggtgacg gcgagtgggc aacgctagac 240

tatggttcag tacaggagtt tgacgcggtt caggcatctt tcagtaaagg taatcagcgc 300

caatctaaat ttgatatcca agtgagtgtt gatggcgaaa gctggacaac ggtactagaa 360

aaccaactaa gctcaggtaa agcgatcggc ctagagcgtt tccaatttga gccagtagtg 420

caagcacgct acgtaagata cgttggtcac ggtaacacca aaaacggttg gaacagtgtg 480

actggattag cggcggttaa ctgtagcatt aacgcatgtc ctgctagcca tatcatcact 540

tcagacgtgg ttgcagcaga agccgtgatt attgctgaaa tgaaagcggc agaaaaagca 600

cgtaaagatg cgcgcaaaga tctacgctct ggtaacttcg gtgtagcagc ggtttaccct 660

tgtgagacga ccgttgaatg tgacactcgc agtgcacttc cagttccgac aggcctgcca 720

gcgacaccag ttgcaggtaa ctcgccaagc gaaaactttg acatgacgca ttggtaccta 780

tctcaaccat ttgaccatga caaaaatggc aaacctgatg atgtgtctga gtggaacctt 840

gcaaacggtt accaacaccc tgaaatcttc tacacagctg atgacggcgg cctagtattc 900

aaagcttacg tgaaaggtgt acgtacctct aaaaacacta agtacgcgcg tacagagctt 960

cgtgaaatga tgcgtcgtgg tgatcagtct attagcacta aaggtgttaa taagaataac 1020

tgggtattct caagcgctcc tgaatctgac ttagagtcgg cagcgggtat tgacggcgtt 1080

ctagaagcga cgttgaaaat cgaccatgca acaacgacgg gtaatgcgaa tgaagtaggt 1140

cgctttatca ttggtcagat tcacgatcaa aacgatgaac caattcgttt gtactaccgt 1200

aaactgccaa accaagaaac gggtgcggtt tacttcgcac atgaaagcca agacgcaact 1260

aaagaggact tctaccctct agtgggcgac atgacggctg aagtgggtga cgatggtatc 1320

gcgcttggcg aagtgttcag ctaccgtatt gacgttaaag gcaacacgat gactgtaacg 1380

ctaatacgtg aaggcaaaga cgatgttgta caagtggttg atatgagcaa cagcggctac 1440

gacgcaggcg gcaagtacat gtacttcaaa gccggtgttt acaaccaaaa catcagcggc 1500

gacctagacg attactcaca agcgactttc tatcagctag atgtatcgca cgatcaatac 1560

aaaaagtaa 1569

<210>34

<211>522

<212>PRT

<213>灿烂弧菌

<400>34

Met Lys Gln Ile Thr Leu Lys Thr Leu Leu Ala Ser Ser Ile Leu Leu

1 5 10 15

Ala Val Gly Cys Ala Ser Thr Ser Thr Pro Thr Ala Asp Phe Pro Asn

20 25 30

Asn Lys Glu Thr Gly Glu Ala Leu Leu Thr Pro Val Ala Val Ser Ala

35 40 45

Ser Ser His Asp Gly Asn Gly Pro Asp Arg Leu Val Asp Gln Asp Leu

50 55 60

Thr Thr Arg Trp Ser Ser Ala Gly Asp Gly Glu Trp Ala Thr Leu Asp

65 70 75 80

Tyr Gly Ser Val Gln Glu Phe Asp Ala Val Gln Ala Ser Phe Ser Lys

85 90 95

Gly Asn Gln Arg Gln Ser Lys Phe Asp Ile Gln Val Ser Val Asp Gly

100 105 110

Glu Ser Trp Thr Thr Val Leu Glu Asn Gln Leu Ser Ser Gly Lys Ala

115 120 125

Ile Gly Leu Glu Arg Phe Gln Phe Glu Pro Val Val Gln Ala Arg Tyr

130 135 140

Val Arg Tyr Val Gly His Gly Asn Thr Lys Asn Gly Trp Asn Ser Val

145 150 155 160

Thr Gly Leu Ala Ala Val Asn Cys Ser Ile Asn Ala Cys Pro Ala Ser

165 170 175

His Ile Ile Thr Ser Asp Val Val Ala Ala Glu Ala Val Ile Ile Ala

180 185 190

Glu Met Lys Ala Ala Glu Lys Ala Arg Lys Asp Ala Arg Lys Asp Leu

195 200 205

Arg Ser Gly Asn Phe Gly Val Ala Ala Val Tyr Pro Cys Glu Thr Thr

210 215 220

Val Glu Cys Asp Thr Arg Ser Ala Leu Pro Val Pro Thr Gly Leu Pro

225 230 235 240

Ala Thr Pro Val Ala Gly Asn Ser Pro Ser Glu Asn Phe Asp Met Thr

245 250 255

His Trp Tyr Leu Ser Gln Pro Phe Asp His Asp Lys Asn Gly Lys Pro

260 265 270

Asp Asp Val Ser Glu Trp Asn Leu Ala Asn Gly Tyr Gln His Pro Glu

275 280 285

Ile Phe Tyr Thr Ala Asp Asp Gly Gly Leu Val Phe Lys Ala Tyr Val

290 295 300

Lys Gly Val Arg Thr Ser Lys Asn Thr Lys Tyr Ala Arg Thr Glu Leu

305 310 315 320

Arg Glu Met Met Arg Arg Gly Asp Gln Ser Ile Ser Thr Lys Gly Val

325 330 335

Asn Lys Asn Asn Trp Val Phe Ser Ser Ala Pro Glu Ser Asp Leu Glu

340 345 350

Ser Ala Ala Gly Ile Asp Gly Val Leu Glu Ala Thr Leu Lys Ile Asp

355 360 365

His Ala Thr Thr Thr Gly Asn Ala Asn Glu Val Gly Arg Phe Ile Ile

370 375 380

Gly Gln Ile His Asp Gln Asn Asp Glu Pro Ile Arg Leu Tyr Tyr Arg

385 390 395 400

Lys Leu Pro Asn Gln Glu Thr Gly Ala Val Tyr Phe Ala His Glu Ser

405 410 415

Gln Asp Ala Thr Lys Glu Asp Phe Tyr Pro Leu Val Gly Asp Met Thr

420 425 430

Ala Glu Val Gly Asp Asp Gly Ile Ala Leu Gly Glu Val Phe Ser Tyr

435 440 445

Arg Ile Asp Val Lys Gly Asn Thr Met Thr Val Thr Leu Ile Arg Glu

450 455 460

Gly Lys Asp Asp Val Val Gln Val Val Asp Met Ser Asn Ser Gly Tyr

465 470 475 480

Asp Ala Gly Gly Lys Tyr Met Tyr Phe Lys Ala Gly Val Tyr Asn Gln

485 490 495

Asn Ile Ser Gly Asp Leu Asp Asp Tyr Ser Gln Ala Thr Phe Tyr Gln

500 505 510

Leu Asp Val Ser His Asp Gln Tyr Lys Lys

515 520

<210>35

<211>1230

<212>DNA

<213>灿烂弧菌

<400>35

atgcaaattt ctaaagtcgc tacagctgtc gctctttcga caggtttatt atttggttgt 60

aacagtgatg gtttacctat tccaacagat ccaggcggaa cagaccctgt tgaacctgtt 120

gaagtttact ctatagaaaa cgtctattgg gatctgacag gtggtgctgt tgctgcacag 180

tcactcagcg gaacttcacc atatcgcttt gataataatg aggaaggtac tcgtgctcta 240

agcatttaca gtggagacgt agctaatggc ttcacttttg agagttcaat atatactgct 300

gaagaagaag gtgttgtttc ctttgaaggt aaggactgta cttacacagt gactgagcaa 360

cagctagata tgacctgtga aaaagatgac gtagaaacag cttactcagc aacagagatt 420

acagatgaat ctgttataac tgcattagaa aatgccgatg atggaaaacc taaatcagtc 480

gatgatgtga acgctgcgat tgcatcagca gaagatggcg cgattattga tttatcatct 540

gaaggtacgt ttgataccgg tgttattgag ctaaataaag ctgtcacaat tgatggtgct 600

ggtttagcaa ccattaccgg agatgcttgt attgatgtca ctgcacccgg tgcaggtatc 660

aaaaacatga cttttgctaa cgacaatttg gccgggtgtt ttggtaggga gtcagctggt 720

acttcagata atgaaactgg tgcgatcgtt attggtaaaa ttggtaaaga ttcagatcct 780

gtagcacttg aaaacctaaa gttcgatgca aacggcatta ccgaagatga tctaggtact 840

aaaaaagcaa gttggttatt ctctcgaggt tactttacat tagacaatag cgaatttgtc 900

ggtttaagtg gcagtttcca aaataatgca attcgtatta actgtagtag tgacaacggg 960

cgatttggtt cacaaatcac aaataataca ttcactatta actctggtgg tagtgatgtg 1020

ggcggaatta aagttggtga ttctagcagt gccgtcataa agaatagtga tgataacctt 1080

ggctgtaatg tcactattga aagcaatacg ttcaatggtt acaaaaccct actttcagct 1140

gacaacggta aagatataag aaatacagcc atctacgcac aaccatctgc agtgaacact 1200

gcggcaggta aagaaaatat cttgaactaa 1230

<210>36

<211>409

<212>PRT

<213>灿烂弧菌

<400>36

Met Gln Ile Ser Lys Val Ala Thr Ala Val Ala Leu Ser Thr Gly Leu

1 5 10 15

Leu Phe Gly Cys Asn Ser Asp Gly Leu Pro Ile Pro Thr Asp Pro Gly

20 25 30

Gly Thr Asp Pro Val Glu Pro Val Glu Val Tyr Ser Ile Glu Asn Val

35 40 45

Tyr Trp Asp Leu Thr Gly Gly Ala Val Ala Ala Gln Ser Leu Ser Gly

50 55 60

Thr Ser Pro Tyr Arg Phe Asp Asn Asn Glu Glu Gly Thr Arg Ala Leu

65 70 75 80

Ser Ile Tyr Ser Gly Asp Val Ala Asn Gly Phe Thr Phe Glu Ser Ser

85 90 95

Ile Tyr Thr Ala Glu Glu Glu Gly Val Val Ser Phe Glu Gly Lys Asp

100 105 110

Cys Thr Tyr Thr Val Thr Glu Gln Gln Leu Asp Met Thr Cys Glu Lys

115 120 125

Asp Asp Val Glu Thr Ala Tyr Ser Ala Thr Glu Ile Thr Asp Glu Ser

130 135 140

Val Ile Thr Ala Leu Glu Asn Ala Asp Asp Gly Lys Pro Lys Ser Val

145 150 155 160

Asp Asp Val Asn Ala Ala Ile Ala Ser Ala Glu Asp Gly Ala Ile Ile

165 170 175

Asp Leu Ser Ser Glu Gly Thr Phe Asp Thr Gly Val Ile Glu Leu Asn

180 185 190

Lys Ala Val Thr Ile Asp Gly Ala Gly Leu Ala Thr Ile Thr Gly Asp

195 200 205

Ala Cys Ile Asp Val Thr Ala Pro Gly Ala Gly Ile Lys Asn Met Thr

210 215 220

Phe Ala Asn Asp Asn Leu Ala Gly Cys Phe Gly Arg Glu Ser Ala Gly

225 230 235 240

Thr Ser Asp Asn Glu Thr Gly Ala Ile Val Ile Gly Lys Ile Gly Lys

245 250 255

Asp Ser Asp Pro Val Ala Leu Glu Asn Leu Lys Phe Asp Ala Asn Gly

260 265 270

Ile Thr Glu Asp Asp Leu Gly Thr Lys Lys Ala Ser Trp Leu Phe Ser

275 280 285

Arg Gly Tyr Phe Thr Leu Asp Asn Ser Glu Phe Val Gly Leu Ser Gly

290 295 300

Ser Phe Gln Asn Asn Ala Ile Arg Ile Asn Cys Ser Ser Asp Asn Gly

305 310 315 320

Arg Phe Gly Ser Gln Ile Thr Asn Asn Thr Phe Thr Ile Asn Ser Gly

325 330 335

Gly Ser Asp Val Gly Gly Ile Lys Val Gly Asp Ser Ser Ser Ala Val

340 345 350

Ile Lys Asn Ser Asp Asp Asn Leu Gly Cys Asn Val Thr Ile Glu Ser

355 360 365

Asn Thr Phe Asn Gly Tyr Lys Thr Leu Leu Ser Ala Asp Asn Gly Lys

370 375 380

Asp Ile Arg Asn Thr Ala Ile Tyr Ala Gln Pro Ser Ala Val Asn Thr

385 390 395 400

Ala Ala Gly Lys Glu Asn Ile Leu Asn

405

<210>37

<211>861

<212>DNA

<213>灿烂弧菌

<400>37

atgaattctg ttacaaaaat tgctgcagct gttgcatgta ctcttttagc gggcacagct 60

gctggtgcat ctcttgatta tcgttacgag tatcgtgctg cgacggatta tacaaagact 120

aatggtgata cggctcacgt agacgctcgc catcaacacc gagttaagct aggtgaaagc 180

tttaagctgt cagacaagtg gaagcactct actggtctag aacttaagtt ccacggtgat 240

gactcttact atgatgaaga ttcaggttct gttaaatcag caaacagcca gagtttttac 300

gatggcaatt ggtacatcta tggtatggag atcgataaca ctgcgacata caaaatagac 360

aataattggt atctacaaat gggtatgcct attgcttggg attgggatga gcctaatgct 420

aacgatggcg actggaagat gaaaaaggtt acgtttaaac ctcagttccg cgttggctat 480

aaagcagata tgggtttaac aactgctatt cgttaccgtc atgaatatgc tgacttccgt 540

aaccacacac aatttggcga caaagattct gaaactggcg agcgtttaga atcagctcaa 600

aagtctaaag ttacactgac gggctcttac aaaattgaat ctctacctaa gcttggcctt 660

tcttacgaag caaactatgt aaaatctttg gataacgtac ttctttataa tagtgatgac 720

tgggaatggg atgctggctt aaaggtaaac tacaagttcg gttcttggaa accttttgct 780

gaaatctggt cttctgatat cagttcatct tcaaaagatc gtgaagctaa ataccgtgtt 840

ggtattgctt actcattcta a 861

<210>38

<211>286

<212>PRT

<213>灿烂弧菌

<400>38

Met Asn Ser Val Thr Lys Ile Ala Ala Ala Val Ala Cys Thr Leu Leu

1 5 10 15

Ala Gly Thr Ala Ala Gly Ala Ser Leu Asp Tyr Arg Tyr Glu Tyr Arg

20 25 30

Ala Ala Thr Asp Tyr Thr Lys Thr Asn Gly Asp Thr Ala His Val Asp

35 40 45

Ala Arg His Gln His Arg Val Lys Leu Gly Glu Ser Phe Lys Leu Ser

50 55 60

Asp Lys Trp Lys His Ser Thr Gly Leu Glu Leu Lys Phe His Gly Asp

65 70 75 80

Asp Ser Tyr Tyr Asp Glu Asp Ser Gly Ser Val Lys Ser Ala Asn Ser

85 90 95

Gln Ser Phe Tyr Asp Gly Asn Trp Tyr Ile Tyr Gly Met Glu Ile Asp

100 105 110

Asn Thr Ala Thr Tyr Lys Ile Asp Asn Asn Trp Tyr Leu Gln Met Gly

115 120 125

Met Pro Ile Ala Trp Asp Trp Asp Glu Pro Asn Ala Asn Asp Gly Asp

130 135 140

Trp Lys Met Lys Lys Val Thr Phe Lys Pro Gln Phe Arg Val Gly Tyr

145 150 155 160

Lys Ala Asp Met Gly Leu Thr Thr Ala Ile Arg Tyr Arg His Glu Tyr

165 170 175

Ala Asp Phe Arg Asn His Thr Gln Phe Gly Asp Lys Asp Ser Glu Thr

180 185 190

Gly Glu Arg Leu Glu Ser Ala Gln Lys Ser Lys Val Thr Leu Thr Gly

195 200 205

Ser Tyr Lys Ile Glu Ser Leu Pro Lys Leu Gly Leu Ser Tyr Glu Ala

210 215 220

Asn Tyr Val Lys Ser Leu Asp Asn Val Leu Leu Tyr Asn Ser Asp Asp

225 230 235 240

Trp Glu Trp Asp Ala Gly Leu Lys Val Asn Tyr Lys Phe Gly Ser Trp

245 250 255

Lys Pro Phe Ala Glu Ile Trp Ser Ser Asp Ile Ser Ser Ser Ser Lys

260 265 270

Asp Arg Glu Ala Lys Tyr Arg Val Gly Ile Ala Tyr Ser Phe

275 280 285

<210>39

<211>1038

<212>DNA

<213>灿烂弧菌

<400>39

atgtttaaga aaaacatatt agcagtggcg ttattagcga ctgtgccaat ggttactttc 60

gcaaataacg gtgtttctta ccccgtacct gccgataaat tcgatatgca taattggaaa 120

ataaccatac cttcagatat taatgaagat ggtcgcgttg atgaaataga aggggtcgct 180

atgatgagct actcacatag tgatttcttc catcttgata aagacggcaa ccttgtattt 240

gaagtgcaga accaagcgat tacgacgaaa aactcgaaga atgcgcgttc tgagttacgc 300

cagatgccaa gaggcgcaga tttctctatc gatacggctg ataaaggaaa ccagtgggca 360

ctgtcgagtc acccagcggc tagtgaatac agtgctgtgg gcggaacatt agaagcgaca 420

ttaaaagtga atcacgtctc agttaacgct aagttcccag aaaaataccc agctcattct 480

gttgtggttg gtcagattca tgctaaaaaa cacaacgagc taatcaaagc tggaaccggt 540

tatgggcatg gtaatgaacc actaaagatc ttctataaga agtttcctga ccaagaaatg 600

ggttcagtat tctggaacta tgaacgtaac ctagagaaaa aagatcctaa ccgtgccgat 660

atcgcttatc cagtgtgggg taacacgtgg gaaaaccctg cagagccggg tgaagccggt 720

attgctcttg gtgaagagtt tagctacaaa gtggaagtga aaggcaccat gatgtaccta 780

acgtttgaaa ccgagcgtca cgataccgtt aagtatgaaa tcgacctgag taagggcatc 840

gatgaacttg actcaccaac gggctatgct gaagatgatt tttactacaa agcgggcgca 900

tacggccaat gtagcgtgag cgattctcac cctgtatggg ggcctggttg tggcggtact 960

ggcgatttcg ctgtcgataa aaagaatggc gattacaaca gtgtgacttt ctctgcgctt 1020

aagttaaacg gtaaatag 1038

<210>40

<211>345

<212>PRT

<213>灿烂弧菌

<400>40

Met Phe Lys Lys Asn Ile Leu Ala Val Ala Leu Leu Ala Thr Val Pro

1 5 10 15

Met Val Thr Phe Ala Asn Asn Gly Val Ser Tyr Pro Val Pro Ala Asp

20 25 30

Lys Phe Asp Met His Asn Trp Lys Ile Thr Ile Pro Ser Asp Ile Asn

35 40 45

Glu Asp Gly Arg Val Asp Glu Ile Glu Gly Val Ala Met Met Ser Tyr

50 55 60

Ser His Ser Asp Phe Phe His Leu Asp Lys Asp Gly Asn Leu Val Phe

65 70 75 80

Glu Val Gln Asn Gln Ala Ile Thr Thr Lys Asn Ser Lys Asn Ala Arg

85 90 95

Ser Glu Leu Arg Gln Met Pro Arg Gly Ala Asp Phe Ser Ile Asp Thr

100 105 110

Ala Asp Lys Gly Asn Gln Trp Ala Leu Ser Ser His Pro Ala Ala Ser

115 120 125

Glu Tyr Ser Ala Val Gly Gly Thr Leu Glu Ala Thr Leu Lys Val Asn

130 135 140

His Val Ser Val Asn Ala Lys Phe Pro Glu Lys Tyr Pro Ala His Ser

145 150 155 160

Val Val Val Gly Gln Ile His Ala Lys Lys His Asn Glu Leu Ile Lys

165 170 175

Ala Gly Thr Gly Tyr Gly His Gly Asn Glu Pro Leu Lys Ile Phe Tyr

180 185 190

Lys Lys Phe Pro Asp Gln Glu Met Gly Ser Val Phe Trp Asn Tyr Glu

195 200 205

Arg Asn Leu Glu Lys Lys Asp Pro Asn Arg Ala Asp Ile Ala Tyr Pro

210 215 220

Val Trp Gly Asn Thr Trp Glu Asn Pro Ala Glu Pro Gly Glu Ala Gly

225 230 235 240

Ile Ala Leu Gly Glu Glu Phe Ser Tyr Lys Val Glu Val Lys Gly Thr

245 250 255

Met Met Tyr Leu Thr Phe Glu Thr Glu Arg His Asp Thr Val Lys Tyr

260 265 270

Glu Ile Asp Leu Ser Lys Gly Ile Asp Glu Leu Asp Ser Pro Thr Gly

275 280 285

Tyr Ala Glu Asp Asp Phe Tyr Tyr Lys Ala Gly Ala Tyr Gly Gln Cys

290 295 300

Ser Val Ser Asp Ser His Pro Val Trp Gly Pro Gly Cys Gly Gly Thr

305 310 315 320

Gly Asp Phe Ala Val Asp Lys Lys Asn Gly Asp Tyr Asn Ser Val Thr

325 330 335

Phe Ser Ala Leu Lys Leu Asn Gly Lys

340 345

<210>41

<211>897

<212>DNA

<213>灿烂弧菌

<400>41

atggataact ctccggtgct gagccgattt ttagagaatg gatttttact ccagcagaaa 60

ctgagccttg ttctttgttg tgtgttgatc gcagcttctg catggatttt aggacagctt 120

gcatggttta ttgaacctgc tgagcaaacc gtcgtgccat ggacagcaac ggcttcctcg 180

tcttcaacgc ctcaatcgac tcttgatatc tcttctttgc agcagagcaa catgtttggt 240

gcttataacc caaccacgcc tgctgtggtt gagcagcaag ttatccaaga tgcgccaaag 300

acgcgactga acctcgtttt agtgggtgca gtagccagtt ctaatccaaa gctgagcttg 360

gctgtgattg ccaatcgcgg cacacaagca acctacggca ttaatgaaga gatcgaaggt 420

acgcgagcta agttaaaagc ggtattagtc gatcgcgtga ttattgataa ctcaggtcga 480

gacgaaacct tgatgcttga aggcattgag tacaagcgtt tgtctgtatc agcacctgcg 540

ccacctcgta cctcttcttc tgtgcgtggc aacaacccag cttctgcaga agagaagcta 600

gatgaaatta aagcgaagat aatgaaagat ccgcaacaaa tcttccaata tgttcgactg 660

tctcaggtga aacgcgacga taaagtgatt ggttatcgtg tgagccctgg caaagattca 720

gaacttttta actctgttgg gctccaaaac ggagatattg ccactcagtt aaatggacaa 780

gacctgacag accctgctgc tatgggcaac atattccgtt ctatctcaga gctgacagag 840

ctaaacctcg tcgtcgagag agatggtcaa caacatgaag tgtttattga attttag 897

<210>42

<211>298

<212>PRT

<213>灿烂弧菌

<400>42

Met Asp Asn Ser Pro Val Leu Ser Arg Phe Leu Glu Asn Gly Phe Leu

1 5 10 15

Leu Gln Gln Lys Leu Ser Leu Val Leu Cys Cys Val Leu Ile Ala Ala

20 25 30

Ser Ala Trp Ile Leu Gly Gln Leu Ala Trp Phe Ile Glu Pro Ala Glu

35 40 45

Gln Thr Val Val Pro Trp Thr Ala Thr Ala Ser Ser Ser Ser Thr Pro

50 55 60

Gln Ser Thr Leu Asp Ile Ser Ser Leu Gln Gln Ser Asn Met Phe Gly

65 70 75 80

Ala Tyr Asn Pro Thr Thr Pro Ala Val Val Glu Gln Gln Val Ile Gln

85 90 95

Asp Ala Pro Lys Thr Arg Leu Asn Leu Val Leu Val Gly Ala Val Ala

100 105 110

Ser Ser Asn Pro Lys Leu Ser Leu Ala Val Ile Ala Asn Arg Gly Thr

115 120 125

Gln Ala Thr Tyr Gly Ile Asn Glu Glu Ile Glu Gly Thr Arg Ala Lys

130 135 140

Leu Lys Ala Val Leu Val Asp Arg Val Ile Ile Asp Asn Ser Gly Arg

145 150 155 160

Asp Glu Thr Leu Met Leu Glu Gly Ile Glu Tyr Lys Arg Leu Ser Val

165 170 175

Ser Ala Pro Ala Pro Pro Arg Thr Ser Ser Ser Val Arg Gly Asn Asn

180 1851 90

Pro Ala Ser Ala Glu Glu Lys Leu Asp Glu Ile Lys Ala Lys Ile Met

195 200 205

Lys Asp Pro Gln Gln Ile Phe Gln Tyr Val Arg Leu Ser Gln Val Lys

210 215 220

Arg Asp Asp Lys Val Ile Gly Tyr Arg Val Ser Pro Gly Lys Asp Ser

225 230 235 240

Glu Leu Phe Asn Ser Val Gly Leu Gln Asn Gly Asp Ile Ala Thr Gln

245 250 255

Leu Asn Gly Gln Asp Leu Thr Asp Pro Ala Ala Met Gly Asn Ile Phe

260 265 270

Arg Ser Ile Ser Glu Leu Thr Glu Leu Asn Leu Val Val Glu Arg Asp

275 280 285

Gly Gln Gln His Glu Val Phe Ile Glu Phe

290 295

<210>43

<211>2025

<212>DNA

<213>灿烂弧菌

<400>43

gtgaagcatt ggtttaagaa aagtgcatgg ttattggcag gaagcttaat ctgcacaccc 60

gcagccatcg cgagtgattt tagtgccagc tttaaaggca ctgatattca agagtttatt 120

aatattgttg gtcgtaacct agagaagacg atcatcgttg acccttcggt gcgcggaaaa 180

atcgatgtac gcagctacga cgtactcaat gaagagcaat actacagctt cttcctaaac 240

gtattggaag tgtatggcta cgcggttgtc gaaatggact cgggtgttct taagatcatc 300

aaggccaaag attcgaaaac atcggcaatt ccagtcgttg gagacagtga cacgatcaaa 360

ggcgacaatg tggtgacacg tgttgtgacg gttcgtaatg tctcggtgcg tgaactttct 420

cctctgcttc gtcaactaaa cgacaatgca ggcgcgggta acgttgtgca ctacgaccca 480

gccaacatca tccttattac aggccgagcg gcggtagtaa accgtttagc tgaaatcatc 540

aagcgtgttg accaagcggg tgataaagag attgaagtcg ttgagctaaa gaatgcttct 600

gcggcagaaa tggtacgtat cgttgatgcg ttaagcaaaa ccactgatgc gaaaaacaca 660

cctgcatttc tacaacctaa attagttgcc gatgaacgta ccaatgcgat tcttatctca 720

ggcgacccta aagtacgtag ccgtttaaga aggctgattg aacagcttga tgttgaaatg 780

gcaaccaagg gcaataacca agttatttac cttaaatatg caaaagccga agatctagtt 840

gatgtgctga aaggcgtgtc ggacaaccta caatcagaga agcagacatc aaccaaagga 900

agttcatcgc agcgtaacca agtgatgatc tcagctcaca gtgacaccaa ctctttagtg 960

attaccgcac agccggacat catgaatgcg cttcaagatg tgatcgcaca gctggatatt 1020

cgtcgtgctc aagtattgat tgaagcactg attgtcgaaa tggccgaagg tgacggcgtt 1080

aaccttggtg tgcagtgggg taaccttgaa acgggtgcca tgattcagta cagcaacact 1140

ggcgcttcca ttggcggtgt gatggttggt ttagaagaag cgaaagacag cgaaacgaca 1200

accgctgttt atgattcaga cggtaaattc ttacgtaatg aaaccacgac ggaagaaggt 1260

gactattcaa cattagcttc cgcactttct ggtgttaatg gtgcggcaat gagtgtggta 1320

atgggtgact ggaccgcctt gatcagtgca gtagcgaccg attcaaattc aaatatccta 1380

tcttctccaa gtatcaccgt gatggataac ggcgaagcgt cattcattgt gggtgaagag 1440

gtgcctgttc taaccggttc tacagcaggc tcaagtaacg acaacccatt ccaaacagtt 1500

gaacgtaaag aagtgggtat caagcttaaa gtggtgccgc aaatcaatga aggtgattcg 1560

gttcaactgc aaatagaaca agaagtatcg aacgtattag gcgccaatgg tgcggttgat 1620

gtgcgttttg ctaagcgaca gctaaataca tcagtgattg ttcaagacgg tcaaatgctg 1680

gtgttgggtg gcttgattga cgagcgagca ttggaaagtg aatctaaggt gccgttcttg 1740

ggagatattc ctgtgcttgg acacttgttc aaatcaacca gtactcaggt tgagaaaaag 1800

aacctaatgg tcttcatcaa accaaccatt attcgtgatg gtatgacagc cgatggtatc 1860

acgcagcgta aatacaactt catccgtgct gagcagttgt acaaggctga gcaaggactg 1920

aagttaatgg cagacgataa catcccagta ttgcctaaat ttggtgccga catgaatcac 1980

ccggctgaaa ttcaagcctt catcgatcaa atggaacaag aataa 2025

<210>44

<211>674

<212>PRT

<213>灿烂弧菌

<400>44

Met Lys His Trp Phe Lys Lys Ser Ala Trp Leu Leu Ala Gly Ser Leu

1 5 10 15

Ile Cys Thr Pro Ala Ala Ile Ala Ser Asp Phe Ser Ala Ser Phe Lys

20 25 30

Gly Thr Asp Ile Gln Glu Phe Ile Asn Ile Val Gly Arg Asn Leu Glu

35 40 45

Lys Thr Ile Ile Val Asp Pro Ser Val Arg Gly Lys Ile Asp Val Arg

50 55 60

Ser Tyr Asp Val Leu Asn Glu Glu Gln Tyr Tyr Ser Phe Phe Leu Asn

65 70 75 80

Val Leu Glu Val Tyr Gly Tyr Ala Val Val Glu Met Asp Ser Gly Val

85 90 95

Leu Lys Ile Ile Lys Ala Lys Asp Ser Lys Thr Ser Ala Ile Pro Val

100 105 110

Val Gly Asp Ser Asp Thr Ile Lys Gly Asp Asn Val Val Thr Arg Val

115 120 125

Val Thr Val Arg Asn Val Ser Val Arg Glu Leu Ser Pro Leu Leu Arg

130 135 140

Gln Leu Asn Asp Asn Ala Gly Ala Gly Asn Val Val His Tyr Asp Pro

145 150 155 160

Ala Asn Ile Ile Leu Ile Thr Gly Arg Ala Ala Val Val Asn Arg Leu

165 170 175

Ala Glu Ile Ile Lys Arg Val Asp Gln Ala Gly Asp Lys Glu Ile Glu

180 185 190

Val Val Glu Leu Lys Asn Ala Ser Ala Ala Glu Met Val Arg Ile Val

195 200 205

Asp Ala Leu Ser Lys Thr Thr Asp Ala Lys Asn Thr Pro Ala Phe Leu

210 215 220

Gln Pro Lys Leu Val Ala Asp Glu Arg Thr Asn Ala Ile Leu Ile Ser

225 230 235 240

Gly Asp Pro Lys Val Arg Ser Arg Leu Arg Arg Leu Ile Glu Gln Leu

245 250 255

Asp Val Glu Met Ala Thr Lys Gly Asn Asn Gln Val Ile Tyr Leu Lys

260 265 270

Tyr Ala Lys Ala Glu Asp Leu Val Asp Val Leu Lys Gly Val Ser Asp

275 280 285

Asn Leu Gln Ser Glu Lys Gln Thr Ser Thr Lys Gly Ser Ser Ser Gln

290 295 300

Arg Asn Gln Val Met Ile Ser Ala His Ser Asp Thr Asn Ser Leu Val

305 310 315 320

Ile Thr Ala Gln Pro Asp Ile Met Asn Ala Leu Gln Asp Val Ile Ala

325 330 335

Gln Leu Asp Ile Arg Arg Ala Gln Val Leu Ile Glu Ala Leu Ile Val

340 345 350

Glu Met Ala Glu Gly Asp Gly Val Asn Leu Gly Val Gln Trp Gly Asn

355 360 365

Leu Glu Thr Gly Ala Met Ile Gln Tyr Ser Asn Thr Gly Ala Ser Ile

370 375 380

Gly Gly Val Met Val Gly Leu Glu Glu Ala Lys Asp Ser Glu Thr Thr

385 390 395 400

Thr Ala Val Tyr Asp Ser Asp Gly Lys Phe Leu Arg Asn Glu Thr Thr

405 410 415

Thr Glu Glu Gly Asp Tyr Ser Thr Leu Ala Ser Ala Leu Ser Gly Val

420 425 430

Asn Gly Ala Ala Met Ser Val Val Met Gly Asp Trp Thr Ala Leu Ile

435 440 445

Ser Ala Val Ala Thr Asp Ser Asn Ser Asn Ile Leu Ser Ser Pro Ser

450 455 460

Ile Thr Val Met Asp Asn Gly Glu Ala Ser Phe Ile Val Gly Glu Glu

465 470 475 480

Val Pro Val Leu Thr Gly Ser Thr Ala Gly Ser Ser Asn Asp Asn Pro

485 490 495

Phe Gln Thr Val Glu Arg Lys Glu Val Gly Ile Lys Leu Lys Val Val

500 505 510

Pro Gln Ile Asn Glu Gly Asp Ser Val Gln Leu Gln Ile Glu Gln Glu

515 520 525

Val Ser Asn Val Leu Gly Ala Asn Gly Ala Val Asp Val Arg Phe Ala

530 535 540

Lys Arg Gln Leu Asn Thr Ser Val Ile Val Gln Asp Gly Gln Met Leu

545 550 555 560

Val Leu Gly Gly Leu Ile Asp Glu Arg Ala Leu Glu Ser Glu Ser Lys

565 570 575

Val Pro Phe Leu Gly Asp Ile Pro Val Leu Gly His Leu Phe Lys Ser

580 585 590

Thr Ser Thr Gln Val Glu Lys Lys Asn Leu Met Val Phe Ile Lys Pro

595 600 605

Thr Ile Ile Arg Asp Gly Met Thr Ala Asp Gly Ile Thr Gln Arg Lys

610 615 620

Tyr Asn Phe Ile Arg Ala Glu Gln Leu Tyr Lys Ala Glu Gln Gly Leu

625 630 635 640

Lys Leu Met Ala Asp Asp Asn Ile Pro Val Leu Pro Lys Phe Gly Ala

645 650 655

Asp Met Asn His Pro Ala Glu Ile Gln Ala Phe Ile Asp Gln Met Glu

660 665 670

Gln Glu

<210>45

<211>1503

<212>DNA

<213>灿烂弧菌

<400>45

atggctgaat tggtaggggc ggcacgtact tatcagcgct tgccgtttag ctttgcgaat 60

cgctacaaga tggtgttgga ataccaacat ccagagcgcg caccgatact ttattatgtt 120

gagccactga aatcggcggc gatcattgaa gtgagtcgtg ttgtgaaaaa tggtttcacg 180

ccacaagcga ttactctcga tgagtttgat aaaaaactaa ccgatgctta tcagcgtgac 240

tcgtcagaag ctcgtcagct catggaagac attggtgctg atagtgatga tttcttctca 300

ctagcggaag aactgcctca agacgaagac ttacttgaat cagaagatga tgcaccaatc 360

atcaagttaa tcaatgcgat gctgggtgag gcgatcaaag agggtgcttc ggatatacac 420

atcgaaacct ttgaaaagtc actttgtatc cgtttccgag ttgatggtgt gctgcgtgat 480

gttctagcgc caagccgtaa actggctccg ctattggttt cacgtgtcaa ggttatggct 540

aaactggata ttgcggaaaa acgcgtgcca caagatggtc gtatttctct gcgtattggt 600

ggccgagcgg ttgatgttcg tgtttcaacc atgccttctt cgcatggtga gcgtgtggta 660

atgcgtctgt tggacaaaaa tgccactcgt ctagacttgc acagtttagg tatgacagcc 720

gaaaaccatg aaaacttccg taagctgatt cagcgcccac atggcattat cttggtgacc 780

ggcccgacag gttcaggtaa atcgacgacc ttgtacgcag gtctgcaaga actcaacagc 840

aatgaacgaa acattttaac cgttgaagac ccaatcgaat tcgatatcga tggcattggt 900

caaacacaag tgaaccctaa ggttgatatg acctttgcgc gtggtttacg tgccattctt 960

cgtcaagatc ctgatgttgt tatgattggt gagatccgtg acttggagac cgcagagatt 1020

gctgtccagg cctctttgac aggtcactta gttatgtcga ctctgcatac caatactgcc 1080

gtcggtgcga ttacacgtct acgtgatatg ggcattgaac ctttcttgat ctcttcttcg 1140

ctgctgggtg ttttggctca gcgcttggtt cgtactttat gtaacgaatg taaagaacct 1200

tatgaagccg ataaagagca gaagaaactg tttgggttga agaagaaaga aagcttgacg 1260

ctttaccatg ccaaaggttg tgaagagtgt ggccataagg gttatcgagg tcgtacgggt 1320

attcatgagc tgttgatgat tgatgattca gtacaagagc tgattcacag tgaagcgggt 1380

gagcaggcga ttgataaagc aattcgtggc acaacaccaa gtattcgaga tgatggcttg 1440

agcaaagttc tgaaaggggt aacgtcccta gaagaagtga tgcgcgtgac caaggaagtc 1500

tag 1503

<210>46

<211>500

<212>PRT

<213>灿烂弧菌

<400>46

Met Ala Glu Leu Val Gly Ala Ala Arg Thr Tyr Gln Arg Leu Pro Phe

1 5 10 15

Ser Phe Ala Asn Arg Tyr Lys Met Val Leu Glu Tyr Gln His Pro Glu

20 25 30

Arg Ala Pro Ile Leu Tyr Tyr Val Glu Pro Leu Lys Ser Ala Ala Ile

35 40 45

Ile Glu Val Ser Arg Val Val Lys Asn Gly Phe Thr Pro Gln Ala Ile

50 55 60

Thr Leu Asp Glu Phe Asp Lys Lys Leu Thr Asp Ala Tyr Gln Arg Asp

65 70 75 80

Ser Ser Glu Ala Arg Gln Leu Met Glu Asp Ile Gly Ala Asp Ser Asp

85 90 95

Asp Phe Phe Ser Leu Ala Glu Glu Leu Pro Gln Asp Glu Asp Leu Leu

100 105 110

Glu Ser Glu Asp Asp Ala Pro Ile Ile Lys Leu Ile Asn Ala Met Leu

115 120 125

Gly Glu Ala Ile Lys Glu Gly Ala Ser Asp Ile His Ile Glu Thr Phe

130 135 140

Glu Lys Ser Leu Cys Ile Arg Phe Arg Val Asp Gly Val Leu Arg Asp

145 150 155 160

Val Leu Ala Pro Ser Arg Lys Leu Ala Pro Leu Leu Val Ser Arg Val

165 170 175

Lys Val Met Ala Lys Leu Asp Ile Ala Glu Lys Arg Val Pro Gln Asp

180 185 190

Gly Arg Ile Ser Leu Arg Ile Gly Gly Arg Ala Val Asp Val Arg Val

195 200 205

Ser Thr Met Pro Ser Ser His Gly Glu Arg Val Val Met Arg Leu Leu

210 215 220

Asp Lys Asn Ala Thr Arg Leu Asp Leu His Ser Leu Gly Met Thr Ala

225 230 235 240

Glu Asn His Glu Asn Phe Arg Lys Leu Ile Gln Arg Pro His Gly Ile

245 250 255

Ile Leu Val Thr Gly Pro Thr Gly Ser Gly Lys Ser Thr Thr Leu Tyr

260 265 270

Ala Gly Leu Gln Glu Leu Asn Ser Asn Glu Arg Asn Ile Leu Thr Val

275 280 285

Glu Asp Pro Ile Glu Phe Asp Ile Asp Gly Ile Gly Gln Thr Gln Val

290 295 300

Asn Pro Lys Val Asp Met Thr Phe Ala Arg Gly Leu Arg Ala Ile Leu

305 310 315 320

Arg Gln Asp Pro Asp Val Val Met Ile Gly Glu Ile Arg Asp Leu Glu

325v330 335

Thr Ala Glu Ile Ala Val Gln Ala Ser Leu Thr Gly His Leu Val Met

340 345 350

Ser Thr Leu His Thr Asn Thr Ala Val Gly Ala Ile Thr Arg Leu Arg

355 360 365

Asp Met Gly Ile Glu Pro Phe Leu Ile Ser Ser Ser Leu Leu Gly Val

370 375 380

Leu Ala Gln Arg Leu Val Arg Thr Leu Cys Asn Glu Cys Lys Glu Pro

385 390 395 400

Tyr Glu Ala Asp Lys Glu Gln Lys Lys Leu Phe Gly Leu Lys Lys Lys

405 410 415

Glu Ser Leu Thr Leu Tyr His Ala Lys Gly Cys Glu Glu Cys Gly His

420 425 430

Lys Gly Tyr Arg Gly Arg Thr Gly Ile His Glu Leu Leu Met Ile Asp

435 440 445

Asp Ser Val Gln Glu Leu Ile His Ser Glu Ala Gly Glu Gln Ala Ile

450 455 460

Asp Lys Ala Ile Arg Gly Thr Thr Pro Ser Ile Arg Asp Asp Gly Leu

465 470 475 480

Ser Lys Val Leu Lys Gly Val Thr Ser Leu Glu Glu Val Met Arg Val

485 490 495

Thr Lys Glu Val

500

<210>47

<211>1221

<212>DNA

<213>灿烂弧菌

<400>47

atggcggcat ttgaatacaa agcactggat gccaaaggca aaagtaaaaa aggctcaatt 60

gaagcagata atgctcgtca ggctcgccaa agaataaaag agcttggctt gatgccggtt 120

gagatgaccg aggctaaagc aaaaacagca aaaggtgctc agccatcgac cagctttaaa 180

cgcggcatca gtacgcctga tcttgcgctt attactcgtc aaatatccac gctcgttcaa 240

tctggtatgc cgctagaaga gtgtttgaaa gccgttgccg aacagtctga gaaacctcgt 300

attcgcacca tgctactcgc ggtgagatct aaggtgactg aaggttattc gttagcagac 360

agcttgtctg attatcccca tatcttcgat gagctattca gagccatggt tgctgctggt 420

gagaagtcag ggcatctaga tgcggtattg gaacgattgg ctgactacgc agaaaaccgt 480

cagaagatgc gttctaagtt gctgcaagcg atgatctacc ccatcgtgct ggtggtgttt 540

gcggtgacga ttgtgtcgtt cctactggca acggtagtgc cgaagatcgt tgagcctatt 600

atccaaatgg gacaagagct ccctcagtcg acacaatttt tattagcatc gagtgaattt 660

atccagaatt ggggcatcca attactggtg ttgaccattg gtgtgattgt gttggttaag 720

actgcgctga aaaagccggg cgttcgcatg agctgggatc gcaaattatt gagcatcccg 780

ctgataggca agatagcgaa agggatcaac acctctcgtt ttgcacgaac actttctatc 840

tgtacctcta gtgcgattcc tatccttgaa gggatgaagg tcgcggtaga tgtgatgtcg 900

aatcatcacg tgaaacaaca agtattacag gcatcagata gcgttagaga aggggcaagc 960

ctgcgtaaag cgcttgatca aaccaaactc tttcccccga tgatgctgca tatgatcgcc 1020

agtggtgagc agagtggcca attggaacag atgctgacaa gagcggcaga taatcaggat 1080

caaagctttg aatcgaccgt taatatcgcg ttaggcattt ttaccccagc gcttattgcg 1140

ttgatggctg gcttagtgct gtttatcgtg atggcgacgc tgatgccaat gcttgaaatg 1200

aacaatttaa tgagtggtta a 1221

<210>48

<211>406

<212>PRT

<213>灿烂弧菌

<400>48

Met Ala Ala Phe Glu Tyr Lys Ala Leu Asp Ala Lys Gly Lys Ser Lys

1 5 10 15

Lys Gly Ser Ile Glu Ala Asp Asn Ala Arg Gln Ala Arg Gln Arg Ile

20 25 30

Lys Glu Leu Gly Leu Met Pro Val Glu Met Thr Glu Ala Lys Ala Lys

35 40 45

Thr Ala Lys Gly Ala Gln Pro Ser Thr Ser Phe Lys Arg Gly Ile Ser

50 55 60

Thr Pro Asp Leu Ala Leu Ile Thr Arg Gln Ile Ser Thr Leu Val Gln

65 70 75 80

Ser Gly Met Pro Leu Glu Glu Cys Leu Lys Ala Val Ala Glu Gln Ser

85 90 95

Glu Lys Pro Arg Ile Arg Thr Met Leu Leu Ala Val Arg Ser Lys Val

100 105 110

Thr Glu Gly Tyr Ser Leu Ala Asp Ser Leu Ser Asp Tyr Pro His Ile

115 120 125

Phe Asp Glu Leu Phe Arg Ala Met Val Ala Ala Gly Glu Lys Ser Gly

130 135 140

His Leu Asp Ala Val Leu Glu Arg Leu Ala Asp Tyr Ala Glu Asn Arg

145 150 155 160

Gln Lys Met Arg Ser Lys Leu Leu Gln Ala Met Ile Tyr Pro Ile Val

165 170 175

Leu Val Val Phe Ala Val Thr Ile Val Ser Phe Leu Leu Ala Thr Val

180 185 190

Val Pro Lys Ile Val Glu Pro Ile Ile Gln Met Gly Gln Glu Leu Pro

195 200 205

Gln Ser Thr Gln Phe Leu Leu Ala Ser Ser Glu Phe Ile Gln Asn Trp

210 215 220

Gly Ile Gln Leu Leu Val Leu Thr Ile Gly Val Ile Val Leu Val Lys

225 230 235 240

Thr Ala Leu Lys Lys Pro Gly Val Arg Met Ser Trp Asp Arg Lys Leu

245 250 255

Leu Ser Ile Pro Leu Ile Gly Lys Ile Ala Lys Gly Ile Asn Thr Ser

260 265 270

Arg Phe Ala Arg Thr Leu Ser Ile Cys Thr Ser Ser Ala Ile Pro Ile

275 280 285

Leu Glu Gly Met Lys Val Ala Val Asp Val Met Ser Asn His His Val

290 295 300

Lys Gln Gln Val Leu Gln Ala Ser Asp Ser Val Arg Glu Gly Ala Ser

305 310 315 320

Leu Arg Lys Ala Leu Asp Gln Thr Lys Leu Phe Pro Pro Met Met Leu

325 330 335

His Met Ile Ala Ser Gly Glu Gln Ser Gly Gln Leu Glu Gln Met Leu

340 345 350

Thr Arg Ala Ala Asp Asn Gln Asp Gln Ser Phe Glu Ser Thr Val Asn

355 360 365

Ile Ala Leu Gly Ile Phe Thr Pro Ala Leu Ile Ala Leu Met Ala Gly

370 375 380

Leu Val Leu Phe Ile Val Met Ala Thr Leu Met Pro Met Leu Glu Met

385 390 395 400

Asn Asn Leu Met Ser Gly

405

<210>49

<211>444

<212>DNA

<213>灿烂弧菌

<400>49

atgaaaaata aaatgaaaaa acaatcaggc tttaccctat tagaagtcat ggttgttgtc 60

gttatccttg gtgttctagc aagttttgtt gtacctaacc tgttgggcaa caaagagaag 120

gcggatcaac aaaaagccat cactgatatt gtggcgctag agaacgcgct cgacatgtac 180

aaactggata acagcgttta cccaacaacg gatcaaggcc tggacgggtt ggtgacaaag 240

ccaagcagtc cagagcctcg taactaccga gacggcggtt acatcaagcg tctacctaac 300

gacccatggg gcaatgagta ccaataccta agtcctggtg ataacggcac aattgatatc 360

ttcactcttg gcgcagatgg tcaagaaggt ggtgaaggta ttgctgcaga tatcggcaac 420

tggaacatgc aggacttcca ataa 444

<210>50

<211>146

<212>PRT

<213>灿烂弧菌

<400>50

Lys Asn Lys Met Lys Lys Gln Ser Gly Phe Thr Leu Leu Glu Val Met

1 5 10 15

Val Val Val Val Ile Leu Gly Val Leu Ala Ser Phe Val Val Pro Asn

20 25 30

Leu Leu Gly Asn Lys Glu Lys Ala Asp Gln Gln Lys Ala Ile Thr Asp

35 40 45

Ile Val Ala Leu Glu Asn Ala Leu Asp Met Tyr Lys Leu Asp Asn Ser

50 55 60

Val Tyr Pro Thr Thr Asp Gln Gly Leu Asp Gly Leu Val Thr Lys Pro

65 70 75 80

Ser Ser Pro Glu Pro Arg Asn Tyr Arg Asp Gly Gly Tyr Ile Lys Arg

85 90 95

Leu Pro Asn Asp Pro Trp Gly Asn Glu Tyr Gln Tyr Leu Ser Pro Gly

100 105 110

Asp Asn Gly Thr Ile Asp Ile Phe Thr Leu Gly Ala Asp Gly Gln Glu

115 120 125

Gly Gly Glu Gly Ile Ala Ala Asp Ile Gly Asn Trp Asn Met Gln Asp

130 135 140

Phe Gln

145

<210>51

<211>594

<212>DNA

<213>灿烂弧菌

<400>51

gtgaaaacta agcaaacaca gccaggtttc accttgattg agattctttt ggtgttggta 60

ttactgtcag tatcggcggt cgcggtgatc tcgaccatcc ctaccaatag caaagatgtt 120

gctaaaaaat acgctcaaag cttttatcag cgaattcagc tactcaatga agaggctatt 180

ttgagtggct tagattttgg tgttcgtgtt gatgaaaaaa aatcgactta cgttctgatg 240

actttgaagt ctgatggctg gcaagaaacg gagttcgaaa agatcccttc ttcaactgaa 300

ttaccggaag aactggcact gtcgctgaca ttaggtggtg gcgcgtggga agacgatgat 360

cggttgttca atccaggaag cttatttgat gaagatatgt ttgctgatct tgaagaggaa 420

aagaagccga aaccaccaca gatctacatc ttgtcgagtg ctgaaatgac gccatttgta 480

ctgtcgtttt acccaaatac cggtgacaca atacaagatg tttggcgcat tcgagtattg 540

gataatggtg tgattcgatt actcgagccg ggagaagaag atgaagaaga ataa 594

<210>52

<211>197

<212>PRT

<213>灿烂弧菌

<400>52

Met Lys Thr Lys Gln Thr Gln Pro Gly Phe Thr Leu Ile Glu Ile Leu

1 5 10 15

Leu Val Leu Val Leu Leu Ser Val Ser Ala Val Ala Val Ile Ser Thr

20 25 30

Ile Pro Thr Asn Ser Lys Asp Val Ala Lys Lys Tyr Ala Gln Ser Phe

35 40 45

Tyr Gln Arg Ile Gln Leu Leu Asn Glu Glu Ala Ile Leu Ser Gly Leu

50 55 60

Asp Phe Gly Val Arg Val Asp Glu Lys Lys Ser Thr Tyr Val Leu Met

65 70 75 80

Thr Leu Lys Ser Asp Gly Trp Gln Glu Thr Glu Phe Glu Lys Ile Pro

85 90 95

Ser Ser Thr Glu Leu Pro Glu Glu Leu Ala Leu Ser Leu Thr Leu Gly

100 105 110

Gly Gly Ala Trp Glu Asp Asp Asp Arg Leu Phe Asn Pro Gly Ser Leu

115 120 125

Phe Asp Glu Asp Met Phe Ala Asp Leu Glu Glu Glu Lys Lys Pro Lys

130 135 140

Pro Pro Gln Ile Tyr Ile Leu Ser Ser Ala Glu Met Thr Pro Phe Val

145 150 155 160

Leu Ser Phe Tyr Pro Asn Thr Gly Asp Thr Ile Gln Asp Val Trp Arg

165 170 175

Ile Arg Val Leu Asp Asn Gly Val Ile Arg Leu Leu Glu Pro Gly Glu

180 185 190

Glu Asp Glu Glu Glu

195

<210>53

<211>396

<212>DNA

<213>灿烂弧菌

<400>53

atgaagaaga ataaccgttc tccttatcgt tctcgcggta tgcctcttgg ttctcgagga 60

atgactctgc ttgaagtatt ggttgcgctg gctatcttcg ctacggcggc gatcagtgtg 120

attcgtgctg tcacccagca catcaatacg ctcagttatc tcgaagaaaa aaccttcgcg 180

gcgatggtcg ttgataatca aatggcccta gtcatgctac atcctgagat gcttaaaaaa 240

gcgcagggca cgcaagagtt agcgggaaga gaatggttct ggaaggtgac tcccatcgat 300

accagcgata atttattaaa ggcgtttgat gtgagtgcgg caaccagtaa gaaagcgtct 360

ccagtcgtta cggtgcgcag ttatgtggtt aattaa 396

<210>54

<211>131

<212>PRT

<213>灿烂弧菌

<400>54

Met Lys Lys Asn Asn Arg Ser Pro Tyr Arg Ser Arg Gly Met Pro Leu

1 5 10 15

Gly Ser Arg Gly Met Thr Leu Leu Glu Val Leu Val Ala Leu Ala Ile

20 25 30

Phe Ala Thr Ala Ala Ile Ser Val Ile Arg Ala Val Thr Gln His Ile

35 40 45

Asn Thr Leu Ser Tyr Leu Glu Glu Lys Thr Phe Ala Ala Met Val Val

50 55 60

Asp Asn Gln Met Ala Leu Val Met Leu His Pro Glu Met Leu Lys Lys

65 70 75 80

Ala Gln Gly Thr Gln Glu Leu Ala Gly Arg Glu Trp Phe Trp Lys Val

85 90 95

Thr Pro Ile Asp Thr Ser Asp Asn Leu Leu Lys Ala Phe Asp Val Ser

100 105 110

Ala Ala Thr Ser Lys Lys Ala Ser Pro Val Val Thr Val Arg Ser Tyr

115 120 125

Val Val Asn

130

<210>55

<211>804

<212>DNA

<213>灿烂弧菌

<400>55

atgtggttaa ttaagagaat gtggtcaatt aagagcatgt tattaattaa gaacagctcg 60

ctaactaaga gcgtgtcgct aactaagagc atgtcggaaa ataagcgtac gccgcgtaaa 120

caaggtctac cttcaaaagg gagaggcttt accttaattg aagtcttggt ctcgattgct 180

atctttgcca cgctaagtat ggcggcttat caggtggtta atcaggtgca gcgaagcaac 240

gagatctcta ttgagcgcag tgctcgtttg aaccaactgc aacgcagttt agtcatttta 300

gataatgatt ttcgccagat ggcggtgcga aaatttcgta ccaacggtga agaagcatca 360

tctaagctga tcttaatgaa agagtattta ttggactccg acagtgtagg catcatgttt 420

actcgtctag gttggcacaa cccacaacag cagtttcctc gcggtgaagt cacgaaggtt 480

ggctaccgta ttaaagaaga aacacttgag cgtgtatggt ggcgttatcc cgatacacct 540

tcaggccaag aaggtgtgat tacccctctg cttgatgatg ttgaaagctt ggaattcgag 600

ttttatgacg gaagccgctg ggggaaagag tggcaaaccg ataaatcact gccgaaagcg 660

gtgaggctta agctgacact gaaagactat ggtgagatag agcgtgttta tctcactccc 720

ggtggcaccc tagatcaggc cgatgattct tcaaacagtg actcttcagg cagtagtgag 780

gggaataatg actcatcgaa ctaa 804

<210>56

<211>267

<212>PRT

<213>灿烂弧菌

<400>56

Met Trp Leu Ile Lys Arg Met Trp Ser Ile Lys Ser Met Leu Leu Ile

1 5 10 15

Lys Asn Ser Ser Leu Thr Lys Ser Val Ser Leu Thr Lys Ser Met Ser

20 25 30

Glu Asn Lys Arg Thr Pro Arg Lys Gln Gly Leu Pro Ser Lys Gly Arg

35 40 45

Gly Phe Thr Leu Ile Glu Val Leu Val Ser Ile Ala Ile Phe Ala Thr

50 55 60

Leu Ser Met Ala Ala Tyr Gln Val Val Asn Gln Val Gln Arg Ser Asn

65 70 75 80

Glu Ile Ser Ile Glu Arg Ser Ala Arg Leu Asn Gln Leu Gln Arg Ser

85 90 95

Leu Val Ile Leu Asp Asn Asp Phe Arg Gln Met Ala Val Arg Lys Phe

100 105 110

Arg Thr Asn Gly Glu Glu Ala Ser Ser Lys Leu Ile Leu Met Lys Glu

115 120 125

Tyr Leu Leu Asp Ser Asp Ser Val Gly Ile Met Phe Thr Arg Leu Gly

130 135 140

Trp His Asn Pro Gln Gln Gln Phe Pro Arg Gly Glu Val Thr Lys Val

145 150 155 160

Gly Tyr Arg Ile Lys Glu Glu Thr Leu Glu Arg Val Trp Trp Arg Tyr

165 170 175

Pro Asp Thr Pro Ser Gly Gln Glu Gly Val Ile Thr Pro Leu Leu Asp

180 185 190

Asp Val Glu Ser Leu Glu Phe Glu Phe Tyr Asp Gly Ser Arg Trp Gly

195 200 205

Lys Glu Trp Gln Thr Asp Lys Ser Leu Pro Lys Ala Val Arg Leu Lys

210 215 220

Leu Thr Leu Lys Asp Tyr Gly Glu Ile Glu Arg Val Tyr Leu Thr Pro

225 230 235 240

Gly Gly Thr Leu Asp Gln Ala Asp Asp Ser Ser Asn Ser Asp Ser Ser

245 250 255

Gly Ser Ser Glu Gly Asn Asn Asp Ser Ser Asn

260 265

<210>57

<211>1050

<212>DNA

<213>灿烂弧菌

<400>57

atgactcatc gaactaataa gcgtttagcg acaaggtcag ccttgggacg taaacaacgt 60

ggtgtcgcgc tgatcattat tttgatgcta ttggcgatca tggcaaccat tgctggcagc 120

atgtccgagc gtttgtttac gcaattcaag cgcgttggta accaactgaa ttaccaacag 180

gcttactggt acagcattgg tgtggaagcg cttgtgcaaa acggtattag gcaaagttac 240

aaagacagtg ataccgtgaa cctaagccaa ccatgggcgt tagaagagca ggtataccca 300

ttggattatg gccaagttaa gggccgcatt gttgatgctc aggcatgttt taatcttaat 360

gccttagccg gagtggcgac cacttcaagt aaccagactc cttatttaat cacggtttgg 420

caaaccttat tggaaaacca agacgttgag ccttatcagg ctgaggttat cgcaaattca 480

acgtgggaat ttgttgatgc ggatacacga accacctctt cgtctggtgt agaagacagc 540

acgtatgaag cgatgaagcc ctcttatttg gcggcgaatg gcttaatggc cgatgaatcc 600

gagctacgag cggtttatca agtcactggt gaagtgatga ataaggttcg cccctttgtt 660

tgcgctctgc caaccgatga tttccgcttg aatgtgaata ctctcacgga aaaacaagca 720

ccgttattgg aagcgatgtt tgcgccaggc ttaagtgaat cggatgccaa acagctgata 780

gataaacgcc catttgatgg ctgggatacg gtagatgctt tcatggctga acctgccatt 840

gttggtgtaa gtgccgaagt cagcaagaaa gcgaaagcat atttaactgt agatagcgcc 900

tattttgagc tagatgcaga ggtattagtt gagcagtcac gtgtacgtat acggacgctt 960

ttctatagta gtaatcgaga aacagtgacg gtagtacgcc gtcgttttgg aggaatcagt 1020

gagcgagttt ctgaccgttc gactgagtag 1050

<210>58

<211>349

<212>PRT

<213>灿烂弧菌

<400>58

Met Thr His Arg Thr Asn Lys Arg Leu Ala Thr Arg Ser Ala Leu Gly

1 5 10 15

Arg Lys Gln Arg Gly Val Ala Leu Ile Ile Ile Leu Met Leu Leu Ala

20 25 30

Ile Met Ala Thr Ile Ala Gly Ser Met Ser Glu Arg Leu Phe Thr Gln

35 40 45

Phe Lys Arg Val Gly Asn Gln Leu Asn Tyr Gln Gln Ala Tyr Trp Tyr

50 55 60

Ser Ile Gly Val Glu Ala Leu Val Gln Asn Gly Ile Arg Gln Ser Tyr

65 70 75 80

Lys Asp Ser Asp Thr Val Asn Leu Ser Gln Pro Trp Ala Leu Glu Glu

85 90 95

Gln Val Tyr Pro Leu Asp Tyr Gly Gln Val Lys Gly Arg Ile Val Asp

100 105 110

Ala Gln Ala Cys Phe Asn Leu Asn Ala Leu Ala Gly Val Ala Thr Thr

115 120 125

Ser Ser Asn Gln Thr Pro Tyr Leu Ile Thr Val Trp Gln Thr Leu Leu

130 135 140

Glu Asn Gln Asp Val Glu Pro Tyr Gln Ala Glu Val Ile Ala Asn Ser

145 150 155 160

Thr Trp Glu Phe Val Asp Ala Asp Thr Arg Thr Thr Ser Ser Ser Gly

165 170 175

Val Glu Asp Ser Thr Tyr Glu Ala Met Lys Pro Ser Tyr Leu Ala Ala

180 185 190

Asn Gly Leu Met Ala Asp Glu Ser Glu Leu Arg Ala Val Tyr Gln Val

195 200 205

Thr Gly Glu Val Met Asn Lys Val Arg Pro Phe Val Cys Ala Leu Pro

210 215 220

Thr Asp Asp Phe Arg Leu Asn Val Asn Thr Leu Thr Glu Lys Gln Ala

225 230 235 240

Pro Leu Leu Glu Ala Met Phe Ala Pro Gly Leu Ser Glu Ser Asp Ala

245 250 255

Lys Gln Leu Ile Asp Lys Arg Pro Phe Asp Gly Trp Asp Thr Val Asp

260 265 270

Ala Phe Met Ala Glu Pro Ala Ile Val Gly Val Ser Ala Glu Val Ser

275 280 285

Lys Lys Ala Lys Ala Tyr Leu Thr Val Asp Ser Ala Tyr Phe Glu Leu

290 295 300

Asp Ala Glu Val Leu Val Glu Gln Ser Arg Val Arg Ile Arg Thr Leu

305 310 315 320

Phe Tyr Ser Ser Asn Arg Glu Thr Val Thr Val Val Arg Arg Arg Phe

325 330 335

Gly Gly Ile Ser Glu Arg Val Ser Asp Arg Ser Thr Glu

340 345

<210>59

<211>1248

<212>DNA

<213>灿烂弧菌

<400>59

gtgagcgagt ttctgaccgt tcgactgagt agcgaaccac aaagccctgt gcagtggtta 60

gtttggtcga caagccaaca agaagtgata gcaagcggtg aactgtctag ctgggaacag 120

cttgacgagt taacgcctta cgctgaaaag cgcagctgta tcgctttatt gccgggaagt 180

gaatgcttaa ttaagcgtgt tgagatcccg aaaggtgctg ctcgccagtt tgattctatg 240

ctgccgttct tattagaaga cgaagtcgca caagatatcg aagacttaca cctgactatt 300

ttagataaag atgccactca cgctaccgtg tgtggtgtgg atcgtgaatg gctaaaacaa 360

gctttagacc tgtttcgcga agccaatata atcttccgta aggtgctacc agatacacta 420

gccgtgcctt ttgaagaaca aggcatcagt gcgttgcaga tagatcagca ttggttattg 480

cgccaaggtc actctcaacg tcaaggtcac tatcaagccg tatcgatcag tgaagcatgg 540

ttaccgatgt ttttgcaaag tgattgggtt gtcgctggtg aggaagagca agcgacgact 600

atcttcagct ataccgcgat gccgagcgac gacgttcaac agcaaagcgg cctcgagtgg 660

caagcaaagc ctgcggaatt ggtgatgtct ttattgagtc agcaagcgat cacaagcggc 720

gtaaatttac tgactggcac ctttaaaacc aaatcttcat tcagtaaata ttggcgtgtt 780

tggcagaaag tggcgattgc tgcttgtttg ctggtggccg tgattgtgac tcagcaagtg 840

ttgaaggttc agcaatacga agcgcaagca caagcctacc gcatggagag tgagcgtatc 900

tttagagctg tgctgcctgg caaacaacgc attccgaccg tgagttacct caagcgtcag 960

atgaatgatg aagctaagaa atacggtggt tcaggcgaag gtgattcttt acttggttgg 1020

ttagctttgc tgcctgaaac cttagggcaa gtgaagacga tcgaagttga aagcattcgc 1080

tacgatggca accgttctga ggttcgactg caggctaaaa gttctgactt ccaacacttt 1140

gagaccgcaa gggtgaagct cgaagagaag tttgtcgttg agcaagggcc attgaaccgt 1200

aatggcgatg ccgtatttgg cagttttact cttaaacccc atcaataa 1248

<210>60

<211>415

<212>PRT

<213>灿烂弧菌

<400>60

Met Ser Glu Phe Leu Thr Val Arg Leu Ser Ser Glu Pro Gln Ser Pro

1 5 10 15

Val Gln Trp Leu Val Trp Ser Thr Ser Gln Gln Glu Val Ile Ala Ser

20 25 30

Gly Glu Leu Ser Ser Trp Glu Gln Leu Asp Glu Leu Thr Pro Tyr Ala

35 40 45

Glu Lys Arg Ser Cys Ile Ala Leu Leu Pro Gly Ser Glu Cys Leu Ile

50 55 60

Lys Arg Val Glu Ile Pro Lys Gly Ala Ala Arg Gln Phe Asp Ser Met

65 70 75 80

Leu Pro Phe Leu Leu Glu Asp Glu Val Ala Gln Asp Ile Glu Asp Leu

85 90 95

His Leu Thr Ile Leu Asp Lys Asp Ala Thr His Ala Thr Val Cys Gly

100 105 110

Val Asp Arg Glu Trp Leu Lys Gln Ala Leu Asp Leu Phe Arg Glu Ala

115 120 125

Asn Ile Ile Phe Arg Lys Val Leu Pro Asp Thr Leu Ala Val Pro Phe

130 135 140

Glu Glu Gln Gly Ile Ser Ala Leu Gln Ile Asp Gln His Trp Leu Leu

145 150 155 160

Arg Gln Gly His Ser Gln Arg Gln Gly His Tyr Gln Ala Val Ser Ile

165 170 175

Ser Glu Ala Trp Leu Pro Met Phe Leu Gln Ser Asp Trp Val Val Ala

180 185 190

Gly Glu Glu Glu Gln Ala Thr Thr Ile Phe Ser Tyr Thr Ala Met Pro

195 200 205

Ser Asp Asp Val Gln Gln Gln Ser Gly Leu Glu Trp Gln Ala Lys Pro

210 215 220

Ala Glu Leu Val Met Ser Leu Leu Ser Gln Gln Ala Ile Thr Ser Gly

225 230 235 240

Val Asn Leu Leu Thr Gly Thr Phe Lys Thr Lys Ser Ser Phe Ser Lys

245 250 255

Tyr Trp Arg Val Trp Gln Lys Val Ala Ile Ala Ala Cys Leu Leu Val

260 265 270

Ala Val Ile Val Thr Gln Gln Val Leu Lys Val Gln Gln Tyr Glu Ala

275 280 285

Gln Ala Gln Ala Tyr Arg Met Glu Ser Glu Arg Ile Phe Arg Ala Val

290 295 300

Leu Pro Gly Lys Gln Arg Ile Pro Thr Val Ser Tyr Leu Lys Arg Gln

305 310 315 320

Met Asn Asp Glu Ala Lys Lys Tyr Gly Gly Ser Gly Glu Gly Asp Ser

325 330 335

Leu Leu Gly Trp Leu Ala Leu Leu Pro Glu Thr Leu Gly Gln Val Lys

340 345 350

Thr Ile Glu Val Glu Ser Ile Arg Tyr Asp Gly Asn Arg Ser Glu Val

355 360 365

Arg Leu Gln Ala Lys Ser Ser Asp Phe Gln His Phe Glu Thr Ala Arg

370 375 380

Val Lys Leu Glu Glu Lys Phe Val Val Glu Gln Gly Pro Leu Asn Arg

385 390 395 400

Asn Gly Asp Ala Val Phe Gly Ser Phe Thr Leu Lys Pro His Gln

405 410 415

<210>61

<211>489

<212>DNA

<213>灿烂弧菌

<400>61

atgagaaata tgattgaacc actccaagcg tggtgggctt caataagtca gcgggaacaa 60

cgattagtca ttggttgttc tattttattg atactgggcg ttgtctattg gggattaata 120

caaccactta gccaacgagc cgagcttgca caaagccgca ttcaaagtga gaagcaactt 180

ctggcttggg taacggacaa agcgaatcaa gtggttgaac tacgaggcag tggtggcatc 240

agtgccagtc agcctttgaa ccaatctgtg cctgcttcta tgcgccgttt taacatcgag 300

ctgatacgcg tgcaaccacg cggtgagatg ctgcaagttt ggattaagcc tgtgccattt 360

aataagttcg ttgactggct gacatacctg aaagaaaagc agggtgttga ggttgagttt 420

atggatattg atcgctctga tagccctggg gttattgaga tcaaccgact acagtttaaa 480

cgaggttaa 489

<210>62

<211>162

<212>PRT

<213>灿烂弧菌

<400>62

Met Arg Asn Met Ile Glu Pro Leu Gln Ala Trp Trp Ala Ser Ile Ser

1 5 10 15

Gln Arg Glu Gln Arg Leu Val Ile Gly Cys Ser Ile Leu Leu Ile Leu

20 25 30

Gly Val Val Tyr Trp Gly Leu Ile Gln Pro Leu Ser Gln Arg Ala Glu

35 40 45

Leu Ala Gln Ser Arg Ile Gln Ser Glu Lys Gln Leu Leu Ala Trp Val

50 55 60

Thr Asp Lys Ala Asn Gln Val Val Glu Leu Arg Gly Ser Gly Gly Ile

65 70 75 80

Ser Ala Ser Gln Pro Leu Asn Gln Ser Val Pro Ala Ser Met Arg Arg

85 90 95

Phe Asn Ile Glu Leu Ile Arg Val Gln Pro Arg Gly Glu Met Leu Gln

100 105 110

Val Trp Ile Lys Pro Val Pro Phe Asn Lys Phe Val Asp Trp Leu Thr

115 120 125

Tyr Leu Lys Glu Lys Gln Gly Val Glu Val Glu Phe Met Asp Ile Asp

130 135 140

Arg Ser Asp Ser Pro Gly Val Ile Glu Ile Asn Arg Leu Gln Phe Lys

145 150 155 160

Arg Gly

<210>63

<211>780

<212>DNA

<213>灿烂弧菌

<400>63

gtgaaacgcg gtttatcttt caaatacggc ctgttattca gcgtcatttt tatcgttttt 60

ttctcggtaa gcttgttgct gcatttgcct gccgcttttg ctctcaagca tgcacccgtc 120

gtgcgtggtt taagcattga aggcgttgag ggcaccgttt ggcaaggtcg cgctaacaat 180

atcgcgtggc agcgtgtcaa ttacggctca gtgcagtggg acttccagtt ctctaaacta 240

ttccaagcca aagcagaact tgcggttcgc tttggccgca acagcgacat gaacttatca 300

ggtaaaggac gtgtcggata tagcatgagt ggtgcttacg cggaaaactt agtggcatca 360

atgccagcca gcaacgtgat gaaatatgcg ccagctatcc cagtgcctgt gtctattgca 420

gggcaagttg aactgacgat caaacatgcg gttcatgctc aaccttggtg tcaatcaggt 480

gaaggtacgc ttgcttggtc tggtgcagca gtcgactcgc cagtgggttc gttagacctt 540

ggccctgtga ttgcggacat aacgtgtgaa gacagcacaa ttgcagccaa aggcactcag 600

aagagcgatc aggtagacag cgagttctca gcgagcgtaa cacctaacca acgctacacc 660

tcggcagcat ggtttaagcc aggcgctgaa ttcccgccag caatgcagag tcagcttaag 720

tggttgggca atcctgatag ccaaggtaaa taccaattta cttatcaagg ccgcttttag 780

<210>64

<211>259

<212>PRT

<213>灿烂弧菌

<400>64

Met Lys Arg Gly Leu Ser Phe Lys Tyr Gly Leu Leu Phe Ser Val Ile

1 5 10 15

Phe Ile Val Phe Phe Ser Val Ser Leu Leu Leu His Leu Pro Ala Ala

20 25 30

Phe Ala Leu Lys His Ala Pro Val Val Arg Gly Leu Ser Ile Glu Gly

35 40 45

Val Glu Gly Thr Val Trp Gln Gly Arg Ala Asn Asn Ile Ala Trp Gln

50 55 60

Arg Val Asn Tyr Gly Ser Val Gln Trp Asp Phe Gln Phe Ser Lys Leu

65 70 75 80

Phe Gln Ala Lys Ala Glu Leu Ala Val Arg Phe Gly Arg Asn Ser Asp

85 90 95

Met Asn Leu Ser Gly Lys Gly Arg Val Gly Tyr Ser Met Ser Gly Ala

100 105 110

Tyr Ala Glu Asn Leu Val Ala Ser Met Pro Ala Ser Asn Val Met Lys

115 120 125

Tyr Ala Pro Ala Ile Pro Val Pro Val Ser Ile Ala Gly Gln Val Glu

130 135 140

Leu Thr Ile Lys His Ala Val His Ala Gln Pro Trp Cys Gln Ser Gly

145 150 155 160

Glu Gly Thr Leu Ala Trp Ser Gly Ala Ala Val Asp Ser Pro Val Gly

165 170 175

Ser Leu Asp Leu Gly Pro Val Ile Ala Asp Ile Thr Cys Glu Asp Ser

180 185 190

Thr Ile Ala Ala Lys Gly Thr Gln Lys Ser Asp Gln Val Asp Ser Glu

195 200 205

Phe Ser Ala Ser Val Thr Pro Asn Gln Arg Tyr Thr Ser Ala Ala Trp

210 215 220

Phe Lys Pro Gly Ala Glu Phe Pro Pro Ala Met Gln Ser Gln Leu Lys

225 230 235 240

Trp Leu Gly Asn Pro Asp Ser Gln Gly Lys Tyr Gln Phe Thr Tyr Gln

245 250 255

Gly Arg Phe

<210>65

<211>10967

<212>DNA

<213>胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043

<400>65

aagttgcagg atatgacgaa agcgtggccg acgactatac cggccacgct ttgaggaatt 60

acaggaaatc agctcgctta ggcgagaaag catcgatcag tacgctaccg tcttccagcg 120

aaaccacgcc gtgcatctcg tgtttcaccg ccagataggc gtcgcccgtt ttcagggtgc 180

gtttttcacc ttcgatcacg acttcaaagc tgccagcggc aacataagca atctggtcgt 240

gaatctcatg gaagtgcggc gtaccaatcg cacctttatc aaagtgcacg taaaccatca 300

tcagctcatc gctccatgtc atgattttac gtttaatgcc accgcccagc tcttcccatg 360

gcgtttcatc atcaataaag tatcttctca tcatctctct cctctaacgc tctttttgcc 420

cataccttct attgcgtcaa caaaccgtgt acgacaacga atgcatggct atggattgcg 480

acattttagc cacatcagta ccagaagaaa cataaaataa gcaaaaccat gacggccctc 540

aagaaataaa taaaacatta tttcattttt attgaattcg catctcatcc aaactatcat 600

cccgcataac aagaaagaac cgggcatgtt gaggaacagg tgacgttgtc actgccacgc 660

aacatcatct gtttcgcccg gcgctttcgc caggaacgat tcctcttctt ggaacggcgc 720

ctgatttttg tttttctctg aaagagaggc taagaaatgc aagttcgtca aagcattcac 780

agcgatcacg cgaagcagct agatacagca ggcctgcgtc gtgaattcct gatcgaacag 840

attttttctg ccgatgccta cactatgacc tatagccaca tcgaccgaat catcgtcggt 900

ggcatcatgc ccgtacacag cgccgtaacg attggcggtg aagtgggtaa acaactcggc 960

gttagctatt tccttgagcg tcgcgaactc ggagccatca acattggcgg cgcgggtacc 1020

gttactgtcg atggcgagcg ctatgacgtg ggtaatgaag aagcaattta tgttggcatg 1080

ggcgtgaaag acgtgcagtt taccagcact gatgccacta acccggccaa gttctactac 1140

aacagcgcgc ctgcacatac gacatatcct acccgcaaga ttacccaagc tgacgcttca 1200

ccacaaaccg tgggagaaga tgcaagctgt aatcgtcgca caattaacaa atacattgtt 1260

cccgatgtat tgccaacctg ccagctcacc atgggattaa ccaagttagc tgaaggcagc 1320

ctgtggaaca ccatgccttg tcatacgcat gagcgccgga tggaagtcta tttctatttt 1380

gatatggatg aggaaacggc cgttttccac atgatggggc aaccgcagga aacccgtcac 1440

atagttatta aaaacgagca ggcggtgatt tcaccgagct ggtcgattca ttccggtgtt 1500

ggcaccagac gctacacctt tatctggggc atggttggcg agaatcaagt tttcggtgac 1560

atggatcacg tcaaggttag cgagttacgt taatcgcttt caaccggaat taccggtgtt 1620

ccctacagta acagctaacg actaagtatt gtcgcttata gagagattat tgatatgatt 1680

ttaaattctt ttgatttgca aggtaaagtt gctcttatca cgggttgtga tacgggttta 1740

ggtcagggta tggctatcgg tctggcacaa gctggctgtg atatcgttgg cgtcaacatc 1800

gttgaaccaa aagataccat cgaaaaagtt accgcactgg gacgccgttt cctcagcctg 1860

accgctgaca tgagcaacgt agcgggtcat gccgagctgg tagagaaagc cgttgctgaa 1920

tttggtcacg ttgacattct ggtcaacaac gccggtatca tccgtcgtga agatgctatc 1980

gagttcagcg agaaaaactg ggacgacgtc atgaatctga acattaagag cgttttcttt 2040

atgtctcagg ctgttgcacg ccagtttatc aaacaaggta aaggcggcaa gatcatcaac 2100

atcgcctcta tgctgtcctt ccaaggcggt atccgcgtgc cttcttacac tgcgtcaaaa 2160

agcgccgtta tgggtgtaac ccgtctgctg gctaacgagt gggcaaaaca cggcatcaac 2220

gttaacgcca ttgctccagg gtacatggca accaacaata ctcagcaact gcgcgccgat 2280

gaagaccgca gcaaagagat tctggaccgt atcccggctg gccgttgggg tttaccacag 2340

gatctgatgg gcccatccgt cttcctggca tccagcgcat ctgattacat caatggctac 2400

acgattgccg ttgatggtgg ctggctggct cgctaagtgt aatttttctt agcggcattt 2460

cgctaatcca cgataaaaag cacaatttag gttgtgcttt ttatttattt ttcaagttgt 2520

tatttcgttt tttataattc tcttttctgc ctaaatcctt tcttaaaaaa aaatcaaaac 2580

aacgttccga ctttgatcac actttcgata ttgcgtgcat gacgacaagg ttaatagcgc 2640

aatataatca atcaaaacag tgtttctatt tataaggaac tgttcacgca gttccataag 2700

aaggtactcc atgagtattt ttgaaaactt atacaccagc aggaaatcgc agctcgacga 2760

atgggttgct gcacttgata gccacatatc ctgcgttcag gaaaaaggcc gcagccaaag 2820

ccaaccgacg ctattactgg ccgatggttt tgatgtggaa aattatgcgc ctgcggtatg 2880

gcaatttccg gatgggcaca gcgcgcctat ttctaatttt gccagccagc agaattggct 2940

aagaacgctg tgcgccatga gcgtcgttac gggtaatgat agttaccaac agcacgctat 3000

cgcacaaagc gaatatttcc tggatcattt cgttgatgat aatagcggcc tgttctactg 3060

gggcggccat cgctttatta atctggatac gctggaaggc gaagggccag aatccaaagc 3120

tcaggtgcat gaattaaagc accacctgcc ctattacgcg ctgttacatc gtgttaacgc 3180

ggaaaagacg ctgaacttct ttcaggggtt ctggaacgca cacgttgaag attggaattc 3240

actggatctg ggtcgtcatg gcgattacag caaaaaacgc gatcctgatg ttttcctgca 3300

taaccgtcat gatgtcgtcg atccggcaca gtggcccgtt ctgccattaa cgaaaggcct 3360

gacgtttgtt aatgccggca cggatctgat ttacgccgca ttcaaatatg cagaatatac 3420

gggcgatagc catgccgcgg catggggtaa acacctttat cgccaatacg ttctggctcg 3480

caacccagaa accggtatgc cggtgtatca attcagttca ccacagcagc gccagccagt 3540

gccggaagac gataaccaga cgcagtcctg gtttggcgat cgcgctcaac gccagtttgg 3600

cccagagttc ggtgaaatcg cacgtgaagc caatgtgctg ttccgcgata tgcgtccact 3660

gctgattgat aacccgctgg caatgctgga tatcctccgc acacagcctg atgcagaaat 3720

gctgaattgg gtaatctctg gattaaaaaa ttattaccag tacgcctacg atgtcaccag 3780

caatacgttg cgcccgatgt ggaacaacgg gcaggacatg acaggctacc gttttaaacg 3840

cgatggctat tacggcaaag cgggaacgga attaaaaccg ttcgcattag aaggtgatta 3900

tttattacct ctggttcgtg cttatcgtct gagcggtgat gaagacctgt acgcactggt 3960

taacaccatg ctgacacggc tgaataaaga agatattcag cacatcgcca gtccgctact 4020

tttgttgacc gttatcgaac tggccgatca caagcaatca gaatcctggg cacattacgc 4080

cgcacaactg gcgggcgtta tgtttgaaca acatttccat cgtggtttgt ttgttcgctc 4140

tgcacagcat cgttatgttc gtctggatga tacctatccg ctggctttac tgactttcgt 4200

tgccgcctgt cgcaacaaat taaacgatat cccgccgtat ctgacacaag gtggatatgt 4260

tcacggcgat tttcacgtta acggggaaaa tagaattgtt tatgacgtgg aattaattta 4320

tccagagtta ttaacagctt aattttatgt tttttttaat gattcacaat taatcaatag 4380

gtaagcatta tgaatgaaaa cagaatgctg gggttagcct atatctcccc ctatattata 4440

gggctgatag tttttaccgc tttccccttt atttcgtcat ttatcctcag ttttactgag 4500

tatgatttga tgagtccgcc tgagtttacg ggtcttgaga actatcaccg tatgttcatg 4560

gaggatgatc ttttttggaa atcaatgggc gtcacctttg cctatgtatt tctgaccatt 4620

ccattgaaat taatcttcgc actgttaatt gcgtttgtac ttaatttcaa attacgtggt 4680

atcggtttct tccgtactgc ttactatgtg ccttctattc tgggcagcag cgtggccatt 4740

gccgttctgt ggcgtgccct attcgccatc gatggcttgc tgaacagctt cctcggcgta 4800

tttggctttg atgccatcaa ctggctgggc gaaccttcgc tggcactgat gtcggtaacc 4860

ctgctgcgcg tatggcagtt tggttccgcc atggttatct tccttgctgc attgcagaac 4920

gtcccgcaat cacagtatga agcagccatg atcgacggtg catccaaatg gcaaatgttc 4980

ctgaaagtaa cggttccact gattacgccg gttattttct ttaactttat catgcagacc 5040

actcaggcat tccaggagtt tacggcacct tacgtcatca ctggcggcgg tccaacgcac 5100

tacacctatc tgttctcgct ctatatctat gataccgcgt tcaagtattt cgatatgggc 5160

tatggtgctg cgctggcatg ggttctgttc ctggttgttg cggtatttgc ggcaatctcc 5220

tttaagtcgt cgaaatactg ggtgttctac tccgctgata aaggaggaaa aaatggctga 5280

catgcattca aacctgacta cagcacaaga aattgctgct gcagaagtac gccgcacgct 5340

gcgtaaagag aaactcagtg cctccatccg ttacgtgata ctgctgttcg ttggcttact 5400

gatgctttac ccactagcgt ggatgttctc agcgtcgttc aaaccgaacc aagagatctt 5460

cacgacactg ggcctgtggc cggaacacgc cacatgggac ggtttcgtta acggttggaa 5520

aaccggtacg gaatacaatt tcggtcacta catgatcaat acgctcaagt tcgtgattcc 5580

gaaagtgcta ctgaccatta tctcttccac cattgtcgct tacggctttg cccgtttcga 5640

gattccatgg aagggcttct ggttcgggac gctgatcacc accatgctgt taccaagcac 5700

cgtgttgctg attccgcagt acatcatgtt ccgtgaaatg ggcatgctga acagctatct 5760

gccactgtac ttgccgatgg cgtttgcaac acaagggttc tttgtgttca tgctgatcca 5820

gttcctgcgt ggtgtaccac gtgatatgga agaagccgcc cagatcgatg gctgtaactc 5880

cttccaggtt ctgtggtatg tggtcgtgcc gattttgaaa ccagccatca tctctgttgc 5940

gctgttccag ttcatgtggt caatgaacga cttcatcggt ccgctgattt atgtctatag 6000

cgtggataaa tatccgattg cgctggcgct gaaaatgtct atcgacgtta ctgaaggcgc 6060

tccgtggaat gaaatcctgg caatgtccag catctccatt ctgccatcca ttattgtttt 6120

cttcctggca cagcgttact tcgtacaagg cgtgaccagc agcggaatta aaggttaata 6180

gaggatttat catggctgaa gttattttca ataaactgga aaaagtatac accaacggct 6240

tcaaagcggt tcacggcatc gacctgacca ttaaagacgg tgagttcatg gttatcgtcg 6300

gcccgtcagg ctgtgcgaaa tcaacgacgc tgcgtatgtt agcgggtctg gaaaccatca 6360

gcggcggtga agttcgcatc ggcgagcgcg ttgttaacaa tctggcaccg aaagagcgtg 6420

ggattgcaat ggtgttccag aactatgcgc tctaccctca tatgacggta aaagagaacc 6480

tggcgtttgg tctgaagctg agcaaaatgc ctaaagatca aattgaagcg caagtaacgg 6540

aagcagccaa aattctggag ctggaagacc tgatggatcg tctgccacgc cagctatctg 6600

gtggtcaggc gcagcgtgtg gccgtaggcc gtgccatcgt taaaaagccg gatgttttcc 6660

tgtttgatga accgttatct aacctggatg ccaaactgcg tgcttccatg cgtatccgta 6720

tttctgacct gcataagcag ttgaagaaaa gcggtaaagc ggcaacgacg gtatatgtta 6780

cccacgacca gactgaagcc atgaccatgg gcgaccgtat ctgcgttatg aagctgggtc 6840

acatcatgca ggtcgatacg ccggataacc tgtaccattt ccctgtcaac atgttcgttg 6900

ctggcttcat tggctcacca gaaatgaaca ttaagccgtg caaactggtc gagaaagacg 6960

gtcagattgg cgttgttgtg ggtaataacg cgctggtatt aaatactgaa aaacaagata 7020

aagtgcgcag ctacgtagga caagacgtat tcttcggcgt tcgcccagac tatgtttcct 7080

tgtcagatac gccatttgaa ggcagccact cacagggtga actggttcgc gtagaaaaca 7140

tgggtcacga attctttatg tacattaaag tcgatggctt tgaattaacc agccgcattc 7200

cttatgacga aggtcggctg attatcgaga agggactgca tcgtccggta tatttccagt 7260

tcgacatgga aaaatgccat atttttgatg caaaaacaga aaaaaatatc tctctttaac 7320

aggagtagta accgatgaaa aaagcgatcc tacacacgtt aatagcttca tctttggcat 7380

tagttgcaat gccatctctg gcagccgatc aggttgagtt gagaatgtcc tggtggggcg 7440

gcaacagccg tcaccaacag acgctcaagg cgattgaaga gttccataag cagcacccag 7500

acatcaccgt gaaagcggaa tacaccggat gggatggtca cctgtctcgt ctgacaacac 7560

agattgccgg taacactgag ccagatgtga tgcagactaa ctggaactgg ctgccgattt 7620

tctccaaaaa cggcgatggt ttttatgatc tgaacaaagt gaaagattct ctggatctga 7680

cccagttcga agcaaaagaa ctgcaaaaca ccacggttaa cggcaagctg aacggtattc 7740

ctatttctgt taccgctcgc gtgttctatt tcaacaacga aagctgggca aaagcgggac 7800

tggaataccc gaaaacgtgg gacgaactgc tgaacgccgg taaagtgttc aaagagaagc 7860

tgggcgacca atactaccct atcgtgttgg aacaccagga ttctctggca ctgctgaact 7920

cttacatggt tcaaaaatac aacattcctg ctattgatgt gaaaagtcag aaattcgcct 7980

ataccgatgc acaatgggtt gaattctttg gcatgtataa gaaactgatc gacagccatg 8040

tcatgcctga tgcgaaatac tatgcctctt tcggtaagag caacatgtat gagatgaagc 8100

catggatcaa tggcgagtgg tctggtactt acatgtggaa ctccactatc actaagtact 8160

ctgacaactt gcaaccacca gcaaaactgg cgttaggtaa ctacccaatg ctgcctggtg 8220

caaaagatgc tggcttgttc ttcaaacctg cacaaatgct gtctatcggt aagtcaacca 8280

agcatcctaa agagtctgct cagttgatca acttcctgct gaacagcaaa gaaggtgctc 8340

aggctttggg tctggaacgt ggtgtaccgt tgagtaaagc ggctgtggct cagctgaccg 8400

ctgatggcat catcaaagat gatgctccag cagttgccgg gttgaagctg gcgctgtctc 8460

tgccgcatga agttgctgtt tctccttatt tcgacgaccc acaaatcgtt tctctgtttg 8520

gtgataccat ccaatctatc gattatggtc agaaatctgt ggaagacgca gcgaaatact 8580

tccagcgtca atctgagcgt gttctgaaac gcgcaatgaa ataatgtagc actcgattta 8640

ccctgtaatt catccctgcc gcaccgacgg cagggatttt tcatttaaat taaaacatcc 8700

tctatattca attcgatctc cctcacaatt tgaaacccta ttttactttt tgttactcaa 8760

aacgatctcg atcacagaac gtaatttaat aataaataga atagaacttg tcccaaaaaa 8820

cataatgcgc ctttcgaatt aaagtattaa gcacagtcct aaccaatggg gaatataaca 8880

atgaaattta aattattagc tctggctgtt acatcattaa ttagtgtgaa tgcaatggct 8940

gtaactatcg attaccgtca tgaaatgaaa gatacaccga aaaatgatca ccgcgatcgt 9000

ttgtcaatgt cacaccgttt tgccaatggc tttggtttat ccgttgaagc aaaatggcgt 9060

caatccagtg ctgacagcac accgaataaa ccatttaatg aaaccgtcag caacggtact 9120

gaagttgtcg ccagctatgt ttacaacttc aacaaaactt tttctctgga gccaggtttc 9180

tctttagatt caagctctac ctctaacaac tatcgccctt atctgcgcgg taaagtgaat 9240

atcactgacg atctttctac ctctttacgt tatcgtcctt actacaaacg taacagcggt 9300

gatgttccaa atgcatcaaa aaacaaccaa gagaatggtt ataacctaac cgccgttctc 9360

agctataaat tcctgaaaga tttccaagtt gattacgaac tggactacaa aaaagcaaat 9420

aaagccggtg cgtatcaata cgacaatgaa acatacaatt tcgaccatga tgtaaaattg 9480

tcttataaaa tggataaaaa ctggaagcct tatatggctg taggtaatgt tgcagattcc 9540

ggcaccaacg atcatcgtca aactcgttac cgtgttggtg tgcaatacag cttctaataa 9600

cggccttgtt atttaaataa gcgttattag gtagcagaag ggatgttatt gttaatcgat 9660

ttactcagat ctacttttat cattaacatc cctttattat ggtgtccgtt gtaggttaag 9720

caggttagtt acgtttcttt gttgtacatg atttagttat atgcgtttta gctgctgtaa 9780

ttgctgtgtc tgatttaccc tcttcgtgta tgaatgttat ttctttatta aaatttgcgg 9840

ttcagggtag tcattttttc tccgatgtga tggctaccct attttttacc accgcccaac 9900

gattcccccc tcattccctt tgtcaggtga tctatcatga ttgttcgttc tctgcttgtc 9960

ggggccatta tgatgtctgt aaatggatta agttacgcac aacctgtttt ctctgtctgg 10020

ccacacggtg aagcaccggg tgcctcttct tcaacggcac agccgcaagt ggtcgaacgg 10080

agtaaagatc cttctcttcc cgatcgagcc gcaacgggta ttcgcagccc tgaaattacc 10140

gtttatccgg cagagaaacc caatggcatg gcattactca ttacgccggg cggttcttat 10200

cagcgcgtcg tgctagataa agaaggcagc gatctagccc ctttctttaa tcaacaaggc 10260

tacacccttt tcgtgatgac ctatcgtatg cccggtgaag gccataaaga aggcgctgac 10320

gctccgctag ccgatgccca acgagccatc agaacactga gagccaacgc cgaaaagtgg 10380

cacattaacc cgcagcgcat cggtattatg gggttctccg ccggtggtca cgttgccgcc 10440

agccttggaa cccgattcgc acagtccgtt taccccgcga tggacgccgt tgataacgta 10500

agcgcacgcc ctgacttcat ggtgttgatg taccccgtaa tttctatgca ggcagatatt 10560

gcgcacgccg gttcacgtaa acagttaatc ggcgagcaac cgatggaagt acaagcggta 10620

cgttattctc ctgagaaaca ggttactgat cagactcccc ccacgttttt ggtgcatgcg 10680

gttgacgatc cgtcagtgtc ggttgataac agcctggtga tgtttagcgc gctgcgggca 10740

aagcagattc cggtcgaaat gcatctcttt gagaaaggta aacacggctt cggtctccgc 10800

ggcaccaagg ggcttcctgc cgctgcctgg cctcaactgc tggacaactg gctacgcgct 10860

ttacctgcaa gcaacgaatt gccgaaagcc gcgccataag gtatagcaaa catcgtaacc 10920

gaaataaatc gttacgccgt caccgcttcc gcagacaggg ataatct 10967

<210>66

<211>2582

<212>DNA

<213>胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043

<400>66

ccaacggcgg gtgcgacata aacataagcg aatcgaagcg ctgcgctccg gtgagtatct 60

gaagtaattt acgatagttt ctttccaaag gcccattcgg gcctttgtta tttcagcgtt 120

tattgattca tcaaacctgc gctttctctg ctcgaatgtt ttcactagat ctgaaacagg 180

tggtgaaaac atgaagaatg ttttataaaa taaaaccacg atcacggaaa aatgaaacat 240

tgtttctata ataccgatat gacaggcgtc tcgcgtgaga tttgtggcct gatttttgaa 300

caaccggtgt cggggtgacc gattcgtcgg acgttcagta atgtcaggtt atcgaagcgt 360

atgcgtgtgt ggcgtcaaat tcttcatgat aagttctaag gatttacgga tggccaaagg 420

taataagatc cccctaacgt ttcataccta ccaggatgca gcaaccggca ccgaagttgt 480

gcgtttaacc ccgcccgatg ttatctgcca ccggaattat ttctaccaga agtgtttctt 540

caatgacggt agcaagctgc tgtttggcgc tgcatttgat ggcccatgga actactatct 600

gctggattta aaagagcaga acgccacaca gttgacggaa ggcaaaggcg acaatacttt 660

tggtggtttc ctgtctccga atgacgatgc gctatattac gttaaaaata cccgtaattt 720

gatgcgtgtc gatctgacta cgctggaaga gaaaacgatt tatcaggtgc ctgacgattg 780

ggtcggctac ggtacttggg ttgccaactc cgattgcacc aaaatggtcg gtattgagat 840

caagaaagaa gactggaagc cactgaccga ttggaaaaaa ttccaggagt tctacttcac 900

taatccttgc tgtcgtctga ttcgcgtcga tttggtaacg ggcgaagcgg agactatcct 960

tcaggaaaac cagtggctgg gtcacccaat ctaccgtcca ggtgatgaca acacggttgc 1020

tttctgtcac gaaggcccgc atgacctggt tgatgctcgt atgtggttca tcaacgaaga 1080

tggcaccaac atgcgcaaag tgaaagagca tgcagaaggc gaaagctgca cccacgaatt 1140

ttgggtgccg gatggctccg cgatgattta tgtctcttat cttaaagacg ataccaaccg 1200

ttatattcgc agcatcgatc ccgttacgct ggaagatcgc caactgcgtg taatgccgcc 1260

gtgttctcac ctgatgagta actatgatgg cacactgttg gtcggtgatg gttccgatgc 1320

accggtcgac gtgcaggatg atggtggcta caaaattgag aacgatccgt tcctgtatgt 1380

tttcaacctg aaaactggca aagaacatcg tattgcgcag cacaatacat cctgggaagt 1440

gttggaaggg gaccgtcagg tcactcaccc gcacccgtct ttcacgccgg ataataaaca 1500

agttctgttt acttctgacg tagatggaaa acctgcgttg tatctggcga aggttcctga 1560

ttcagtctgg aactaataat actaataaat ccgcgtcacg tttcatggcg cggattattt 1620

taaaatattt acttacatat tattttatta agtctctgac gcggttattt ctcaaactta 1680

acttgattat cgttgttgct ccattgccat aatcaaagcg ttccctttat actaaaacca 1740

ttgttctatt ttttttaaaa caaaaaaacc tgagtagggt aaccacaaaa atggctagtg 1800

cagatttaga taaacaaccc gattccgtgt cgtccgtttt aaaggttttt ggtattttgc 1860

aggcattagg tgaagagaga gaaattggta ttaccgagct ttctcagcga gtcatgatgt 1920

ctaagagtac cgtttaccgt ttcttgcaga cgatgaaatc cctgggctat gtcgcgcagg 1980

aaggtgaatc agagaagtat tcgctaacgc tcaagttgtt tgaacttggt gcaaaagcat 2040

tgcagaacgt agacttaatc cgcagtgcgg atatacagat gcgcgagttg tctgtgctga 2100

cgcgggaaac gattcacctt ggcgcgttgg atgaagacgg catcgtttat atccacaaga 2160

ttgattctat gtataacctg cgtatgtatt cgcgcatcgg tcgccgtaat ccactacaca 2220

gtaccgcaat tggtaaagtg ttgctggctt ggcgcgatcg cggtgaagtg gaagaggttc 2280

tgtcgactgt cgaattcacg cgtagtacgc cacacacatt gtgtactgct gaagatcttc 2340

tcaatcaact ggatgtcgtg cgtgagcaag gctacgggga agataaagaa gagcaggaag 2400

aagggctgcg ttgtatcgct gtgccagtat tcgatcgttt tggtgtggtg attgccggcc 2460

tcagtatttc cttcccaacg attcgttttt cagaagaaaa caaacacgaa tatgtggcca 2520

tgctgcacac cgcagctaga aatatctctg agcaaatggg ctaccacaat ttccctttct 2580

ga 2582

<210>67

<211>2331

<212>DNA

<213>根癌农杆菌

<400>67

atgcgtccct ctgccccggc catctccaga cagacacttc tcgatgaacc ccgcccgggc 60

tcattgacca ttggctacga gccgagcgaa gaagcacaac cgacggagaa ccctccgcgc 120

ttttcatggc tacccgatat tgacgacggc gcgcgttacg tgctgcgcat ttcgaccgat 180

cccggtttta cagacaaaaa aacgctcgtc ttcgaggatc tcgcctggaa tttcttcacc 240

ccggatgaag cactgccgga cggccattat cactggtgtt atgcgctatg ggatcagaaa 300

tccgcaacag cgcattccaa ctggagcacc gtacgcagtt tcgagatcag tgaagcactg 360

ccgaaaacgc cgctgcccgg caggtctgcc cgccatgctg ccgcgcaaac cagccaccct 420

cggctgtggc tcaactccga gcaattgagt gccttcgccg atgccgttgc gaaggacccc 480

aaccattgtg gctgggccga gttttacgaa aaatcggtcg agccgtggct cgagcggccg 540

gtcatgccgg aaccgcagcc ctatcccaac aacacgcgtg tcgccacgct ctggcggcag 600

atgtatatag actgccagga agtgatctat gcgatccggc acctggccat tgccggccgc 660

gtgctcggac gcgacgacct tctcgatgca tcccgcaaat ggctgctggc cgtcgccgcc 720

tgggacacga aaggtgcgac ctcacgcgcc tataatgacg aggcggggtt ccgcgtcgtc 780

gtcgcactcg cctggggtta tgactggctg tacgaccatc tgagcgaaga cgaacgcagg 840

accgtgcgat ccgttcttct cgaacggacg cgggaagttg ccgatcatgt catcgcacac 900

gcccgcattc acgtctttcc ctatgacagc catgcggtgc gctcgctttc ggctgtattg 960

acgccggcct gcatcgcact tcagggagaa agcgacgagg ctggcgaatg gctcgactat 1020

accgtcgaat tccttgccac gctctattct ccctgggcgg gaaccgatgg tggttgggcg 1080

gaaggtccgc attactggat gaccggcatg gcctatctca tcgaggccgc caatctgatc 1140

cgctcctata ttggttatga cctctatcaa cggccgtttt tccagaatac cggtcgcttc 1200

ccgctttaca ccaaggcgcc gggaacccgc cgcgccaact tcggcgacga ctccaccctt 1260

ggcgaccttc ccggcctgaa gctgggatac aacgtccggc aattcgccgg cgtcaccggc 1320

aatggccatt accagtggta tttcgatcac atcaaggccg atgcgacagg cacggaaatg 1380

gccttttaca attacggctg gtgggacctc aacttcgacg atctcgtcta tcgccacgat 1440

tacccgcagg tggaagccgt gtctcccgcc gacctgccgg cactcgccgt tttcgatgat 1500

attggttggg cgaccatcca aaaagacatg gaagacccgg accggcacct gcagttcgtc 1560

ttcaaatcca gcccttacgg ttcgctcagc cacagtcacg gcgaccagaa tgcctttgtg 1620

ctttatgccc atggcgagga tctggcgatc cagtccggtt attacgtggc gttcaattcg 1680

cagatgcatc tgaattggcg gcgtcagaca cggtcgaaaa atgccgtgct gatcggcggc 1740

aaaggccaat atgcggaaaa ggacaaggcg cttgcacgcc gcgccgccgg ccgcatcgtc 1800

tcggtggagg aacagcccgg ccatgttcgt atcgtcggcg atgcaaccgc cgcctaccag 1860

gttgcgaacc cgctggttca aaaggtgctg cgcgaaaccc acttcgttaa tgacagctat 1920

ttcgtgattg tcgacgaagt cgaatgttcg gaaccccagg aactgcaatg gctttgccat 1980

acactcggag cgccgcagac cggcaggtca agcttccgct acaatggccg gaaagccggt 2040

ttctacggac agttcgttta ctcttcgggc ggcacgccgc aaatcagcgc cgtggagggt 2100

tttcccgata tcgacccgaa agaattcgaa gggctcgaca tacaccacca tgtctgcgcc 2160

acggttccgg ccgccacccg gcatcgcctt gtcacccttc tggtgcctta cagcctgaag 2220

gagccgaagc gcattttcag cttcatcgat gatcagggtt tttccaccga catctacttc 2280

agtgatgtcg atgacgagcg tttcaagctc tcccttccca agcagttcta a 2331

<210>68

<211>776

<212>PRT

<213>根癌农杆菌

<400>68

Met Arg Pro Ser Ala Pro Ala Ile Ser Arg Gln Thr Leu Leu Asp Glu

1 5 10 15

Pro Arg Pro Gly Ser Leu Thr Ile Gly Tyr Glu Pro Ser Glu Glu Ala

20 25 30

Gln Pro Thr Glu Asn Pro Pro Arg Phe Ser Trp Leu Pro Asp Ile Asp

35 40 45

Asp Gly Ala Arg Tyr Val Leu Arg Ile Ser Thr Asp Pro Gly Phe Thr

50 55 60

Asp Lys Lys Thr Leu Val Phe Glu Asp Leu Ala Trp Asn Phe Phe Thr

65 70 75 80

Pro Asp Glu Ala Leu Pro Asp Gly His Tyr His Trp Cys Tyr Ala Leu

85 90 95

Trp Asp Gln Lys Ser Ala Thr Ala His Ser Asn Trp Ser Thr Val Arg

100 105 110

Ser Phe Glu Ile Ser Glu Ala Leu Pro Lys Thr Pro Leu Pro Gly Arg

115 120 125

Ser Ala Arg His Ala Ala Ala Gln Thr Ser His Pro Arg Leu Trp Leu

130 135 140

Asn Ser Glu Gln Leu Ser Ala Phe Ala Asp Ala Val Ala Lys Asp Pro

145 150 155 160

Asn His Cys Gly Trp Ala Glu Phe Tyr Glu Lys Ser Val Glu Pro Trp

165 170 175

Leu Glu Arg Pro Val Met Pro Glu Pro Gln Pro Tyr Pro Asn Asn Thr

180 185 190

Arg Val Ala Thr Leu Trp Arg Gln Met Tyr Ile Asp Cys Gln Glu Val

195 200 205

Ile Tyr Ala Ile Arg His Leu Ala Ile Ala Gly Arg Val Leu Gly Arg

210 215 220

Asp Asp Leu Leu Asp Ala Ser Arg Lys Trp Leu Leu Ala Val Ala Ala

225 230 235 240

Trp Asp Thr Lys Gly Ala Thr Ser Arg Ala Tyr Asn Asp Glu Ala Gly

245 250 255

Phe Arg Val Val Val Ala Leu Ala Trp Gly Tyr Asp Trp Leu Tyr Asp

260 265 270

His Leu Ser Glu Asp Glu Arg Arg Thr Val Arg Ser Val Leu Leu Glu

275 280 285

Arg Thr Arg Glu Val Ala Asp His Val Ile Ala His Ala Arg Ile His

290 295 300

Val Phe Pro Tyr Asp Ser His Ala Val Arg Ser Leu Ser Ala Val Leu

305 310 315 320

Thr Pro Ala Cys Ile Ala Leu Gln Gly Glu Ser Asp Glu Ala Gly Glu

325 330 335

Trp Leu Asp Tyr Thr Val Glu Phe Leu Ala Thr Leu Tyr Ser Pro Trp

340 345 350

Ala Gly Thr Asp Gly Gly Trp Ala Glu Gly Pro His Tyr Trp Met Thr

355 360 365

Gly Met Ala Tyr Leu Ile Glu Ala Ala Asn Leu Ile Arg Ser Tyr Ile

370 375 380

Gly Tyr Asp Leu Tyr Gln Arg Pro Phe Phe Gln Asn Thr Gly Arg Phe

385 390 395 400

Pro Leu Tyr Thr Lys Ala Pro Gly Thr Arg Arg Ala Asn Phe Gly Asp

405 410 415

Asp Ser Thr Leu Gly Asp Leu Pro Gly Leu Lys Leu Gly Tyr Asn Val

420 425 430

Arg Gln Phe Ala Gly Val Thr Gly Asn Gly His Tyr Gln Trp Tyr Phe

435 440 445

Asp His Ile Lys Ala Asp Ala Thr Gly Thr Glu Met Ala Phe Tyr Asn

450 455 460

Tyr Gly Trp Trp Asp Leu Asn Phe Asp Asp Leu Val Tyr Arg His Asp

465 470 475 480

Tyr Pro Gln Val Glu Ala Val Ser Pro Ala Asp Leu Pro Ala Leu Ala

485 490 495

Val Phe Asp Asp Ile Gly Trp Ala Thr Ile Gln Lys Asp Met Glu Asp

500 505 510

Pro Asp Arg His Leu Gln Phe Val Phe Lys Ser Ser Pro Tyr Gly Ser

515 520 525

Leu Ser His Ser His Gly Asp Gln Asn Ala Phe Val Leu Tyr Ala His

530 535 540

Gly Glu Asp Leu Ala Ile Gln Ser Gly Tyr Tyr Val Ala Phe Asn Ser

545 550 555 560

Gln Met His Leu Asn Trp Arg Arg Gln Thr Arg Ser Lys Asn Ala Val

565 570 575

Leu Ile Gly Gly Lys Gly Gln Tyr Ala Glu Lys Asp Lys Ala Leu Ala

580 585 590

Arg Arg Ala Ala Gly Arg Ile Val Ser Val Glu Glu Gln Pro Gly His

595 600 605

Val Arg Ile Val Gly Asp Ala Thr Ala Ala Tyr Gln Val Ala Asn Pro

610 615 620

Leu Val Gln Lys Val Leu Arg Glu Thr His Phe Val Asn Asp Ser Tyr

625 630 635 640

Phe Val Ile Val Asp Glu Val Glu Cys Ser Glu Pro Gln Glu Leu Gln

645 650 655

Trp Leu Cys His Thr Leu Gly Ala Pro Gln Thr Gly Arg Ser Ser Phe

660 665 670

Arg Tyr Asn Gly Arg Lys Ala Gly Phe Tyr Gly Gln Phe Val Tyr Ser

675 680 685

Ser Gly Gly Thr Pro Gln Ile Ser Ala Val Glu Gly Phe Pro Asp Ile

690 695 700

Asp Pro Lys Glu Phe Glu Gly Leu Asp Ile His His His Val Cys Ala

705 710 715 720

Thr Val Pro Ala Ala Thr Arg His Arg Leu Val Thr Leu Leu Val Pro

725 730 735

Tyr Ser Leu Lys Glu Pro Lys Arg Ile Phe Ser Phe Ile Asp Asp Gln

740 745 750

Gly Phe Ser Thr Asp Ile Tyr Phe Ser Asp Val Asp Asp Glu Arg Phe

755 760 765

Lys Leu Ser Leu Pro Lys Gln Phe

770 775

<210>69

<211>1068

<212>DNA

<213>根癌农杆菌C58

<400>69

atgttcacaa cgtccgccta tgcctgcgat gacggctctt cgccgatgaa gctcgcgacc 60

atcaggcgcc gcgatcccgg tccgcgcgat gtcgaaatcg agatagaatt ctgtggcgtc 120

tgccactcgg acatccatac ggcccgcagc gaatggccgg gctccctcta cccttgcgtc 180

cccggccacg aaatcgtcgg ccgtgtcggt cgggtgggcg cgcaagtcac ccggttcaag 240

acgggtgacc gcgtcggtgt cggctgtatc gtcgatagct gccgcgaatg cgcaagctgc 300

gccgaagggc tggagcaata ttgcgaaaac ggcatgaccg gcacctataa ctcccctgac 360

aaggcgatgg gcggcggcgc gcatacgctt ggcggctatt ccgcccatgt ggtggtggat 420

gaccgctatg tgctcaatat tcccgaaggg ctcgatccgg cggcagcagc accgctactc 480

tgcgctggta tcaccaccta ctcgccgctg cgccactgga atgccggccc cggcaaacgc 540

gtcggcgtcg tcggtctggg cggcctcggc catatggccg tcaagctcgc caatgccatg 600

ggtgcgactg tcgtgatgat caccacctcg cccggcaagg cggaggatgc caaaaaactc 660

ggcgcacacg aggtgatcat ctcccgcgat gcggagcaga tgaagaaggc tacctcgagc 720

ctcgatctca tcatcgatgc tgtcgccgcc gaccacgaca tcgacgccta tctggcgctg 780

ctgaaacgcg atggcgcgct ggtgcaggtg ggcgcgccgg aaaagccact ttcggtgatg 840

gccttcagcc tcatccccgg ccgcaagacc tttgccggct cgatgatcgg cggtattccc 900

gagactcagg aaatgctgga tttctgcgcc gaaaaaggca tcgccggcga aatcgagatg 960

atcgatatcg atcagatcaa tgacgcttat gaacgcatga taaaaagcga tgtgcgttat 1020

cgtttcgtca ttgatatgaa gagcctgccg cgccagaagg ccgcctga 1068

<210>70

<211>355

<212>PRT

<213>根癌农杆菌C58

<400>70

Met Phe Thr Thr Ser Ala Tyr Ala Cys Asp Asp Gly Ser Ser Pro Met

1 5 10 15

Lys Leu Ala Thr Ile Arg Arg Arg Asp Pro Gly Pro Arg Asp Val Glu

20 25 30

Ile Glu Ile Glu Phe Cys Gly Val Cys His Ser Asp Ile His Thr Ala

35 40 45

Arg Ser Glu Trp Pro Gly Ser Leu Tyr Pro Cys Val Pro Gly His Glu

50 55 60

Ile Val Gly Arg Val Gly Arg Val Gly Ala Gln Val Thr Arg Phe Lys

65 70 75 80

Thr Gly Asp Arg Val Gly Val Gly Cys Ile Val Asp Ser Cys Arg Glu

85 90 95

Cys Ala Ser Cys Ala Glu Gly Leu Glu Gln Tyr Cys Glu Asn Gly Met

100 105 110

Thr Gly Thr Tyr Asn Ser Pro Asp Lys Ala Met Gly Gly Gly Ala His

115 120 125

Thr Leu Gly Gly Tyr Ser Ala His Val Val Val Asp Asp Arg Tyr Val

130 135 140

Leu Asn Ile Pro Glu Gly Leu Asp Pro Ala Ala Ala Ala Pro Leu Leu

145 150 155 160

Cys Ala Gly Ile Thr Thr Tyr Ser Pro Leu Arg His Trp Asn Ala Gly

165 170 175

Pro Gly Lys Arg Val Gly Val Val Gly Leu Gly Gly Leu Gly His Met

180 185 190

Ala Val Lys Leu Ala Asn Ala Met Gly Ala Thr Val Val Met Ile Thr

195 200 205

Thr Ser Pro Gly Lys Ala Glu Asp Ala Lys Lys Leu Gly Ala His Glu

210 215 220

Val Ile Ile Ser Arg Asp Ala Glu Gln Met Lys Lys Ala Thr Ser Ser

225 230 235 240

Leu Asp Leu Ile Ile Asp Ala Val Ala Ala Asp His Asp Ile Asp Ala

245 250 255

Tyr Leu Ala Leu Leu Lys Arg Asp Gly Ala Leu Val Gln Val Gly Ala

260 265 270

Pro Glu Lys Pro Leu Ser Val Met Ala Phe Ser Leu Ile Pro Gly Arg

275 280 285

Lys Thr Phe Ala Gly Ser Met Ile Gly Gly Ile Pro Glu Thr Gln Glu

290 295 300

Met Leu Asp Phe Cys Ala Glu Lys Gly Ile Ala Gly Glu Ile Glu Met

305 310 315 320

Ile Asp Ile Asp Gln Ile Asn Asp Ala Tyr Glu Arg Met Ile Lys Ser

325 330 335

Asp Val Arg Tyr Arg Phe Val Ile Asp Met Lys Ser Leu Pro Arg Gln

340 345 350

Lys Ala Ala

355

<210>71

<211>1047

<212>DNA

<213>根癌农杆菌C58

<400>71

atggctattg caagaggtta tgctgcgacc gacgcgtcga agccgcttac cccgttcacc 60

ttcgaacgcc gcgagccgaa tgatgacgac gtcgtcatcg atatcaaata tgccggcatc 120

tgccactcgg acatccacac cgtccgcaac gaatggcaca atgccgttta cccgatcgtt 180

ccgggccacg aaatcgccgg tgtcgtgcgg gccgttggtt ccaaggtcac gcggttcaag 240

gtcggcgacc atgtcggcgt cggctgcttt gtcgattcct gcgttggctg cgccacccgc 300

gatgtcgaca atgagcagta tatgccgggt ctcgtgcaga cctacaattc cgttgaacgg 360

gacggcaaga gcgcgaccca gggcggttat tccgaccata tcgtggtcag ggaagactac 420

gtcctgtcca tcccggacaa cctgccgctc gatgcctccg cgccgcttct ctgcgccggc 480

atcacgctct attcgccgct gcagcactgg aatgcaggcc ccggcaagaa agtggctatc 540

gtcggcatgg gtggccttgg ccacatgggc gtgaagatcg gctcggccat gggcgctgat 600

atcaccgttc tctcgcagac gctgtcgaag aaggaagacg gcctcaagct cggcgcgaag 660

gaatattacg ccaccagcga cgcctcgacc tttgagaaac tcgccggcac cttcgacctg 720

atcctgtgca cagtctcggc cgaaatcgac tggaacgcct acctcaacct gctcaaggtc 780

aacggcacga tggttctgct cggcgtgccg gaacatgcga tcccggtgca cgcattctcg 840

gtcattcccg cccgccgttc gctcgccggt tcgatgatcg gctcgatcaa ggaaacccag 900

gaaatgctgg atttctgcgg caagcacgac atcgtttcgg aaatcgaaac gatcggcatc 960

aaggacgtca acgaagccta tgagcgcgtg ctgaagagcg acgtgcgtta ccgcttcgtc 1020

atcgacatgg cctcgctcga cgcttga 1047

<210>72

<211>348

<212>PRT

<213>根癌农杆菌C58

<400>72

Met Ala Ile Ala Arg Gly Tyr Ala Ala Thr Asp Ala Ser Lys Pro Leu

1 5 10 15

Thr Pro Phe Thr Phe Glu Arg Arg Glu Pro Asn Asp Asp Asp Val Val

20 25 30

Ile Asp Ile Lys Tyr Ala Gly Ile Cys His Ser Asp Ile His Thr Val

35 40 45

Arg Asn Glu Trp His Asn Ala Val Tyr Pro Ile Val Pro Gly His Glu

50 55 60

Ile Ala Gly Val Val Arg Ala Val Gly Ser Lys Val Thr Arg Phe Lys

65 70 75 80

Val Gly Asp His Val Gly Val Gly Cys Phe Val Asp Ser Cys Val Gly

85 90 95

Cys Ala Thr Arg Asp Val Asp Asn Glu Gln Tyr Met Pro Gly Leu Val

100 105 110

Gln Thr Tyr Asn Ser Val Glu Arg Asp Gly Lys Ser Ala Thr Gln Gly

115 120 125

Gly Tyr Ser Asp His Ile Val Val Arg Glu Asp Tyr Val Leu Ser Ile

130 135 140

Pro Asp Asn Leu Pro Leu Asp Ala Ser Ala Pro Leu Leu Cys Ala Gly

145 150 155 160

Ile Thr Leu Tyr Ser Pro Leu Gln His Trp Asn Ala Gly Pro Gly Lys

165 170 175

Lys Val Ala Ile Val Gly Met Gly Gly Leu Gly His Met Gly Val Lys

180 185 190

Ile Gly Ser Ala Met Gly Ala Asp Ile Thr Val Leu Ser Gln Thr Leu

195 200 205

Ser Lys Lys Glu Asp Gly Leu Lys Leu Gly Ala Lys Glu Tyr Tyr Ala

210 215 220

Thr Ser Asp Ala Ser Thr Phe Glu Lys Leu Ala Gly Thr Phe Asp Leu

225 230 235 240

Ile Leu Cys Thr Val Ser Ala Glu Ile Asp Trp Asn Ala Tyr Leu Asn

245 250 255

Leu Leu Lys Val Asn Gly Thr Met Val Leu Leu Gly Val Pro Glu His

260 265 270

Ala Ile Pro Val His Ala Phe Ser Val Ile Pro Ala Arg Arg Ser Leu

275 280 285

Ala Gly Ser Met Ile Gly Ser Ile Lys Glu Thr Gln Glu Met Leu Asp

290 295 300

Phe Cys Gly Lys His Asp Ile Val Ser Glu Ile Glu Thr Ile Gly Ile

305 310 315 320

Lys Asp Val Asn Glu Ala Tyr Glu Arg Val Leu Lys Ser Asp Val Arg

325 330 335

Tyr Arg Phe Val Ile Asp Met Ala Ser Leu Asp Ala

340 345

<210>73

<211>1029

<212>DNA

<213>根癌农杆菌C58

<400>73

atgactaaaa caatgaaggc ggcggttgtc cgcgcatttg gaaaaccgct gaccatcgag 60

gaagtggcaa taccggatcc cggccccggt gaaattctca tcaactacaa ggcgacgggc 120

gtttgccaca ccgacctgca cgccgcaacg ggggattggc cggtcaagcc caacccgccc 180

ttcattcccg gacatgaagg tgcaggttac gtcgccaaga tcggcgctgg cgtcaccggc 240

atcaaggagg gcgaccgcgc cggcacgccc tggctctaca ccgcctgcgg atgctgcatt 300

ccctgccgta ccggctggga aaccctgtgc ccgagccaga agaactcagg ttattccgtc 360

aacggcagct ttgccgaata tggccttgcc gatccgaaat tcgtcggccg cctgcctgac 420

aatctcgatt tcggcccagc cgcacccgtg ctctgcgccg gcgttacagt ctataagggc 480

ctgaaggaaa ccgaagtcag gcccggtgaa tgggtggtca tttcaggcat tggcgggctt 540

ggccacatgg ccgtgcaata tgcgaaagcc atgggcatgc atgtggttgc cgccgatatt 600

ttcgacgaca agctggcgct tgccaaaaag ctcggagccg acgtcgtcgt caacggccgc 660

gcgcctgacg cggtggagca agtgcaaaag gcaaccggcg gcgtccatgg cgcgctggtg 720

acggcggttt caccgaaggc catggagcag gcttatggct tcctgcgctc caagggcacg 780

atggcgcttg tcggtctgcc gccgggcttc atctccattc cggtgttcga cacggtgctg 840

aagcgcatca cggtgcgtgg ctccatcgtc ggcacgcggc aggatctgga ggaggcgttg 900

accttcgccg gtgaaggcaa ggtggccgcc cacttctcgt gggacaagct cgaaaacatc 960

aatgatatct tccatcgcat ggaagagggc aagatcgacg gccgtatcgt cgtggatctc 1020

gccgcctga 1029

<210>74

<211>342

<212>PRT

<213>根癌农杆菌C58

<400>74

Met Thr Lys Thr Met Lys Ala Ala Val Val Arg Ala Phe Gly Lys Pro

1 5 10 15

Leu Thr Ile Glu Glu Val Ala Ile Pro Asp Pro Gly Pro Gly Glu Ile

20 25 30

Leu Ile Asn Tyr Lys Ala Thr Gly Val Cys His Thr Asp Leu His Ala

35 40 45

Ala Thr Gly Asp Trp Pro Val Lys Pro Asn Pro Pro Phe Ile Pro Gly

50 55 60

His Glu Gly Ala Gly Tyr Val Ala Lys Ile Gly Ala Gly Val Thr Gly

65 70 75 80

Ile Lys Glu Gly Asp Arg Ala Gly Thr Pro Trp Leu Tyr Thr Ala Cys

85 90 95

Gly Cys Cys Ile Pro Cys Arg Thr Gly Trp Glu Thr Leu Cys Pro Ser

100 105 110

Gln Lys Asn Ser Gly Tyr Ser Val Asn Gly Ser Phe Ala Glu Tyr Gly

115 120 125

Leu Ala Asp Pro Lys Phe Val Gly Arg Leu Pro Asp Asn Leu Asp Phe

130 135 140

Gly Pro Ala Ala Pro Val Leu Cys Ala Gly Val Thr Val Tyr Lys Gly

145 150 155 160

Leu Lys Glu Thr Glu Val Arg Pro Gly Glu Trp Val Val Ile Ser Gly

165 170 175

Ile Gly Gly Leu Gly His Met Ala Val Gln Tyr Ala Lys Ala Met Gly

180 185 190

Met His Val Val Ala Ala Asp Ile Phe Asp Asp Lys Leu Ala Leu Ala

195 200 205

Lys Lys Leu Gly Ala Asp Val Val Val Asn Gly Arg Ala Pro Asp Ala

210 215 220

Val Glu Gln Val Gln Lys Ala Thr Gly Gly Val His Gly Ala Leu Val

225 230 235 240

Thr Ala Val Ser Pro Lys Ala Met Glu Gln Ala Tyr Gly Phe Leu Arg

245 250 255

Ser Lys Gly Thr Met Ala Leu Val Gly Leu Pro Pro Gly Phe Ile Ser

260 265 270

Ile Pro Val Phe Asp Thr Val Leu Lys Arg Ile Thr Val Arg Gly Ser

275 280 285

Ile Val Gly Thr Arg Gln Asp Leu Glu Glu Ala Leu Thr Phe Ala Gly

290 295 300

Glu Gly Lys Val Ala Ala His Phe Ser Trp Asp Lys Leu Glu Asn Ile

305 310 315 320

Asn Asp Ile Phe His Arg Met Glu Glu Gly Lys Ile Asp Gly Arg Ile

325 330 335

Val Val Asp Leu Ala Ala

340

<210>75

<211>1008

<212>DNA

<213>根癌农杆菌C58

<400>75

atgaccgggg cgaaccagcc ttgggaggtt caagaggttc ccgttccgaa ggcagagcca 60

ggacttgtcc ttgttaaaat ccacgcctcc ggcatgtgct acacggacgt gtgggcgacg 120

cagggtgccg gtggcgacat ctatccgcag acccccggcc atgaggttgt cggcgagatc 180

atcgaggtcg gcgcgggcgt tcatacgcgc aaggtgggag accgggtcgg caccacctgg 240

gtgcagtcct cttgtggacg atgctcctac tgccgccaga accgtccgtt gaccggccag 300

acagccatga actgcgattc acccaggaca acggggttcg cgacgcaagg cgggcacgca 360

gagtacatcg cgatctctgc tgaaggcaca gtgttattac ccgacgggct cgactacacg 420

gatgccgcac ccatgatgtg cgcaggctac acgacctgga gcggcttgcg cgacgccgag 480

cccaaacctg gtgacagaat tgcggtactt ggcatcggcg ggctggggca cgtcgccgtg 540

cagttctcca aagccttggg gtttgagacc atcgcgatca cgcattcacc cgacaagcac 600

aagttggcca ccgatcttgg tgcagacatc gtcgtcgccg atggcaaaga gttattggag 660

gccggcggtg cggacgttct tctggttacg accaacgact tcgacaccgc cgaaaaagcg 720

atggcgggcg taaggcctga cgggcgcatc gttctttgcg cgctcgactt cagcaagccg 780

ttctcgatcc cgtccgacgg caagccgttc cacatgatgc gccaacgcgt ggttgggtcc 840

acgcatggcg gacagcacta tctcgccgaa atcctcgatc tcgccgccaa gggcaaggtc 900

aagccgattg tcgagacctt cgccctcgag caggcaaccg aggcatatga gcggctatcc 960

accgggaaga tgcgcttccg gggcgtgttc cttccgcacg gcgcttga 1008

<210>76

<211>335

<212>PRT

<213>根癌农杆菌C58

<400>76

Met Thr Gly Ala Asn Gln Pro Trp Glu Val Gln Glu Val Pro Val Pro

1 5 10 15

Lys Ala Glu Pro Gly Leu Val Leu Val Lys Ile His Ala Ser Gly Met

20 25 30

Cys Tyr Thr Asp Val Trp Ala Thr Gln Gly Ala Gly Gly Asp Ile Tyr

35 40 45

Pro Gln Thr Pro Gly His Glu Val Val Gly Glu Ile Ile Glu Val Gly

50 55 60

Ala Gly Val His Thr Arg Lys Val Gly Asp Arg Val Gly Thr Thr Trp

65 70 75 80

Val Gln Ser Ser Cys Gly Arg Cys Ser Tyr Cys Arg Gln Asn Arg Pro

85 90 95

Leu Thr Gly Gln Thr Ala Met Asn Cys Asp Ser Pro Arg Thr Thr Gly

100 105 110

Phe Ala Thr Gln Gly Gly His Ala Glu Tyr Ile Ala Ile Ser Ala Glu

115 120 125

Gly Thr Val Leu Leu Pro Asp Gly Leu Asp Tyr Thr Asp Ala Ala Pro

130 135 140

Met Met Cys Ala Gly Tyr Thr Thr Trp Ser Gly Leu Arg Asp Ala Glu

145 150 155 160

Pro Lys Pro Gly Asp Arg Ile Ala Val Leu Gly Ile Gly Gly Leu Gly

165 170 175

His Val Ala Val Gln Phe Ser Lys Ala Leu Gly Phe Glu Thr Ile Ala

180 185 190

Ile Thr His Ser Pro Asp Lys His Lys Leu Ala Thr Asp Leu Gly Ala

195 200 205

Asp Ile Val Val Ala Asp Gly Lys Glu Leu Leu Glu Ala Gly Gly Ala

210 215 220

Asp Val Leu Leu Val Thr Thr Asn Asp Phe Asp Thr Ala Glu Lys Ala

225 230 235 240

Met Ala Gly Val Arg Pro Asp Gly Arg Ile Val Leu Cys Ala Leu Asp

245 250 255

Phe Ser Lys Pro Phe Ser Ile Pro Ser Asp Gly Lys Pro Phe His Met

260 265 270

Met Arg Gln Arg Val Val Gly Ser Thr His Gly Gly Gln His Tyr Leu

275 280 285

Ala Glu Ile Leu Asp Leu Ala Ala Lys Gly Lys Val Lys Pro Ile Val

290 295 300

Glu Thr Phe Ala Leu Glu Gln Ala Thr Glu Ala Tyr Glu Arg Leu Ser

305 310 315 320

Thr Gly Lys Met Arg Phe Arg Gly Val Phe Leu Pro His Gly Ala

325 330 335

<210>77

<211>1017

<212>DNA

<213>根癌农杆菌C58

<400>77

atgaccatgc atgccattca attcgtcgag aagggacgcg ccgtgctggc ggaactcccc 60

gtcgccgatc tgccgccggg ccatgcgctc gtgcgggtca aggcttcggg gctttgccat 120

accgatatcg acgtgctgca tgcgcgttat ggcgacggtg cgttccccgt cattccgggg 180

catgaatatg ctggcgaagt cgcagccgtg gcttccgatg tgacagtctt caaggctggc 240

gaccgggttg tcgtcgatcc caatctgccc tgtggcacct gcgccagctg caggaaaggg 300

ctgaccaacc tttgcagcac attgaaagct tacggcgttt cccacaatgg cggctttgcg 360

gagttcagtg tggtgcgtgc cgatcacctg cacggtatcg gttcgatgcc ctatcacgtc 420

gcggcgctgg ctgagccgct tgcctgtgtt gtcaatggca tgcagagtgc gggtattggc 480

gagagtggcg tggtgccgga gaatgcgctt gttttcggtg ctgggcccat cggcctgctg 540

cttgccctgt cgctgaaatc acgcggcatt gcgacggtga cgatggccga tatcaatgaa 600

agcaggctgg cctttgccca ggacctcggg cttcagacgg cggtatccgg ctcggaagcg 660

ctctcgcggc agcggaagga gttcgatttc gtggccgatg cgacgggtat tgccccggtc 720

gccgaggcga tgatcccgct ggttgcggat ggcggcacgg cgctattctt cggcgtctgc 780

gcgccggatg cccgtatttc ggtggcaccg tttgaaatct tccggcgcca gctgaaactt 840

gtcggctcgc attcgctgaa ccgcaacata ccgcaggcgc ttgccattct ggagacggat 900

ggcgaggtca tggcgcggct cgtttcgcac cgcttgccgc tttcggagat gctgccgttc 960

tttacgaaaa aaccgtctga tccggcgacg atgaaagtgc aatttgcagc cgaatga 1017

<210>78

<211>338

<212>PRT

<213>根癌农杆菌C58

<400>78

Met Thr Met His Ala Ile Gln Phe Val Glu Lys Gly Arg Ala Val Leu

1 5 10 15

Ala Glu Leu Pro Val Ala Asp Leu Pro Pro Gly His Ala Leu Val Arg

20 25 30

Val Lys Ala Ser Gly Leu Cys His Thr Asp Ile Asp Val Leu His Ala

35 40 45

Arg Tyr Gly Asp Gly Ala Phe Pro Val Ile Pro Gly His Glu Tyr Ala

50 55 60

Gly Glu Val Ala Ala Val Ala Ser Asp Val Thr Val Phe Lys Ala Gly

65 70 75 80

Asp Arg Val Val Val Asp Pro Asn Leu Pro Cys Gly Thr Cys Ala Ser

85 90 95

Cys Arg Lys Gly Leu Thr Asn Leu Cys Ser Thr Leu Lys Ala Tyr Gly

100 105 110

Val Ser His Asn Gly Gly Phe Ala Glu Phe Ser Val Val Arg Ala Asp

115 120 125

His Leu His Gly Ile Gly Ser Met Pro Tyr His Val Ala Ala Leu Ala

130 135 140

Glu Pro Leu Ala Cys Val Val Asn Gly Met Gln Ser Ala Gly Ile Gly

145 150 155 160

Glu Ser Gly Val Val Pro Glu Asn Ala Leu Val Phe Gly Ala Gly Pro

165 170 175

Ile Gly Leu Leu Leu Ala Leu Ser Leu Lys Ser Arg Gly Ile Ala Thr

180 185 190

Val Thr Met Ala Asp Ile Asn Glu Ser Arg Leu Ala Phe Ala Gln Asp

195 200 205

Leu Gly Leu Gln Thr Ala Val Ser Gly Ser Glu Ala Leu Ser Arg Gln

210 215 220

Arg Lys Glu Phe Asp Phe Val Ala Asp Ala Thr Gly Ile Ala Pro Val

225 230 235 240

Ala Glu Ala Met Ile Pro Leu Val Ala Asp Gly Gly Thr Ala Leu Phe

245 250 255

Phe Gly Val Cys Ala Pro Asp Ala Arg Ile Ser Val Ala Pro Phe Glu

260 265 270

Ile Phe Arg Arg Gln Leu Lys Leu Val Gly Ser His Ser Leu Asn Arg

275 280 285

Asn Ile Pro Gln Ala Leu Ala Ile Leu Glu Thr Asp Gly Glu Val Met

290 295 300

Ala Arg Leu Val Ser His Arg Leu Pro Leu Ser Glu Met Leu Pro Phe

305 310 315 320

Phe Thr Lys Lys Pro Ser Asp Pro Ala Thr Met Lys Val Gln Phe Ala

325 330 335

Ala Glu

<210>79

<211>1044

<212>DNA

<213>根癌农杆菌C58

<400>79

atgcgcgcgc tttattacga acgattcggc gagacccctg tagtcgcgtc cctgcctgat 60

ccggcaccga gcgatggcgg cgtggtgatt gcggtgaagg caaccggcct ctgccgcagc 120

gactggcatg gctggatggg acatgacacg gatatccgtc tgccgcatgt gcccggccac 180

gagttcgccg gcgtcatctc cgcagtcggc agaaacgtca cccgcttcaa gacgggtgat 240

cgcgttaccg tgcctttcgt ctccggctgc ggccattgcc atgagtgccg ctccggcaat 300

cagcaggtct gcgaaacgca gttccagccc ggcttcaccc attggggttc cttcgccgaa 360

tatgtcgcca tcgactatgc cgatcagaac ctcgtgcacc tgccggaatc gatgagttac 420

gccaccgccg ccggcctcgg ttgccgtttc gccacctcct tccgggcggt gacggatcag 480

ggacgcctga agggcggcga atggctggct gtccatggct gcggcggtgt cggtctctcc 540

gccatcatga tcggcgccgg cctcggcgca caggtcgtcg ccatcgatat tgccgaagac 600

aagctcgaac tcgcccggca actgggtgca accgcaacca tcaacagccg ctccgttgcc 660

gatgtcgccg aagcggtgcg cgacatcacc ggtggcggcg cgcatgtgtc ggtggatgcg 720

cttggccatc cgcagacctg ctgcaattcc atcagcaacc tgcgccggcg cggacgccat 780

gtgcaggtgg ggctgatgct ggcagaccat gccatgccgg ccattcccat ggcccgggtg 840

atcgctcatg agctggagat ctatggcagc cacggcatgc aggcatggcg ttacgaggac 900

atgctggcca tgatcgaaag cggcaggctt gcgccggaaa agctgattgg ccgccatatc 960

tcgctgaccg aagcggccgt cgccctgccc ggaatggata ggttccagga gagcggcatc 1020

agcatcatcg accggttcga atag 1044

<210>80

<211>357

<212>PRT

<213>根癌农杆菌C58

<400>80

Met Asn Leu Arg Thr Asn Asp Glu Ala Met Met Arg Ala Leu Tyr Tyr

1 5 10 15

Glu Arg Phe Gly Glu Thr Pro Val Val Ala Ser Leu Pro Asp Pro Ala

20 25 30

Pro Ser Asp Gly Gly Val Val Ile Ala Val Lys Ala Thr Gly Leu Cys

35 40 45

Arg Ser Asp Trp His Gly Trp Met Gly His Asp Thr Asp Ile Arg Leu

50 55 60

Pro His Val Pro Gly His Glu Phe Ala Gly Val Ile Ser Ala Val Gly

65 70 75 80

Arg Asn Val Thr Arg Phe Lys Thr Gly Asp Arg Val Thr Val Pro Phe

85 90 95

Val Ser Gly Cys Gly His Cys His Glu Cys Arg Ser Gly Asn Gln Gln

100 105 110

Val Cys Glu Thr Gln Phe Gln Pro Gly Phe Thr His Trp Gly Ser Phe

115 120 125

Ala Glu Tyr Val Ala Ile Asp Tyr Ala Asp Gln Asn Leu Val His Leu

130 135 140

Pro Glu Ser Met Ser Tyr Ala Thr Ala Ala Gly Leu Gly Cys Arg Phe

145 150 155 160

Ala Thr Ser Phe Arg Ala Val Thr Asp Gln Gly Arg Leu Lys Gly Gly

165 170 175

Glu Trp Leu Ala Val His Gly Cys Gly Gly Val Gly Leu Ser Ala Ile

180 185 190

Met Ile Gly Ala Gly Leu Gly Ala Gln Val Val Ala Ile Asp Ile Ala

195 200 205

Glu Asp Lys Leu Glu Leu Ala Arg Gln Leu Gly Ala Thr Ala Thr Ile

210 215 220

Asn Ser Arg Ser Val Ala Asp Val Ala Glu Ala Val Arg Asp Ile Thr

225 230 235 240

Gly Gly Gly Ala His Val Ser Val Asp Ala Leu Gly His Pro Gln Thr

245 250 255

Cys Cys Asn Ser Ile Ser Asn Leu Arg Arg Arg Gly Arg His Val Gln

260 265 270

Val Gly Leu Met Leu Ala Asp His Ala Met Pro Ala Ile Pro Met Ala

275 280 285

Arg Val Ile Ala His Glu Leu Glu Ile Tyr Gly Ser His Gly Met Gln

290 295 300

Ala Trp Arg Tyr Glu Asp Met Leu Ala Met Ile Glu Ser Gly Arg Leu

305 310 315 320

Ala Pro Glu Lys Leu Ile Gly Arg His Ile Ser Leu Thr Glu Ala Ala

325 330 335

Val Ala Leu Pro Gly Met Asp Arg Phe Gln Glu Ser Gly Ile Ser Ile

340 345 350

Ile Asp Arg Phe Glu

355

<210>81

<211>1011

<212>DNA

<213>根癌农杆菌C58

<400>81

atgctggcga ttttctgtga cactcccggt caattaaccg ccaaggatct gccgaacccc 60

gtgcgcggcg aaggtgaagt cctggtacgt attcgccgga ttggcgtttg cggcacggat 120

ctgcacatct ttaccggcaa ccagccctat ctttcctatc cgcggatcat gggtcacgaa 180

ctttccggca cggttgagga ggcacccgct ggcagccacc tttccgctgg cgatgtggtg 240

accataattc cctatatgtc ctgcgggaaa tgcaatgcct gcctgaaggg taagagcaat 300

tgctgccgca atatcggtgt gcttggcgtt catcgcgatg gcggcatggt ggaatatctg 360

agcgtgccgc agcaattcgt gctgaaggcg gaggggctga gcctcgacca ggcagccatg 420

acggaatttc tggcgatcgg tgcccatgcg gtgcgtcgcg gtgccgtcga aaaagggcaa 480

aaggtcctga tcgtcggtgc cggcccgatc ggcatggcgg ttgctgtctt tgcggttctc 540

gatggcacgg aagtgacgat gatcgacggt cgcaccgacc ggctggattt ctgcaaggac 600

cacctcggtg tcgctcatac agtcgccctc ggcgacggtg acaaagatcg tctgtccgac 660

attaccggtg gcaatttctt cgatgcggtg tttgatgcga ccggcaatcc gaaagccatg 720

gagcgcggtt tctccttcgt cggtcacggc ggctcctatg ttctggtgtc catcgtcgcc 780

agcgatatca gcttcaacga cccggaattt cacaagcgtg agacgacgct gctcggcagc 840

cgcaacgcga cggctgatga tttcgagcgg gtgcttcgcg ccttgcgcga agggaaagtg 900

ccggaggcac taatcaccca tcgcatgaca cttgccgatg ttccctcgaa gttcgccggc 960

ctgaccgatc cgaaagccgg agtcatcaag ggcatggtgg aggtcgcatg a 1011

<210>82

<211>336

<212>PRT

<213>根癌农杆菌C58

<400>82

Met Leu Ala Ile Phe Cys Asp Thr Pro Gly Gln Leu Thr Ala Lys Asp

1 5 10 15

Leu Pro Asn Pro Val Arg Gly Glu Gly Glu Val Leu Val Arg Ile Arg

20 25 30

Arg Ile Gly Val Cys Gly Thr Asp Leu His Ile Phe Thr Gly Asn Gln

35 40 45

Pro Tyr Leu Ser Tyr Pro Arg Ile Met Gly His Glu Leu Ser Gly Thr

50 55 60

Val Glu Glu Ala Pro Ala Gly Ser His Leu Ser Ala Gly Asp Val Val

65 70 75 80

Thr Ile Ile Pro Tyr Met Ser Cys Gly Lys Cys Asn Ala Cys Leu Lys

85 90 95

Gly Lys Ser Asn Cys Cys Arg Asn Ile Gly Val Leu Gly Val His Arg

100 105 110

Asp Gly Gly Met Val Glu Tyr Leu Ser Val Pro Gln Gln Phe Val Leu

115 120 125

Lys Ala Glu Gly Leu Ser Leu Asp Gln Ala Ala Met Thr Glu Phe Leu

130 135 140

Ala Ile Gly Ala His Ala Val Arg Arg Gly Ala Val Glu Lys Gly Gln

145 150 155 160

Lys Val Leu Ile Val Gly Ala Gly Pro Ile Gly Met Ala Val Ala Val

165 170 175

Phe Ala Val Leu Asp Gly Thr Glu Val Thr Met Ile Asp Gly Arg Thr

180 185 190

Asp Arg Leu Asp Phe Cys Lys Asp His Leu Gly Val Ala His Thr Val

195 200 205

Ala Leu Gly Asp Gly Asp Lys Asp Arg Leu Ser Asp Ile Thr Gly Gly

210 215 220

Asn Phe Phe Asp Ala Val Phe Asp Ala Thr Gly Asn Pro Lys Ala Met

225 230 235 240

Glu Arg Gly Phe Ser Phe Val Gly His Gly Gly Ser Tyr Val Leu Val

245 250 255

Ser Ile Val Ala Ser Asp Ile Ser Phe Asn Asp Pro Glu Phe His Lys

260 265 270

Arg Glu Thr Thr Leu Leu Gly Ser Arg Asn Ala Thr Ala Asp Asp Phe

275 280 285

Glu Arg Val Leu Arg Ala Leu Arg Glu Gly Lys Val Pro Glu Ala Leu

290 295 300

Ile Thr His Arg Met Thr Leu Ala Asp Val Pro Ser Lys Phe Ala Gly

305 310 315 320

Leu Thr Asp Pro Lys Ala Gly Val Ile Lys Gly Met Val Glu Val Ala

325 330 335

<210>83

<211>1005

<212>DNA

<213>根癌农杆菌C58

<400>83

gtgaaagcct tcgtcgtcga caagtacaag aagaagggcc cgctgcgtct ggccgacatg 60

cccaatccgg tcatcggcgc caatgatgtg ctggttcgca tccatgccac tgccatcaat 120

cttctcgact ccaaggtgcg cgacggggaa ttcaagctgt tcctgcccta tcgtcctccc 180

ttcattctcg gtcatgatct ggccggaacg gtcatccgcg tcggcgcgaa tgtacggcag 240

ttcaagacag gcgacgaggt tttcgctcgc ccgcgtgatc accgggtcgg aaccttcgca 300

gaaatgattg cggtcgatgc cgcagacctt gcgctgaagc caacgagcct gtccatggag 360

caggcagcgt cgatcccgct cgtcggactg actgcctggc aggcgcttat cgaggttggc 420

aaggtcaagt ccggccagaa ggttttcatc caggccggtt ccggcggtgt cggcaccttc 480

gccatccagc ttgccaagca tctcggcgct accgtggcca cgaccaccag cgccgcgaat 540

gccgaactgg tcaaaagcct cggcgcagat gtggtgatcg actacaagac gcaggacttc 600

gaacaggtgc tgtccggcta cgatctcgtc ctgaacagcc aggatgccaa gacgctggaa 660

aagtcgttga acgtgctgag accgggcgga aagctcattt cgatctccgg tccgccggat 720

gttgcctttg ccagatcgtt gaaactgaat ccgctcctgc gttttgtcgt cagaatgctg 780

agccgtggtg tcctgaaaaa ggcaagcaga cgcggtgtcg attactcttt cctgttcatg 840

cgcgccgaag gtcagcaatt gcatgagatc gccgaactga tcgatgccgg caccatccgt 900

ccggtcgtcg acaaggtgtt tcaatttgcg cagacgcccg acgccctggc ctatgtcgag 960

accggacggg caaggggcaa ggttgtggtt acatacgcat cctag 1005

<210>84

<211>359

<212>PRT

<213>根癌农杆菌C58

<400>84

Met Pro Ser Leu Cys Arg Lys Pro Trp Leu Ser Ser Leu Pro Asp Leu

1 5 10 15

Ile Asn Val Ser His Trp Arg Lys Pro Val Lys Ala Phe Val Val Asp

20 25 30

Lys Tyr Lys Lys Lys Gly Pro Leu Arg Leu Ala Asp Met Pro Asn Pro

35 40 45

Val Ile Gly Ala Asn Asp Val Leu Val Arg Ile His Ala Thr Ala Ile

50 55 60

Asn Leu Leu Asp Ser Lys Val Arg Asp Gly Glu Phe Lys Leu Phe Leu

65 70 75 80

Pro Tyr Arg Pro Pro Phe Ile Leu Gly His Asp Leu Ala Gly Thr Val

85 90 95

Ile Arg Val Gly Ala Asn Val Arg Gln Phe Lys Thr Gly Asp Glu Val

100 105 110

Phe Ala Arg Pro Arg Asp His Arg Val Gly Thr Phe Ala Glu Met Ile

115 120 125

Ala Val Asp Ala Ala Asp Leu Ala Leu Lys Pro Thr Ser Leu Ser Met

130 135 140

Glu Gln Ala Ala Ser Ile Pro Leu Val Gly Leu Thr Ala Trp Gln Ala

145 150 155 160

Leu Ile Glu Val Gly Lys Val Lys Ser Gly Gln Lys Val Phe Ile Gln

165 170 175

Ala Gly Ser Gly Gly Val Gly Thr Phe Ala Ile Gln Leu Ala Lys His

180 185 190

Leu Gly Ala Thr Val Ala Thr Thr Thr Ser Ala Ala Asn Ala Glu Leu

195 200 205

Val Lys Ser Leu Gly Ala Asp Val Val Ile Asp Tyr Lys Thr Gln Asp

210 215 220

Phe Glu Gln Val Leu Ser Gly Tyr Asp Leu Val Leu Asn Ser Gln Asp

225 230 235 240

Ala Lys Thr Leu Glu Lys Ser Leu Asn Val Leu Arg Pro Gly Gly Lys

245 250 255

Leu Ile Ser Ile Ser Gly Pro Pro Asp Val Ala Phe Ala Arg Ser Leu

260 265 270

Lys Leu Asn Pro Leu Leu Arg Phe Val Val Arg Met Leu Ser Arg Gly

275 280 285

Val Leu Lys Lys Ala Ser Arg Arg Gly Val Asp Tyr Ser Phe Leu Phe

290 295 300

Met Arg Ala Glu Gly Gln Gln Leu His Glu Ile Ala Glu Leu Ile Asp

305 310 315 320

Ala Gly Thr Ile Arg Pro Val Val Asp Lys Val Phe Gln Phe Ala Gln

325 330 335

Thr Pro Asp Ala Leu Ala Tyr Val Glu Thr Gly Arg Ala Arg Gly Lys

340 345 350

Val Val Val Thr Tyr Ala Ser

355

<210>85

<211>1032

<212>DNA

<213>根癌农杆菌C58

<400>85

atgaaagcga ttgtcgccca cggggcaaag gatgtgcgca tcgaagaccg gccggaggaa 60

aagccgggtc cgggcgaggt gcggctccgt ctggcgaggg gcgggatctg cggcagtgat 120

ctgcattatt acaatcatgg cggtttcggc gccgtgcggc ttcgtgaacc catggtgctg 180

ggccatgagg tttccgccgt catcgaggaa ctgggcgaag gcgttgaggg gctgaagatc 240

ggcggtctgg tggcggtttc gccgtcgcgc ccatgccgaa cctgccgctt ctgccaggag 300

ggtctgcaca atcagtgcct caacatgcgg ttttatggca gcgccatgcc tttcccgcat 360

attcagggcg cgttccggga aattctggtg gcggacgccc tgcaatgcgt gccggccgat 420

ggtctcagcg ccggggaagc cgccatggcg gaaccgctgg cggtgacgct gcatgccaca 480

cgccgggccg gcgatttgct gggaaaacgt gtgctcgtca cgggttgcgg ccccatcggc 540

attctctcca ttctggctgc gcgccgggcg ggtgctgctg aaatcgtcgc caccgacctt 600

tccgatttca cgctcggcaa ggcgcgtgaa gcgggggcgg accgtgtcat caacagcaag 660

gatgagcccg atgcgctcgc cgcttatggt gcaaacaagg gaaccttcga cattctctat 720

gaatgctcgg gtgcggccgt ggcgcttgcc ggcggcatta cggcactgcg gccgcgcggc 780

atcatcgtcc agctcgggct cggcggcgat atgagcctgc cgatgatggc gatcacagcc 840

aaggaactcg acctgcgtgg ttcctttcgc ttccacgagg aattcgccac cggcgtcgag 900

ctgatgcgca agggcctgat cgacgtcaaa cccttcatca cccagaccgt cgatcttgcc 960

gacgccatct cggccttcga attcgcctcg gatcgcagcc gcgccatgaa ggtgcagatc 1020

gccttttcct aa 1032

<210>86

<211>343

<212>PRT

<213>根癌农杆菌C58

<400>86

Met Lys Ala Ile Val Ala His Gly Ala Lys Asp Val Arg Ile Glu Asp

1 5 10 15

Arg Pro Glu Glu Lys Pro Gly Pro Gly Glu Val Arg Leu Arg Leu Ala

20 25 30

Arg Gly Gly Ile Cys Gly Ser Asp Leu His Tyr Tyr Asn His Gly Gly

35 40 45

Phe Gly Ala Val Arg Leu Arg Glu Pro Met Val Leu Gly His Glu Val

50 55 60

Ser Ala Val Ile Glu Glu Leu Gly Glu Gly Val Glu Gly Leu Lys Ile

65 70 75 80

Gly Gly Leu Val Ala Val Ser Pro Ser Arg Pro Cys Arg Thr Cys Arg

85 90 95

Phe Cys Gln Glu Gly Leu His Asn Gln Cys Leu Asn Met Arg Phe Tyr

100 105 110

Gly Ser Ala Met Pro Phe Pro His Ile Gln Gly Ala Phe Arg Glu Ile

115 120 125

Leu Val Ala Asp Ala Leu Gln Cys Val Pro Ala Asp Gly Leu Ser Ala

130 135 140

Gly Glu Ala Ala Met Ala Glu Pro Leu Ala Val Thr Leu His Ala Thr

145 150 155 160

Arg Arg Ala Gly Asp Leu Leu Gly Lys Arg Val Leu Val Thr Gly Cys

165 170 175

Gly Pro Ile Gly Ile Leu Ser Ile Leu Ala Ala Arg Arg Ala Gly Ala

180 185 190

Ala Glu Ile Val Ala Thr Asp Leu Ser Asp Phe Thr Leu Gly Lys Ala

195 200 205

Arg Glu Ala Gly Ala Asp Arg Val Ile Asn Ser Lys Asp Glu Pro Asp

210 215 220

Ala Leu Ala Ala Tyr Gly Ala Asn Lys Gly Thr Phe Asp Ile Leu Tyr

225 230 235 240

Glu Cys Ser Gly Ala Ala Val Ala Leu Ala Gly Gly Ile Thr Ala Leu

245 250 255

Arg Pro Arg Gly Ile Ile Val Gln Leu Gly Leu Gly Gly Asp Met Ser

260 265 270

Leu Pro Met Met Ala Ile Thr Ala Lys Glu Leu Asp Leu Arg Gly Ser

275 280 285

Phe Arg Phe His Glu Glu Phe Ala Thr Gly Val Glu Leu Met Arg Lys

290 295 300

Gly Leu Ile Asp Val Lys Pro Phe Ile Thr Gln Thr Val Asp Leu Ala

305 310 315 320

Asp Ala Ile Ser Ala Phe Glu Phe Ala Ser Asp Arg Ser Arg Ala Met

325 330 335

Lys Val Gln Ile Ala Phe Ser

340

<210>87

<211>939

<212>DNA

<213>根癌农杆菌C58

<400>87

atgccgatgg cgctcgggca cgaagcggcg ggcgtcgtcg aggcattggg cgaaggcgtg 60

cgcgatcttg agcccggcga tcatgtggtc atggtcttca tgcccagttg cggacattgc 120

ctgccctgtg cggaaggcag gcccgctctg tgcgagccgg gcgccgccgc caatgcagca 180

ggcaggctgt tgggtggcgc cacccgcctg aactatcatg gcgaggtcgt ccatcatcac 240

cttggtgtgt cggcctttgc cgaatatgcc gtggtgtcgc gcaattcgct ggtcaagatc 300

gaccgcgatc ttccatttgt cgaggcggca ctcttcggct gcgcggttct caccggcgtc 360

ggcgccgtcg tgaatacggc aagggtcagg accggctcga ctgcggtcgt catcggactt 420

ggcggtgtgg gccttgccgc ggttctcgga gcccgggcgg ccggtgccag caagatcgtc 480

gccgtcgacc tttcgcagga aaagcttgca ctcgccagcg aactgggcgc gaccgccatc 540

gtgaacggac gcgatgagga tgccgtcgag caggtccgcg agctcacttc cggcggtgcc 600

gattatgcct tcgagatggc agggtctatt cgcgccctcg aaaacgcctt caggatgacc 660

aaacgtggcg gcaccaccgt taccgccggt ctgccaccgc cgggtgcggc cctgccgctc 720

aacgtcgtgc agctcgtcgg cgaggagcgg acactcaagg gcagctatat cggcacctgt 780

gtgcctctcc gggatattcc gcgcttcatc gccctttatc gcgacggccg gttgccggtg 840

aaccgccttc tgagcggaag gctgaagcta gaagacatca atgaagggtt cgaccgcctg 900

cacgacggaa gcgccgttcg gcaagtcatc gaattctga 939

<210>88

<211>312

<212>PRT

<213>根癌农杆菌C58

<400>88

Met Pro Met Ala Leu Gly His Glu Ala Ala Gly Val Val Glu Ala Leu

1 5 10 15

Gly Glu Gly Val Arg Asp Leu Glu Pro Gly Asp His Val Val Met Val

20 25 30

Phe Met Pro Ser Cys Gly His Cys Leu Pro Cys Ala Glu Gly Arg Pro

35 40 45

Ala Leu Cys Glu Pro Gly Ala Ala Ala Asn Ala Ala Gly Arg Leu Leu

50 55 60

Gly Gly Ala Thr Arg Leu Asn Tyr His Gly Glu Val Val His His His

65 70 75 80

Leu Gly Val Ser Ala Phe Ala Glu Tyr Ala Val Val Ser Arg Asn Ser

85 90 95

Leu Val Lys Ile Asp Arg Asp Leu Pro Phe Val Glu Ala Ala Leu Phe

100 105 110

Gly Cys Ala Val Leu Thr Gly Val Gly Ala Val Val Asn Thr Ala Arg

115 120 125

Val Arg Thr Gly Ser Thr Ala Val Val Ile Gly Leu Gly Gly Val Gly

130 135 140

Leu Ala Ala Val Leu Gly Ala Arg Ala Ala Gly Ala Ser Lys Ile Val

145 150 155 160

Ala Val Asp Leu Ser Gln Glu Lys Leu Ala Leu Ala Ser Glu Leu Gly

165 170 175

Ala Thr Ala Ile Val Asn Gly Arg Asp Glu Asp Ala Val Glu Gln Val

180 185 190

Arg Glu Leu Thr Ser Gly Gly Ala Asp Tyr Ala Phe Glu Met Ala Gly

195 200 205

Ser Ile Arg Ala Leu Glu Asn Ala Phe Arg Met Thr Lys Arg Gly Gly

210 215 220

Thr Thr Val Thr Ala Gly Leu Pro Pro Pro Gly Ala Ala Leu Pro Leu

225 230 235 240

Asn Val Val Gln Leu Val Gly Glu Glu Arg Thr Leu Lys Gly Ser Tyr

245 250 255

Ile Gly Thr Cys Val Pro Leu Arg Asp Ile Pro Arg Phe Ile Ala Leu

260 265 270

Tyr Arg Asp Gly Arg Leu Pro Val Asn Arg Leu Leu Ser Gly Arg Leu

275 280 285

Lys Leu Glu Asp Ile Asn Glu Gly Phe Asp Arg Leu His Asp Gly Ser

290 295 300

Ala Val Arg Gln Val Ile Glu Phe

305 310

<210>89

<211>1035

<212>DNA

<213>根癌农杆菌C58

<400>89

atgaaacatt ctcaggacaa accacgcctg ctgattgcga tgcgtagcga gcttccagaa 60

ggcttcttcg gtccgcgcga atgggcaagg ctgaatgccg tagcggacat tattccgggc 120

tttccccata cggatttcga cacggcgaac ggtgccgagg ctctcgccga agcggatatt 180

ctgctcgctg cctggggtac gccatccctg acacgcgaac gactttcacg cgcgccgcgg 240

ctgaaaatgc tggcctatgc ggcatcatcg gtgcggatgg ttgcgcccgc agaattctgg 300

gagacgtcgg atattctggt cacgacagca gcttccgcca tggccgtgcc ggttgccgaa 360

ttcacctatg cggcaatcat catgtgcggc aaggatgtgt ttcgattgcg ggatgaacat 420

agaacagagc gcggcaccgg cgtttttggc agcaggcgcg gcagaagcct gccctatctt 480

ggcaatcatg cccgcaaggt tggcattgtc ggcgcctcgc gcatcgggcg gctggtgatg 540

gagatgctgg cgcgcggcac attcgagatt gccgtttacg atccctttct gtcggcggaa 600

gaggccgcat cccttggcgc gaagaaagcc gaactggacg agcttctcgc atggtccgat 660

gtggtctcgc tgcacgcgcc gatcctgccg gaaacgcacc atatgatcgg cgcccgcgaa 720

ctggcgctga tggcggacca tgccatcttc atcaacacgg cgcggggctg gctggtcgac 780

cacgatgcat tgctgactga agcgatttcc ggacggctgc gcattctgat tgacacgccc 840

gaacccgagc ccctgcccac ggacagcccg ttttacgatc tgcccaatgt cgttctaacc 900

ccccatatag ccggggcgct gggcaatgaa ttgcgcgcac tttccgatct ggccattacc 960

gaaattgaac gtttcgtggc gggacttgcg cccctccacc cggtccacaa gcaggatatg 1020

gaacgtatgg catga 1035

<210>90

<211>331

<212>PRT

<213>根癌农杆菌C58

<400>90

Met Arg Ser Glu Leu Pro Glu Gly Phe Phe Gly Pro Arg Glu Trp Ala

1 5 10 15

Arg Leu Asn Ala Val Ala Asp Ile Ile Pro Gly Phe Pro His Thr Asp

20 25 30

Phe Asp Thr Ala Asn Gly Ala Glu Ala Leu Ala Glu Ala Asp Ile Leu

35 40 45

Leu Ala Ala Trp Gly Thr Pro Ser Leu Thr Arg Glu Arg Leu Ser Arg

50 55 60

Ala Pro Arg Leu Lys Met Leu Ala Tyr Ala Ala Ser Ser Val Arg Met

65 70 75 80

Val Ala Pro Ala Glu Phe Trp Glu Thr Ser Asp Ile Leu Val Thr Thr

85 90 95

Ala Ala Ser Ala Met Ala Val Pro Val Ala Glu Phe Thr Tyr Ala Ala

100 105 110

Ile Ile Met Cys Gly Lys Asp Val Phe Arg Leu Arg Asp Glu His Arg

115 120 125

Thr Glu Arg Gly Thr Gly Val Phe Gly Ser Arg Arg Gly Arg Ser Leu

130 135 140

Pro Tyr Leu Gly Asn His Ala Arg Lys Val Gly Ile Val Gly Ala Ser

145 150 155 160

Arg Ile Gly Arg Leu Val Met Glu Met Leu Ala Arg Gly Thr Phe Glu

165 170 175

Ile Ala Val Tyr Asp Pro Phe Leu Ser Ala Glu Glu Ala Ala Ser Leu

180 185 190

Gly Ala Lys Lys Ala Glu Leu Asp Glu Leu Leu Ala Trp Ser Asp Val

195 200 205

Val Ser Leu His Ala Pro Ile Leu Pro Glu Thr His His Met Ile Gly

210 215 220

Ala Arg Glu Leu Ala Leu Met Ala Asp His Ala Ile Phe Ile Asn Thr

225 230 235 240

Ala Arg Gly Trp Leu Val Asp His Asp Ala Leu Leu Thr Glu Ala Ile

245 250 255

Ser Gly Arg Leu Arg Ile Leu Ile Asp Thr Pro Glu Pro Glu Pro Leu

260 265 270

Pro Thr Asp Ser Pro Phe Tyr Asp Leu Pro Asn Val Val Leu Thr Pro

275 280 285

His Ile Ala Gly Ala Leu Gly Asn Glu Leu Arg Ala Leu Ser Asp Leu

290 295 300

Ala Ile Thr Glu Ile Glu Arg Phe Val Ala Gly Leu Ala Pro Leu His

305 310 315 320

Pro Val His Lys Gln Asp Met Glu Arg Met Ala

325 330

<210>91

<211>750

<212>DNA

<213>根癌农杆菌C58

<400>91

atgcagcgtt ttaccaacag aaccatcgtt gtcgccgggg ccggccggga tatcggccgg 60

gcatgcgcca tccgtttcgc acaggaaggc gccaatgtcg ttcttaccta taatggcgcg 120

gcagagggcg cggccacagc cgttgccgaa atcgaaaagc ttggtcgttc ggctctggcg 180

atcaaggcgg atctcacaaa cgccgccgaa gtcgaggctg ccatatctgc ggctgcggac 240

aagtttgggg agatccacgg cctcgtccat gttgccggcg gcctgatcgc ccgcaagaca 300

atcgcagaaa tggatgaagc cttctggcat caggtcctcg acgtcaatct gacatcgctg 360

ttcctgacgg ccaagaccgc attgccgaag atggccaagg gcggcgcgat cgtcactttc 420

tcgtcgcagg ccggccgtga tggcggcggc ccgggcgctc ttgcctatgc cacttccaag 480

ggtgccgtga tgaccttcac ccgcggactt gccaaagaag tcggccccaa aatccgcgtc 540

aacgccgttt gccccggtat gatctccacc accttccacg ataccttcac caagccggag 600

gtgcgcgaac gggtggccgg cgcgacgtcg ctcaagcgcg aagggtcgag cgaagacgtc 660

gccggtctgg tggccttcct cgcgtctgac gatgccgctt atgtcaccgg cgcctgctac 720

gacatcaatg gcggcgtcct gttttcctga 750

<210>92

<211>249

<212>PRT

<213>根癌农杆菌C58

<400>92

Met Gln Arg Phe Thr Asn Arg Thr Ile Val Val Ala Gly Ala Gly Arg

1 5 10 15

Asp Ile Gly Arg Ala Cys Ala Ile Arg Phe Ala Gln Glu Gly Ala Asn

20 25 30

Val Val Leu Thr Tyr Asn Gly Ala Ala Glu Gly Ala Ala Thr Ala Val

35 40 45

Ala Glu Ile Glu Lys Leu Gly Arg Ser Ala Leu Ala Ile Lys Ala Asp

50 55 60

Leu Thr Asn Ala Ala Glu Val Glu Ala Ala Ile Ser Ala Ala Ala Asp

65 70 75 80

Lys Phe Gly Glu Ile His Gly Leu Val His Val Ala Gly Gly Leu Ile

85 90 95

Ala Arg Lys Thr Ile Ala Glu Met Asp Glu Ala Phe Trp His Gln Val

100 105 110

Leu Asp Val Asn Leu Thr Ser Leu Phe Leu Thr Ala Lys Thr Ala Leu

115 120 125

Pro Lys Met Ala Lys Gly Gly Ala Ile Val Thr Phe Ser Ser Gln Ala

130 135 140

Gly Arg Asp Gly Gly Gly Pro Gly Ala Leu Ala Tyr Ala Thr Ser Lys

145 150 155 160

Gly Ala Val Met Thr Phe Thr Arg Gly Leu Ala Lys Glu Val Gly Pro

165 170 175

Lys Ile Arg Val Asn Ala Val Cys Pro Gly Met Ile Ser Thr Thr Phe

180 185 190

His Asp Thr Phe Thr Lys Pro Glu Val Arg Glu Arg Val Ala Gly Ala

195 200 205

Thr Ser Leu Lys Arg Glu Gly Ser Ser Glu Asp Val Ala Gly Leu Val

210 215 220

Ala Phe Leu Ala Ser Asp Asp Ala Ala Tyr Val Thr Gly Ala Cys Tyr

225 230 235 240

Asp Ile Asn Gly Gly Val Leu Phe Ser

245

<210>93

<211>930

<212>DNA

<213>大肠杆菌DH10B

<400>93

atgtccaaaa agattgccgt gattggcgaa tgcatgattg agctttccga gaaaggcgcg 60

gacgttaagc gcggtttcgg cggcgatacc ctgaacactt ccgtctatat cgcccgtcag 120

gtcgatcctg cggcattaac cgttcattac gtaacggcgc tgggaacgga cagttttagc 180

cagcagatgc tggacgcctg gcacggcgag aacgttgata cttccctgac ccaacggatg 240

gaaaaccgtc tgccgggcct ttactacatt gaaaccgaca gcaccggcga gcgtacgttc 300

tactactggc ggaacgaagc cgccgccaaa ttctggctgg agagtgagca gtctgcggcg 360

atttgcgaag agctggcgaa tttcgattat ctctacctga gcgggattag cctggcgatc 420

ttaagcccga ccagccgcga aaagctgctt tccctgctgc gcgaatgccg cgccaacggc 480

ggaaaagtga ttttcgacaa taactatcgt ccgcgcctgt gggccagcaa agaagagaca 540

cagcaggtgt accaacaaat gctggaatgc acggatatcg ccttcctgac gctggacgac 600

gaagacgcgc tgtggggtca acagccggtg gaagacgtca ttgcgcgcac ccataacgcg 660

ggcgtgaaag aagtggtggt gaaacgcggg gcggattctt gcctggtgtc cattgctggc 720

gaagggttag tggatgttcc ggcggtgaaa ctgccgaaag aaaaagtgat cgataccacc 780

gcagctggcg actctttcag tgccggttat ctggcggtac gtctgacagg cggcagcgcg 840

gaagacgcgg cgaaacgtgg gcacctgacc gcaagtaccg ttattcagta tcgcggcgcg 900

attatcccgc gtgaggcgat gccagcgtaa 930

<210>94

<211>309

<212>PRT

<213>大肠杆菌DH10B

<400>94

Met Ser Lys Lys Ile Ala Val Ile Gly Glu Cys Met Ile Glu Leu Ser

1 5 10 15

Glu Lys Gly Ala Asp Val Lys Arg Gly Phe Gly Gly Asp Thr Leu Asn

20 25 30

Thr Ser Val Tyr Ile Ala Arg Gln Val Asp Pro Ala Ala Leu Thr Val

35 40 45

His Tyr Val Thr Ala Leu Gly Thr Asp Ser Phe Ser Gln Gln Met Leu

50 55 60

Asp Ala Trp His Gly Glu Asn Val Asp Thr Ser Leu Thr Gln Arg Met

65 70 75 80

Glu Asn Arg Leu Pro Gly Leu Tyr Tyr Ile Glu Thr Asp Ser Thr Gly

85 90 95

Glu Arg Thr Phe Tyr Tyr Trp Arg Asn Glu Ala Ala Ala Lys Phe Trp

100 105 110

Leu Glu Ser Glu Gln Ser Ala Ala Ile Cys Glu Glu Leu Ala Asn Phe

115 120 125

Asp Tyr Leu Tyr Leu Ser Gly Ile Ser Leu Ala Ile Leu Ser Pro Thr

130 135 140

Ser Arg Glu Lys Leu Leu Ser Leu Leu Arg Glu Cys Arg Ala Asn Gly

145 150 155 160

Gly Lys Val Ile Phe Asp Asn Asn Tyr Arg Pro Arg Leu Trp Ala Ser

165 170 175

Lys Glu Glu Thr Gln Gln Val Tyr Gln Gln Met Leu Glu Cys Thr Asp

180 185 190

Ile Ala Phe Leu Thr Leu Asp Asp Glu Asp Ala Leu Trp Gly Gln Gln

195 200 205

Pro Val Glu Asp Val Ile Ala Arg Thr His Asn Ala Gly Val Lys Glu

210 215 220

Val Val Val Lys Arg Gly Ala Asp Ser Cys Leu Val Ser Ile Ala Gly

225 230 235 240

Glu Gly Leu Val Asp Val Pro Ala Val Lys Leu Pro Lys Glu Lys Val

245 250 255

Ile Asp Thr Thr Ala Ala Gly Asp Ser Phe Ser Ala Gly Tyr Leu Ala

260 265 270

Val Arg Leu Thr Gly Gly Ser Ala Glu Asp Ala Ala Lys Arg Gly His

275 280 285

Leu Thr Ala Ser Thr Val Ile Gln Tyr Arg Gly Ala Ile Ile Pro Arg

290 295 300

Glu Ala Met Pro Ala

305

<210>95

<211>642

<212>DNA

<213>大肠杆菌DH10B

<400>95

atgaaaaact ggaaaacaag tgcagaatca atcctgacca ccggcccggt tgtaccggtt 60

atcgtggtaa aaaaactgga acacgcggtg ccgatggcaa aagcgttggt tgctggtggg 120

gtgcgcgttc tggaagtgac tctgcgtacc gagtgtgcag ttgacgctat ccgtgctatc 180

gccaaagaag tgcctgaagc gattgtgggt gccggtacgg tgctgaatcc acagcagctg 240

gcagaagtca ctgaagcggg tgcacagttc gcaattagcc cgggtctgac cgagccgctg 300

ctgaaagctg ctaccgaagg gactattcct ctgattccgg ggatcagcac tgtttccgaa 360

ctgatgctgg gtatggacta cggtttgaaa gagttcaaat tcttcccggc tgaagctaac 420

ggcggcgtga aagccctgca ggcgatcgcg ggtccgttct cccaggtccg tttctgcccg 480

acgggtggta tttctccggc taactaccgt gactacctgg cgctgaaaag cgtgctgtgc 540

atcggtggtt cctggctggt tccggcagat gcgctggaag cgggcgatta cgaccgcatt 600

actaagctgg cgcgtgaagc tgtagaaggc gctaagctgt aa 642

<210>96

<211>213

<212>PRT

<213>大肠杆菌DH10B

<400>96

Met Lys Asn Trp Lys Thr Ser Ala Glu Ser Ile Leu Thr Thr Gly Pro

1 5 10 15

Val Val Pro Val Ile Val Val Lys Lys Leu Glu His Ala Val Pro Met

20 25 30

Ala Lys Ala Leu Val Ala Gly Gly Val Arg Val Leu Glu Val Thr Leu

35 40 45

Arg Thr Glu Cys Ala Val Asp Ala Ile Arg Ala Ile Ala Lys Glu Val

50 55 60

Pro Glu Ala Ile Val Gly Ala Gly Thr Val Leu Asn Pro Gln Gln Leu

65 70 75 80

Ala Glu Val Thr Glu Ala Gly Ala Gln Phe Ala Ile Ser Pro Gly Leu

85 90 95

Thr Glu Pro Leu Leu Lys Ala Ala Thr Glu Gly Thr Ile Pro Leu Ile

100 105 110

Pro Gly Ile Ser Thr Val Ser Glu Leu Met Leu Gly Met Asp Tyr Gly

115 120 125

Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly Gly Val Lys

130 135 140

Ala Leu Gln Ala Ile Ala Gly Pro Phe Ser Gln Val Arg Phe Cys Pro

145 150 155 160

Thr Gly Gly Ile Ser Pro Ala Asn Tyr Arg Asp Tyr Leu Ala Leu Lys

165 170 175

Ser Val Leu Cys Ile Gly Gly Ser Trp Leu Val Pro Ala Asp Ala Leu

180 185 190

Glu Ala Gly Asp Tyr Asp Arg Ile Thr Lys Leu Ala Arg Glu Ala Val

195 200 205

Glu Gly Ala Lys Leu

210

<210>97

<211>780

<212>DNA

<213>短乳杆菌ATCC 367

<400>97

atggcatcaa atggaaaagt agcaatggtt accggtggcg gacaaggaat tggtgaagcc 60

atctcgaaac ggttagctaa cgacggcttt gctgtggcaa ttgctgattt gaacttggac 120

aatgccaaca aggtcgtttc tgatattgaa gctgctggtg gcaaggccat tgcggtcaag 180

accgatgtct ctgatcgtga tagcgtgttt gctgcggtta atgaagcggc cgacaagctg 240

ggcggctttg acgttatcgt taataacgcc ggccttggcc caaccacgcc aattgacacc 300

atcacccaag aacagtttga tacggtttat cacgttaacg tgggtggggt tctttggggc 360

attcaagcag cccatgcgaa gttcaaggaa ttgggtcatg gtgggaagat catttccgcg 420

acgtctcaag ccggggttgt tggtaacccg aacttagctc tgtacagtgg aactaagttt 480

gccattcgtg gtgtgaccca agttgcggcg cgtgacttag ccgctgaagg tatcacggtc 540

aatgcttatg cacccgggat tgttaagaca ccaatgatgt ttgacatcgc tcacaaggtt 600

ggtcaaaatg ctggtaaaga cgacgaatgg gggatgcaaa ccttctcaaa ggacatcgct 660

ttatgtcgat tgtcagaacc agaagatgtg gctaacgggg tggctttctt agccggtccc 720

gattctaact acattacggg tcaaacactt gaagttgatg gtgggatgca gttccactaa 780

<210>98

<211>259

<212>PRT

<213>短乳杆菌ATCC 367

<400>98

Met Ala Ser Asn Gly Lys Val Ala Met Val Thr Gly Gly Gly Gln Gly

1 5 10 15

Ile Gly Glu Ala Ile Ser Lys Arg Leu Ala Asn Asp Gly Phe Ala Val

20 25 30

Ala Ile Ala Asp Leu Asn Leu Asp Asn Ala Asn Lys Val Val Ser Asp

35 40 45

Ile Glu Ala Ala Gly Gly Lys Ala Ile Ala Val Lys Thr Asp Val Ser

50 55 60

Asp Arg Asp Ser Val Phe Ala Ala Val Asn Glu Ala Ala Asp Lys Leu

65 70 75 80

Gly Gly Phe Asp Val Ile Val Asn Asn Ala Gly Leu Gly Pro Thr Thr

85 90 95

Pro Ile Asp Thr Ile Thr Gln Glu Gln Phe Asp Thr Val Tyr His Val

100 105 110

Asn Val Gly Gly Val Leu Trp Gly Ile Gln Ala Ala His Ala Lys Phe

115 120 125

Lys Glu Leu Gly His Gly Gly Lys Ile Ile Ser Ala Thr Ser Gln Ala

130 135 140

Gly Val Val Gly Asn Pro Asn Leu Ala Leu Tyr Ser Gly Thr Lys Phe

145 150 155 160

Ala Ile Arg Gly Val Thr Gln Val Ala Ala Arg Asp Leu Ala Ala Glu

165 170 175

Gly Ile Thr Val Asn Ala Tyr Ala Pro Gly Ile Val Lys Thr Pro Met

180 185 190

Met Phe Asp Ile Ala His Lys Val Gly Gln Asn Ala Gly Lys Asp Asp

195 200 205

Glu Trp Gly Met Gln Thr Phe Ser Lys Asp Ile Ala Leu Cys Arg Leu

210 215 220

Ser Glu Pro Glu Asp Val Ala Asn Gly Val Ala Phe Leu Ala Gly Pro

225 230 235 240

Asp Ser Asn Tyr Ile Thr Gly Gln Thr Leu Glu Val Asp Gly Gly Met

245 250 255

Gln Phe His

<210>99

<211>1089

<212>DNA

<213>恶臭假单胞菌KT2440

<400>99

atgaatgacc tgagccacac ccacatgcgc gcggccgtct ggcatggccg ccacgatatt 60

cgtgtcgaac aggtaccttt gccggccgac cctgcgccgg gctgggtgca gatcaaggtg 120

gactggtgcg gcatctgcgg ctccgacctg cacgaatatg ttgccggccc ggtgttcatc 180

ccggtagagg ccccgcaccc gctgaccggc attcagggcc agtgcatcct cggccacgaa 240

ttctgcggcc acatcgccaa gcttggcgaa ggcgtggaag gctatgccgt aggcgacccg 300

gtggcggcag acgcgtgcca gcattgtggt acctgctatt actgcaccca tggcctgtac 360

aacatctgcg aacgcctggc gttcaccggc ctgatgaaca acggtgcctt cgccgagctg 420

gtcaacgtgc ccgccaacct gctctaccgg ctgccgcagg gcttccctgc cgaagccggg 480

gcactgatcg agccgctggc ggtgggtatg cacgcggtga aaaaggccgg cagcctgctt 540

gggcaaaccg ttgtagtggt tggggccggc accatcggcc tgtgcaccat catgtgcgcc 600

aaggctgcag gtgcggcaca ggtcatcgcc cttgagatgt cctctgcgcg caaagccaag 660

gccaaggaag cgggcgccaa cgtggtgctg gaccccagcc agtgcgatgc cctggcggaa 720

atccgcgcac tgactgctgg gctgggcgcc gatgtgagtt ttgagtgcat cggcaacaaa 780

catacggcca agctggccat cgacaccatc cgcaaagcag gcaagtgcgt gctggtgggt 840

attttcgaag agcccagcga gttcaacttc ttcgagctgg tgtccaccga gaagcaagtg 900

ctgggggcgt tggcgtacaa cggcgagttt gctgacgtga ttgccttcat tgctgatggt 960

cggctggata ttcgcccgct ggtaaccggc cggatcggat tggagcagat tgtcgagctg 1020

ggcttcgagg aactggtgaa caacaaagag gagaacgtga agatcatcgt ttcaccaggt 1080

gtgcgctga 1089

<210>100

<211>362

<212>PRT

<213>恶臭假单胞菌KT2440

<400>100

Met Asn Asp Leu Ser His Thr His Met Arg Ala Ala Val Trp His Gly

1 5 10 15

Arg His Asp Ile Arg Val Glu Gln Val Pro Leu Pro Ala Asp Pro Ala

20 25 30

Pro Gly Trp Val Gln Ile Lys Val Asp Trp Cys Gly Ile Cys Gly Ser

35 40 45

Asp Leu His Glu Tyr Val Ala Gly Pro Val Phe Ile Pro Val Glu Ala

50 55 60

Pro His Pro Leu Thr Gly Ile Gln Gly Gln Cys Ile Leu Gly His Glu

65 70 75 80

Phe Cys Gly His Ile Ala Lys Leu Gly Glu Gly Val Glu Gly Tyr Ala

85 90 95

Val Gly Asp Pro Val Ala Ala Asp Ala Cys Gln His Cys Gly Thr Cys

100 105 110

Tyr Tyr Cys Thr His Gly Leu Tyr Asn Ile Cys Glu Arg Leu Ala Phe

115 120 125

Thr Gly Leu Met Asn Asn Gly Ala Phe Ala Glu Leu Val Asn Val Pro

130 135 140

Ala Asn Leu Leu Tyr Arg Leu Pro Gln Gly Phe Pro Ala Glu Ala Gly

145 150 155 160

Ala Leu Ile Glu Pro Leu Ala Val Gly Met His Ala Val Lys Lys Ala

165 170 175

Gly Ser Leu Leu Gly Gln Thr Val Val Val Val Gly Ala Gly Thr Ile

180 185 190

Gly Leu Cys Thr Ile Met Cys Ala Lys Ala Ala Gly Ala Ala Gln Val

195 200 205

Ile Ala Leu Glu Met Ser Ser Ala Arg Lys Ala Lys Ala Lys Glu Ala

210 215 220

Gly Ala Asn Val Val Leu Asp Pro Ser Gln Cys Asp Ala Leu Ala Glu

225 230 235 240

Ile Arg Ala Leu Thr Ala Gly Leu Gly Ala Asp Val Ser Phe Glu Cys

245 250 255

Ile Gly Asn Lys His Thr Ala Lys Leu Ala Ile Asp Thr Ile Arg Lys

260 265 270

Ala Gly Lys Cys Val Leu Val Gly Ile Phe Glu Glu Pro Ser Glu Phe

275 280 285

Asn Phe Phe Glu Leu Val Ser Thr Glu Lys Gln Val Leu Gly Ala Leu

290 295 300

Ala Tyr Asn Gly Glu Phe Ala Asp Val Ile Ala Phe Ile Ala Asp Gly

305 310 315 320

Arg Leu Asp Ile Arg Pro Leu Val Thr Gly Arg Ile Gly Leu Glu Gln

325 330 335

Ile Val Glu Leu Gly Phe Glu Glu Leu Val Asn Asn Lys Glu Glu Asn

340 345 350

Val Lys Ile Ile Val Ser Pro Gly Val Arg

355 360

<210>101

<211>771

<212>DNA

<213>肺炎克雷伯氏菌MGH78578

<400>101

atgaaaaaag tcgcacttgt taccggcgcc ggccagggga ttggtaaagc tatcgccctt 60

cgtctggtga aggatggatt tgccgtggcc attgccgatt ataacgacgc caccgccaaa 120

gcggtcgcct cggaaatcaa ccaggccggc ggacacgccg tggcggtgaa agtggatgtc 180

tccgaccgcg atcaggtatt tgccgccgtt gaacaggcgc gcaaaacgct gggcggcttc 240

gacgtcatcg tcaataacgc cggtgtggca ccgtctacgc cgatcgagtc cattaccccg 300

gagattgtcg acaaagtcta caacatcaac gtcaaagggg tgatctgggg tattcaggcg 360

gcggtcgagg cctttaagaa agaggggcac ggcgggaaaa tcatcaacgc ctgttcccag 420

gccggccacg tcggcaaccc ggagctggcg gtgtatagct ccagtaaatt cgcggtacgc 480

ggcttaaccc agaccgccgc tcgcgacctc gcgccgctgg gcatcacggt caacggctac 540

tgcccgggga ttgtcaaaac gccaatgtgg gccgaaattg accgccaggt gtccgaagcc 600

gccggtaaac cgctgggcta cggtaccgcc gagttcgcca aacgcatcac tctcggtcgt 660

ctgtccgagc cggaagatgt cgccgcctgc gtctcctatc ttgccagccc ggattctgat 720

tacatgaccg gtcagtcgtt gctgatcgac ggcgggatgg tatttaacta a 771

<210>102

<211>256

<212>PRT

<213>肺炎克雷伯氏菌MGH78578

<400>102

Met Lys Lys Val Ala Leu Val Thr Gly Ala Gly Gln Gly Ile Gly Lys

1 5 10 15

Ala Ile Ala Leu Arg Leu Val Lys Asp Gly Phe Ala Val Ala Ile Ala

20 25 30

Asp Tyr Asn Asp Ala Thr Ala Lys Ala Val Ala Ser Glu Ile Asn Gln

35 40 45

Ala Gly Gly His Ala Val Ala Val Lys Val Asp Val Ser Asp Arg Asp

50 55 60

Gln Val Phe Ala Ala Val Glu Gln Ala Arg Lys Thr Leu Gly Gly Phe

65 70 75 80

Asp Val Ile Val Asn Asn Ala Gly Val Ala Pro Ser Thr Pro Ile Glu

85 90 95

Ser Ile Thr Pro Glu Ile Val Asp Lys Val Tyr Asn Ile Asn Val Lys

100 105 110

Gly Val Ile Trp Gly Ile Gln Ala Ala Val Glu Ala Phe Lys Lys Glu

115 120 125

Gly His Gly Gly Lys Ile Ile Asn Ala Cys Ser Gln Ala Gly His Val

130 135 140

Gly Asn Pro Glu Leu Ala Val Tyr Ser Ser Ser Lys Phe Ala Val Arg

145 150 155 160

Gly Leu Thr Gln Thr Ala Ala Arg Asp Leu Ala Pro Leu Gly Ile Thr

165 170 175

Val Asn Gly Tyr Cys Pro Gly Ile Val Lys Thr Pro Met Trp Ala Glu

180 185 190

Ile Asp Arg Gln Val Ser Glu Ala Ala Gly Lys Pro Leu Gly Tyr Gly

195 200 205

Thr Ala Glu Phe Ala Lys Arg Ile Thr Leu Gly Arg Leu Ser Glu Pro

210 215 220

Glu Asp Val Ala Ala Cys Val Ser Tyr Leu Ala Ser Pro Asp Ser Asp

225 230 235 240

Tyr Met Thr Gly Gln Ser Leu Leu Ile Asp Gly Gly Met Val Phe Asn

245 250 255

<210>103

<211>1665

<212>DNA

<213>肺炎克雷伯氏菌MGH78578

<400>103

atgagatcga aaagatttga agcactggcg aaacgccctg tgaatcagga tggtttcgtt 60

aaggagtgga ttgaagaggg ctttatcgcg atggaaagcc ctaacgatcc caaaccttct 120

atccgcatcg tcaacggcgc ggtgaccgaa ctcgacgata aaccggttga gcagttcgac 180

ctgattgacc actttatcgc gcgctacggc attaatctcg cccgggccga agaagtgatg 240

gccatggatt cggttaagct cgccaacatg ctctgcgacc cgaacgttaa acgcagcgac 300

atcgtgccgc tcactaccgc gatgaccccg gcgaaaatcg tggaagtggt gtcgcatatg 360

aacgtggtcg agatgatgat ggcgatgcaa aaaatgcgcg cccgccgcac gccgtcccag 420

caggcgcatg tcactaatat caaagataat ccggtacaga ttgccgccga cgccgctgaa 480

ggcgcatggc gcggctttga cgagcaggag accaccgtcg ccgtggcgcg ctacgcgccg 540

ttcaacgcca tcgccctgct ggtcggttca caggttggcc gccccggcgt cctcacccag 600

tgttcgctgg aagaagccac cgagctgaaa ctgggcatgc tgggccacac ctgctatgcc 660

gaaaccattt cggtatacgg tacggaaccg gtgtttaccg atggcgatga caccccgtgg 720

tcgaaaggct tcctcgcctc ctcctacgcc tcgcgcggcc tgaaaatgcg ctttacctcc 780

ggttccggct cggaggtgca gatgggctat gccgaaggca aatcgatgct ttatctcgaa 840

gcgcgctgca tctacatcac caaagccgcc ggggtgcaag gcctgcagaa tggctccgtc 900

agctgtatcg gcgtgccgtc cgccgtgccg tccgggatcc gcgccgtact ggcggaaaac 960

ctgatctgct cagcgctgga tctggagtgc gcctccagca acgatcaaac ctttacccac 1020

tcggatatgc ggcgtaccgc gcgtctgctg atgcagttcc tgccaggtac cgactttatc 1080

tcctccggtt actcggcggt gccgaactac gacaacatgt tcgccggttc caacgaagat 1140

gccgaagact tcgatgacta caacgtgatc cagcgcgacc tgaaggtcga tggcggcctg 1200

cggccggtgc gtgaagagga cgtgatcgcc attcgcaaca aagccgcccg cgcgctgcag 1260

gcggtatttg ccggcatggg tttgccgcct attacggatg aagaagtaga agccgccacc 1320

tacgcccacg gttcaaaaga tatgcctgag cgcaatatcg tcgaggacat caagtttgct 1380

caggagatca tcaacaagaa ccgcaacggc ctggaggtgg tgaaagccct ggcgaaaggc 1440

ggcttccccg atgtcgccca ggacatgctc aatattcaga aagccaagct caccggcgac 1500

tacctgcata cctccgccat cattgttggc gagggccagg tgctctcggc cgtgaatgac 1560

gtgaacgatt atgccggtcc ggcaacaggc taccgcctgc aaggcgagcg ctgggaagag 1620

attaaaaata tcccgggcgc gctcgatccc aatgaacttg gctaa 1665

<210>104

<211>554

<212>PRT

<213>肺炎克雷伯氏菌MGH78578

<400>104

Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln

1 5 10 15

Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu

20 25 30

Ser Pro Asn Asp Pro Lys Pro Ser Ile Arg Ile Val Asn Gly Ala Val

35 40 45

Thr Glu Leu Asp Asp Lys Pro Val Glu Gln Phe Asp Leu Ile Asp His

50 55 60

Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala Arg Ala Glu Glu Val Met

65 70 75 80

Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val

85 90 95

Lys Arg Ser Asp Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys

100 105 110

Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala

115 120 125

Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val

130 135 140

Thr Asn Ile Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu

145 150 155 160

Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala

165 170 175

Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val

180 185 190

Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu

195 200 205

Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser

210 215 220

Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp

225 230 235 240

Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met

245 250 255

Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu

260 265 270

Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys

275 280 285

Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly

290 295 300

Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn

305 310 315 320

Leu Ile Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln

325 330 335

Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln

340 345 350

Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro

355 360 365

Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe

370 375 380

Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu

385 390 395 400

Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala

405 410 415

Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr

420 425 430

Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met

435 440 445

Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile

450 455 460

Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Lys Gly

465 470 475 480

Gly Phe Pro Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys

485 490 495

Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Glu Gly

500 505 510

Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala

515 520 525

Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile

530 535 540

Pro Gly Ala Leu Asp Pro Asn Glu Leu Gly

545 550

<210>105

<211>690

<212>DNA

<213>肺炎克雷伯氏菌MGH78578

<400>105

atggaaatta acgaaacgct gctgcgccag attatcgaag aggtgctgtc ggagatgaaa 60

tcaggcgcag ataagccggt ctcctttagc gcgcctgcgg cttctgtcgc ctctgccgcg 120

ccggtcgccg ttgcgcctgt gtccggcgac agcttcctga cggaaatcgg cgaagccaaa 180

cccggcacgc agcaggatga agtcattatt gccgtcgggc cagcgtttgg tctggcgcaa 240

accgccaata tcgtcggcat tccgcataaa aatattctgc gcgaagtgat cgccggcatt 300

gaggaagaag gcatcaaagc ccgggtgatc cgctgcttta agtcttctga cgtcgccttc 360

gtggcagtgg aaggcaaccg cctgagcggc tccggcatct cgatcggtat tcagtcgaaa 420

ggcaccaccg tcatccacca gcgcggcctg ccgccgcttt ccaatctgga actcttcccg 480

caggcgccgc tgctgacgct ggaaacctac cgtcagattg gcaaaaacgc cgcgcgctac 540

gccaaacgcg agtcgccgca gccggtgccg acgcttaacg atcagatggc tcgtcccaaa 600

taccaggcga agtcggccat tttgcacatt aaagagacca aatacgtggt gacgggcaaa 660

aacccgcagg aactgcgcgt ggcgctttaa 690

<210>106

<211>229

<212>PRT

<213>肺炎克雷伯氏菌MGH78578

<400>106

Met Glu Ile Asn Glu Thr Leu Leu Arg Gln Ile Ile Glu Glu Val Leu

1 5 10 15

Ser Glu Met Lys Ser Gly Ala Asp Lys Pro Val Ser Phe Ser Ala Pro

20 25 30

Ala Ala Ser Val Ala Ser Ala Ala Pro Val Ala Val Ala Pro Val Ser

35 40 45

Gly Asp Ser Phe Leu Thr Glu Ile Gly Glu Ala Lys Pro Gly Thr Gln

50 55 60

Gln Asp Glu Val Ile Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln

65 70 75 80

Thr Ala Asn Ile Val Gly Ile Pro His Lys Asn Ile Leu Arg Glu Val

85 90 95

Ile Ala Gly Ile Glu Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys

100 105 110

Phe Lys Ser Ser Asp Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu

115 120 125

Ser Gly Ser Gly Ile Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val

130 135 140

Ile His Gln Arg Gly Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro

145 150 155 160

Gln Ala Pro Leu Leu Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn

165 170 175

Ala Ala Arg Tyr Ala Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu

180 185 190

Asn Asp Gln Met Ala Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu

195 200 205

His Ile Lys Glu Thr Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu

210 215 220

Leu Arg Val Ala Leu

225

<210>107

<211>525

<212>DNA

<213>肺炎克雷伯氏菌MGH78578

<400>107

atgaataccg acgcaattga atccatggta cgcgacgtgc tgagccggat gaacagccta 60

caggacggga taacgcccgc gccagccgcg ccgacaaacg acaccgttcg ccagccaaaa 120

gttagcgact acccgttagc gacccgccat ccggagtggg tcaaaaccgc taccaataaa 180

acgctcgatg acctgacgct ggagaacgta ttaagcgatc gcgttacggc gcaggacatg 240

cgcatcactc cggaaacgct gcgtatgcag gcggcgatcg cccaggatgc cggacgcgat 300

cggctggcga tgaactttga gcgggccgca gagctcaccg cggttcccga cgaccgaatc 360

cttgagatct acaacgccct gcgcccatac cgttccaccc aggcggagct actggcgatc 420

gctgatgacc tcgagcatcg ctaccaggca cgactctgtg ccgcctttgt tcgggaagcg 480

gccgggctgtacatcgagcg taagaagctg aaaggcgacg attaa 525

<210>108

<211>174

<212>PRT

<213>肺炎克雷伯氏菌MGH78578

<400>108

Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg

1 5 10 15

Met Asn Ser Leu Gln Asp Gly Ile Thr Pro Ala Pro Ala Ala Pro Thr

20 25 30

Asn Asp Thr Val Arg Gln Pro Lys Val Ser Asp Tyr Pro Leu Ala Thr

35 40 45

Arg His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp

50 55 60

Leu Thr Leu Glu Asn Val Leu Ser Asp Arg Val Thr Ala Gln Asp Met

65 70 75 80

Arg Ile Thr Pro Glu Thr Leu Arg Met Gln Ala Ala Ile Ala Gln Asp

85 90 95

Ala Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu

100 105 110

Thr Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg

115 120 125

Pro Tyr Arg Ser Thr Gln Ala Glu Leu Leu Ala Ile Ala Asp Asp Leu

130 135 140

Glu His Arg Tyr Gln Ala Arg Leu Cys Ala Ala Phe Val Arg Glu Ala

145 150 155 160

Ala Gly Leu Tyr Ile Glu Arg Lys Lys Leu Lys Gly Asp Asp

165 170

<210>109

<211>789

<212>DNA

<213>恶臭假单胞菌KT2440

<400>109

atgacagtca attatgattt ttccggaaaa gtcgtgctgg ttaccggcgc tggctctggt 60

attggccgtg ccactgcgct tgccttcgcg cagtcgggcg catccgttgc ggtcgcagac 120

atctcgactg accacggttt gaaaaccgta gagttggtca aagccgaagg aggcgaggcg 180

accttcttcc atgtcgatgt aggctctgaa cccagcgtcc agtcgatgct ggctggtgtc 240

gtggcgcatt acggcggcct ggacattgcg cacaacaacg ccggcattga ggccaatatc 300

gtgccgctgg ccgagctgga ctccgacaac tggcgtcgtg tcatcgatgt gaacctttcc 360

tcggtgttct attgcctgaa aggtgaaatc cctctgatgc tgaaaagggg cggcggcgcc 420

attgtgaata ccgcatcggc ctccgggctg attggcggct atcgcctttc cgggtatacc 480

gccacgaagc acggcgtagt ggggctgact aaggctgctg ctatcgatta tgcaaaccag 540

aatatccgga ttaatgccgt gtgccctggt ccagttgact ccccattcct ggctgacatg 600

ccgcaaccca tgcgcgatcg acttctcttt ggcactccaa ttggacgatt ggccaccgca 660

gaggagatcg cgcgttcggt tctgtggctg tgttctgacg atgcaaaata cgtggtgggc 720

cattcgatgt cagtcgacgg tggcgtggca gtgactgcgg ttggtactcg aatggatgat 780

ctcttttaa 789

<210>110

<211>262

<212>PRT

<213>恶臭假单胞菌KT2440

<400>110

Met Thr Val Asn Tyr Asp Phe Ser Gly Lys Val Val Leu Val Thr Gly

1 5 10 15

Ala Gly Ser Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala Gln Ser

20 25 30

Gly Ala Ser Val Ala Val Ala Asp Ile Ser Thr Asp His Gly Leu Lys

35 40 45

Thr Val Glu Leu Val Lys Ala Glu Gly Gly Glu Ala Thr Phe Phe His

50 55 60

Val Asp Val Gly Ser Glu Pro Ser Val Gln Ser Met Leu Ala Gly Val

65 70 75 80

Val Ala His Tyr Gly Gly Leu Asp Ile Ala His Asn Asn Ala Gly Ile

85 90 95

Glu Ala Asn Ile Val Pro Leu Ala Glu Leu Asp Ser Asp Asn Trp Arg

100 105 110

Arg Val Ile Asp Val Asn Leu Ser Ser Val Phe Tyr Cys Leu Lys Gly

115 120 125

Glu Ile Pro Leu Met Leu Lys Arg Gly Gly Gly Ala Ile Val Asn Thr

130 135 140

Ala Ser Ala Ser Gly Leu Ile Gly Gly Tyr Arg Leu Ser Gly Tyr Thr

145 150 155 160

Ala Thr Lys His Gly Val Val Gly Leu Thr Lys Ala Ala Ala Ile Asp

165 170 175

Tyr Ala Asn Gln Asn Ile Arg Ile Asn Ala Val Cys Pro Gly Pro Val

180 185 190

Asp Ser Pro Phe Leu Ala Asp Met Pro Gln Pro Met Arg Asp Arg Leu

195 200 205

Leu Phe Gly Thr Pro Ile Gly Arg Leu Ala Thr Ala Glu Glu Ile Ala

210 215 220

Arg Ser Val Leu Trp Leu Cys Ser Asp Asp Ala Lys Tyr Val Val Gly

225 230 235 240

His Ser Met Ser Val Asp Gly Gly Val Ala Val Thr Ala Val Gly Thr

245 250 255

Arg Met Asp Asp Leu Phe

260

<210>111

<211>762

<212>DNA

<213>恶臭假单胞菌KT2440

<400>111

atgagcatga ccttttctgg ccaggtagcc ctggtgaccg gcgcgggtgc cggcatcggc 60

cgggcaaccg ccctggcgtt cgcccacgag ggcatgaaag tggtggtggc ggacctcgac 120

ccggtcggcg gcgaggccac cgtggcgcag atccacgcgg caggcggcga agcgctgttc 180

attgcctgcg acgtgacccg cgacgccgag gtgcgccagt tgcatgagcg cctgatggcc 240

gcctacggcc ggctggacta cgccttcaac aacgccggga tcgagatcga gcaacaccgc 300

ctggccgaag gcagcgaagc ggagttcgat gccatcatgg gcgtgaacgt gaagggcgtg 360

tggttgtgca tgaagtatca gttgcccttg ttgctggccc aaggcggtgg ggccatcgtc 420

aataccgcgt cggtggcggg gctaggggcg gcgccaaaga tgagcatcta cagcgccagc 480

aagcatgcgg tcatcggtct gaccaagtcg gcggccatcg agtacgccaa gaagggcatc 540

cgcgtgaacg ccgtgtgccc ggccgtgatc gacaccgaca tgttccgccg cgcttaccag 600

gccgacccgc gcaaggccga gttcgccgca gccatgcacc cggtagggcg cattggcaag 660

gtcgaggaaa tcgccagcgc cgtgctgtat ctgtgcagtg acggcgcggc gtttaccacc 720

gggcattgcc tgacggtgga tggtggggct acggcgatct ga 762

<210>112

<211>253

<212>PRT

<213>恶臭假单胞菌KT2440

<400>112

Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Gly

1 5 10 15

Ala Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala His Glu Gly Met

20 25 30

Lys Val Val Val Ala Asp Leu Asp Pro Val Gly Gly Glu Ala Thr Val

35 40 45

Ala Gln Ile His Ala Ala Gly Gly Glu Ala Leu Phe Ile Ala Cys Asp

50 55 60

Val Thr Arg Asp Ala Glu Val Arg Gln Leu His Glu Arg Leu Met Ala

65 70 75 80

Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile

85 90 95

Glu Gln His Arg Leu Ala Glu Gly Ser Glu Ala Glu Phe Asp Ala Ile

100 105 110

Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu

115 120 125

Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser

130 135 140

Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ser Ala Ser

145 150 155 160

Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala

165 170 175

Lys Lys Gly Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr

180 185 190

Asp Met Phe Arg Arg Ala Tyr Gln Ala Asp Pro Arg Lys Ala Glu Phe

195 200 205

Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile

210 215 220

Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr

225 230 235 240

Gly His Cys Leu Thr Val Asp Gly Gly Ala Thr Ala Ile

245 250

<210>113

<211>810

<212>DNA

<213>恶臭假单胞菌KT2440

<400>113

atgtcttttc aaaacaaaat cgttgtgctc acaggcgcag cttctggcat cggcaaagcg 60

acagcacagc tgctagtgga gcagggcgcc catgtggttg ccatggatct taaaagcgac 120

ttgcttcaac aagcattcgg cagtgaggag cacgttctgt gcatccctac cgacgtcagc 180

gatagcgaag ccgtgcgagc cgccttccag gcagtggacg cgaaatttgg ccgtgtcgac 240

gtgattatta acgccgcggg catcaacgca cctacgcgag aagccaacca gaaaatggtt 300

gatgccaacg tcgctgccct cgatgccatg aagagcgggc gggcgcccac tttcgacttc 360

ctggccgata cctcggatca ggatttccgg cgcgtaatgg aagtcaattt gttcagccag 420

ttttactgca ttcgagaggg tgttccgctg atgcgccgag cgggtggcgg cagcatcgtc 480

aacatctcca gcgtggcagc gctcctgggc gtggcaatgc cactttacta ccccgcctcc 540

aaggcggcgg tgctgggcct cacccgtgca gcggcagctg agttggcacc ttacaacatt 600

cgtgtgaatg ccatcgctcc aggctctgtc gacacaccat tgatgcatga gcaaccaccg 660

gaagtcgttc agttcctggt cagcatgcaa cccatcaagc ggctggccca acccgaggag 720

cttgcccaaa gcatcctgtt ccttgccggt gagcattcgt ccttcatcac cggacagacg 780

ctttctccca acggcgggat gcacatgtaa 810

<210>114

<211>269

<212>PRT

<213>恶臭假单胞菌KT2440

<400>114

Met Ser Phe Gln Asn Lys Ile Val Val Leu Thr Gly Ala Ala Ser Gly

1 5 10 15

Ile Gly Lys Ala Thr Ala Gln Leu Leu Val Glu Gln Gly Ala His Val

20 25 30

Val Ala Met Asp Leu Lys Ser Asp Leu Leu Gln Gln Ala Phe Gly Ser

35 40 45

Glu Glu His Val Leu Cys Ile Pro Thr Asp Val Ser Asp Ser Glu Ala

50 55 60

Val Arg Ala Ala Phe Gln Ala Val Asp Ala Lys Phe Gly Arg Val Asp

65 70 75 80

Val Ile Ile Asn Ala Ala Gly Ile Asn Ala Pro Thr Arg Glu Ala Asn

85 90 95

Gln Lys Met Val Asp Ala Asn Val Ala Ala Leu Asp Ala Met Lys Ser

100 105 110

Gly Arg Ala Pro Thr Phe Asp Phe Leu Ala Asp Thr Ser Asp Gln Asp

115 120 125

Phe Arg Arg Val Met Glu Val Asn Leu Phe Ser Gln Phe Tyr Cys Ile

130 135 140

Arg Glu Gly Val Pro Leu Met Arg Arg Ala Gly Gly Gly Ser Ile Val

145 150 155 160

Asn Ile Ser Ser Val Ala Ala Leu Leu Gly Val Ala Met Pro Leu Tyr

165 170 175

Tyr Pro Ala Ser Lys Ala Ala Val Leu Gly Leu Thr Arg Ala Ala Ala

180 185 190

Ala Glu Leu Ala Pro Tyr Asn Ile Arg Val Asn Ala Ile Ala Pro Gly

195 200 205

Ser Val Asp Thr Pro Leu Met His Glu Gln Pro Pro Glu Val Val Gln

210 215 220

Phe Leu Val Ser Met Gln Pro Ile Lys Arg Leu Ala Gln Pro Glu Glu

225 230 235 240

Leu Ala Gln Ser Ile Leu Phe Leu Ala Gly Glu His Ser Ser Phe Ile

245 250 255

Thr Gly Gln Thr Leu Ser Pro Asn Gly Gly Met His Met

260 265

<210>115

<211>771

<212>DNA

<213>恶臭假单胞菌KT2440

<400>115

atgacccttg aaggcaaaac tgcactcgtc accggttcca ccagcggcat tggcctgggc 60

atcgcccagg tattggcccg ggctggcgcc aacatcgtgc tcaacggctt tggtgacccg 120

ggccccgcca tggcggaaat tgcccggcac ggggtgaagg ttgtgcacca cccggccgac 180

ctgtcggatg tggtccagat cgaggctttg ttcaacctgg ccgaacgcga gttcggcggc 240

gtcgacatcc tggtcaacaa cgccggtatc cagcatgtgg caccggttga gcagttcccg 300

ccagaaagct gggacaagat catcgccctg aacctgtcgg ccgtattcca tggcacgcgc 360

ctggcgctgc cgggcatgcg cacgcgcaac tgggggcgca tcatcaatat cgcttcggtg 420

catggcctgg tcggctcgat tggcaaggca gcctacgtgg cagccaagca tggcgtgatc 480

ggcctgacca aggtggtcgg cctggaaacc gccaccagtc atgtcacctg caatgccata 540

tgcccgggct gggtgctgac accgctggtg caaaagcaga tcgacgatcg tgcggccaag 600

ggtggcgatc ggctgcaagc gcagcacgat ctgctggcag aaaagcaacc gtcgctggct 660

ttcgtcaccc ccgaacacct cggtgagctg gtactctttc tgtgcagcga ggccggtagc 720

caggttcgcg gcgccgcctg gaacgtcgat ggtggctggt tggcccagtg a 771

<210>116

<211>256

<212>PRT

<213>恶臭假单胞菌KT2440

<400>116

Met Thr Leu Glu Gly Lys Thr Ala Leu Val Thr Gly Ser Thr Ser Gly

1 5 10 15

Ile Gly Leu Gly Ile Ala Gln Val Leu Ala Arg Ala Gly Ala Asn Ile

20 25 30

Val Leu Asn Gly Phe Gly Asp Pro Gly Pro Ala Met Ala Glu Ile Ala

35 40 45

Arg His Gly Val Lys Val Val His His Pro Ala Asp Leu Ser Asp Val

50 55 60

Val Gln Ile Glu Ala Leu Phe Asn Leu Ala Glu Arg Glu Phe Gly Gly

65 70 75 80

Val Asp Ile Leu Val Asn Asn Ala Gly Ile Gln His Val Ala Pro Val

85 90 95

Glu Gln Phe Pro Pro Glu Ser Trp Asp Lys Ile Ile Ala Leu Asn Leu

100 105 110

Ser Ala Val Phe His Gly Thr Arg Leu Ala Leu Pro Gly Met Arg Thr

115 120 125

Arg Asn Trp Gly Arg Ile Ile Asn Ile Ala Ser Val His Gly Leu Val

130 135 140

Gly Ser Ile Gly Lys Ala Ala Tyr Val Ala Ala Lys His Gly Val Ile

145 150 155 160

Gly Leu Thr Lys Val Val Gly Leu Glu Thr Ala Thr Ser His Val Thr

165 170 175

Cys Asn Ala Ile Cys Pro Gly Trp Val Leu Thr Pro Leu Val Gln Lys

180 185 190

Gln Ile Asp Asp Arg Ala Ala Lys Gly Gly Asp Arg Leu Gln Ala Gln

195 200 205

His Asp Leu Leu Ala Glu Lys Gln Pro Ser Leu Ala Phe Val Thr Pro

210 215 220

Glu His Leu Gly Glu Leu Val Leu Phe Leu Cys Ser Glu Ala Gly Ser

225 230 235 240

Gln Val Arg Gly Ala Ala Trp Asn Val Asp Gly Gly Trp Leu Ala Gln

245 250 255

<210>117

<211>750

<212>DNA

<213>恶臭假单胞菌KT2440

<400>117

atgtccaagc aacttacact cgaaggcaaa gtggccctgg ttcagggcgg ttcccgaggc 60

attggcgcag ctatcgtaag gcgcctggcc cgcgaaggcg cgcaagtggc cttcacctat 120

gtcagctctg ccggcccggc tgaagaactg gctcgggaaa ttaccgagaa cggcggcaaa 180

gccttggccc tgcgggctga cagcgctgat gccgcggccg tgcagctggc ggttgatgac 240

accgagaaag ccttgggccg gctggatatc ctggtcaaca acgccggtgt gctggcagtg 300

gccccagtga cagagttcga cctggccgac ttcgatcata tgctggccgt gaacgtacgc 360

agcgtgttcg tcgccagcca ggccgcggca cgctatatgg gccagggcgg tcgtatcatc 420

aacattggca gcaccaacgc cgagcgcatg ccgtttgccg gtggtgcacc gtacgccatg 480

agcaagtcgg cactggttgg tctgacccgc ggcatggcac gcgacctcgg gccgcagggc 540

attaccgtga acaacgtgca gcccggcccg gtggacaccg acatgaaccc ggccagtggc 600

gagtttgccg agagcctgat tccgctgatg gccattgggc gatatggcga gccggaggag 660

attgccagct tcgtggctta cctggcaggg cctgaagccg ggtatatcac cggggccagc 720

ctgactgtag atggtgggtt tgcagcctga 750

<210>118

<211>249

<212>PRT

<213>恶臭假单胞菌KT2440

<400>118

Met Ser Lys Gln Leu Thr Leu Glu Gly Lys Val Ala Leu Val Gln Gly

1 5 10 15

Gly Ser Arg Gly Ile Gly Ala Ala Ile Val Arg Arg Leu Ala Arg Glu

20 25 30

Gly Ala Gln Val Ala Phe Thr Tyr Val Ser Ser Ala Gly Pro Ala Glu

35 40 45

Glu Leu Ala Arg Glu Ile Thr Glu Asn Gly Gly Lys Ala Leu Ala Leu

50 55 60

Arg Ala Asp Ser Ala Asp Ala Ala Ala Val Gln Leu Ala Val Asp Asp

65 70 75 80

Thr Glu Lys Ala Leu Gly Arg Leu Asp Ile Leu Val Asn Asn Ala Gly

85 90 95

Val Leu Ala Val Ala Pro Val Thr Glu Phe Asp Leu Ala Asp Phe Asp

100 105 110

His Met Leu Ala Val Asn Val Arg Ser Val Phe Val Ala Ser Gln Ala

115 120 125

Ala Ala Arg Tyr Met Gly Gln Gly Gly Arg Ile Ile Asn Ile Gly Ser

130 135 140

Thr Asn Ala Glu Arg Met Pro Phe Ala Gly Gly Ala Pro Tyr Ala Met

145 150 155 160

Ser Lys Ser Ala Leu Val Gly Leu Thr Arg Gly Met Ala Arg Asp Leu

165 170 175

Gly Pro Gln Gly Ile Thr Val Asn Asn Val Gln Pro Gly Pro Val Asp

180 185 190

Thr Asp Met Asn Pro Ala Ser Gly Glu Phe Ala Glu Ser Leu Ile Pro

195 200 205

Leu Met Ala Ile Gly Arg Tyr Gly Glu Pro Glu Glu Ile Ala Ser Phe

210 215 220

Val Ala Tyr Leu Ala Gly Pro Glu Ala Gly Tyr Ile Thr Gly Ala Ser

225 230 235 240

Leu Thr Val Asp Gly Gly Phe Ala Ala

245

<210>119

<211>858

<212>DNA

<213>恶臭假单胞菌KT2440

<400>119

atgagcgact accctacccc tccattccca tcccaaccgc aaagcgttcc cggttcccag 60

cgcaagatgg atccgtatcc ggactgcggt gagcagagct acaccggcaa caatcgcctc 120

gcaggcaaga tcgccttgat aaccggtgct gacagcggca tcgggcgtgc ggtggcgatt 180

gcctatgccc gagaaggcgc tgacgttgcc attgcctatc tgaatgaaca cgacgatgcg 240

caggaaaccg cgcgctgggt caaagcggct ggccgccagt gcctgctgct gcccggcgac 300

ctggcacaga aacagcactg ccacgacatc gtcgacaaga ccgtggcgca gtttggtcgc 360

atcgatatcc tggtcaacaa cgccgcgttc cagatggccc atgaaagcct ggacgacatt 420

gatgacgatg aatgggtgaa gaccttcgat accaacatca ccgccatttt ccgcatttgc 480

cagcgcgctt tgccctcgat gccaaagggc ggttcgatca tcaacaccag ttcggtcaac 540

tctgacgacc cgtcacccag cctgttggcc tatgccgcga ccaaaggggc tattgccaat 600

ttcactgcag gccttgcgca actgctgggc aagcagggca ttcgcgtcaa cagcgtcgca 660

cccggcccga tctggacccc gctgatcccg gccaccatgc ctgatgaggc ggtgagaaac 720

ttcggttccg gttacccgat gggacggccg ggtcaacctg tggaggtggc gccaatctat 780

gtcttgctgg ggtccgatga agccagctac atctcgggtt cgcgttacgc cgtgacggga 840

ggcaaaccta ttctgtga 858

<210>120

<211>285

<212>PRT

<213>恶臭假单胞菌KT2440

<400>120

Met Ser Asp Tyr Pro Thr Pro Pro Phe Pro Ser Gln Pro Gln Ser Val

1 5 10 15

Pro Gly Ser Gln Arg Lys Met Asp Pro Tyr Pro Asp Cys Gly Glu Gln

20 25 30

Ser Tyr Thr Gly Asn Asn Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr

35 40 45

Gly Ala Asp Ser Gly Ile Gly Arg Ala Val Ala Ile Ala Tyr Ala Arg

50 55 60

Glu Gly Ala Asp Val Ala Ile Ala Tyr Leu Asn Glu His Asp Asp Ala

65 70 75 80

Gln Glu Thr Ala Arg Trp Val Lys Ala Ala Gly Arg Gln Cys Leu Leu

85 90 95

Leu Pro Gly Asp Leu Ala Gln Lys Gln His Cys His Asp Ile Val Asp

100 105 110

Lys Thr Val Ala Gln Phe Gly Arg Ile Asp Ile Leu Val Asn Asn Ala

115 120 125

Ala Phe Gln Met Ala His Glu Ser Leu Asp Asp Ile Asp Asp Asp Glu

130 135 140

Trp Val Lys Thr Phe Asp Thr Asn Ile Thr Ala Ile Phe Arg Ile Cys

145 150 155 160

Gln Arg Ala Leu Pro Ser Met Pro Lys Gly Gly Ser Ile Ile Asn Thr

165 170 175

Ser Ser Val Asn Ser Asp Asp Pro Ser Pro Ser Leu Leu Ala Tyr Ala

180 185 190

Ala Thr Lys Gly Ala Ile Ala Asn Phe Thr Ala Gly Leu Ala Gln Leu

195 200 205

Leu Gly Lys Gln Gly Ile Arg Val Asn Ser Val Ala Pro Gly Pro Ile

210 215 220

Trp Thr Pro Leu Ile Pro Ala Thr Met Pro Asp Glu Ala Val Arg Asn

225 230 235 240

Phe Gly Ser Gly Tyr Pro Met Gly Arg Pro Gly Gln Pro Val Glu Val

245 250 255

Ala Pro Ile Tyr Val Leu Leu Gly Ser Asp Glu Ala Ser Tyr Ile Ser

260 265 270

Gly Ser Arg Tyr Ala Val Thr Gly Gly Lys Pro Ile Leu

275 280 285

<210>121

<211>774

<212>DNA

<213>恶臭假单胞菌KT2440

<400>121

atgatcgaaa tcagcggcag caccccgggc cacaatggcc gggtagcctt ggtcacgggc 60

gccgcccgcg gcatcggtct gggcattgcc gcatggctga tctgcgaagg ctggcaagtg 120

gtgctgagtg atctggaccg ccagcgtggt accaaagtgg ccaaggcgtt gggcgacaac 180

gcctggttca tcaccatgga cgttgccgac gaggcccagg tcagtgccgg cgtgtccgaa 240

gtgctcgggc agttcggccg gctggacgcg ctggtgtgca atgcggccat tgccaacccg 300

cacaaccaga cgctggaaag cctgagcctg gcacaatgga accgggtgct gggggtcaac 360

ctcagcggcc ccatgctgct ggccaagcat tgtgcgccgt acctgcgtgc gcacaatggg 420

gcgatcgtca acctgacctc tacccgtgct cggcagtccg aacccgacac cgaggcttac 480

gcggcaagca agggcggcct ggtggctttg acccatgccc tggccatgag cctgggcccg 540

gagattcgcg tcaatgcggt gagcccgggc tggatcgatg cccgtgatcc gtcgcagcgc 600

cgtgccgagc cgttgagcga agctgaccat gcccagcatc caacgggcag ggtagggacc 660

gtggaagatg tcgcggccat ggttgcctgg ttgctgtcac gccaggcggc atttgtcacc 720

ggccaggagt ttgtggtcga tggcggcatg acccgcaaga tgatctatac ctga 774

<210>122

<211>257

<212>PRT

<213>恶臭假单胞菌KT2440

<400>122

Met Ile Glu Ile Ser Gly Ser Thr Pro Gly His Asn Gly Arg Val Ala

1 5 10 15

Leu Val Thr Gly Ala Ala Arg Gly Ile Gly Leu Gly Ile Ala Ala Trp

20 25 30

Leu Ile Cys Glu Gly Trp Gln Val Val Leu Ser Asp Leu Asp Arg Gln

35 40 45

Arg Gly Thr Lys Val Ala Lys Ala Leu Gly Asp Asn Ala Trp Phe Ile

50 55 60

Thr Met Asp Val Ala Asp Glu Ala Gln Val Ser Ala Gly Val Ser Glu

65 70 75 80

Val Leu Gly Gln Phe Gly Arg Leu Asp Ala Leu Val Cys Asn Ala Ala

85 90 95

Ile Ala Asn Pro His Asn Gln Thr Leu Glu Ser Leu Ser Leu Ala Gln

100 105 110

Trp Asn Arg Val Leu Gly Val Asn Leu Ser Gly Pro Met Leu Leu Ala

115 120 125

Lys His Cys Ala Pro Tyr Leu Arg Ala His Asn Gly Ala Ile Val Asn

130 135 140

Leu Thr Ser Thr Arg Ala Arg Gln Ser Glu Pro Asp Thr Glu Ala Tyr

145 150 155 160

Ala Ala Ser Lys Gly Gly Leu Val Ala Leu Thr His Ala Leu Ala Met

165 170 175

Ser Leu Gly Pro Glu Ile Arg Val Asn Ala Val Ser Pro Gly Trp Ile

180 185 190

Asp Ala Arg Asp Pro Ser Gln Arg Arg Ala Glu Pro Leu Ser Glu Ala

195 200 205

Asp His Ala Gln His Pro Thr Gly Arg Val Gly Thr Val Glu Asp Val

210 215 220

Ala Ala Met Val Ala Trp Leu Leu Ser Arg Gln Ala Ala Phe Val Thr

225 230 235 240

Gly Gln Glu Phe Val Val Asp Gly Gly Met Thr Arg Lys Met Ile Tyr

245 250 255

Thr

<210>123

<211>741

<212>DNA

<213>恶臭假单胞菌KT2440

<400>123

atgagcctgc aaggtaaagt tgcactggtt accggcgcca gccgtggcat tggccaggcc 60

atcgccctcg agctgggccg ccagggcgcg accgtgatcg gtaccgccac gtcggcgtcc 120

ggtgccgagc gcatcgctgc caccctgaaa gaacacggca ttaccggcac tggcatggag 180

ctgaacgtga ccagcgccga atcggttgaa gccgtactgg ccgccattgg cgagcagttc 240

ggcgcgccgg ccatcttggt caacaatgcc ggtatcaccc gcgacaacct catgctgcgc 300

atgaaagacg acgagtggtt tgatgtcatc gacaccaacc tgaacagcct ctaccgtctg 360

tccaagggcg tgctgcgtgg catgaccaag gcgcgttggg gtcgtatcat cagcatcggc 420

tcggtcgttg gtgccatggg taacgcaggt caggccaact acgcggctgc caaggccggt 480

ctggaaggtt tcagccgcgc cctggcgcgt gaagtgggtt cgcgtggtat caccgtcaac 540

tcggtgaccc caggcttcat cgataccgac atgacccgcg agctgccaga agctcagcgc 600

gaagccctgc agacccagat tccgctgggc cgcctgggcc aggctgacga aattgccaag 660

gtggtttcgt tcctggcatc cgacggcgcc gcctacgtga ccggcgctac cgtgccggtc 720

aacggcggga tgtacatgta a 741

<210>124

<211>246

<212>PRT

<213>恶臭假单胞菌KT2440

<400>124

Met Ser Leu Gln Gly Lys Val Ala Leu Val Thr Gly Ala Ser Arg Gly

1 5 10 15

Ile Gly Gln Ala Ile Ala Leu Glu Leu Gly Arg Gln Gly Ala Thr Val

20 25 30

Ile Gly Thr Ala Thr Ser Ala Ser Gly Ala Glu Arg Ile Ala Ala Thr

35 40 45

Leu Lys Glu His Gly Ile Thr Gly Thr Gly Met Glu Leu Asu Val Thr

50 55 60

Ser Ala Glu Ser Val Glu Ala Val Leu Ala Ala Ile Gly Glu Gln Phe

65 70 75 80

Gly Ala Pro Ala Ile Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Asn

85 90 95

Leu Met Leu Arg Met Lys Asp Asp Glu Trp Phe Asp Val Ile Asp Thr

100 105 110

Asn Leu Asn Ser Leu Tyr Arg Leu Ser Lys Gly Val Leu Arg Gly Met

115 120 125

Thr Lys Ala Arg Trp Gly Arg Ile Ile Ser Ile Gly Ser Val Val Gly

130 135 140

Ala Met Gly Asn Ala Gly Gln Ala Asn Tyr Ala Ala Ala Lys Ala Gly

145 150 155 160

Leu Glu Gly Phe Ser Arg Ala Leu Ala Arg Glu Val Gly Ser Arg Gly

165 170 175

Ile Thr Val Asn Ser Val Thr Pro Gly Phe Ile Asp Thr Asp Met Thr

180 185 190

Arg Glu Leu Pro Glu Ala Gln Arg Glu Ala Leu Gln Thr Gln Ile Pro

195 200 205

Leu Gly Arg Leu Gly Gln Ala Asp Glu Ile Ala Lys Val Val Ser Phe

210 215 220

Leu Ala Ser Asp Gly Ala Ala Tyr Val Thr Gly Ala Thr Val Pro Val

225 230 235 240

Asn Gly Gly Met Tyr Met

245

<210>125

<211>738

<212>DNA

<213>恶臭假单胞菌KT2440

<400>125

atgactcaga aaatagctgt cgtgaccggc ggcagtcgcg gcattggcaa gtccatcgtg 60

ctggccctgg ccggcgcggg ttatcaggtt gccttcagtt atgtccgtga cgaggcgtca 120

gccgctgcct tgcaggcgca ggtcgaaggg ctcggccggg actgcctggc cgtgcagtgt 180

gatgtcaagg aagcgccgag cattcaggcg ttttttgaac gggtcgagca acgtttcgag 240

cgtatcgact tgttggtcaa caacgccggt attacccgtg acggtttgct cgccacgcaa 300

tcgttgaacg acatcaccga ggtcatccag accaacctgg tcggcacgtt gttgtgctgt 360

cagcaggtgc tgccctgcat gatgcgccaa cgcagcgggt gcatcgtcaa cctcagttcg 420

gtggccgcgc aaaagcccgg caagggccag agcaactacg ccgccgccaa aggcggtgta 480

gaagcattga cacgcgcact ggcggtggag ttggcgccgc gcaacatccg ggtcaacgcg 540

gtggcgcccg gcatcgtcag caccgacatg agccaagccc tggtcggcgc ccatgagcag 600

gaaatccagt cgcggctgtt gatcaaacgg ttcgcccggc ctgaagaaat tgccgacgcg 660

gtgctgtatc tggccgagcg cggcctgtac atcacgggcg aagtcctgtc cgtcaacggc 720

ggattgaaaa tgccatga 738

<210>126

<211>245

<212>PRT

<213>恶臭假单胞菌KT2440

<400>126

Met Thr Gln Lys Ile Ala Val Val Thr Gly Gly Ser Arg Gly Ile Gly

1 5 10 15

Lys Ser Ile Val Leu Ala Leu Ala Gly Ala Gly Tyr Gln Val Ala Phe

20 25 30

Ser Tyr Val Arg Asp Glu Ala Ser Ala Ala Ala Leu Gln Ala Gln Val

35 40 45

Glu Gly Leu Gly Arg Asp Cys Leu Ala Val Gln Cys Asp Val Lys Glu

50 55 60

Ala Pro Ser Ile Gln Ala Phe Phe Glu Arg Val Glu Gln Arg Phe Glu

65 70 75 80

Arg Ile Asp Leu Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Gly Leu

85 90 95

Leu Ala Thr Gln Ser Leu Asn Asp Ile Thr Glu Val Ile Gln Thr Asn

100 105 110

Leu Val Gly Thr Leu Leu Cys Cys Gln Gln Val Leu Pro Cys Met Met

115 120 125

Arg Gln Arg Ser Gly Cys Ile Val Asn Leu Ser Ser Val Ala Ala Gln

130 135 140

Lys Pro Gly Lys Gly Gln Ser Asn Tyr Ala Ala Ala Lys Gly Gly Val

145 150 155 160

Glu Ala Leu Thr Arg Ala Leu Ala Val Glu Leu Ala Pro Arg Asn Ile

165 170 175

Arg Val Asn Ala Val Ala Pro Gly Ile Val Ser Thr Asp Met Ser Gln

180 185 190

Ala Leu Val Gly Ala His Glu Gln Glu Ile Gln Ser Arg Leu Leu Ile

195 200 205

Lys Arg Phe Ala Arg Pro Glu Glu Ile Ala Asp Ala Val Leu Tyr Leu

210 215 220

Ala Glu Arg Gly Leu Tyr Ile Thr Gly Glu Val Leu Ser Val Asn Gly

225 230 235 240

Gly Leu Lys Met Pro

245

<210>127

<211>768

<212>DNA

<213>恶臭假单胞菌KT2440

<400>127

atgtccaaga cccacctgtt cgacctcgac ggcaagattg cctttgtttc cggcgccagc 60

cgtggcatcg gcgaggccat cgcccacttg ctcgcgcagc aaggggccca tgtgatcgtt 120

tccagccgca agcttgacgg gtgccagcag gtggccgacg ccatcattgc cgccggcggc 180

aaggccacgg ctgtggcctg ccacattggt gagctggaac agattcagca ggtgttcgcc 240

ggcattcgcg aacagttcgg gcgactggac gtgctggtca acaatgcagc caccaacccg 300

caattctgca atgtgctgga caccgaccca ggggcgttcc agaagaccgt ggacgtgaac 360

atccgtggtt acttcttcat gtcggtggag gctggcaagc tgatgcgcga gaacggcggc 420

ggcagcatca tcaacgtggc gtcgatcaac ggtgtttcac ccgggctgtt ccaaggcatc 480

tactcggtga ccaaggcggc ggtcatcaac atgaccaagg tgttcgccaa agagtgtgca 540

cccttcggta ttcgctgcaa cgcgctactg ccggggctga ccgataccaa gttcgcttcg 600

gcattggtga agaacgaagc catcctcaac gccgccttgc agcagatccc cctcaaacgc 660

gtggccgacc ccaaggaaat ggcgggtgcg gtgctgtacc tggccagcga tgcctccagc 720

tacaccaccg gcaccacgct caatgtcgac ggtggcttcc tgtcctga 768

<210>128

<211>255

<212>PRT

<213>恶臭假单胞菌KT2440

<400>128

Met Ser Lys Thr His Leu Phe Asp Leu Asp Gly Lys Ile Ala Phe Val

1 5 10 15

Ser Gly Ala Ser Arg Gly Ile Gly Glu Ala Ile Ala His Leu Leu Ala

20 25 30

Gln Gln Gly Ala His Val Ile Val Ser Ser Arg Lys Leu Asp Gly Cys

35 40 45

Gln Gln Val Ala Asp Ala Ile Ile Ala Ala Gly Gly Lys Ala Thr Ala

50 55 60

Val Ala Cys His Ile Gly Glu Leu Glu Gln Ile Gln Gln Val Phe Ala

65 70 75 80

Gly Ile Arg Glu Gln Phe Gly Arg Leu Asp Val Leu Val Asn Asn Ala

85 90 95

Ala Thr Asn Pro Gln Phe Cys Asn Val Leu Asp Thr Asp Pro Gly Ala

100 105 110

Phe Gln Lys Thr Val Asp Val Asn Ile Arg Gly Tyr Phe Phe Met Ser

115 120 125

Val Glu Ala Gly Lys Leu Met Arg Glu Asn Gly Gly Gly Ser Ile Ile

130 135 140

Asn Val Ala Ser Ile Asn Gly Val Ser Pro Gly Leu Phe Gln Gly Ile

145 150 155 160

Tyr Ser Val Thr Lys Ala Ala Val Ile Asn Met Thr Lys Val Phe Ala

165 170 175

Lys Glu Cys Ala Pro Phe Gly Ile Arg Cys Asn Ala Leu Leu Pro Gly

180 185 190

Leu Thr Asp Thr Lys Phe Ala Ser Ala Leu Val Lys Asn Glu Ala Ile

195 200 205

Leu Asn Ala Ala Leu Gln Gln Ile Pro Leu Lys Arg Val Ala Asp Pro

210 215 220

Lys Glu Met Ala Gly Ala Val Leu Tyr Leu Ala Ser Asp Ala Ser Ser

225 230 235 240

Tyr Thr Thr Gly Thr Thr Leu Asn Val Asp Gly Gly Phe Leu Ser

245 250 255

<210>129

<211>762

<212>DNA

<213>荧光假单孢菌Pf-5

<400>129

atgagcatga cgttttccgg ccaggtggcc ctagtgaccg gcgcagccaa tggtatcggc 60

cgcgccaccg cccaggcatt tgccgcacaa ggcttgaagg tggtggtggc ggacctggac 120

acggcggggg gcgagggcac cgtggcgctg atccgcgagg ccggtggcga ggcattgttc 180

gtgccgtgca acgttaccct ggaggcggat gtgcaaagcc tcatggcccg caccatcgaa 240

gcctatgggc gcctggatta cgccttcaac aatgccggta tcgagatcga aaagggccgc 300

cttgcggagg gctccatgga tgagttcgac gccatcatgg gggtcaacgt caaaggggtc 360

tggctgtgca tgaagtacca gttgccgctg ctgctggccc agggcggtgg ggcgatcgtc 420

aacaccgcct cggtggcggg cctgggcgcg gcgccgaaga tgagcatcta tgcggcctcc 480

aagcatgcgg tgatcggcct gaccaagtcg gcggccatcg aatatgcgaa gaagaaaatc 540

cgcgtgaacg cggtatgccc ggcggtgatc gacaccgaca tgttccgccg tgcctacgag 600

gcggacccga agaaggccga gttcgccgcg gccatgcacc cggtggggcg catcggcaag 660

gtcgaggaga tcgccagtgc ggtgctctac ctgtgcagcg atggcgcggc ctttaccacc 720

ggccatgcac tggcggtcga cggcggggcc accgcgatct ga 762

<210>130

<211>253

<212>PRT

<213>荧光假单孢菌Pf-5

<400>130

Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala

1 5 10 15

Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu

20 25 30

Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val

35 40 45

Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn

50 55 60

Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu

65 70 75 80

Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile

85 90 95

Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile

100 105 110

Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu

115 120 125

Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser

130 135 140

Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser

145 150 155 160

Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala

165 170 175

Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr

180 185 190

Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe

195 200 205

Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile

210 215 220

Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr

225 230 235 240

Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile

245 250

<210>131

<211>735

<212>DNA

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>131

atgaaacttg ccagtaaaac cgccattgtc accggcgccg cacgcggtat cggctttggc 60

attgcccagg tgcttgcgcg ggaaggcgcg cgagtgatta tcgccgatcg tgatgcacac 120

ggcgaagccg ccgccgcttc cctgcgcgaa tcgggcgcac aggcgctgtt tatcagctgc 180

aatatcgctg aaaaaacgca ggtcgaagcc ctgtattccc aggccgaaga ggcgtttggc 240

ccggtagaca ttctggtgaa taacgccgga atcaaccgcg acgccatgct gcacaaatta 300

acggaagcgg actgggacac ggttatcgac gttaacctga aaggcacttt cctctgtatg 360

cagcaggccg ctatccgcat gcgcgagcgc ggtgcgggcc gcattatcaa tatcgcttcc 420

gccagttggc ttggcaacgt cgggcaaacc aactattcgg cgtcaaaagc cggcgtggtg 480

ggaatgacca aaaccgcctg ccgcgaactg gcgaaaaaag gtgtcacggt gaatgccatc 540

tgcccgggct ttatcgatac cgacatgacg cgcggcgtac cggaaaacgt ctggcaaatc 600

atggtcagca aaattcccgc gggttacgcc ggcgaggcga aagacgtcgg cgagtgtgtg 660

gcgtttctgg cgtccgatgg cgcgcgctat atcaatggtg aagtgattaa cgtcggcggc 720

ggcatggtgc tgtaa 735

<210>132

<211>253

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>132

Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala

1 5 10 15

Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu

20 25 30

Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val

35 40 45

Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn

50 55 60

Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu

65 70 75 80

Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile

85 90 95

Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile

100 105 110

Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu

115 120 125

Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser

130 135 140

Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser

145 150 155 160

Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala

165 170 175

Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr

180 185 190

Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe

195 200 205

Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile

210 215 220

Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr

225 230 235 240

Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile

245 250

<210>133

<211>750

<212>DNA

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>133

atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60

ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120

ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180

aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240

cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300

aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360

caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420

gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480

ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540

aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600

atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660

gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720

gacgttaacg gcggcatgtt aattcactaa 750

<210>134

<211>249

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>134

Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala

1 5 10 15

Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala

20 25 30

Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala

35 40 45

Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp

50 55 60

Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly

65 70 75 80

Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys

85 90 95

Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser

100 105 110

Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg

115 120 125

Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln

130 135 140

Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala

145 150 155 160

Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp

165 170 175

Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile

180 185 190

Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly

195 200 205

Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala

210 215 220

Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu

225 230 235 240

Asp Val Asn Gly Gly Met Leu Ile His

245

<210>135

<211>750

<212>DNA

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>135

atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60

ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120

ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180

aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240

cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300

aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360

caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420

gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480

ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540

aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600

atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660

gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720

gacgttaacg gcggcatgtt aattcactaa 750

<210>136

<211>249

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>136

Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala

1 5 10 15

Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala

20 25 30

Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala

35 40 45

Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp

50 55 60

Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly

65 70 75 80

Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys

85 90 95

Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser

100 105 110

Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg

115 120 125

Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln

130 135 140

Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala

145 150 155 160

Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp

165 170 175

Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile

180 185 190

Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly

195 200 205

Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala

210 215 220

Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu

225 230 235 240

Asp Val Asn Gly Gly Met Leu Ile His

245

<210>137

<211>714

<212>DNA

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>137

atgacagcgt ttcacaacaa atcagtgctg gttttaggcg ggagtcgggg aattggcgcg 60

gcgatcgtca ggcgttttgt cgccgatggc gcgtcggtgg tgtttagcta ttccggttcg 120

ccggaagcgg ccgagcggct ggcggcagag accggcagca cggcggtgca ggcggacagc 180

gccgatcgcg atgcggtgat aagcctggtc cgcgacagcg gcccgctgga cgtgttagtg 240

gtcaatgccg ggatcgcgct tttcggtgac gctctcgagc aggacagcga tgcaatcgat 300

cgcctgttcc acatcaatat tcacgccccc taccatgcct ccgtcgaagc ggcgcgccgc 360

atgccggaag gcgggcgcat tattgtcatc ggctcagtca atggcgatcg catgccgttg 420

ccgggaatgg cggcctatgc gctcagcaaa tcggccctgc aggggctggc gcgcggcctg 480

gcgcgggatt ttggcccgcg cggcatcacg gtcaacgtcg tccagcccgg cccaattgat 540

accgacgcca acccggagaa cggcccgatg aaagagctga tgcacagctt tatggccatt 600

aagcgccatg gccgtccgga agaggtggcg ggaatggtgg cgtggctggc cggtccggag 660

gcgtcgtttg tcactggcgc catgcacacc atcgacggag cgtttggcgc ctga 714

<210>138

<211>237

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>138

Met Thr Ala Phe His Asn Lys Ser Val Leu Val Leu Gly Gly Ser Arg

1 5 10 15

Gly Ile Gly Ala Ala Ile Val Arg Arg Phe Val Ala Asp Gly Ala Ser

20 25 30

Val Val Phe Ser Tyr Ser Gly Ser Pro Glu Ala Ala Glu Arg Leu Ala

35 40 45

Ala Glu Thr Gly Ser Thr Ala Val Gln Ala Asp Ser Ala Asp Arg Asp

50 55 60

Ala Val Ile Ser Leu Val Arg Asp Ser Gly Pro Leu Asp Val Leu Val

65 70 75 80

Val Asn Ala Gly Ile Ala Leu Phe Gly Asp Ala Leu Glu Gln Asp Ser

85 90 95

Asp Ala Ile Asp Arg Leu Phe His Ile Asn Ile His Ala Pro Tyr His

100 105 110

Ala Ser Val Glu Ala Ala Arg Arg Met Pro Glu Gly Gly Arg Ile Ile

115 120 125

Val Ile Gly Ser Val Asn Gly Asp Arg Met Pro Leu Pro Gly Met Ala

130 135 140

Ala Tyr Ala Leu Ser Lys Ser Ala Leu Gln Gly Leu Ala Arg Gly Leu

145 150 155 160

Ala Arg Asp Phe Gly Pro Arg Gly Ile Thr Val Asn Val Val Gln Pro

165 170 175

Gly Pro Ile Asp Thr Asp Ala Asn Pro Glu Asn Gly Pro Met Lys Glu

180 185 190

Leu Met His Ser Phe Met Ala Ile Lys Arg His Gly Arg Pro Glu Glu

195 200 205

Val Ala Gly Met Val Ala Trp Leu Ala Gly Pro Glu Ala Ser Phe Val

210 215 220

Thr Gly Ala Met His Thr Ile Asp Gly Ala Phe Gly Ala

225 230 235

<210>139

<211>750

<212>DNA

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>139

atgaacggcc tgctaaacgg taaacgtatt gtcgtcaccg gtgcggcgcg cggtctcggg 60

taccactttg ccgaagcctg cgccgctcag ggcgcgacgg tggtgatgtg cgacatcctg 120

cagggagagc tggcggaaag cgctcatcgc ctgcagcaga agggctatca ggtcgaatct 180

cacgccatcg atcttgccag tcaagcatcg atcgagcagg tcttcagcgc catcggcgcg 240

caggggtcta tcgatggctt agtcaataac gcagcgatgg ccaccggcgt cggcggaaaa 300

aatatgatcg attacgatcc ggatctgtgg gatcgggtaa tgacggtcaa cgttaaaggc 360

acctggttgg tgacccgcgc ggcggtaccg ctgctgcgcg aaggggcggc gatcgtcaac 420

gtcgcttcgg ataccgcgct gtggggcgcg ccgcggctga tggcctatgt cgccagtaag 480

ggcgcggtga ttgcgatgac ccgctccatg gcccgcgagc tgggtgaaaa gcggatccgt 540

atcaacgcca tcgcgccggg actgacccgc gttgaggcca cggaatacgt tcccgccgag 600

cgtcatcagc tgtatgagaa cggccgcgcg ctcagcggcg cgcagcagcc ggaagatgtc 660

accggcagcg tggtctggct gctgagcgat ctttcgcgct ttatcaccgg ccaactgatc 720

ccggtcaacg gcggttttgt ctttaactaa 750

<210>140

<211>249

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>140

Met Asn Gly Leu Leu Asn Gly Lys Arg Ile Val Val Thr Gly Ala Ala

1 5 10 15

Arg Gly Leu Gly Tyr His Phe Ala Glu Ala Cys Ala Ala Gln Gly Ala

20 25 30

Thr Val Val Met Cys Asp Ile Leu Gln Gly Glu Leu Ala Glu Ser Ala

35 40 45

His Arg Leu Gln Gln Lys Gly Tyr Gln Val Glu Ser His Ala Ile Asp

50 55 60

Leu Ala Ser Gln Ala Ser Ile Glu Gln Val Phe Ser Ala Ile Gly Ala

65 70 75 80

Gln Gly Ser Ile Asp Gly Leu Val Asn Asn Ala Ala Met Ala Thr Gly

85 90 95

Val Gly Gly Lys Asn Met Ile Asp Tyr Asp Pro Asp Leu Trp Asp Arg

100 105 110

Val Met Thr Val Asn Val Lys Gly Thr Trp Leu Val Thr Arg Ala Ala

115 120 125

Val Pro Leu Leu Arg Glu Gly Ala Ala Ile Val Asn Val Ala Ser Asp

130 135 140

Thr Ala Leu Trp Gly Ala Pro Arg Leu Met Ala Tyr Val Ala Ser Lys

145 150 155 160

Gly Ala Val Ile Ala Met Thr Arg Ser Met Ala Arg Glu Leu Gly Glu

165 170 175

Lys Arg Ile Arg Ile Asn Ala Ile Ala Pro Gly Leu Thr Arg Val Glu

180 185 190

Ala Thr Glu Tyr Val Pro Ala Glu Arg His Gln Leu Tyr Glu Asn Gly

195 200 205

Arg Ala Leu Ser Gly Ala Gln Gln Pro Glu Asp Val Thr Gly Ser Val

210 215 220

Val Trp Leu Leu Ser Asp Leu Ser Arg Phe Ile Thr Gly Gln Leu Ile

225 230 235 240

Pro Val Asn Gly Gly Phe Val Phe Asn

245

<210>141

<211>795

<212>DNA

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>141

atgaatgcac aaattgaagg gcgcgtcgcg gtagtcaccg gcggttcgtc aggaatcggc 60

tttgaaacgc tgcgcctgct gctgggcgaa ggggcgaaag tcgccttttg cggccgcaac 120

ccggatcggc ttgccagcgc ccatgcggcg ttgcaaaacg aatatccaga aggtgaggtg 180

ttctcctggc gctgtgacgt actgaacgaa gctgaagttg aggcgttcgc cgccgcggtc 240

gccgcgcgtt tcggcggcgt cgatatgctg attaataacg ccggccaggg ctatgtcgcc 300

cacttcgccg atacgccacg tgaggcctgg ctgcacgaag ccgaactgaa actgttcggc 360

gtgattaacc cggtaaaggc ctttcagtcc ctgctagagg cgtcggatat cgcctcgatt 420

acctgtgtga actcgctgct ggcgttacag ccggaagagc acatgatcgc cacctctgcc 480

gcccgcgccg cgctgctcaa tatgacgctg actctgtcga aagagctggt ggataaaggt 540

attcgtgtga attccattct gctggggatg gtggagtccg ggcagtggca gcgccgtttt 600

gagagccgaa gcgataagag ccagagttgg cagcagtgga ccgccgatat cgcccgtaag 660

cgggggatcc cgatggcgcg tctcggtaag ccgcaggagc cagcgcaagc gctgctattc 720

ctcgcttcgc cgctggcctc ctttaccacc ggcgcggcgc tggacgtttc cggcggtttc 780

tgtcgccatc tgtaa 795

<210>142

<211>264

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>142

Met Asn Ala Gln Ile Glu Gly Arg Val Ala Val Val Thr Gly Gly Ser

1 5 10 15

Ser Gly Ile Gly Phe Glu Thr Leu Arg Leu Leu Leu Gly Glu Gly Ala

20 25 30

Lys Val Ala Phe Cys Gly Arg Asn Pro Asp Arg Leu Ala Ser Ala His

35 40 45

Ala Ala Leu Gln Asn Glu Tyr Pro Glu Gly Glu Val Phe Ser Trp Arg

50 55 60

Cys Asp Val Leu Asn Glu Ala Glu Val Glu Ala Phe Ala Ala Ala Val

65 70 75 80

Ala Ala Arg Phe Gly Gly Val Asp Met Leu Ile Asn Asn Ala Gly Gln

85 90 95

Gly Tyr Val Ala His Phe Ala Asp Thr Pro Arg Glu Ala Trp Leu His

100 105 110

Glu Ala Glu Leu Lys Leu Phe Gly Val Ile Asn Pro Val Lys Ala Phe

115 120 125

Gln Ser Leu Leu Glu Ala Ser Asp Ile Ala Ser Ile Thr Cys Val Asn

130 135 140

Ser Leu Leu Ala Leu Gln Pro Glu Glu His Met Ile Ala Thr Ser Ala

145 150 155 160

Ala Arg Ala Ala Leu Leu Asn Met Thr Leu Thr Leu Ser Lys Glu Leu

165 170 175

Val Asp Lys Gly Ile Arg Val Asn Ser Ile Leu Leu Gly Met Val Glu

180 185 190

Ser Gly Gln Trp Gln Arg Arg Phe Glu Ser Arg Ser Asp Lys Ser Gln

195 200 205

Ser Trp Gln Gln Trp Thr Ala Asp Ile Ala Arg Lys Arg Gly Ile Pro

210 215 220

Met Ala Arg Leu Gly Lys Pro Gln Glu Pro Ala Gln Ala Leu Leu Phe

225 230 235 240

Leu Ala Ser Pro Leu Ala Ser Phe Thr Thr Gly Ala Ala Leu Asp Val

245 250 255

Ser Gly Gly Phe Cys Arg His Leu

260

<210>143

<211>1795

<212>DNA

<213>荧光假单孢菌

<400>143

cgccaagcaa tcgggctttg gggcagaatt gggtcgcgaa gggcttgagg agtttgccca 60

gtccaagatc atcaacgccg cgctataaat taaaggatcc cccatggcga tgattacagg 120

cggcgaactg gttgttcgca ccctaataaa ggctggggtc gaacatctgt tcggcctgca 180

cggcgcgcat atcgatacga tttttcaagc ctgtctcgat catgatgtgc cgatcatcga 240

cacccgccat gaggccgccg cagggcatgc ggccgagggc tatgcccgcg ctggcgccaa 300

gctgggcgtg gctggtcacg gcgggcgggg gatttaccaa tgcggtcacg cccattgcca 360

acgcttggct ggatcgcaag gccggtgtat tcctcacccg ggatcgggcg cgctgcgtga 420

tgatgaaacc aacacgttgc aggcggggat tgatcaggtc gccatggcgg cgcccattac 480

caaatgggcg catcgggtga tggcaaccga gcatatccca cggctggtga tgcaggcgat 540

ccgcgccgcg ttgagcgcgc cacgcgggcc ggtgttgctg gatctgccgt gggatattct 600

gatgaaccag attgatgagg atagcgtcat tatccccgat ctggtcttgt ccgcgcatgg 660

ggccagaccc gaccctgccg atctggatca ggctctcgcg cttttgcgca aggcggagcg 720

gccggtcatc gtgctcggct cagaagcctc gcggacagcg cgcaagacgg cgcttagcgc 780

cttcgtggcg gcgactggcg tgccggtgtt tgccgattat gaagggctaa gcatgctctc 840

ggggctgccc gatgctatgc ggggcgggct ggtgcaaaac ctctattctt ttgccaaagc 900

cgatgccgcg ccagatctcg tgctgatgct gggggcgcgc tttggcctta acaccgggca 960

tggatctggg cagttgatcc cccatagcgc gcaggtcatt caggtcgacc ctgatgcctg 1020

cgagctggga cgcctgcagg gcatcgctct gggcattgtg gccgatgtgg gtgggaccat 1080

cgaggctttg gcgcaggcca ccgcgcaaga tgcggcttgg ccggatcgcg gcgactggtg 1140

cgccaaagtg acggatctgg cgcaagagcg ctatgccagc atcgctgcga aatcgagcag 1200

cgagcatgcg ctccacccct ttcacgcctc gcaggtcatt gccaaacacg tcgatgcagg 1260

ggtgacggtg gtagcggatg gtgcgctgac ctatctctgg ctgtccgaag tgatgagccg 1320

cgtgaaaccc ggcggttttc tctgccacgg ctatctaggc tcgatgggcg tgggcttcgg 1380

cacggcgctg ggcgcgcaag tggccgatct tgaagcaggc cgccgcacga tccttgtgac 1440

cggcgatggc tcggtgggct atagcatcgg tgaatttgat acgctggtgc gcaaacaatt 1500

gccgctgatc gtcatcatca tgaacaacca aagctggggg gcgacattgc atttccagca 1560

attggccgtc ggccccaatc gcgtgacggg cacccgtttg gaaaatggct cctatcacgg 1620

ggtggccgcc gcctttggcg cggatggcta tcatgtcgac agtgtggaga gcttttctgc 1680

ggctctggcc caagcgctcg cccataatcg ccccgcctgc atcaatgtcg cggtcgcgct 1740

cgatccgatc ccgcccgaag aactcattct gatcggcatg gaccccttcg catga 1795

<210>144

<211>563

<212>PRT

<213>荧光假单孢菌

<400>144

Met Ala Met Ile Thr Gly Gly Glu Leu Val Val Arg Thr Leu Ile Lys

1 5 10 15

Ala Gly Val Glu His Leu Phe Gly Leu His Gly Ala His Ile Asp Thr

20 25 30

Ile Phe Gln Ala Cys Leu Asp His Asp Val Pro Ile Ile Asp Thr Arg

35 40 45

His Glu Ala Ala Ala Gly His Ala Ala Glu Gly Tyr Ala Arg Ala Gly

50 55 60

Ala Lys Leu Gly Val Ala Gly His Gly Gly Arg Gly Ile Tyr Gln Cys

65 70 75 80

Gly His Ala His Cys Gln Arg Leu Ala Gly Ser Gln Gly Arg Cys Ile

85 90 95

Pro His Pro Gly Ser Gly Ala Leu Arg Asp Asp Glu Thr Asn Thr Leu

100 105 110

Gln Ala Gly Ile Asp Gln Val Ala Met Ala Ala Pro Ile Thr Lys Trp

115 120 125

Ala His Arg Val Met Ala Thr Glu His Ile Pro Arg Leu Val Met Gln

130 135 140

Ala Ile Arg Ala Ala Leu Ser Ala Pro Arg Gly Pro Val Leu Leu Asp

145 150 155 160

Leu Pro Trp Asp Ile Leu Met Asn Gln Ile Asp Glu Asp Ser Val Ile

165 170 175

Ile Pro Asp Leu Val Leu Ser Ala His Gly Ala Arg Pro Asp Pro Ala

180 185 190

Asp Leu Asp Gln Ala Leu Ala Leu Leu Arg Lys Ala Glu Arg Pro Val

195 200 205

Ile Val Leu Gly Ser Glu Ala Ser Arg Thr Ala Arg Lys Thr Ala Leu

210 215 220

Ser Ala Phe Val Ala Ala Thr Gly Val Pro Val Phe Ala Asp Tyr Glu

225 230 235 240

Gly Leu Ser Met Leu Ser Gly Leu Pro Asp Ala Met Arg Gly Gly Leu

245 250 255

Val Gln Asn Leu Tyr Ser Phe Ala Lys Ala Asp Ala Ala Pro Asp Leu

260 265 270

Val Leu Met Leu Gly Ala Arg Phe Gly Leu Asn Thr Gly His Gly Ser

275 280 285

Gly Gln Leu Ile Pro His Ser Ala Gln Val Ile Gln Val Asp Pro Asp

290 295 300

Ala Cys Glu Leu Gly Arg Leu Gln Gly Ile Ala Leu Gly Ile Val Ala

305 310 315 320

Asp Val Gly Gly Thr Ile Glu Ala Leu Ala Gln Ala Thr Ala Gln Asp

325 330 335

Ala Ala Trp Pro Asp Arg Gly Asp Trp Cys Ala Lys Val Thr Asp Leu

340 345 350

Ala Gln Glu Arg Tyr Ala Ser Ile Ala Ala Lys Ser Ser Ser Glu His

355 360 365

Ala Leu His Pro Phe His Ala Ser Gln Val Ile Ala Lys His Val Asp

370 375 380

Ala Gly Val Thr Val Val Ala Asp Gly Ala Leu Thr Tyr Leu Trp Leu

385 390 395 400

Ser Glu Val Met Ser Arg Val Lys Pro Gly Gly Phe Leu Cys His Gly

405 410 415

Tyr Leu Gly Ser Met Gly Val Gly Phe Gly Thr Ala Leu Gly Ala Gln

420 425 430

Val Ala Asp Leu Glu Ala Gly Arg Arg Thr Ile Leu Val Thr Gly Asp

435 440 445

Gly Ser Val Gly Tyr Ser Ile Gly Glu Phe Asp Thr Leu Val Arg Lys

450 455 460

Gln Leu Pro Leu Ile Val Ile Ile Met Asn Asn Gln Ser Trp Gly Ala

465 470 475 480

Thr Leu His Phe Gln Gln Leu Ala Val Gly Pro Asn Arg Val Thr Gly

485 490 495

Thr Arg Leu Glu Asn Gly Ser Tyr His Gly Val Ala Ala Ala Phe Gly

500 505 510

Ala Asp Gly Tyr His Val Asp Ser Val Glu Ser Phe Ser Ala Ala Leu

515 520 525

Ala Gln Ala Leu Ala His Asn Arg Pro Ala Cys Ile Asn Val Ala Val

530 535 540

Ala Leu Asp Pro Ile Pro Pro Glu Glu Leu Ile Leu Ile Gly Met Asp

545 550 555 560

Pro Phe Ala

<210>145

<211>9

<212>PRT

<213>人工序列

<220>

<223>与自动转运蛋白粘附或I型分泌靶重复相似的多肽

<220>

<221>变体

<222>3，5，7，8，9

<223>Xaa＝任何氨基酸

<400>145

Gly Gly Xaa Gly Xaa Asp Xaa Xaa Xaa

1 5

<210>146

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>146

gtctttattc atatatatat cctccttaat tcaaccgttc aatcaccatc 50

<210>147

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>147

gggcggccgc aaggggttcg cgttggccga 30

<210>148

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>148

ggagaaaata ccgcatcagg cg 22

<210>149

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>149

cgggatccaa gttgcaggat atgacgaaag cg 32

<210>150

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>150

gctctagaag attatccctg tctgcggaag cgg 33

<210>151

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>151

gctctagagg ggtgcctaat gagtgagcta ac 32

<210>152

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>152

cgggatccgc gttaatattt tgttaaaatt cgc 33

<210>153

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>153

gctctagagt ttatgtcgca cccgccgttg g 31

<210>154

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>154

cccaagctta gaaagggaaa ttgtggtagc cc 32

<210>155

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>155

ggaattccat atgcgtccct ctgccccggc c 31

<210>156

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>156

cgggatcctt agaactgctt gggaagggag 30

<210>157

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>157

aggtacggtg aaataaagga ggatatacat atgtccaaaa agattgccgt 50

<210>158

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物

<400>158

ttttcctttt gcggccgccc cgctggcatc gcctcac 37

<210>159

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>159

ggcgatgcca gcgtaaagga ggatatacat atgaaaaact ggaaaacaag 50

<210>160

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物

<400>160

ttttcctttt gcggccgccc cagcttagcg ccttcta 37

<210>161

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>161

cccgagctct taggaggatt agtcatggaa c 31

<210>162

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>162

gctctagatt attttgaata atcgtagaaa cc 32

<210>163

<211>42

<212>DNA

<213>人工序列

<220>

<223>引物

<400>163

gctctagagg aggatatata tatgaaaaat tgtgtcatcg tc 42

<210>164

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>164

aactgcagtt aattcaaccg ttcaatcacc 30

<210>165

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>165

cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg 46

<210>166

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>166

ggttgaatta aggaggatat atatatgaat aaagacacac taatacctac 50

<210>167

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>167

cccaagctta gccggcaagt acacatcttc 30

<210>168

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>168

cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg 46

<210>169

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>169

cccaagctta gccggcaagt acacatcttc 30

<210>170

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>170

aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg 40

<210>171

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>171

cggggtaccg cggatacata tttgaatgta tttag 35

<210>172

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物

<400>172

aaggaaaaaa gcggccgcgc ggatacatat ttgaatgtat ttag 44

<210>173

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物

<400>173

gctctagagg aggatatata tatggctaac tacttcaata cac 43

<210>174

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>174

tgctgttgcg ggttaaggag gatatatata tgcctaagta ccgttccgcc 50

<210>175

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>175

aacggtactt aggcatatat atatcctcct taacccgcaa cagcaatacg 50

<210>176

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>176

acatgcatgc ttaacccccc agtttcgatt 30

<210>177

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物

<400>177

gctctagagg aggatatata tatggctaac tacttcaata cac 43

<210>178

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>178

acatgcatgc ttaacccccc agtttcgatt 30

<210>179

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物

<400>179

cccgagctca ggaggatata tatatggata aacagtatcc ggt 43

<210>180

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>180

gctctagatt acagaatttg actcaggt 28

<210>181

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物

<400>181

cccgagctca ggaggatata tatatgttga caaaagcaac aaaag 45

<210>182

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>182

ctctaaatct ctggaaaggg taccg 25

<210>183

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>183

gctctagatt agagagcttt cgttttcatg 30

<210>184

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物

<400>184

cccgagctca ggaggatata tatatgttga caaaagcaac aaaag 45

<210>185

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>185

gctctagatt agagagcttt cgttttcatg 30

<210>186

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>186

cgagctcagg aggatatata tatgagccag caagtcatta ttttcg 46

<210>187

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>187

aaaactgcag cgtttgatga cgtggacgat agcgg 35

<210>188

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>188

cgagctcagg aggatatata tatgagccag caagtcatta ttttcg 46

<210>189

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>189

aggggtgtaa ggaggatata tatatggcta agacgttata cgaaaaattg 50

<210>190

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>190

cgtcttagcc atatatatat cctccttaca ccccttctgc tacatagcgg 50

<210>191

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>191

aaaactgcag cgtttgatga cgtggacgat agcgg 35

<210>192

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>192

cgagctcagg aggatatata tatgagccag caagtcatta ttttcg 46

<210>193

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>193

aaaactgcag cgtttgatga cgtggacgat agcgg 35

<210>194

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>194

cgagctcagg aggatatata tatgagccag caagtcatta ttttcg 46

<210>195

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>195

gaaaccgtgt gaggaggata tatatatgtc gaagaattac catattgccg 50

<210>196

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>196

aggggtgtaa ggaggatata tatatggcta agacgttata cgaaaaattg 50

<210>197

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>197

acattaaata aggaggatat atatatggca gagaaattta tcaaacacac 50

<210>198

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>198

attcttcgac atatatatat cctcctcaca cggtttcctt gttgttttcg 50

<210>199

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>199

cgtcttagcc atatatatat cctccttaca ccccttctgc tacatagcgg 50

<210>200

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>200

tttctctgcc atatatatat cctccttatt taatgttgcg aatgtcggcg 50

<210>201

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>201

aaaactgcag cgtttgatga cgtggacgat agcgg 35

<210>202

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>202

cgagctcagg aggatatata tatgagccag caagtcatta ttttcg 46

<210>203

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>203

aaaactgcag cgtttgatga cgtggacgat agcgg 35

<210>204

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>204

aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg 40

<210>205

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>205

cggggtaccg cggatacata tttgaatgta tttag 35

<210>206

<211>42

<212>DNA

<213>人工序列

<220>

<223>引物

<400>206

aaggaaaaaa gcggccgcac ttttcatact cccgccattc ag 42

<210>207

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>207

caaaggccgt ctgcacgcgc cgaaaggcaa a 31

<210>208

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>208

tttgcctttc ggcgcgtgca gacggccttt g 31

<210>209

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>209

acatgcatgc cgtttgatga cgtggacgat agcgg 35

<210>210

<211>42

<212>DNA

<213>人工序列

<220>

<223>引物

<400>210

aaggaaaaaa gcggccgcac ttttcatact cccgccattc ag 42

<210>211

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>211

acatgcatgc cgtttgatga cgtggacgat agcgg 35

<210>212

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物

<400>212

cccgagctca ggaggatata tatatgaatt atcagaacga cgatttac 48

<210>213

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>213

gcgtcgcggg taaggaggaa aattttatgt cctcacgtaa agagcttgcc 50

<210>214

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>214

gaactgctgt aaggaggtta aaattatgga gaggattgtc gttactctcg 50

<210>215

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>215

caatcagcgt aaggaggtat atataatgaa aaccgtaact gtaaaagatc 50

<210>216

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>216

tacaccaggc ataaggagga attaattatg gaaacctatg ctgtttttgg 50

<210>217

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>217

tacgtgagga cataaaattt tcctccttac ccgcgacgcg cttttactgc 50

<210>218

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>218

caatcctctc cataatttta acctccttac agcagttctt ttgctttcgc 50

<210>219

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>219

caatcagcgt aaggaggtat atataatgaa aaccgtaact gtaaaagatc 50

<210>220

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>220

tacggttttc attatatata cctccttacg ctgattgaca atcggcaatg 50

<210>221

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>221

acatgcatgc ttacgcggac aattcctcct gcaa 34

<210>222

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物

<400>222

cccgagctca ggaggatata tatatgaatt atcagaacga cgatttac 48

<210>223

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>223

acatgcatgc ttacgcggac aattcctcct gcaa 34

<210>224

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物

<400>224

cccgagctca ggaggatata tatatgacat cggaaaaccc gttactgg 48

<210>225

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>225

gatccaacct aaggaggaaa attttatgac acaacctctt tttctgatcg 50

<210>226

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>226

gatcaattgt taaggaggta tatataatgg aatccctgac gttacaaccc 50

<210>227

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>227

caggcagcct aaggaggaat taattatggc tggaaacaca attggacaac 50

<210>228

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>228

aggttgtgtc ataaaatttt cctccttagg ttggatcaac aggcactacg 50

<210>229

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>229

cagggattcc attatatata cctccttaac aattgatcgt ctgtgccagg 50

<210>230

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>230

gtttccagcc ataattaatt cctccttagg ctgcctggct aatccgcgcc 50

<210>231

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>231

acatgcatgc ttaccagcgt ggaatatcag tcttc 35

<210>232

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物

<400>232

cccgagctca ggaggatata tatatgacat cggaaaaccc gttactgg 48

<210>233

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>233

acatgcatgc ttaccagcgt ggaatatcag tcttc 35

<210>234

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物

<400>234

cccgagctca ggaggatata tatatggttg ctgaattgac cgcattac 48

<210>235

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>235

aatcgccagt aaggaggaaa attttatgac acaacctctt tttctgatcg 50

<210>236

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>236

gatcaattgt taaggaggta tatataatgg aatccctgac gttacaaccc 50

<210>237

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>237

caggcagcct aaggaggaat taattatggc tggaaacaca attggacaac 50

<210>238

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>238

gaggttgtgt cataaaattt tcctccttac tggcgattgt cattcgcctg 50

<210>239

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>239

cagggattcc attatatata cctccttaac aattgatcgt ctgtgccagg 50

<210>240

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>240

gtttccagcc ataattaatt cctccttagg ctgcctggct aatccgcgcc 50

<210>241

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>241

acatgcatgc ttaccagcgt ggaatatcag tcttc 35

<210>242

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物

<400>242

cccgagctca ggaggatata tatatggttg ctgaattgac cgcattac 48

<210>243

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>243

acatgcatgc ttaccagcgt ggaatatcag tcttc 35

<210>244

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>244

aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg 40

<210>245

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>245

gctctagaac ttttcatact cccgccattc ag 32

<210>246

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>246

gctctagagc ggatacatat ttgaatgtat ttag 34

<210>247

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物

<400>247

aaggaaaaaa gcggccgcgc ggatacatat ttgaatgtat ttag 44

<210>248

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>248

catgccatgg ctatgattac tggtgg 26

<210>249

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>249

ccccgagctc ttacgcgccg gattggaaat aca 33

<210>250

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>250

catgccatgg ccaaagttac aaatcaaaaa g 31

<210>251

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>251

cgagctctta aaatgatttt atatagatat cc 32

<210>252

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>252

catgccatgg gtattccaga aactcaaaaa g 31

<210>253

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>253

cccgagctct tatttagaag tgtcaacaac g 31

<210>254

<211>47

<212>DNA

<213>人工序列

<220>

<223>引物

<400>254

ccccgagctc aggaggatat acatatgaat aaagacacac taatacc 47

<210>255

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>255

cccaagctta gccggcaagt acacatcttc 30

<210>256

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物

<400>256

cccgagctca ggaggatata tatatgtata cagtaggaga ttacc 45

<210>257

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>257

gctctagatt atgatttatt ttgttcagca aat 33

<210>258

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物

<400>258

cccgagctca ggaggatata tatatgtata cagtaggaga ttacc 45

<210>259

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>259

gctctagatt atgatttatt ttgttcagca aat 33

<210>260

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>260

cgagctcagg aggatatata tatgaaaaaa gtcgcacttg ttaccg 46

<210>261

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>261

ggccggcggc cgcgcgatgg cggtgaaagt g 31

<210>262

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>262

aactaatcta gaggaggata tatatatgag catgacgttt tccggccagg 50

<210>263

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>263

ccttgcggag ggctcgatgg atgagttcga c 31

<210>264

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>264

cactttcacc gccatcgcgc ggccgccggc c 31

<210>265

<211>50

<212>DNA

<213>人工序列

<220>

<223>引物

<400>265

gctcatatat atatcctcct ctagattagt taaacaccat cccgccgtcg 50

<210>266

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>266

gtcgaactca tccatcgagc cctccgcaag g 31

<210>267

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>267

cccaagctta gatcgcggtg gccccgccgt cg 32

<210>268

<211>46

<212>DNA

<213>人工序列

<220>

<223>引物

<400>268

cgagctcagg aggatatata tatgaaaaaa gtcgcacttg ttaccg 46

<210>269

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>269

cccaagctta gatcgcggtg gccccgccgt cg 32

<210>270

<211>43

<212>DNA

<213>人工序列

<220>

<223>引物

<400>270

gctctagagg aggatttaaa aatggaaatt aacgaaacgc tgc 43

<210>271

<211>45

<212>DNA

<213>人工序列

<220>

<223>引物

<400>271

tccccgcggt taagcatggc gatcccgaaa tggaatccct ttgac 45

<210>272

<211>44

<212>DNA

<213>人工序列

<220>

<223>引物

<400>272

ccgctcgagg aggatatata tatgagatcg aaaagatttg aagc 44

<210>273

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>273

gctctagatt agccaagttc attgggatcg 30

<210>274

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>274

cggggtacca cttttcatac tcccgccatt cag 33

<210>275

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>275

cggtaccctt tccagagatt tagag 25

<210>276

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>276

ggaattccat atgttcacaa cgtccgccta 30

<210>277

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>277

gcttgacggc catgtggccg aggccgc 27

<210>278

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>278

gcggcctcgg ccacatggcc gtcaagc 27

<210>279

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>279

cgggatcctt aggcggcctt ctggcgcg 28

<210>280

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>280

ggaattccat atggctattg caagaggtta 30

<210>281

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>281

cgggatcctt aagcgtcgag cgaggcca 28

<210>282

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>282

ggaattccat atgactaaaa caatgaaggc 30

<210>283

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>283

caccggggcc ggggtccggt attgcca 27

<210>284

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>284

tggcaatacc ggaccccggc cccggtg 27

<210>285

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>285

cgggatcctt aggcggcgag atccacga 28

<210>286

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>286

ggaattccat atgaccgggg cgaaccagcc 30

<210>287

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>287

atagccgctc atacgcctcg gttgcct 27

<210>288

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>288

aggcaaccga ggcgtatgag cggctat 27

<210>289

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>289

cgggatcctt aagcgccgtg cggaagga 28

<210>290

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>290

ggaattccat atgaccatgc atgccattca 30

<210>291

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>291

cgggatcctt attcggctgc aaattgca 28

<210>292

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>292

ggaattccat atgcgcgcgc tttattacga 30

<210>293

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>293

cgggatcctt attcgaaccg gtcgatga 28

<210>294

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>294

ggaattccat atgctggcga ttttctgtga 30

<210>295

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>295

cgggatcctt atgcgacctc caccatgc 28

<210>296

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>296

ggaattccat atgaaagcct tcgtcgtcga 30

<210>297

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>297

cgggatcctt aggatgcgta tgtaacca 28

<210>298

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>298

ggaattccat atgaaagcga ttgtcgccca 30

<210>299

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>299

cgggatcctt aggaaaaggc gatctgca 28

<210>300

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>300

ggaattccat atgccgatgg cgctcgggca 30

<210>301

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>301

cgggatcctt agaattcgat gacttgcc 28

<210>302

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>302

ggaattccat atgaaacatt ctcaggacaa 30

<210>303

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>303

gggcgccgat catgtggtgc gtttccg 27

<210>304

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>304

cggaaacgca ccacatgatc ggcgccc 27

<210>305

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>305

cgggatcctt atgccatacg ttccatat 28

<210>306

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>306

ggaattccat atgcagcgtt ttaccaacag 30

<210>307

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物

<400>307

cgggatcctt aggaaaacag gacgccgc 28

<210>308

<211>610

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH 78578

<400>308

Met Arg Tyr Ile Ala Gly Ile Asp Ile Gly Asn Ser Ser Thr Glu Val

1 5 10 15

Ala Leu Ala Thr Val Asp Asp Ala Gly Val Leu Asn Ile Arg His Ser

20 25 30

Ala Leu Ala Glu Thr Thr Gly Ile Lys Gly Thr Leu Arg Asn Val Phe

35 40 45

Gly Ile Gln Glu Ala Leu Thr Gln Ala Ala Lys Ala Ala Gly Ile Gln

50 55 60

Leu Ser Asp Ile Ser Leu Ile Arg Ile Asn Glu Ala Thr Pro Val Ile

65 70 75 80

Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Ile Ile Thr Glu Ser

85 90 95

Thr Met Ile Gly His Asn Pro Lys Thr Pro Gly Gly Val Gly Leu Gly

100 105 110

Val Gly Ile Thr Ile Thr Pro Glu Ala Leu Leu Ser Cys Ser Ala Asp

115 120 125

Thr Pro Tyr Ile Leu Val Val Ser Ser Ala Phe Asp Phe Ala Asp Val

130 135 140

Ala Ala Met Val Asn Ala Ala Thr Ala Ala Gly Tyr Gln Ile Thr Gly

145 150 155 160

Ile Ile Leu Gln Gln Asp Asp Gly Val Leu Val Asn Asn Arg Leu Gln

165 170 175

Gln Pro Leu Pro Val Ile Asp Glu Val Gln His Ile Asp Arg Ile Pro

180 185 190

Leu Gly Met Leu Ala Ala Val Glu Val Ala Leu Pro Gly Lys Ile Ile

195 200 205

Glu Thr Leu Ser Asn Pro Tyr Gly Ile Ala Thr Val Phe Asp Leu Asn

210 215 220

Ala Glu Glu Thr Lys Asn Ile Val Pro Met Ala Arg Ala Leu Ile Gly

225 230 235 240

Asn Arg Ser Ala Val Val Val Lys Thr Pro Ser Gly Asp Val Lys Ala

245 250 255

Arg Ala Ile Pro Ala Gly Asn Leu Leu Leu Ile Ala Gln Gly Arg Ser

260 265 270

Val Gln Val Asp Val Ala Ala Gly Ala Glu Ala Ile Met Lys Ala Val

275 280 285

Asp Gly Cys Gly Lys Leu Asp Asn Val Ala Gly Glu Ala Gly Thr Asn

290 295 300

Ile Gly Gly Met Leu Glu His Val Arg Gln Thr Met Ala Glu Leu Thr

305 310 315 320

Asn Lys Pro Ala Gln Glu Ile Arg Ile Gln Asp Leu Leu Ala Val Asp

325 330 335

Thr Ala Val Pro Val Ser Val Thr Gly Gly Leu Ala Gly Glu Phe Ser

340 345 350

Leu Glu Gln Ala Val Gly Ile Ala Ser Met Val Lys Ser Asp Arg Leu

355 360 365

Gln Met Ala Leu Ile Ala Arg Glu Ile Glu His Lys Leu Gln Ile Ala

370 375 380

Val Gln Val Gly Gly Ala Glu Ala Glu Ala Ala Ile Leu Gly Ala Leu

385 390 395 400

Thr Thr Pro Gly Thr Thr Arg Pro Leu Ala Ile Leu Asp Leu Gly Ala

405 410 415

Gly Ser Thr Asp Ala Ser Ile Ile Asn Ala Gln Gly Glu Ile Ser Ala

420 425 430

Thr His Leu Ala Gly Ala Gly Asp Met Val Thr Met Ile Ile Ala Arg

435 440 445

Glu Leu Gly Leu Glu Asp Arg Tyr Leu Ala Glu Glu Ile Lys Lys Tyr

450 455 460

Pro Leu Ala Lys Val Glu Ser Leu Phe His Leu Arg His Glu Asp Gly

465 470 475 480

Ser Val Gln Phe Phe Pro Ser Ala Leu Pro Pro Ala Val Phe Ala Arg

485 490 495

Val Cys Val Val Lys Pro Asp Glu Leu Val Pro Leu Pro Gly Asp Leu

500 505 510

Pro Leu Glu Lys Val Arg Ala Ile Arg Arg Ser Ala Lys Ser Arg Val

515 520 525

Phe Val Thr Asn Ala Leu Arg Ala Leu Arg Gln Val Ser Pro Thr Gly

530 535 540

Asn Ile Arg Asp Ile Pro Phe Val Val Leu Val Gly Gly Ser Ser Leu

545 550 555 560

Asp Phe Glu Ile Pro Gln Leu Val Thr Asp Ala Leu Ala His Tyr Arg

565 570 575

Leu Val Ala Gly Arg Gly Asn Ile Arg Gly Cys Glu Gly Pro Arg Asn

580 585 590

Ala Val Ala Ser Gly Leu Leu Leu Ser Trp Gln Lys Gly Gly Thr His

595 600 605

Gly Glu

610

<210>309

<211>116

<212>PRT

<213>肺炎克雷伯氏菌肺炎亚种MGH78578

<400>309

Met Glu Ser Ser Val Val Ala Pro Ala Ile Val Ile Ala Val Thr Asp

1 5 10 15

Glu Cys Ser Glu Gln Trp Arg Asp Val Leu Leu Gly Ile Glu Glu Glu

20 25 30

Gly Ile Pro Phe Val Leu Gln Pro Gln Thr Gly Gly Asp Leu Ile His

35 40 45

His Ala Trp Gln Ala Ala Gln Arg Ser Pro Leu Gln Val Gly Ile Ala

50 55 60

Cys Asp Arg Glu Arg Leu Ile Val His Tyr Lys Asn Leu Pro Ala Ser

65 70 75 80

Thr Pro Leu Phe Ser Leu Met Tyr His Gln Asn Arg Leu Ala Arg Arg

85 90 95

Asn Thr Gly Asn Asn Ala Ala Arg Leu Val Lys Gly Ile Pro Phe Arg

100 105 110

Asp Arg His Ala

115

<210>310

<211>787

<212>PRT

<213>丁酸梭菌

<400>310

Met Ile Ser Lys Gly Phe Ser Thr Gln Thr Glu Arg Ile Asn Ile Leu

1 5 10 15

Lys Ala Gln Ile Leu Asn Ala Lys Pro Cys Val Glu Ser Glu Arg Ala

20 25 30

Ile Leu Ile Thr Glu Ser Phe Lys Gln Thr Glu Gly Gln Pro Ala Ile

35 40 45

Leu Arg Arg Ala Leu Ala Leu Lys His Ile Leu Glu Asn Ile Pro Ile

50 55 60

Thr Ile Arg Asp Gln Glu Leu Ile Val Gly Ser Leu Thr Lys Glu Pro

65 70 75 80

Arg Ser Ser Gln Val Phe Pro Glu Phe Ser Asn Lys Trp Leu Gln Asp

85 90 95

Glu Leu Asp Arg Leu Asn Lys Arg Thr Gly Asp Ala Phe Gln Ile Ser

100 105 110

Glu Glu Ser Lys Glu Lys Leu Lys Asp Val Phe Glu Tyr Trp Asn Gly

115 120 125

Lys Thr Thr Ser Glu Leu Ala Thr Ser Tyr Met Thr Glu Glu Thr Arg

130 135 140

Glu Ala Val Asn Cys Asp Val Phe Thr Val Gly Asn Tyr Tyr Tyr Asn

145 150 155 160

Gly Val Gly His Val Ser Val Asp Tyr Gly Lys Val Leu Arg Val Gly

165 170 175

Phe Asn Gly Ile Ile Asn Glu Ala Lys Glu Gln Leu Glu Lys Asn Arg

180 185 190

Ser Ile Asp Pro Asp Phe Ile Lys Lys Glu Lys Phe Leu Asn Ser Val

195 200 205

Ile Ile Ser Cys Glu Ala Ala Ile Thr Tyr Val Asn Arg Tyr Ala Lys

210 215 220

Lys Ala Lys Glu Ile Ala Asp Asn Thr Ser Asp Ala Lys Arg Lys Ala

225 230 235 240

Glu Leu Asn Glu Ile Ala Lys Ile Cys Ser Lys Val Ser Gly Glu Gly

245 250 255

Ala Lys Ser Phe Tyr Glu Ala Cys Gln Leu Phe Trp Phe Ile His Ala

260 265 270

Ile Ile Asn Ile Glu Ser Asn Gly His Ser Ile Ser Pro Ala Arg Phe

275 280 285

Asp Gln Tyr Met Tyr Pro Tyr Tyr Glu Asn Asp Lys Asn Ile Thr Asp

290 295 300

Lys Phe Ala Gln Glu Leu Ile Asp Cys Ile Trp Ile Lys Leu Asn Asp

305 310 315 320

Ile Asn Lys Val Arg Asp Glu Ile Ser Thr Lys His Phe Gly Gly Tyr

325 330 335

Pro Met Tyr Gln Asn Leu Ile Val Gly Gly Gln Asn Ser Glu Gly Lys

340 345 350

Asp Ala Thr Asn Lys Val Ser Tyr Met Ala Leu Glu Ala Ala Val His

355 360 365

Val Lys Leu Pro Gln Pro Ser Leu Ser Val Arg Ile Trp Asn Lys Thr

370 375 380

Pro Asp Glu Phe Leu Leu Arg Ala Ala Glu Leu Thr Arg Glu Gly Leu

385 390 395 400

Gly Leu Pro Ala Tyr Tyr Asn Asp Glu Val Ile Ile Pro Ala Leu Val

405 410 415

Ser Arg Gly Leu Thr Leu Glu Asp Ala Arg Asp Tyr Gly Ile Ile Gly

420 425 430

Cys Val Glu Pro Gln Lys Pro Gly Lys Thr Glu Gly Trp His Asp Ser

435 440 445

Ala Phe Phe Asn Leu Ala Arg Ile Val Glu Leu Thr Ile Asn Ser Gly

450 455 460

Phe Asp Lys Asn Lys Gln Ile Gly Pro Lys Thr Gln Asn Phe Glu Glu

465 470 475 480

Met Lys Ser Phe Asp Glu Phe Met Lys Ala Tyr Lys Ala Gln Met Glu

485 490 495

Tyr Phe Val Lys His Met Cys Cys Ala Asp Asn Cys Ile Asp Ile Ala

500 505 510

His Ala Glu Arg Ala Pro Leu Pro Phe Leu Ser Ser Met Val Asp Asn

515 520 525

Cys Ile Gly Lys Gly Lys Ser Leu Gln Asp Gly Gly Ala Glu Tyr Asn

530 535 540

Phe Ser Gly Pro Gln Gly Val Gly Val Ala Asn Ile Gly Asp Ser Leu

545 550 555 560

Val Ala Val Lys Lys Ile Val Phe Asp Glu Asn Lys Ile Thr Pro Ser

565 570 575

Glu Leu Lys Lys Thr Leu Asn Asn Asp Phe Lys Asn Ser Glu Glu Ile

580 585 590

Gln Ala Leu Leu Lys Asn Ala Pro Lys Phe Gly Asn Asp Ile Asp Glu

595 600 605

Val Asp Asn Leu Ala Arg Glu Gly Ala Leu Val Tyr Cys Arg Glu Val

610 615 620

Asn Lys Tyr Thr Asn Pro Arg Gly Gly Asn Phe Gln Pro Gly Leu Tyr

625 630 635 640

Pro Ser Ser Ile Asn Val Tyr Phe Gly Ser Leu Thr Gly Ala Thr Pro

645 650 655

Asp Gly Arg Lys Ser Gly Gln Pro Leu Ala Asp Gly Val Ser Pro Ser

660 665 670

Arg Gly Cys Asp Val Ser Gly Pro Thr Ala Ala Cys Asn Ser Val Ser

675 680 685

Lys Leu Asp His Phe Ile Ala Ser Asn Gly Thr Leu Phe Asn Gln Lys

690 695 700

Phe His Pro Ser Ala Leu Lys Gly Asp Asn Gly Leu Met Asn Leu Ser

705 710 715 720

Ser Leu Ile Arg Ser Tyr Phe Asp Gln Lys Gly Phe His Val Gln Phe

725 730 735

Asn Val Ile Asp Lys Lys Ile Leu Leu Ala Ala Gln Lys Asn Pro Glu

740 745 750

Lys Tyr Gln Asp Leu Ile Val Arg Val Ala Gly Tyr Ser Ala Gln Phe

755 760 765

Ile Ser Leu Asp Lys Ser Ile Gln Asn Asp Ile Ile Ala Arg Thr Glu

770 775 780

His Val Met

785

<210>311

<211>304

<212>PRT

<213>肉毒梭菌

<400>311

Met Ser Lys Glu Ile Lys Gly Val Leu Phe Asn Ile Gln Lys Phe Ser

1 5 10 15

Leu His Asp Gly Pro Gly Ile Arg Thr Ile Val Phe Phe Lys Gly Cys

20 25 30

Ser Met Ser Cys Leu Trp Cys Ser Asn Pro Glu Ser Gln Asp Ile Lys

35 40 45

Pro Gln Val Met Phe Asn Lys Asn Leu Cys Thr Lys Cys Gly Arg Cys

50 55 60

Lys Ser Gln Cys Lys Ser Ala Ala Ile Asp Met Asn Ser Glu Tyr Arg

65 70 75 80

Ile Asp Lys Ser Lys Cys Thr Glu Cys Thr Lys Cys Val Asp Asn Cys

85 90 95

Leu Ser Gly Ala Leu Val Ile Glu Gly Arg Asn Tyr Ser Val Glu Asp

100 105 110

Val Ile Lys Glu Leu Lys Lys Asp Ser Val Gln Tyr Arg Arg Ser Asn

115 120 125

Gly Gly Ile Thr Leu Ser Gly Gly Glu Val Leu Leu Gln Pro Asp Phe

130 135 140

Ala Val Glu Leu Leu Lys Glu Cys Lys Ser Tyr Gly Trp His Thr Ala

145 150 155 160

Ile Glu Thr Ala Met Tyr Val Asn Ser Glu Ser Val Lys Lys Val Ile

165 170 175

Pro Tyr Ile Asp Leu Ala Met Ile Asp Ile Lys Ser Met Asn Asp Glu

180 185 190

Ile His Arg Lys Phe Thr Gly Val Ser Asn Glu Ile Ile Leu Gln Asn

195 200 205

Ile Lys Leu Ser Asp Glu Leu Ala Lys Glu Ile Ile Ile Arg Ile Pro

210 215 220

Val Ile Glu Gly Phe Asn Ala Asp Leu Gln Ser Ile Gly Ala Ile Ala

225 230 235 240

Gln Phe Ser Lys Ser Leu Thr Asn Leu Lys Arg Ile Asp Leu Leu Pro

245 250 255

Tyr His Asn Tyr Gly Glu Asn Lys Tyr Gln Ala Ile Gly Arg Glu Tyr

260 265 270

Ser Leu Lys Glu Leu Lys Ser Pro Ser Lys Asp Lys Met Glu Arg Leu

275 280 285

Lys Ala Leu Val Glu Ile Met Gly Ile Pro Cys Thr Ile Gly Ala Glu

290 295 300

<210>312

<211>545

<212>PRT

<213>巴西固氮螺菌

<400>312

Met Lys Leu Ala Glu Ala Leu Leu Arg Ala Leu Lys Asp Arg Gly Ala

1 5 10 15

Gln Ala Met Phe Gly Ile Pro Gly Asp Phe Ala Leu Pro Phe Phe Lys

20 25 30

Val Ala Glu Glu Thr Gln Ile Leu Pro Leu His Thr Leu Ser His Glu

35 40 45

Pro Ala Val Gly Phe Ala Ala Asp Ala Ala Ala Arg Tyr Ser Ser Thr

50 55 60

Leu Gly Val Ala Ala Val Thr Tyr Gly Ala Gly Ala Phe Asn Met Val

65 70 75 80

Asn Ala Val Ala Gly Ala Tyr Ala Glu Lys Ser Pro Val Val Val Ile

85 90 95

Ser Gly Ala Pro Gly Thr Thr Glu Gly Asn Ala Gly Leu Leu Leu His

100 105 110

His Gln Gly Arg Thr Leu Asp Thr Gln Phe Gln Val Phe Lys Glu Ile

115 120 125

Thr Val Ala Gln Ala Arg Leu Asp Asp Pro Ala Lys Ala Pro Ala Glu

130 135 140

Ile Ala Arg Val Leu Gly Ala Ala Arg Ala Gln Ser Arg Pro Val Tyr

145 150 155 160

Leu Glu Ile Pro Arg Asn Met Val Asn Ala Glu Val Glu Pro Val Gly

165 170 175

Asp Asp Pro Ala Trp Pro Val Asp Arg Asp Ala Leu Ala Ala Cys Ala

180 185 190

Asp Glu Val Leu Ala Ala Met Arg Ser Ala Thr Ser Pro Val Leu Met

195 200 205

Val Cys Val Glu Val Arg Arg Tyr Gly Leu Glu Ala Lys Val Ala Glu

210 215 220

Leu Ala Gln Arg Leu Gly Val Pro Val Val Thr Thr Phe Met Gly Arg

225 230 235 240

Gly Leu Leu Ala Asp Ala Pro Thr Pro Pro Leu Gly Thr Tyr Ile Gly

245 250 255

Val Ala Gly Asp Ala Glu Ile Thr Arg Leu Val Glu Glu Ser Asp Gly

260 265 270

Leu Phe Leu Leu Gly Ala Ile Leu Ser Asp Thr Asn Phe Ala Val Ser

275 280 285

Gln Arg Lys Ile Asp Leu Arg Lys Thr Ile His Ala Phe Asp Arg Ala

290 295 300

Val Thr Leu Gly Tyr His Thr Tyr Ala Asp Ile Pro Leu Ala Gly Leu

305 310 315 320

Val Asp Ala Leu Leu Glu Arg Leu Pro Pro Ser Asp Arg Thr Thr Arg

325 330 335

Gly Lys Glu Pro His Ala Tyr Pro Thr Gly Leu Gln Ala Asp Gly Glu

340 345 350

Pro Ile Ala Pro Met Asp Ile Ala Arg Ala Val Asn Asp Arg Val Arg

355 360 365

Ala Gly Gln Glu Pro Leu Leu Ile Ala Ala Asp Met Gly Asp Cys Leu

370 375 380

Phe Thr Ala Met Asp Met Ile Asp Ala Gly Leu Met Ala Pro Gly Tyr

385 390 395 400

Tyr Ala Gly Met Gly Phe Gly Val Pro Ala Gly Ile Gly Ala Gln Cys

405 410 415

Val Ser Gly Gly Lys Arg Ile Leu Thr Val Val Gly Asp Gly Ala Phe

420 425 430

Gln Met Thr Gly Trp Glu Leu Gly Asn Cys Arg Arg Leu Gly Ile Asp

435 440 445

Pro Ile Val Ile Leu Phe Asn Asn Ala Ser Trp Glu Met Leu Arg Thr

450 455 460

Phe Gln Pro Glu Ser Ala Phe Asn Asp Leu Asp Asp Trp Arg Phe Ala

465 470 475 480

Asp Met Ala Ala Gly Met Gly Gly Asp Gly Val Arg Val Arg Thr Arg

485 490 495

Ala Glu Leu Lys Ala Ala Leu Asp Lys Ala Phe Ala Thr Arg Gly Arg

500 505 510

Phe Gln Leu Ile Glu Ala Met Ile Pro Arg Gly Val Leu Ser Asp Thr

515 520 525

Leu Ala Arg Phe Val Gln Gly Gln Lys Arg Leu His Ala Ala Pro Arg

530 535 540

Glu

545

<210>313

<211>348

<212>PRT

<213>红球菌ST-10

<400>313

Met Lys Ala Ile Gln Tyr Thr Arg Ile Gly Ala Glu Pro Glu Leu Thr

1 5 10 15

Glu Ile Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val

20 25 30

Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe Ile Met Ser Leu Pro

35 40 45

Glu Glu Gln Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly

50 55 60

Ala Gly Lys Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp Ile

65 70 75 80

Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Asn Cys Trp

85 90 95

His Cys Ser Gln Gly Leu Glu Asn Tyr Cys Ser Arg Ala Gln Glu Leu

100 105 110

Gly Ile Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe

115 120 125

Met Ile Val Asp Ser Pro Arg His Leu Val Pro Ile Gly Asp Leu Asp

130 135 140

Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His

145 150 155 160

Ala Ile Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ser Tyr Ala Val

165 170 175

Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg

180 185 190

His Leu Ser Ala Ala Thr Val Ile Ala Leu Asp Val Ser Ala Asp Lys

195 200 205

Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp

210 215 220

Lys Asp Ala Ala Glu Asn Val Arg Lys Ile Thr Gly Ser Gln Gly Ala

225 230 235 240

Ala Leu Val Leu Asp Phe Val Gly Tyr Gln Pro Thr Ile Asp Thr Ala

245 250 255

Met Ala Val Ala Gly Val Gly Ser Asp Val Thr Ile Val Gly Ile Gly

260 265 270

Asp Gly Gln Ala His Ala Lys Val Gly Phe Phe Gln Ser Pro Tyr Glu

275 280 285

Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu Ile Glu

290 295 300

Leu Ile Asp Leu Ala His Ala Gly Ile Phe Asp Ile Ser Val Glu Thr

305 310 315 320

Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly

325 330 335

Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu

340 345

Claims

1.将多糖转化为大量生产型化学品的方法，包括：

(a)使所述多糖与多糖降解或解聚代谢系统接触，其中所述多糖任选地衍生自生物质，其中所述代谢系统选自：

(i)酶促或化学催化，和

(ii)微生物系统，其中所述微生物系统包含重组微生物，其中所述重组微生物包含一个或多个允许其在作为唯一碳源的所述多糖上生长的外源基因，

从而将所述多糖转化为适宜的单糖或寡糖；以及

(b)使所述适宜的单糖或寡糖与大量生产型化学品生物合成途径接触，其中所述大量生产型化学品生物合成途径包含醛或酮生物合成途径，

从而将所述多糖转化为所述大量生产型化学品。

2.如权利要求1所述的方法，其中所述生物质选自海洋生物质和蔬菜/果实/植物生物质。

3.如权利要求2所述的方法，其中所述海洋生物质选自海藻(kelp)、巨藻、马尾藻类海草、海藻(seaweed)、藻类、海洋微生物区系、微藻类以及海草。

4.如权利要求2所述的方法，其中所述蔬菜/果实/植物生物质包括植物皮或渣。

5.如权利要求2所述的方法，其中所述蔬菜/果实/植物生物质选自柑橘、马铃薯、番茄、葡萄、醋栗、胡萝卜、芒果、甜菜、苹果、柳枝稷、木材以及干草。

6.如权利要求1所述的方法，其中所述多糖选自藻酸盐、琼脂、角叉菜聚糖、岩藻依聚糖、果胶、多聚半乳糖醛酸盐、纤维素、半纤维素、木聚糖、阿拉伯聚糖以及甘露聚糖。

7.如权利要求1所述的方法，其中所述适宜的单糖或寡糖选自2-酮-3-脱氧D-葡糖酸盐(KDG)、D-甘露醇、古洛糖醛酸盐、甘露糖醛酸盐、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸盐、半乳糖醛酸盐以及鼠李糖。

8.如权利要求1所述的方法，其中所述大量生产型化学品选自：甲烷、甲醇、乙烷、乙烯、乙醇、正-丙烷、1-丙烯、1-丙醇、丙醛、丙酮、丙酸盐、正-丁烷、1-丁烯、1-丁醇、丁醛、丁酸盐、异丁醛、异丁醇、2-甲基丁醛、2-甲基丁醇、3-甲基丁醛、3-甲基丁醇、2-丁烯、2-丁醇、2-丁酮、2，3-丁二醇、3-羟基-2-丁酮、2，3-丁二酮、乙苯、苯乙烯、2-苯基乙醇、苯乙醛、1-苯基丁烷、4-苯基-1-丁烯、4-苯基-2-丁烯、1-苯基-2-丁烯、1-苯基-2-丁醇、4-苯基-2-丁醇、1-苯基-2-丁酮、4-苯基-2-丁酮、1-苯基-2，3-丁二醇、1-苯基-3-羟基-2-丁酮、4-苯基-3-羟基-2-丁酮、1-苯基-2，3-丁二酮、正-戊烷、乙基苯酚、乙烯基苯酚、2-(4-羟苯基)乙醇、4-羟苯基乙醛、1-(4-羟苯基)丁烷、4-(4-羟苯基)-1-丁烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯基)-2-丁醇、1-(4-羟苯基)-2-丁酮、4-(4-羟苯基)-2-丁酮、1-(4-羟苯基)-2，3-丁二醇、1-(4-羟苯基)-3-羟基-2-丁酮、4-(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-2，3-丁二酮、吲哚乙烷、吲哚乙烯、2-(吲哚-3-)乙醇、正-戊烷、1-戊烯、1-戊醇、戊醛、戊酸盐、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2，3-戊二醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2，3-戊二酮、2-甲基戊烷、4-甲基-1-戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲基-3-戊酮、4-甲基-2，3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、4-甲基-2，3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基-2，3-戊二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2，3-戊二酮、4-甲基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2，3-戊二醇、4-甲基-1-苯基-2，3-戊二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1-(4-羟苯基)戊烷、1-(4-羟苯基)-1-戊烯、1-(4-羟苯基)-2-戊烯、1-(4-羟苯基)-3-戊烯、1-(4-羟苯基)-2-戊醇、1-(4-羟苯基)-3-戊醇、1-(4-羟苯基)-2-戊酮、1-(4-羟苯基)-3-戊酮、1-(4-羟苯基)-2，3-戊二醇、1-(4-羟苯基)-2-羟基-3-戊酮、1-(4-羟苯基)-3-羟基-2-戊酮、1-(4-羟苯基)-2，3-戊二酮、4-甲基-1-(4-羟苯基)戊烷、4-甲基-1-(4-羟苯基)-2-戊烯、4-甲基-1-(4-羟苯基)-3-戊烯、4-甲基-1-(4-羟苯基)-1-戊烯、4-甲基-1-(4-羟苯基)-3-戊醇、4-甲基-1-(4-羟苯基)-2-戊醇、4-甲基-1-(4-羟苯基)-3-戊酮、4-甲基-1-(4-羟苯基)-2-戊酮、4-甲基-1-(4-羟苯基)-2，3-戊二醇、4-甲基-1-(4-羟苯基)-2，3-戊二酮、4-甲基-1-(4-羟苯基)-3-羟基-2-戊酮、4-甲基-1-(4-羟苯基)-2-羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-1-戊烯、1-(吲哚-3)-2-戊烯、1-(吲哚-3)-3-戊烯、1-(吲哚-3)-2-戊醇、1-(吲哚-3)-3-戊醇、1-(吲哚-3)-2-戊酮、1-(吲哚-3)-3-戊酮、1-(吲哚-3)-2，3-戊二醇、1-(吲哚-3)-2-羟基-3-戊酮、1-(吲哚-3)-3-羟基-2-戊酮、1-(吲哚-3)-2，3-戊二酮、4-甲基-1-(吲哚-3-)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲哚-3)-1-戊烯、4-甲基-2-(吲哚-3)-3-戊醇、4-甲基-1-(吲哚-3)-2-戊醇、4-甲基-1-(吲哚-3)-3-戊酮、4-甲基-1-(吲哚-3)-2-戊酮、4-甲基-1-(吲哚-3)-2，3-戊二醇、4-甲基-1-(吲哚-3)-2，3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲基-1-(吲哚-3)-2-羟基-3-戊酮、正-己烷、1-己烯、1-己醇、己醛、己酸盐、2-己烯、3-己烯、2-己醇、3-己醇、2-己酮、3-己酮、2，3-己二醇、2，3-己二酮、3，4-己二醇、3，4-己二酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、3-甲基己烷、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲基-3-己酮、2-甲基-3，4-己二醇、2-甲基-3，4-己二酮、5-甲基-2，3-己二醇、5-甲基-2，3-己二酮、4-甲基-2，3-己二醇、4-甲基-2，3-己二酮、2-甲基-3-羟基-4-己酮、2-甲基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟基-3-己酮、4-甲基-3-羟基-2-己酮、2，5-二甲基己烷、2，5-二甲基-2-己烯、2，5-二甲基-3-己烯、2，5-二甲基-3-己醇、2，5-二甲基-3-己酮、2，5-二甲基-3，4-己二醇、2，5-二甲基-3，4-己二酮、2，5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2，3-己二醇、4-甲基-1-苯基-2，3-己二醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2，3-己二酮、4-甲基-1-苯基-2，3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1-(4-羟苯基)-1-己烯、5-甲基-1-(4-羟苯基)-2-己烯、5-甲基-1-(4-羟苯基)-3-己烯、4-甲基-1-(4-羟苯基)-1-己烯、4-甲基-1-(4-羟苯基)-2-己烯、4-甲基-1-(4-羟苯基)-3-己烯、5-甲基-1-(4-羟苯基)-2-己醇、5-甲基-1-(4-羟苯基)-3-己醇、4-甲基-1-(4-羟苯基)-2-己醇、4-甲基-1-(4-羟苯基)-3-己醇、5-甲基-1-(4-羟苯基)-2-己酮、5-甲基-1-(4-羟苯基)-3-己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4-羟苯基)-3-己酮、5-甲基-1-(4-羟苯基)-2，3-己二醇、4-甲基-1-(4-羟苯基)-2，3-己二醇、5-甲基-1-(4-羟苯基)-3-羟基-2-己酮、5-甲基-1-(4-羟苯基)-2-羟基-3-己酮、4-甲基-1-(4-羟苯基)-3-羟基-2-己酮、4-甲基-1-(4-羟苯基)-2-羟基-3-己酮、5-甲基-1-(4-羟苯基)-2，3-己二酮、4-甲基-1-(4-羟苯基)-2，3-己二酮、4-甲基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3)-2-己烯、5-甲基-1-(吲哚-3)-3-己烯、4-甲基-1-(吲哚-3)-1-己烯、4-甲基-1-(吲哚-3)-2-己烯、4-甲基-1-(吲哚-3)-3-己烯、5-甲基-1-(吲哚-3)-2-己醇、5-甲基-1-(吲哚-3)-3-己醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基-1-(吲哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚-3)-2-己酮、4-甲基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2，3-己二醇、4-甲基-1-(吲哚-3)-2，3-己二醇、5-甲基-1-(吲哚-3)-3-羟基-2-己酮、5-甲基-1-(吲哚-3)-2-羟基-3-己酮、4-甲基-1-(吲哚-3)-3-羟基-2-己酮、4-甲基-1-(吲哚-3)-2-羟基-3-己酮、5-甲基-1-(吲哚-3)-2，3-己二酮、4-甲基-1-(吲哚-3)-2，3-己二酮、正-庚烷、1-庚烯、1-庚醇、庚醛、庚酸盐、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2，3-庚二醇、2，3-庚二酮、3，4-庚二醇、3，4-庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚酮、2-甲基-3，4-庚二醇、2-甲基-3，4-庚二酮、6-甲基-3，4-庚二醇、6-甲基-3，4-庚二酮、5-甲基-3，4-庚二醇、5-甲基-3，4-庚二酮、2-甲基-3-羟基-4-庚酮、2-甲基-4-羟基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚酮、5-甲基-4-羟基-3-庚酮、2，6-二甲基庚烷、2，5-二甲基庚烷、2，6-二甲基-2-庚烯、2，6-二甲基-3-庚烯、2，5-二甲基-2-庚烯、2，5-二甲基-3-庚烯、3，6-二甲基-3-庚烯、2，6-二甲基-3-庚醇、2，6-二甲基-4-庚醇、2，5-二甲基-3-庚醇、2，5-二甲基-4-庚醇、2，6-二甲基-3，4-庚二醇、2，6-二甲基-3，4-庚二酮、2，5-二甲基-3，4-庚二醇、2，5-二甲基-3，4-庚二酮、2，6-二甲基-3-羟基-4-庚酮、2，6-二甲基-4-羟基-3-庚酮、2，5-二甲基-3-羟基-4-庚酮、2，5-二甲基-4-羟基-3-庚酮、正-辛烷、1-辛烯、2-辛烯、1-辛醇、辛醛、辛酸盐(octanoate)、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4，5-辛二醇、4，5-辛二酮、4-羟基-5-辛酮、2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲基-4，5-辛二醇、2-甲基-4，5-辛二酮、3-甲基-4，5-辛二醇、3-甲基-4，5-辛二酮、2-甲基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟基-4-辛酮、2，7-二甲基辛烷、2，7-二甲基-3-辛烯、2，7-二甲基-4-辛烯、2，7-二甲基-4-辛醇、2，7-二甲基-4-辛酮、2，7-二甲基-4，5-辛二醇、2，7-二甲基-4，5-辛二酮、2，7-二甲基-4-羟基-5-辛酮、2，6-二甲基辛烷、2，6-二甲基-3-辛烯、2，6-二甲基-4-辛烯、3，7-二甲基-3-辛烯、2，6-二甲基-4-辛醇、3，7-二甲基-4-辛醇、2，6-二甲基-4-辛酮、3，7-二甲基-4-辛酮、2，6-二甲基-4，5-辛二醇、2，6-二甲基-4，5-辛二酮、2，6-二甲基-4-羟基-5-辛酮、2，6-二甲基-5-羟基-4-辛酮、3，6-二甲基辛烷、3，6-二甲基-3-辛烯、3，6-二甲基-4-辛烯、3，6-二甲基-4-辛醇、3，6-二甲基-4-辛酮、3，6-二甲基-4，5-辛二醇、3，6-二甲基-4，5-辛二酮、3，6-二甲基-4-羟基-5-辛酮、正-壬烷、1-壬烯、1-壬醇、壬醛、壬酸盐、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基-5-壬醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基-4，5-壬二醇、8-甲基-4，5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2，8-二甲基壬烷、2，8-二甲基-3-壬烯、2，8-二甲基-4-壬烯、2，8-二甲基-5-壬烯、2，8-二甲基-4-壬醇、2，8-二甲基-5-壬醇、2，8-二甲基-4-壬酮、2，8-二甲基-5-壬酮、2，8-二甲基-4，5-壬二醇、2，8-二甲基-4，5-壬二酮、2，8-二甲基-4-羟基-5-壬酮、2，8-二甲基-5-羟基-4-壬酮、2，7-二甲基壬烷、3，8-二甲基-3-壬烯、3，8-二甲基-4-壬烯、3，8-二甲基-5-壬烯、3，8-二甲基-4-壬醇、3，8-二甲基-5-壬醇、3，8-二甲基-4-壬酮、3，8-二甲基-5-壬酮、3，8-二甲基-4，5-壬二醇、3，8-二甲基-4，5-壬二酮、3，8-二甲基-4-羟基-5-壬酮、3，8-二甲基-5-羟基-4-壬酮、正-癸烷、1-癸烯、1-癸醇、癸酸盐、2，9-二甲基癸烷、2，9-二甲基-3-癸烯、2，9-二甲基-4-癸烯、2，9-二甲基-5-癸醇、2，9-二甲基-5-癸酮、2，9-二甲基-5，6-癸二醇、2，9-二甲基-6-羟基-5-癸酮、2，9-二甲基-5，6-癸二酮、正-十一烷、1-十一碳烯、1-十一烷醇、十一醛、十一酸盐、正-十二烷、1-十二碳烯、1-十二烷醇、十二醛、十二酸盐、正-十二烷、1-decadecene、1-十二烷醇、十二醛、十二酸盐、正-十三烷、1-十三碳烯、1-十三烷醇、十三醛、十三酸盐、正-十四烷、1-十四碳烯、1-十四烷醇、十四醛、十四酸盐、正-十五烷、1-十五碳烯、1-十五烷醇、十五醛、十五酸盐、正-十六烷、1-十六碳烯、1-十六烷醇、十六醛、十六酸盐、正-十七烷、1-十七碳烯、1-十七烷醇、十七醛、十七酸盐、正-十八烷、1-十八碳烯、1-十八烷醇、十八醛、十八酸盐、正-十九烷、1-十九碳烯、1-十九烷醇、十九醛、十九酸盐、二十烷、1-二十碳烯、1-二十烷醇、二十醛、二十酸盐、3-羟基丙醛、1，3-丙二醇、4-羟基丁醛、1，4-丁二醇、3-羟基-2-丁酮、2，3-丁二醇、1，5-戊二醇、高柠檬酸盐、高异柠檬酸盐、b-羟基己二酸盐、戊二酸盐、glutarsemialdehyde、戊二醛、2-羟基-1-环戊酮、1，2-环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2，3-二羟基-异戊酸盐、2-氧代异戊酸盐、异丁酰辅酶A、异丁酸盐、异丁醛、5-氨基戊醛、1，10-二氨基癸烷、1，10-二氨基-5-癸烯、1，10-二氨基-5-羟基癸烷、1，10-二氨基-5-癸酮、1，10-二氨基-5，6-癸二醇、1，10-二氨基-6-羟基-5-癸酮、苯乙醛、1，4-二苯基丁烷、1，4-二苯基-1-丁烯、1，4-二苯基-2-丁烯、1，4-二苯基-2-丁醇、1，4-二苯基-2-丁酮、1，4-二苯基-2，3-丁二醇、1，4-二苯基-3-羟基-2-丁酮、1-(4-羟苯基)-4-苯基丁烷、1-(4-羟苯基)-4-苯基-1-丁烯、1-(4-羟苯基)-4-苯基-2-丁烯、1-(4-羟苯基)-4-苯基-2-丁醇、1-(4-羟苯基)-4-苯基-2-丁酮、1-(4-羟苯基)-4-苯基-2，3-丁二醇、1-(4-羟苯基)-4-苯基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲哚-3)-4-苯基-2-丁烯、1-(吲哚-3)-4-苯基-2-丁醇、1-(吲哚-3)-4-苯基-2-丁酮、1-(吲哚-3)-4-苯基-2，3-丁二醇、1-(吲哚-3)-4-苯基-3-羟基-2-丁酮、4-羟苯基乙醛、1，4-二(4-羟苯基)丁烷、1，4-二(4-羟苯基)-1-丁烯、1，4-二(4-羟苯基)-2-丁烯、1，4-二(4-羟苯基)-2-丁醇、1，4-二(4-羟苯基)-2-丁酮、1，4-二(4-羟苯基)-2，3-丁二醇、1，4-二(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-4-(吲哚-3-)丁烷、1-(4-羟苯基)-4-(吲哚-3)-1-丁烯、1-二(4-羟苯基)-4-(吲哚-3)-2-丁烯、1-(4-羟苯基)-4-(吲哚-3)-2-丁醇、1-(4-羟苯基)-4-(吲哚-3)-2-丁酮、1-(4-羟苯基)-4-(吲哚-3)-2，3-丁二醇、1-(4-羟苯基-4-(吲哚-3)-3-羟基-2-丁酮、吲哚-3-乙醛、1，4-二(吲哚-3-)丁烷、1，4-二(吲哚-3)-1-丁烯、1，4-二(吲哚-3)-2-丁烯、1，4-二(吲哚-3)-2-丁醇、1，4-二(吲哚-3)-2-丁酮、1，4-二(吲哚-3)-2，3-丁二醇、1，4-二(吲哚-3)-3-羟基-2-丁酮、琥珀酸半醛、己烷-1，8-二羧酸、3-己烯-1，8-二羧酸、3-羟基-己烷-1，8-二羧酸、3-己酮-1，8-二羧酸、3，4-己二醇-1，8-二羧酸、4-羟基-3-己酮-1，8-二羧酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾、以及磷酸盐。

9.将多糖转化为适宜的单糖或寡糖的方法，包括：

(a)使所述多糖与微生物系统接触足以将所述多糖转化为适宜的单糖或寡糖的时间，其中所述多糖任选地从生物质获得，其中所述微生物系统包含：

(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因，其中所述裂解酶和/或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域；

(ii)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白和超通道(superchannel)；以及

(iii)至少一个编码和表达酶的基因，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶和醛缩酶，

从而将所述多糖转化为适宜的单糖或寡糖。

10.将多糖转化为适宜的单糖或寡糖的方法，包括：

(a)使所述多糖与化学或酶促催化途径接触足以将所述多糖转化为第一单糖或寡糖的时间，其中所述多糖任选地由生物质获得；和

(b)使所述第一多糖或寡糖与微生物系统接触足以将所述第一多糖或寡糖转化为适宜的单糖或寡糖的时间，其中所述微生物系统包含：

(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因；

从而将所述多糖转化为所述适宜的单糖或寡糖。

11.如权利要求9或10所述的方法，其中所述裂解酶选自藻酸盐裂解酶、果胶酸裂解酶、多聚甘露糖醛酸裂解酶、多聚葡糖酸裂解酶、多聚半乳糖醛酸裂解酶以及鼠李聚糖半乳糖醛酸裂解酶。

12.如权利要求9或10所述的方法，其中所述水解酶选自藻酸盐水解酶、鼠李聚糖半乳糖醛酸水解酶、多聚甘露糖醛酸水解酶、果胶水解酶以及多聚半乳糖醛酸水解酶。

13.如权利要求9或10所述的方法，其中所述转运蛋白选自ABC转运蛋白、同向转运蛋白(symporter)以及外膜孔蛋白。

14.如权利要求13所述的方法，其中所述ABC转运蛋白选自Atu3021，Atu3022、Atu3023、Atu3024、algM1、algM2、AlgQ1、AlgQ2、AlgS、OG2516 05558、OG2516 05563、OG2516 05568、OG2516 05573、TogM、TogN、TogA、TogB、及其功能变体。

15.如权利要求13所述的方法，其中所述同向转运蛋白选自V12B01_24239(SEQ ID NO：26)、V12B01_24194(SEQ ID NO：8)和TogT，及其功能变体。

16.如权利要求13所述的方法，其中所述外膜孔蛋白包含选自V12B01_24269、KdgM和KdgN及其功能变体的孔蛋白。

17.能在作为唯一碳源的多糖上生长的重组微生物，其中所述多糖选自藻酸盐、果胶、三半乳糖醛酸盐、二半乳糖醛酸盐、纤维素以及半纤维素。

18.如权利要求17所述的重组微生物，其中所述多糖是藻酸盐。

19.如权利要求17所述的重组微生物，其中所述多糖是果胶。

20.如权利要求17所述的重组微生物，其中所述多糖是三半乳糖醛酸盐。

21.重组微生物，包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因，其中所述裂解酶或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域；(ii)至少一个编码和表达酶的基因，所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白和超通道(superchannel)；以及(iii)至少一个编码和表达酶的基因，所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。

22.如权利要求17-21中任一项所述的重组微生物，其中所述微生物能在作为唯一碳源的多糖上生长。

23.如权利要求22所述的重组微生物，其中所述多糖选自藻酸盐、果胶以及三半乳糖醛酸盐。

24.将适宜的单糖或寡糖转化为第一大量生产型化学品的方法，包括：

(a)使所述适宜的单糖或寡糖与微生物系统接触足以将所述适宜的单糖或寡糖转化为所述大量生产型化学品的时间，其中所述微生物系统包含重组微生物，其中所述微生物包含大量生产型化学品生物合成途径，

从而将所述适宜的单糖或寡糖转化为所述第一大量生产型化学品。

25.如权利要求24所述的方法，其中所述大量生产型化学品途径包含一个或多个编码醛或酮生物合成途径的基因。

26.如权利要求25所述的方法，其中所述醛或酮生物合成途径选自乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛、2-吲哚-3-乙醛、戊二醛、5-氨基-戊醛、琥珀酸半醛以及琥珀酸4-羟苯基乙醛生物合成途径中的一个或多个。

27.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含乙醛生物合成途径和选自丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

28.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含丙醛生物合成途径和选自丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛以及苯乙醛生物合成途径的生物合成途径。

29.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含丁醛生物合成途径和选自异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

30.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含异丁醛生物合成途径和选自2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

31.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含2-甲基-丁醛生物合成途径和选自3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

32.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含3-甲基-丁醛生物合成途径和选自2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

33.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含2-苯乙醛生物合成途径和选自2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。

34.如权利要求26所述的方法，其中所述醛或酮生物合成途径包含2-(4-羟苯基)乙醛生物合成途径和2-吲哚-3-乙醛生物合成途径。

35.如权利要求24所述的方法，其中所述第一大量生产型化学品进一步被酶促和/或化学还原和脱水为第二大量生产型化学品。

36.将适宜的单糖或寡糖转化为大量生产型化学品的方法，包括：

(a)使所述适宜的单糖或寡糖与微生物系统接触足以将所述适宜的单糖或寡糖转化为所述大量生产型化学品的时间，其中所述微生物系统包含：

(i)一个或多个编码和表达醛生物合成途径的基因，其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因；和

(ii)一个或多个编码和表达醛还原酶的基因，从而将所述适宜的单糖或寡糖转化为所述大量生产型化学品。

37.如权利要求36所述的方法，其中所述脱羧酶是吲哚-3-丙酮酸脱羧酶(IPDC)。

38.如权利要求37所述的方法，其中所述IPDC包含与SEQ ID NO：312所示的氨基酸序列至少80％、90％、95％、98％或99％同一的氨基酸序列。

39.如权利要求36所述的方法，其中所述醛还原酶是苯乙醛还原酶(PAR)。

40.如权利要求39所述的方法，其中所述PAR包含与SEQ ID NO：313所示的氨基酸序列至少80％、90％、95％、98％或99％同一的氨基酸序列。

41.如权利要求36所述的方法，其中所述大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。

42.重组微生物，包含(i)一个或多个编码和表达醛生物合成途径的基因，其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因；以及(ii)一个或多个编码和表达醛还原酶的基因。

43.如权利要求42所述的重组微生物，其中所述醛生物合成途径还包含一个或多个编码和表达酶的基因，所述酶选自辅酶A连接的醛脱氢酶、醛脱氢酶以及醇脱氢酶。

44.如权利要求42所述的重组微生物，其中所述脱氢酶是吲哚-3-丙酮酸脱羧酶(IPDC)。

45.如权利要求42所述的重组微生物，其中所述醛还原酶是苯乙醛还原酶(PAR)。

46.如权利要求42所述的重组微生物，其中所述微生物能将适宜的单糖或寡糖转化为大量生产型化学品。

47.如权利要求46所述的重组微生物，其中所述大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。

48.如权利要求17-23或42-47所述的重组微生物，其中所述微生物包含与野生型微生物相比降低的乙醇产生能力。

49.如权利要求48所述的重组微生物，其中所述微生物包含乙酰辅酶A向乙醇的转化的降低或抑制。

50.如权利要求48所述的重组微生物，其中所述重组微生物包含乙醇脱氢酶的减少，从而提供降低的乙醇产生能力。

51.如权利要求50所述的重组微生物，其中所述乙醇脱氢酶是adhE、其同源物或变体。

52.如权利要求50所述的重组微生物，其中所述微生物包含adhE、其同源物或变体的缺失或敲除。

53.如权利要求17-23或42-47所述的重组微生物，其中所述重组微生物包含编码酶的基因的一个或多个缺失或敲除，所述酶选自催化乙酰辅酶A转化为乙醇的酶、催化丙酮酸盐转化为乳酸盐的酶、催化延胡索酸盐转化为琥珀酸盐的酶、催化乙酰辅酶A和磷酸盐转化为辅酶A和乙酰磷酸盐的酶、催化乙酰辅酶A和甲酸盐转化为辅酶A和丙酮酸盐的酶以及催化α-酮酸转化为支链氨基酸的酶。

54.如权利要求1-53中任一项所述的微生物系统或重组微生物，其中所述重组微生物或微生物系统包含选自以下的微生物：醋化醋酸杆菌(Acetobacter aceti)、无色杆菌(Achromobacter)、嗜酸菌(Acidiphilium)、不动杆菌(Acinetobacter)、马杜拉放线菌(Actinomadura)、游动放线菌(Actinoplanes)、敏捷好氧炽热球菌(Aeropyrum pernix)、农杆菌(Agrobacterium)、产碱杆菌(Alcaligenes)、菠萝(Ananas comosus)(M)、节杆菌(Arthrobacter)、黑曲霉(Aspargillus niger)、米曲霉(Aspargillus oryze)、蜜蜂曲霉(Aspergillus melleus)、粉状曲霉(Aspergillus pulverulentus)、斋藤曲霉(Aspergillus saitoi)、酱油曲霉(Aspergillus sojea)、宇佐美曲霉(Aspergillus usamii)、嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、浸麻芽孢杆菌(Bacillus macerans)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、双歧杆菌(Bifidobacterium)、短短芽孢杆菌(Brevibacillus brevis)、洋葱伯克霍尔德氏菌(Burkholderia cepacia)、圆柱念珠菌(Candida cylindracea)、皱褶念珠菌(Candida rugosa)、番木瓜(Caricapapaya)(L)、纤维微菌(Cellulosimicrobium)、头孢霉菌(Cephalosporium)、变动毛壳菌(Chaetomium erraticum)、细丽毛壳菌(Chaetomium gracile)、梭菌(Clostridium)、丁酸梭菌(Clostridium butyricum)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维素梭菌(Clostridium thermocellum)、(谷氨酸)棒杆菌(Corynebacterium(glutamicum))、Corynebacterium efficiens、大肠杆菌(Escherichia coli)、肠球菌(Enterococcus)、菊欧文氏菌(Erwinachrysanthemi)、葡糖酸杆菌(Gliconobacter)、葡糖酸醋酸杆菌(Gluconacetobacter)、盐盒菌(Haloarcula)、特异腐质霉(Humicola insolens)、Humicola nsolens、西唐北里孢菌(Kitasatospora setae)、克雷伯氏菌(Klebsiella)、产酸克雷伯氏菌(Klebsiella oxytoca)、克鲁维酵母(Kluyveromyces)、脆壁克鲁维酵母(Kluyveromyces fragilis)、乳酸克鲁维酵母(Kluyveromyces lactis)、库克菌(Kocuria)、Lactlactis、乳酸杆菌(Lactobacillus)、发酵乳酸杆菌(Lactobacillus fermentum)、清酒乳酸杆菌(Lactobacillus sake)、乳球菌(Lactococcus)、乳酸乳球菌(Lactococcuslactis)、明串珠菌(Leuconostoc)、甲基孢囊菌(Methylocystis)、西西里甲烷叶菌(Methanolobus siciliae)、嗜器官产甲烷菌(Methanogeniumorganophilum)、布氏甲杆菌(Methanobacterium bryantii)、蛾微杆菌(Microbacterium imperiale)、溶壁微球菌(Micrococcus lysodeikticus)、小月菌(Microlunatus)、爪哇毛霉(Mucor javanicus)、分枝杆菌(Mycobacterium)、漆斑菌(Myrothecium)、硝化杆菌(Nitrobacter)、亚硝化单胞菌(Nitrosomonas)、诺卡氏菌(Nocardia)、番木瓜(Papaya carica)、片球菌(Pediococcus)、嗜盐片球菌(Pediococcus halophilus)、青霉菌(Penicillium)、产黄青霉(Penicillium camemberti)、橘青霉(Penicillium citrinum)、埃默森青霉(Penicillium emersonii)、娄地青霉(Penicillium roqueforti)、淡紫青霉(Penicillum lilactinum)、多色青霉(Penicillum multicolor)、好氧反硝化菌(Paracoccus pantotrophus)、丙酸杆菌(Propionibacterium)、假单胞菌(Pseudomonas)、荧光假单孢菌(Pseudomonas fluorescens)、脱氮假单胞杆菌(Pseudomonas denitrificans)、火球菌(Pyrococcus)、激烈火球菌(Pyrococcus furiosus)、堀野氏火球菌(Pyrococcus horikoshii)、根癌菌(Rhizobium)、米黑根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucorpusillus Lindt)、根霉(Rhizopus)、德氏根霉(Rhizopus delemar)、东京根霉(Rhizopus japonicus)、雪白根霉(Rhizopus niveus)、米根霉(Rhizopus oryzae)、少孢根霉(Rhizopus oligosporus)、红球菌(Rhodococcus)、酿酒酵母(Sccharomyces cerevisiae)、Sclerotina libertina、多食鞘氨醇杆菌(sphingobacterium multivorum)、鞘氨醇杆菌(sphingobium)、鞘胺醇单胞菌(sphingomonas)、链球菌(Streptococcus)、嗜热链球菌(Streptococcusthermophilus)Y-1、链霉菌(Streptomyces)、灰色链霉菌(Streptomycesgriseus)、变铅青链霉菌(Streptomyces lividans)、鼠灰链霉菌(Streptomycesmurinus)、锈棕色链霉菌(Streptomyces rubiginosus)、紫红链霉菌(Streptomyces violaceoruber)、茂原链轮丝菌(Streptoverticilliummobaraense)、四体球菌(Tetragenococcus)、栖热菌(Thermus)、泛养硫球菌(Thiosphaera pantotropha)、栓菌(Trametes)、木霉(Trichoderma)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、潘氏丝孢酵母(Trichosporon penicillatum)、溶藻弧菌(Vibrio alginolyticus)、黄单胞菌(Xanthomonas)、酵母(yeast)、鲁氏接合酵母(Zygosaccharomyces rouxii)、发酵单胞菌(Zymomonas)以及运动发酵单胞菌(Zymomonus mobilis)。

55.如权利要求1-8或24-41中任一项所述的方法所产生的大量生产型化学品。

56.混合的大量生产型化学品，包含权利要求55所述的大量生产型化学品和精炼的石油产品。

57.如权利要求56所述的混合的大量生产型化学品，其中所述大量生产型化学品选自C10-C12烃、2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。

58.如权利要求57所述的混合的大量生产型化学品，其中所述C10-C12烃选自2，7-二甲基辛烷和和2，9-二甲基癸烷。

59.如权利要求56所述的混合的大量生产型化学品，其中所述精炼的石油产品选自喷气燃料和柴油燃料。

60.产生富大量生产型化学品的精炼的石油产品的方法，包括：

(a)将所述精炼的石油产品与通过权利要求1-8或21-41中任一项的方法所产生的所述大量生产型化学品混合，

从而产生所述富大量生产型化学品的精炼的石油产品。