CN101889092A - 生物燃料生产 - Google Patents

生物燃料生产 Download PDF

Info

Publication number
CN101889092A
CN101889092A CN2008801192815A CN200880119281A CN101889092A CN 101889092 A CN101889092 A CN 101889092A CN 2008801192815 A CN2008801192815 A CN 2008801192815A CN 200880119281 A CN200880119281 A CN 200880119281A CN 101889092 A CN101889092 A CN 101889092A
Authority
CN
China
Prior art keywords
methyl
hydroxyphenyls
dimethyl
isophthalic acids
indoles
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2008801192815A
Other languages
English (en)
Inventor
吉国靖雄
樫山雄树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bio Architecture Lab Inc
Original Assignee
Bio Architecture Lab Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bio Architecture Lab Inc filed Critical Bio Architecture Lab Inc
Publication of CN101889092A publication Critical patent/CN101889092A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • C12P5/026Unsaturated compounds, i.e. alkenes, alkynes or allenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/16Butanols
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/22Preparation of oxygen-containing organic compounds containing a hydroxy group aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • C12P7/38Cyclopentanone- or cyclopentadione-containing products
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T50/00Aeronautics or air transport
    • Y02T50/60Efficient propulsion technologies, e.g. for aircraft
    • Y02T50/678Aviation using fuels of non-fossil origin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Saccharide Compounds (AREA)

Abstract

提供了用于将多糖、如衍生自生物质的多糖转化为适宜的单糖或寡糖,以及将适宜的单糖或寡糖转化为大量生产型化学品如生物燃料的方法、酶、重组微生物以及微生物系统。还提供了本文所述方法所产生的大量生产型化学品。还提供了富大量生产型化学品的精炼的石油产品,以及产生该石油产品的方法。

Description

生物燃料生产
优先权信息
本申请要求2007年10月24日提交的美国临时申请第60/977,628号的优先权,在此通过引用,将其全文并入。
有关序列表的声明
以文本格式提供了本申请相关的序列表,替代纸件,并且特此通过引用将其并入本说明书。含有序列表的文本文件的名称为150097_40101_SEQUENCE_LISTING.txt。该文本文件为519KB,于2008年10月3日生成,并经由EFS-Web以电子的方式提交。
发明领域
本发明通常涉及微生物系统和化学系统将生物质转化为大量生产型化学品(commodity chemicals)如生物燃料/生物汽油(biopetrol)的用途。
发明背景
石油正面临全球存储量下降,且带来超过30%的温室气体排放,促使全球变暖。每年全球消耗8000亿桶运输燃料(transportation fuel)。柴油燃料和喷气燃料(jet fuel)占全球运输燃料的50%以上。
已经通过意义重大的立法,要求燃料生产商给来自运输燃料的生产和使用的碳排放设定上限或者将其减少。燃料生产商正在寻求实质相似的低碳燃料,其可以通过现有基础设施(如精炼厂、管道、油罐)混合并且分送。
由于石油成本的增加以及对石化给料的依赖,化学工业也在寻找改善利润和价格的稳定性同时减少对环境的影响。化学工业正致力于发展更绿色的产品,其比当前的产品在能量、水和CO2方面更有效。由生物来源如生物质所产生的燃料代表了过程的一个方面。
现有的将生物质转化为生物燃料的方法聚焦于木质纤维素生物质的用途,并且存在许多与使用这种方法有关的问题。纤维素生物质的大规模栽培需要大量耕地,这仅可以通过用能量作物生产代替粮食作物生产、采伐森林以及再耕作当前未耕作土地而实现。其他的问题包括,水的可利用性和质量的减少以及杀虫剂和肥料使用的增加。
由于其坚固的机械强度和复杂的化学组成,利用生物系统降解木质纤维素生物质是非常困难的挑战。将木质素完全转化为单糖,需要大约30种不同的酶。该复杂方法唯一可利用的替代选择需要大量的热、压力和强酸。因此本领域需要将生物质转化为可用作生物燃料或生物汽油的烃的经济且技术简单的方法。
附图简要说明
图1表示实施例1所述的fosmid克隆的灿烂弧菌(Vibrio splendidus)的基因组区。基因用橙色箭头标示。标记表示数值基因指数(numericalgene indices)以及预测的蛋白功能。
图2说明某些实施方案所涉及的途径,在所述实施方案中,大肠杆菌(E.coli)经基因工程可以生长于作为唯一碳源的藻酸盐上。
图3说明某些实施方案所涉及的途径,在所述实施方案中,大肠杆菌经基因工程可以生长于作为唯一碳源的果胶上。
图4表示生长于作为唯一碳源的藻酸盐上的工程或重组的大肠杆菌的结果(参看实心圆)。根癌农杆菌(Agrobacterium tumefaciens)细胞提供了阳性对照(参看同心圆(hatched circle))。紧邻根癌农杆菌阳性对照左侧的孔含有DH10B大肠杆菌细胞,该细胞提供了阴性对照。
图5表示大肠杆菌重组菌株在半乳糖醛酸盐和果胶中的生长。图5A表示24hr后大肠杆菌在各种长度的半乳糖醛酸盐上的生长。图5A中的重组菌株是大肠杆菌BL21(DE3)菌株,容纳有pTrlogl-kdgR+pBBRGal3P,对照菌株是BL21(DE3)菌株,容纳有pTrc99A+pBBR1MCS-2,如实施例2所述。图5B表示3-4天后重组大肠杆菌在果胶上的生长。图5B中的重组菌株是大肠杆菌DH5a菌株,含有pPEL74(Ctrl)、pPEL74以及pROU2,如实施例2所述。
图6表示藻酸盐降解形成丙酮酸盐。图6A说明藻酸盐降解和代谢的简化代谢途径。图6B表示藻酸盐通过酶促降解途径,体外降解形成丙酮酸盐的结果。图6C表示藻酸盐通过化学降解途径,体外降解形成丙酮酸盐的结果。
图7表示从根癌农杆菌C58分离的各种醇脱氢酶的生物活性。图7A示出通过NADPH消耗所监测的DEHU氢化酶活性,图7B表示通过NADPH消耗所监测的甘露糖醛酸氢化酶(mannuronate hydrogenase)活性。
图8表示对照样品(图8A)和由pBADalsS-ilvCD-leuABCD2和pTrcBALK(图8B)产生的异丁醛、3-甲基戊醇以及2-甲基戊醛的GC-MS层析谱结果。
图9表示对照样品(图9A)和由pBADtyrA-aroLAC-aroG-tktA-aroBDE和pTrcBALK(图9B)产生的4-羟苯基乙醇以及吲哚-3-乙醇的GC-MS层析谱结果。
图10表示异丁醛(图10A)、3-甲基戊醇(图10B)以及2-甲基戊醇(图10C)的质谱结果。
图11表示苯基乙醇(图11A)、4-羟苯基乙醇(图11B)以及吲哚-3-乙醇(图11C)的质谱结果。
图12表示二醇脱水酶的生物活性。图12A表示NADH消耗所监测的丁偶姻(butyroin)通过ddh1、ddh2以及ddh3的还原。图12B表示ddh3对1,2-环戊二醇和1,2-环己二醇的氧化活性,这通过NADH产生测量。
图13概括了DDH多肽所催化的氧化反应中各种底物动力学研究的结果。这些反应是NAD+依赖性的。
图14表示分离自短乳杆菌(Lactobaccilus brevis)ATCC 367的二醇脱氢酶DDH1的核苷酸序列(图14A)(SEQ ID NO:97)和多肽序列(图14B)(SEQ ID NO:98)。
图15表示分离自恶臭假单胞菌(Pseudomonas putida)KT2440的二醇脱氢酶DDH2的核苷酸序列(图15A)(SEQ ID NO:99)和多肽序列(图15B)(SEQ ID NO:100)。
图16表示分离自肺炎克雷伯氏菌(Klebsiella pneumoniae)MGH78578的二醇脱氢酶DDH3的核苷酸序列(图16A)(SEQ ID NO:101)和多肽序列(图16B)(SEQ ID NO:102)。
图17表示分离自荧光假单胞菌(Pseudomonas fluorescens)的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种(Klebsiella pneumoniae subsp.pneumoniae)MGH78578(DDH3)的ddh基因的依次的体内生物活性。该反应说明丁醛依次转化为5-羟基-4-辛酮和4,5-辛酮二醇。图17A表示丁偶姻(5-羟基-4-辛酮)在5.36分钟时的检测,而图17B表示4,5-辛二醇在6.49和6.65分钟时的检测。
图18表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明正-戊醛依次转化为6-羟基-5-癸酮和5,6-癸二醇。图18A表示valeroin(6-羟基-5-癸酮)在8.22分钟时的检测,而图18B表示5,6癸二醇在9.22和9.35分钟时的检测。
图19表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明,3-甲基丁醛依次转化为2,7-二甲基-5-羟基-4-辛酮和2,7-二甲基-4,5-辛二醇。图19A表示isoveraloin(2,7-二甲基-5-羟基-4-辛酮)在6.79分钟时的检测,而图19B表示2,7-二甲基-4,5-辛二醇在7.95和8.15分钟时的检测。
图20表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明,正-己醛依次转化为7-羟基-6-十二碳酮和6,7-十二烷二醇。图20A表示hexanoin(7-羟基-6-癸酮)在10.42分钟时的检测,而图20B表示6,7-十二烷二醇在10.89和10.95分钟时的检测。
图21表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明,4-甲基戊醛依次转化为2,9-二甲基-6-羟基-5-癸酮和2,9-二甲基-5,6-癸二醇。图21A表示isohexanoin(2,9-二甲基-6-羟基-5-癸酮)在9.45分钟时的检测,而图21B表示2,9-二甲基-5,6-癸二醇在10.38和10.44分钟时的检测。
图22表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的体内生物活性。该图说明,通过显示octanoin(9-羟基-8-十六碳酮)在12.35分钟时的检测,正-辛醛转化为9-羟基-8-十六碳酮。
图23表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的体内生物活性。该图说明,通过显示乙偶姻(acetoin)(3-羟基-2-丁酮)在rt=0.91分钟时的检测,乙醛转化为3-羟基-2-丁酮。
图24表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的依次的体内生物活性。该图说明,正-丙醛依次转化为4-羟基-3-己酮和3,4-己二醇。图24A表示propioin(4羟基-3-己酮)在rt=2.62分钟时的检测,而图24B表示3,4-己二醇在rt=3.79分钟时的检测。
图25表示分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子的使用,用于大肠杆菌蛋白的表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578(DDH3)的ddh基因的体内生物活性。该图说明,通过显示1,4-二苯基-3-羟基-2-丁酮在rt=13.66分钟时的检测,苯乙醛转化为1,4-二苯基-3-羟基-2-丁酮。
图26表示来自肺炎克雷伯氏菌MGH 78578(DDH3)的二醇脱氢酶ddh和来自肺炎克雷伯氏菌MGH 78578的二醇脱水酶pduCDE的依次生物学活性。图26A表示GC-MS数据,该数据证实,在样品提取物中存在4,5-辛二醇,该辛二醇是通过ddh3由丁偶姻还原所产生的预期产物。图26B表示GC-MS数据,其证实在样品提取物种存在4-辛酮,该4-辛酮是丁偶姻和4,5-辛二醇分别通过ddh3和pduCDE依次脱氢和脱水而产生的预期产物。
图27表示来自肺炎克雷伯氏菌MGH 78578(DDH3)的二醇脱氢酶ddh和来自肺炎克雷伯氏菌MGH 78578的二醇脱水酶pduCDE的依次生物学活性。图27A和图27B表示样品提取物气相层析/质谱和4-辛酮标准气相层析/质谱间的比较,证实4-辛酮是由丁偶姻利用酶二醇脱氢酶(ddh3)和二醇脱水酶(pduCDE)产生的。
图28表示分离自肺炎克雷伯氏菌MGH 78578的二醇脱水酶大亚基(pduC)的核苷酸序列(图28A)(SEQ ID NO:103)和多肽序列(图28B)(SEQID NO:104)。
图29表示除了分离自肺炎克雷伯氏菌MGH 78578的二醇脱水酶小亚基(pduE)的核苷酸序列(图29C)(SEQ ID NO:107)和多肽序列(图29D)(SEQ ID NO:108)外,分离自肺炎克雷伯氏菌MGH 78578的二醇脱水酶中亚基(pduD)的核苷酸序列(图29A)(SEQ ID NO:105)和多肽序列(图29B)(SEQ ID NO:106)。
图30表示NADP产生(图30A)和NADPH产生(图30B)所监测的4-辛醇通过次级醇脱氢酶(secondary alcohol dehydrogenase)的氧化。
图31表示NADP产生(图31A)和NADPH产生(图31B)所监测的4-辛醇通过次级醇脱氢酶的氧化。
图32表示NADH产生(图32A)和NADPH产生(图32B)所监测的2,7-二甲基辛醇通过次级醇脱氢酶的氧化。
图33表示2ADH11和2ADH16的氧化和还原活性。图33A表示NADPH消耗所测量的2,7-二甲基-4-辛酮的还原。图33B表示2,7-二甲基-4-辛酮、4-辛酮以及环戊酮的还原。
图34表示环戊醇通过次级醇脱氢酶的氧化和还原。图34A表示NADH或NADPH形成所监测的环戊醇的氧化。图34B表示NADPH消耗所监测的环戊醇的还原。
图35表示每个底物的所示还原反应的计算的速率常数,该还原反应是由次级醇脱氢酶ADH-16(SEQ ID NO:138)催化的。
图36表示每个底物的所示氧化反应的计算的速率常数,该氧化反应是由次级醇脱氢酶ADH-16(SEQ ID NO:138)催化的。
图37示出藻酸盐裂解酶基因/蛋白的名录,该藻酸盐裂解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。
图38示出果胶酸裂解酶基因/蛋白的名录,该果胶酸裂解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。
图39A示出鼠李聚糖半乳糖醛酸(rhamnogalacturonan)裂解酶基因/蛋白的名录,该裂解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。图39B表示鼠李聚糖半乳糖醛酸水解酶基因/蛋白的名录,该水解酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。
图40示出果胶甲酯酶基因/蛋白的名录,该果胶甲酯酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。
图41示出果胶乙酰酯酶(pectate acetyl esterase)基因/蛋白的名录,该果胶乙酰酯酶基因/蛋白可以根据本文所述的方法和重组微生物来使用。
图42表示24小时时,由实施例4所述的重组微生物产生的2-苯基乙醇(图42A)、2-(4-羟苯基)乙醇(图42B)以及2-(吲哚-3-)乙醇(图42C),其包含功能性2-苯基乙醇、2-(4-羟苯基)乙醇以及2-(吲哚-3-)乙醇生物合成途径。
图43表示GC-MS层析谱结果,该结果证实在一周时,由实施例4所述的重组微生物(pBADpheA-aroLAC-aroG-tktA-aroBDE和pTrcBALK)产生2-苯基乙醇(图43B)。图43A表示阴性对照细胞(pBAD33和pTrc99A)。
图44表示GC-MS层析谱结果,该结果证实在一周时,由实施例4所述的重组微生物(pBADtyrA-aroLAC-aroG-tktA-aroBDE和pTrcBALK)产生2-(4-羟苯基)乙醇(9.36分钟)和2-(吲哚-3)乙醇(10.32分钟)。
图45证实由1,2-丙二醇形成1-丙醛(图45A)和由内消旋-2,3-丁二醇形成2-丁酮(图45B),二者均由分离的不依赖B12的二醇脱水酶体外催化,如实施例9所述。
图46A表示由1,2-丙二醇体内产生1-丙醇。图46B表示由内消旋-2,3丁二醇体内产生2-丁醇。图46C表示由反式-1,2-环戊二醇体内产生环戊酮。这些实验是按实施例9中所述进行的。
图47表示实施例10所进行的TBA测定的结果。图47中左侧的试管表示取自表达Vs24254的细胞的过夜培养物的培养基,表明分泌藻酸盐裂解酶,而右侧的试管表示利用来自表达Vs24259的细胞的培养基(阴性对照)的TBA反应。在阴性对照中缺少粉红着色表明,没有发生或者发生很少的藻酸盐多聚体切割。
图48表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的苯甲醛裂解酶(BAL)催化由乙醛和丙醛间的连接反应体内产生3-羟基-2-戊酮和2-羟基-3-戊酮(图48A),并催化由丙醛和丁醛间的连接反应体内产生4-羟基-3-庚酮和3-羟基-4-庚酮(图48B)。
图49表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由乙醛和戊醛间的连接反应体内产生3-羟基-2-庚酮(图49A),并催化由戊醛和丙醛间的连接反应体内产生4-羟基-3-辛酮和3-羟基-4-辛酮(图49B)。
图50表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由丁醛和戊醛间的连接反应体内产生5-羟基-4-壬酮(图50A),并催化由己醛和3-甲基丁醛间的连接反应体内产生2-甲基-5-羟基-4-癸酮和2-甲基-4-羟基-5-癸酮(图50B)。
图51表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由乙醛和4-甲基己醛间的连接反应体内产生6-甲基-3-羟基-2-庚酮(图51A),并催化由4-甲基己醛和丙醛间的连接反应体内产生7-甲基-4-羟基-3-辛酮(图51B)。
图52表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由4-甲基己醛和丁醛间的连接反应体内产生8-甲基-5-羟基-4-壬酮(图52A),并催化由乙醛和辛醛间的连接反应体内产生3-羟基-2-癸酮(图52B)。
图53表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由辛醛和丙醛间的连接反应体内产生4-羟基-3-十一碳酮(图53A),并催化由辛醛和丁醛间的连接反应体内产生5-羟基-4-十二碳酮(图53B)。
图54表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由辛醛和戊醛间的连接反应体内产生6-羟基-5-十三碳酮(图54A),并催化由辛醛和3-甲基丁醛间的连接反应体内产生2-甲基-5-羟基4-十二碳酮和2-甲基-4-羟基-5-癸酮(图54B)。
图55表示分离自荧光假单胞菌并克隆至大肠杆菌的C-C连接酶的体内生物活性。GC-MS层析谱结果表明,密码子优化的BAL催化由辛醛和4-甲基戊醛间的连接反应体内产生2-甲基-6-羟基-5-十三碳酮。
图56表示如实施例10所述,重组大肠杆菌在作为唯一碳源的藻酸盐上的生长。在葡萄糖上的生长(图56B)提供了阳性对照。细胞用无质粒(BL21-阴性对照)、一种质粒(如Da或3a)或两种质粒(如Dk3a和Da3k)转化。质粒以小写字母表示:“a”表示pET-DEST42质粒骨架,而“k”表示pENTR/D/TOPO骨架。“D”表示质粒含有基因组区Vs24214-24249,而“3”表示质粒含有基因组区Vs24189-24209。因此,Da为pET-DEST42-Vs24214-24249,Da3k为pET-DEST42-Vs24214-24249和pENTR/D/TOPO-Vs24189-24209等。这些结果表明,组合的基因组区Vs24214-24249和Vs24189-24209足以赋予大肠杆菌在作为唯一碳源的藻酸盐上生长的能力。
图57表示如实施例11所进行的,通过生长于藻酸盐上的大肠杆菌产生乙醇。用pBBRPdc-AdhA/B或pBBRPdc-AdhA/B+1.5FOS转化大肠杆菌,并允许其在含有藻酸盐的m9培养基中生长。
发明概述
本发明的实施方案包括将多糖转化为大量生产型化学品的方法,包括(a)使多糖与多糖降解或解聚代谢系统接触,其中所述多糖任选地衍生于生物质,所述代谢系统选自(i)酶促或化学催化,和(ii)微生物系统,其中所述微生物系统包含重组微生物,其中该重组微生物包含一个或多个允许其在作为唯一碳源的多糖上生长的外源基因,据此将所述多糖转化为适宜的单糖或寡糖;以及(b)使适宜的单糖或寡糖与大量生产型化学品生物合成途径接触,其中该大量生产型化学品生物合成途径包含醛或酮生物合成途径,据此将多糖转化为大量生产型化学品。
在某些方面,生物质选自海洋生物质和蔬菜(vegetable)/果实(fruit)/植物(plant)生物质。在某些方面,海洋生物质选自海藻(kelp)、巨藻(giantkelp)、马尾藻类海草(sargasso)、海藻(seaweed)、藻类(algae)、海洋微生物区系(marine microflora)、微藻类(microalgae)以及海草(sea grass)。在某些方面,蔬菜/果实/植物生物质包含植物皮(plant peel)或渣。在某些方面,蔬菜/果实/植物生物质选自柑橘(citrus)、马铃薯(potato)、番茄(tomato)、葡萄(grape)、醋栗(gooseberry)、胡萝卜(carrot)、芒果(mango)、甜菜(sugar-beet)、苹果(apple)、柳枝稷(switchgrass)、木材(wood)以及干草(stover)。
在某些方面,多糖选自藻酸盐、琼脂、角叉菜聚糖、岩藻依聚糖、果胶、多聚半乳糖醛酸盐、纤维素、半纤维素、木聚糖、阿拉伯聚糖以及甘露聚糖。在某些方面,适宜的单糖或寡糖选自2-酮-3-脱氧D-葡糖酸盐(KDG)、D-甘露醇、古洛糖醛酸盐(guluronate)、甘露糖醛酸盐、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸盐、半乳糖醛酸盐以及鼠李糖。
在某些方面,大量生产型化学品选自甲烷、甲醇、乙烷、乙烯、乙醇、正-丙烷、1-丙烯、1-丙醇、丙醛、丙酮、丙酸盐、正-丁烷、1-丁烯、1-丁醇、丁醛、丁酸盐、异丁醛、异丁醇、2-甲基丁醛、2-甲基丁醇、3-甲基丁醛、3-甲基丁醇、2-丁烯、2-丁醇、2-丁酮、2,3-丁二醇、3-羟基-2-丁酮、2,3-丁二酮、乙苯、苯乙烯、2-苯基乙醇、苯乙醛、1-苯基丁烷、4-苯基-1-丁烯、4-苯基-2-丁烯、1-苯基-2-丁烯、1-苯基-2-丁醇、4-苯基-2-丁醇、1-苯基-2-丁酮、4-苯基-2-丁酮、1-苯基-2,3-丁二醇、1-苯基-3-羟基-2-丁酮、4-苯基-3-羟基-2-丁酮、1-苯基-2,3-丁二酮、正-戊烷、乙基苯酚、乙烯基苯酚、2-(4-羟苯基)乙醇、4-羟苯基乙醛、1-(4-羟苯基)丁烷、4-(4-羟苯基)-1-丁烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯基)-2-丁醇、1-(4-羟苯基)-2-丁酮、4-(4-羟苯基)-2-丁酮、1-(4-羟苯基)-2,3-丁二醇、1-(4-羟苯基)-3-羟基-2-丁酮、4-(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-2,3-丁二酮、吲哚乙烷(indolylethane)、吲哚乙烯(indolylethene)、2-(吲哚-3-)乙醇、正-戊烷、1-戊烯、1-戊醇、戊醛、戊酸盐、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2,3-戊二醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2,3-戊二酮、2-甲基戊烷、4-甲基-1-戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲基-3-戊酮、4-甲基-2,3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、4-甲基-2,3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基-2,3-戊二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2,3-戊二酮、4-甲基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2,3-戊二醇、4-甲基-1-苯基-2,3-戊二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1-(4-羟苯基)戊烷、1-(4-羟苯基)-1-戊烯、1-(4-羟苯基)-2-戊烯、1-(4-羟苯基)-3-戊烯、1-(4-羟苯基)-2-戊醇、1-(4-羟苯基)-3-戊醇、1-(4-羟苯基)-2-戊酮、1-(4-羟苯基)-3-戊酮、1-(4-羟苯基)-2,3-戊二醇、1-(4-羟苯基)-2-羟基-3-戊酮、1-(4-羟苯基)-3-羟基-2-戊酮、1-(4-羟苯基)-2,3-戊二酮、4-甲基-1-(4-羟苯基)戊烷、4-甲基-1-(4-羟苯基)-2-戊烯、4-甲基-1-(4-羟苯基)-3-戊烯、4-甲基-1-(4-羟苯基)-1-戊烯、4-甲基-1-(4-羟苯基)-3-戊醇、4-甲基-1-(4-羟苯基)-2-戊醇、4-甲基-1-(4-羟苯基)-3-戊酮、4-甲基-1-(4-羟苯基)-2-戊酮、4-甲基-1-(4-羟苯基)-2,3-戊二醇、4-甲基-1-(4-羟苯基)-2,3-戊二酮、4-甲基-1-(4-羟苯基)-3-羟基-2-戊酮、4-甲基-1-(4-羟苯基)-2-羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-1-戊烯、1-(吲哚-3)-2-戊烯、1-(吲哚-3)-3-戊烯、1-(吲哚-3)-2-戊醇、1-(吲哚-3)-3-戊醇、1-(吲哚-3)-2-戊酮、1-(吲哚-3)-3-戊酮、1-(吲哚-3)-2,3-戊二醇、1-(吲哚-3)-2-羟基-3-戊酮、1-(吲哚-3)-3-羟基-2-戊酮、1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3-)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲哚-3)-1-戊烯、4-甲基-2-(吲哚-3)-3-戊醇、4-甲基-1-(吲哚-3)-2-戊醇、4-甲基-1-(吲哚-3)-3-戊酮、4-甲基-1-(吲哚-3)-2-戊酮、4-甲基-1-(吲哚-3)-2,3-戊二醇、4-甲基-1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲基-1-(吲哚-3)-2-羟基-3-戊酮、正-己烷、1-己烯、1-己醇、己醛、己酸盐、2-己烯、3-己烯、2-己醇、3-己醇、2-己酮、3-己酮、2,3-己二醇、2,3-己二酮、3,4-己二醇、3,4-己二酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、3-甲基己烷、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲基-3-己酮、2-甲基-3,4-己二醇、2-甲基-3,4-己二酮、5-甲基-2,3-己二醇、5-甲基-2,3-己二酮、4-甲基-2,3-己二醇、4-甲基-2,3-己二酮、2-甲基-3-羟基-4-己酮、2-甲基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟基-3-己酮、4-甲基-3-羟基-2-己酮、2,5-二甲基己烷、2,5-二甲基-2-己烯、2,5-二甲基-3-己烯、2,5-二甲基-3-己醇、2,5-二甲基-3-己酮、2,5-二甲基-3,4-己二醇、2,5-二甲基-3,4-己二酮、2,5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2,3-己二醇、4-甲基-1-苯基-2,3-己二醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2,3-己二酮、4-甲基-1-苯基-2,3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1-(4-羟苯基)-1-己烯、5-甲基-1-(4-羟苯基)-2-己烯、5-甲基-1-(4-羟苯基)-3-己烯、4-甲基-1-(4-羟苯基)-1-己烯、4-甲基-1-(4-羟苯基)-2-己烯、4-甲基-1-(4-羟苯基)-3-己烯、5-甲基-1-(4-羟苯基)-2-己醇、5-甲基-1-(4-羟苯基)-3-己醇、4-甲基-1-(4-羟苯基)-2-己醇、4-甲基-1-(4-羟苯基)-3-己醇、5-甲基-1-(4-羟苯基)-2-己酮、5-甲基-1-(4-羟苯基)-3-己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4-羟苯基)-3-己酮、5-甲基-1-(4-羟苯基)-2,3-己二醇、4-甲基-1-(4-羟苯基)-2,3-己二醇、5-甲基-1-(4-羟苯基)-3-羟基-2-己酮、5-甲基-1-(4-羟苯基)-2-羟基-3-己酮、4-甲基-1-(4-羟苯基)-3-羟基-2-己酮、4-甲基-1-(4-羟苯基)-2-羟基-3-己酮、5-甲基-1-(4-羟苯基)-2,3-己二酮、4-甲基-1-(4-羟苯基)-2,3-己二酮、4-甲基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3)-2-己烯、5-甲基-1-(吲哚-3)-3-己烯、4-甲基-1-(吲哚-3)-1-己烯、4-甲基-1-(吲哚-3)-2-己烯、4-甲基-1-(吲哚-3)-3-己烯、5-甲基-1-(吲哚-3)-2-己醇、5-甲基-1-(吲哚-3)-3-己醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基-1-(吲哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚-3)-2-己酮、4-甲基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二醇、4-甲基-1-(吲哚-3)-2,3-己二醇、5-甲基-1-(吲哚-3)-3-羟基-2-己酮、5-甲基-1-(吲哚-3)-2-羟基-3-己酮、4-甲基-1-(吲哚-3)-3-羟基-2-己酮、4-甲基-1-(吲哚-3)-2-羟基-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二酮、4-甲基-1-(吲哚-3)-2,3-己二酮、正-庚烷、1-庚烯、1-庚醇、庚醛、庚酸盐、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2,3-庚二醇、2,3-庚二酮、3,4-庚二醇、3,4-庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚酮、2-甲基-3,4-庚二醇、2-甲基-3,4-庚二酮、6-甲基-3,4-庚二醇、6-甲基-3,4-庚二酮、5-甲基-3,4-庚二醇、5-甲基-3,4-庚二酮、2-甲基-3-羟基-4-庚酮、2-甲基-4-羟基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚酮、5-甲基-4-羟基-3-庚酮、2,6-二甲基庚烷、2,5-二甲基庚烷、2,6-二甲基-2-庚烯、2,6-二甲基-3-庚烯、2,5-二甲基-2-庚烯、2,5-二甲基-3-庚烯、3,6-二甲基-3-庚烯、2,6-二甲基-3-庚醇、2,6-二甲基-4-庚醇、2,5-二甲基-3-庚醇、2,5-二甲基-4-庚醇、2,6-二甲基-3,4-庚二醇、2,6-二甲基-3,4-庚二酮、2,5-二甲基-3,4-庚二醇、2,5-二甲基-3,4-庚二酮、2,6-二甲基-3-羟基-4-庚酮、2,6-二甲基-4-羟基-3-庚酮、2,5-二甲基-3-羟基-4-庚酮、2,5-二甲基-4-羟基-3-庚酮、正-辛烷、1-辛烯、2-辛烯、1-辛醇、辛醛、辛酸盐(octanoate)、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4,5-辛二醇、4,5-辛二酮、4-羟基-5-辛酮、2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲基-4,5-辛二醇、2-甲基-4,5-辛二酮、3-甲基-4,5-辛二醇、3-甲基-4,5-辛二酮、2-甲基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟基-4-辛酮、2,7-二甲基辛烷、2,7-二甲基-3-辛烯、2,7-二甲基-4-辛烯、2,7-二甲基-4-辛醇、2,7-二甲基-4-辛酮、2,7-二甲基-4,5-辛二醇、2,7-二甲基-4,5-辛二酮、2,7-二甲基-4-羟基-5-辛酮、2,6-二甲基辛烷、2,6-二甲基-3-辛烯、2,6-二甲基-4-辛烯、3,7-二甲基-3-辛烯、2,6-二甲基-4-辛醇、3,7-二甲基-4-辛醇、2,6-二甲基-4-辛酮、3,7-二甲基-4-辛酮、2,6-二甲基-4,5-辛二醇、2,6-二甲基-4,5-辛二酮、2,6-二甲基-4-羟基-5-辛酮、2,6-二甲基-5-羟基-4-辛酮、3,6-二甲基辛烷、3,6-二甲基-3-辛烯、3,6-二甲基-4-辛烯、3,6-二甲基-4-辛醇、3,6-二甲基-4-辛酮、3,6-二甲基-4,5-辛二醇、3,6-二甲基-4,5-辛二酮、3,6-二甲基-4-羟基-5-辛酮、正-壬烷、1-壬烯、1-壬醇、壬醛、壬酸盐、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基-5-壬醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基-4,5-壬二醇、8-甲基-4,5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2,8-二甲基壬烷、2,8-甲基-3-壬烯、2,8-二甲基-4-壬烯、2,8-二甲基-5-壬烯、2,8-二甲基-4-壬醇、2,8-二甲基-5-壬醇、2,8-二甲基-4-壬酮、2,8-二甲基-5-壬酮、2,8-二甲基-4,5-壬二醇、2,8-二甲基-4,5-壬二酮、2,8-二甲基-4-羟基-5-壬酮、2,8-二甲基-5-羟基-4-壬酮、2,7-二甲基壬烷、3,8-二甲基-3-壬烯、3,8-二甲基-4-壬烯、3,8-二甲基-5-壬烯、3,8-二甲基-4-壬醇、3,8-二甲基-5-壬醇、3,8-二甲基-4-壬酮、3,8-二甲基-5-壬酮、3,8-二甲基-4,5-壬二醇、3,8-二甲基-4,5-壬二酮、3,8-二甲基-4-羟基-5-壬酮、3,8-二甲基-5-羟基-4-壬酮、正-癸烷、1-癸烯、1-癸醇、癸酸盐、2,9-二甲基癸烷、2,9-二甲基-3-癸烯、2,9-二甲基-4-癸烯、2,9-二甲基-5-癸醇、2,9-二甲基-5-癸酮、2,9-二甲基-5,6-癸二醇、2,9-二甲基-6-羟基-5-癸酮、2,9-二甲基-5,6-癸二酮、正-十一烷、1-十一碳烯、1-十一烷醇、十一醛、十一酸盐、正-十二烷、1-十二碳烯、1-十二烷醇、十二醛、十二酸盐、正-十二烷、1-decadecene、1-十二烷醇、十二醛、十二酸盐、正-十三烷、1-十三碳烯、1-十三烷醇、十三醛、十三酸盐、正-十四烷、1-十四碳烯、1-十四烷醇、十四醛、十四酸盐、正-十五烷、1-十五碳烯、1-十五烷醇、十五醛、十五酸盐、正-十六烷、1-十六碳烯、1-十六烷醇、十六醛、十六酸盐、正-十七烷、1-十七碳烯、1-十七烷醇、十七醛、十七酸盐、正-十八烷、1-十八碳烯、1-十八烷醇、十八醛、十八酸盐、正-十九烷、1-十九碳烯、1-十九烷醇、十九醛、十九酸盐、二十烷、1-二十碳烯、1-二十烷醇、二十醛、二十酸盐、3-羟基丙醛、1,3-丙二醇、4-羟基丁醛、1,4-丁二醇、3-羟基-2-丁酮、2,3-丁二醇、1,5-戊二醇、高柠檬酸盐、高异柠檬酸盐、b-羟基己二酸盐、戊二酸盐、glutarsemialdehyde、戊二醛、2-羟基-1-环戊酮、1,2-环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2,3-二羟基-异戊酸盐、2-氧代异戊酸盐、异丁酰辅酶A、异丁酸盐、异丁醛、5-氨基戊醛、1,10-二氨基癸烷、1,10-二氨基-5-癸烯、1,10-二氨基-5-羟基癸烷、1,10-二氨基-5-癸酮、1,10-二氨基-5,6-癸二醇、1,10-二氨基-6-羟基-5-癸酮、苯乙醛(phenylacetoaldehyde)、1,4-二苯基丁烷、1,4-二苯基-1-丁烯、1,4-二苯基-2-丁烯、1,4-二苯基-2-丁醇、1,4-二苯基-2-丁酮、1,4-二苯基-2,3-丁二醇、1,4-二苯基-3-羟基-2-丁酮、1-(4-羟苯基)-4-苯基丁烷、1-(4-羟苯基)-4-苯基-1-丁烯、1-(4-羟苯基)-4-苯基-2-丁烯、1-(4-羟苯基)-4-苯基-2-丁醇、1-(4-羟苯基)-4-苯基-2-丁酮、1-(4-羟苯基)-4-苯基-2,3-丁二醇、1-(4-羟苯基)-4-苯基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲哚-3)-4-苯基-2-丁烯、1-(吲哚-3)-4-苯基-2-丁醇、1-(吲哚-3)-4-苯基-2-丁酮、1-(吲哚-3)-4-苯基-2,3-丁二醇、1-(吲哚-3)-4-苯基-3-羟基-2-丁酮、4-羟苯基乙醛、1,4-二(4-羟苯基)丁烷、1,4-二(4-羟苯基)-1-丁烯、1,4-二(4-羟苯基)-2-丁烯、1,4-二(4-羟苯基)-2-丁醇、1,4-二(4-羟苯基)-2-丁酮、1,4-二(4-羟苯基)-2,3-丁二醇、1,4-二(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-4-(吲哚-3-)丁烷、1-(4-羟苯基)-4-(吲哚-3)-1-丁烯、1-二(4-羟苯基)-4-(吲哚-3)-2-丁烯、1-(4-羟苯基)-4-(吲哚-3)-2-丁醇、1-(4-羟苯基)-4-(吲哚-3)-2-丁酮、1-(4-羟苯基)-4-(吲哚-3)-2,3-丁二醇、1-(4-羟苯基-4-(吲哚-3)-3-羟基-2-丁酮、吲哚-3-乙醛、1,4-二(吲哚-3-)丁烷、1,4-二(吲哚-3)-1-丁烯、1,4-二(吲哚-3)-2-丁烯、1,4-二(吲哚-3)-2-丁醇、1,4-二(吲哚-3)-2-丁酮、1,4-二(吲哚-3)-2,3-丁二醇、1,4-二(吲哚-3)-3-羟基-2-丁酮、琥珀酸半醛、己烷-1,8-二羧酸、3-己烯-1,8-二羧酸、3-羟基-己烷-1,8-二羧酸、3-己酮-1,8-二羧酸、3,4-己二醇-1,8-二羧酸、4-羟基-3-己酮-1,8-二羧酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾以及磷酸盐。
本发明的某些实施方案包括将多糖转化为适宜的单糖或寡糖的方法,包括(a)使多糖与微生物系统接触足以将所述多糖转化为适宜的单糖或寡糖的时间,其中所述多糖任选地由生物质获得,其中所述微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因,其中该裂解酶和/或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域(autotransporter domain);(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白及超通道(superchannel);以及(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶,从而将多糖转化为适宜的单糖或寡糖。
本发明的某些实施方案包括将多糖转化为适宜的单糖或寡糖的方法,包括(a)使多糖与化学或酶促催化途径接触足以将所述多糖转化为第一单糖或寡糖的时间,其中所述多糖任选地由生物质获得,和(b)使第一单糖或寡糖与微生物系统接触足以将第一单糖或寡糖转化为适宜的单糖或寡糖的时间,其中所述微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因,(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白及超通道;以及(iii)至少一个编码和表达酶的基因,从而将多糖转化为适宜的单糖或寡糖,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。
在某些方面,裂解酶选自藻酸盐裂解酶、果胶酸裂解酶、多聚甘露糖醛酸裂解酶(polymannuronate lyase)、多聚葡糖酸裂解酶(polygluronatelyase)、多聚半乳糖醛酸裂解酶以及鼠李聚糖半乳糖醛酸裂解酶。在某些方面,水解酶选自藻酸盐水解酶、鼠李聚糖半乳糖醛酸水解酶、多聚甘露糖醛酸水解酶、果胶水解酶以及多聚半乳糖醛酸水解酶。在某些方面,转运蛋白选自ABC转运蛋白、同向转运蛋白(symporter)以及外膜孔蛋白。在某些方面,ABC转运蛋白选自Atu3021、Atu3022、Atu3023、Atu3024、algM1、algM2、AlgQ1、AlgQ2、AlgS、OG2516_05558、OG2516_05563、OG2516_05568、OG2516_05573、TogM、TogN、TogA、TogB和其功能变体。在某些方面,同向转运蛋白选自V12B01_24239(SEQ ID NO:26)、V12B01_24194(SEQ ID NO:8)和TogT,以及其功能变体。在某些方面,外膜孔蛋白包括选自V12B01_24269、KdgM和KdgN的孔蛋白及其功能变体。
某些实施方案包括能在作为唯一碳源的多糖上生长的重组微生物,其中所述多糖选自藻酸盐、果胶、三-半乳糖醛酸盐、二半乳糖醛酸盐、纤维素以及半纤维素。在某些方面,多糖是藻酸盐。在某些方面,多糖是果胶。在某些方面,多糖是三半乳糖醛酸盐。
某些实施方案包括重组的微生物,其包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因,其中所述裂解酶或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域;(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白以及超通道;以及(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。在某些方面,微生物能在作为唯一碳源的多糖上生长。在某些方面,多糖选自藻酸盐、果胶以及三半乳糖醛酸盐。
某些实施方案包括将适宜的单糖或寡糖转化为第一大量生产型化学品的方法,包括(a)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖或寡糖转化为大量生产型化学品的时间,其中所述微生物系统包含重组的微生物,其中所述微生物包含大量生产型化学品生物合成途径,从而将适宜的单糖或寡糖转化为第一大量生产型化学品。在某些方面,大量生产型化学品途径包括一个或多个编码醛或酮生物合成途径的基因。
在某些方面,醛或酮生物合成途径选自乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛、2-吲哚-3-乙醛、戊二醛、5-氨基-戊醛、琥珀酸半醛以及琥珀酸4-羟苯基乙醛生物合成途径中的一个或多个。在某些方面,醛或酮生物合成途径包含乙醛生物合成途径和选自丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
在某些方面,醛或酮生物合成途径包含丙醛生物合成途径和选自丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛以及苯乙醛生物合成途径的生物合成途径。在某些方面,醛或酮生物合成途径包含丁醛生物合成途径和选自异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。在某些方面,醛或酮生物合成途径包含异丁醛生物合成途径和选自2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径中的生物合成途径。
在某些方面,醛或酮生物合成途径包含2-甲基-丁醛生物合成途径和选自3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。在某些方面,醛或酮生物合成途径包含3-甲基-丁醛生物合成途径以及选自2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。在某些方面,醛或酮生物合成途径包含2-苯乙醛生物合成途径和选自2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
在某些方面,醛或酮生物合成途径包含2-(4-羟苯基)乙醛生物合成途径和2-吲哚-3-乙醛生物合成途径。在某些方面,第一大量生产型化学品进一步被酶促和/或化学还原和脱水为第二大量生产型化学品。
某些实施方案包括将适宜的单糖或寡糖转化为大量生产型化学品的方法,包括(a)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖或寡糖转化为大量生产型化学品的时间,其中所述微生物系统包含:(i)一个或多个编码和表达醛生物合成途径的基因,其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因;以及(ii)一个或多个编码和表达醛还原酶的基因,从而将适宜的单糖或寡糖转化为大量生产型化学品。在某些方面,脱羧酶是吲哚-3-丙酮酸脱羧酶(IPDC)。在某些方面,IPDC包含与SEQ ID NO:312所示的氨基酸序列至少80%、90%、95%、98%或99%同一(identical)的氨基酸序列。在某些方面,醛还原酶是苯乙醛还原酶(PAR)。在某些方面,PAR包含与SEQ ID NO:313所示氨基酸序列至少80%、90%、95%、98%或99%同一的氢基酸序列。在某些方面,大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。
某些实施方案包括重组微生物,其包含(i)一个或多个编码和表达醛生物合成途径的基因,其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因;以及(ii)一个或多个编码和表达醛还原酶的基因。在某些方面,醛生物合成途径还包含一个或多个编码和表达酶的基因,所述酶选自辅酶A连接的醛脱氢酶、醛脱氢酶以及醇脱氢酶。在某些方面,脱羧酶是吲哚-3-丙酮酸脱羧酶(IPDC)。在某些方面,醛还原酶是苯乙醛还原酶(PAR)。在某些方面,微生物能将适宜的单糖或寡糖转化为大量生产型化学品。在某些方面,大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。
某些实施方案包括重组微生物,其中该微生物包含与野生型微生物相比降低的乙醇产生能力。在某些方面,该微生物包含乙酰辅酶A向乙醇转化的减少或抑制。在某些方面,该重组微生物包含乙醇脱氢酶的减少,从而提供降低的乙醇产生能力。在某些方面,乙醇脱氢酶是adhE、其同源物或变体。在某些方面,该微生物包含adhE、其同源物或变体的缺失或敲除。在某些方面,该重组微生物包括编码酶的基因中的一个或多个缺失或敲除,所述酶选自催化乙酰辅酶A转化为乙醇的酶、催化丙酮酸盐转化为乳酸盐的酶、催化延胡索酸盐转化为琥珀酸盐的酶、催化乙酰辅酶A和磷酸盐转化为辅酶A和乙酰磷酸盐的酶、催化乙酰辅酶A和甲酸盐转化为辅酶A和丙酮酸盐的酶以及催化α-酮酸转化为支链氨基酸的酶。
某些实施方案包括,其中本文所述的微生物系统或重组微生物包括选自以下的微生物:醋化醋酸杆菌(Acetobacter aceti)、无色杆菌(Achromobacter)、嗜酸菌(Acidiphilium)、不动杆菌(Acinetobacter)、马杜拉放线菌(Actinomadura)、游动放线菌(Actinoplanes)、敏捷好氧炽热球菌(Aeropyrum pernix)、农杆菌(Agrobacterium)、产碱杆菌(Alcaligenes)、菠萝(Ananas comosus)(M)、节杆菌(Arthrobacter)、黑曲霉(Aspargillus niger)、米曲霉(Aspargillus oryze)、蜜蜂曲霉(Aspergillus melleus)、粉状曲霉(Aspergillus pulverulentus)、斋藤曲霉(Aspergillus saitoi)、酱油曲霉(Aspergillus sojea)、宇佐美曲霉(Aspergillus usamii)、嗜碱芽孢杆菌(Bacillusalcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、浸麻芽孢杆菌(Bacillus macerans)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、双歧杆菌(Bifidobacterium)、短短芽孢杆菌(Brevibacillus brevis)、洋葱伯克霍尔德氏菌(Burkholderia cepacia)、圆柱念珠菌(Candida cylindracea)、皱褶念珠菌(Candida rugosa)、番木瓜(Carica papaya)(L)、纤维微菌(Cellulosimicrobium)、头孢霉菌(Cephalosporium)、变动毛壳菌(Chaetomiumerraticum)、细丽毛壳菌(Chaetomium gracile)、梭菌(Clostridium)、丁酸梭菌(Clostridium butyricum)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维素梭菌(Clostridium thermocellum)、(谷氨酸)棒杆菌(Corynebacterium(glutamicum))、Corynebacterium efficiens、大肠杆菌(Escherichia coli)、肠球菌(Enterococcus)、菊欧文氏菌(Erwina chrysanthemi)、葡糖酸杆菌(Gliconobacter)、葡糖酸醋酸杆菌(Gluconacetobacter)、盐盒菌(Haloarcula)、特异腐质霉(Humicola insolens)、Humicola nsolens、西唐北里孢菌(Kitasatospora setae)、克雷伯氏菌(Klebsiella)、产酸克雷伯氏菌(Klebsiella oxytoca)、克鲁维酵母(Kluyveromyces)、脆壁克鲁维酵母(Kluyveromyces fragilis)、乳酸克鲁维酵母(Kluyveromyces lactis)、库克菌(Kocuria)、Lactlactis、乳酸杆菌(Lactobacillus)、发酵乳酸杆菌(Lactobacillusfermentum)、清酒乳酸杆菌(Lactobacillus sake)、乳球菌(Lactococcus)、乳酸乳球菌(Lactococcus lactis)、明串珠菌(Leuconostoc)、甲基孢囊菌(Methylocystis)、西西里甲烷叶菌(Methanolobus siciliae)、嗜器官产甲烷菌(Methanogenium organophilum)、布氏甲杆菌(Methanobacterium bryantii)、蛾微杆菌(Microbacterium imperiale)、溶壁微球菌(Micrococcuslysodeikticus)、小月菌(Microlunatus)、爪哇毛霉(Mucor javanicus)、分枝杆菌(Mycobacterium)、漆斑菌(Myrothecium)、硝化杆菌(Nitrobacter)、亚硝化单胞菌(Nitrosomonas)、诺卡氏菌(Nocardia)、番木瓜(Papaya carica)、片球菌(Pediococcus)、嗜盐片球菌(Pediococcus halophilus)、青霉菌(Penicillium)、产黄青霉(Penicillium camemberti)、橘青霉(Penicilliumcitrinum)、埃默森青霉(Penicillium emersonii)、娄地青霉(Penicilliumroqueforti)、淡紫青霉(Penicillum lilactinum)、多色青霉(Penicillummulticolor)、好氧反硝化菌(Paracoccus pantotrophus)、丙酸杆菌(Propionibacterium)、假单胞菌(Pseudomonas)、荧光假单孢菌(Pseudomonasfluorescens)、脱氮假单胞杆菌(Pseudomonas denitrificans)、火球菌(Pyrococcus)、激烈火球菌(Pyrococcus furiosus)、堀野氏火球菌(Pyrococcushorikoshii)、根癌菌(Rhizobium)、米黑根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucor pusillus Lindt)、根霉(Rhizopus)、德氏根霉(Rhizopusdelemar)、东京根霉(Rhizopus japonicus)、雪白根霉(Rhizopus niveus)、米根霉(Rhizopus oryzae)、少孢根霉(Rhizopus oligosporus)、红球菌(Rhodococcus)、酿酒酵母(Sccharomyces cerevisiae)、Sclerotina libertina、多食鞘氨醇杆菌(Sphingobacterium multivorum)、鞘氨醇杆菌(Sphingobium)、鞘胺醇单胞菌(Sphingomonas)、链球菌(Streptococcus)、嗜热链球菌(Streptococcus thermophilus)Y-1、链霉菌(Streptomyces)、灰色链霉菌(Streptomyces griseus)、变铅青链霉菌(Streptomyces lividans)、鼠灰链霉菌(Streptomyces murinus)、锈棕色链霉菌(Streptomyces rubiginosus)、紫红链霉菌(Streptomyces violaceoruber)、茂原链轮丝菌(Streptoverticilliummobaraense)、四体球菌(Tetragenococcus)、栖热菌(Thermus)、泛养硫球菌(Thiosphaera pantotropha)、栓菌(Trametes)、木霉(Trichoderma)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、潘氏丝孢酵母(Trichosporon penicillatum)、溶藻弧菌(Vibrio alginolyticus)、黄单胞菌(Xanthomonas)、酵母(yeast)、鲁氏接合酵母(Zygosaccharomyces rouxii)、发酵单胞菌(Zymomonas)以及运动发酵单胞菌(Zymomonus mobilis)。
某些实施方案包括通过本文所述方法产生的大量生产型化学品。某些方面包括混合的大量生产型化学品,其包含本文提供的方法所产生的大量生产型化学品以及精炼的石油产品。在某些方面,大量生产型化学品选自C10-C12烃、2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。在某些方面,C10-C12烃选自2,7-二甲基辛烷和2,9-二甲基癸烷。在某些方面,精炼的石油产品选自喷气燃料和柴油燃料。
某些实施方案包括产生富大量生产型化学品的精炼的石油产品的方法,包括(a)将精炼的石油产品与通过本文所述方法产生的大量生产型化学品混合,从而产生富大量生产型化学品的精炼的石油产品。
发明详述
本发明的实施方案涉及意外的发现,即以其它方式不能生长于作为唯一碳源的衍生于生物质的某些多糖上的微生物,经基因工程化,可以在作为唯一碳源的这些多糖上生长。此类微生物可以包括原核微生物和真核微生物两者,如细菌和酵母。在某些方面,大肠杆菌的某些实验室和/或野生型菌株可以经基因工程化生长于作为唯一碳源的衍生于藻酸盐或果胶的生物质上,以产生适宜的单糖或其它分子。除对本领域技术人员显而易见的其它用途,这些工程化或重组微生物在藻酸盐或果胶上的生长所产生的单糖和其它分子,可以用作产生各种大量生产型化学品如生物燃料的给料。
在生物燃料给料的生产方面,相对于其它生物质来源,藻酸盐和果胶提供了优势。例如,大规模水产养殖(aquatic-farming)可以产生显著量的生物质,而无需用能量作物生产替代粮食作物生产,无需采伐森林和再耕种当前未耕种的土地,因为大部分水圈,包括海洋、河流和湖泊,仍然未使用。作为一特定实例,北美洲的太平洋海岸有丰富的大规模水产养殖所需的矿质。巨藻生活在该地区,以快至1m/日的速度生长,是地球上植物中速度最快的,且生长可达50m。另外,水产养殖具有其它的优点,包括防止红潮爆发和产生对鱼类友好的环境。
作为其它优势,且与木质纤维素生物质相反,衍生于水生有机物、果实、植物和/或蔬菜来源的生物质易于降解。此类生物质通常缺少木质素,且比木质纤维素生物质显著更脆且利用酶或化学催化剂(如甲酸盐)易于降解。作为一实例,利用酶或化学催化剂,水生生物质如海藻可以很容易地转化为单糖,因为海藻所具有的主要的糖组分(藻酸盐:30%,甘露醇:15%)与木质纤维素(葡萄糖:24.1-39%,甘露糖:0.2-4.6%,半乳糖:0.5-2.4%,木糖:0.4-22.1%,阿拉伯糖:1.5-2.8%以及糖醛酸:1.2-20.7%,且总的糖含量对应于干重的36.5-70%)相比显著更简单。
作为另外的实例,来自植物如果实和/或蔬菜的生物质含有果胶,即衍生于植物细胞壁的杂多糖。果胶的特征结构是线性链的α-(1-4)-连接的D-半乳糖醛酸,其形成果胶主链即同型半乳糖醛酸聚糖(homogalacturonan)。如本文所述,利用酶、化学催化和/或经设计利用果胶作为碳源的微生物系统,可以容易地将果胶转化为寡糖或适宜的单糖。利用水生、果实和/或蔬菜生物质糖化和发酵比利用木质纤维素容易得多。
在这点上,本发明实施方案也涉及意料之外的发现,即某些微生物可以经过基因工程化产生各种大量生产型化学品如生物燃料。在某些方面,这些生物燃料可以包括链烷,如中到长链的链烷,其提供了优于基于乙醇的生物燃料的优势。在某些方面,各种工程化或重组微生物(如生长于作为碳源的果胶或藻酸盐上的重组微生物)的生长所产生的单糖(如2-酮-3脱氧D葡糖酸盐;KDG)和其它分子可以用于产生大量生产型化学品,如生物燃料。作为一实例,适宜的单糖如KDG,可以为重组微生物利用,以产生链烷,如中到长链的链烷及其它化学品。在某些方面,此类重组微生物可以用于产生如2,7-二甲基辛烷和2,9-二甲基癸烷的大量生产型化学品以及本文所提供的和本领域已知的化学品。
此类方法产生相对于其它生物燃料具有显著优势的生物燃料。特别是,中到长链链烷提供了许多相对于诸如乙醇和丁醇的现有常见生物燃料的重要优势,并且在将来是基于石油的燃料如汽油、柴油、煤油以及重油的引入注目的长期替代品。作为一实例,中到长链链烷和醇是所有石油产品和特别地喷气燃料的主要组分,因此我们生产的链烷可以为现有的发动机直接利用。作为另一实例,中到长链醇是比乙醇好得多的燃料,并且具有几乎可与汽油媲美的能量密度。
作为另一个实例,正-链烷是包括汽油、柴油、煤油以及重油的所有油产品的主要组分。微生物系统或重组微生物可以用来产生具有不同碳长度的正-链烷,所述长度的范围例如对于汽油(如机动车)为从C7到超过C20:C7,对于柴油(如机动车、火车、轮船)C10-C15,以及对于煤油(如航空和轮船)和所有的重油C8-C16。
作为本发明的一方面,本文所述方法和重组微生物所产生的大量生产型化学品可以为现有石油精炼厂利用,用来与传统精炼方法所产生的石油产品混合。为此,如上所述,燃料生产者正寻求实质相似的低碳燃料,其可以通过现有的基础设施(精炼厂、管道、油罐)混合并分送。作为烃,根据本文的方法所产生的大量生产型化学品与衍生于石油的燃料实质相似,将温室气体排放减少超过衍生于石油的燃料的80%,并且与油气工业现有的基础设施兼容。例如,某些本文所产生的大量生产型化学品,包括例如各种C10-C12烃如2,7二甲基辛烷、2,7二甲基癸酮等,可以直接混合成精炼的石油产品,如喷气和柴油燃料。通过利用此类生物产生的大量生产型化学品作为喷气和柴油燃料的混合原料(blendstock),精炼厂可以将温室气体排放减少超过80%。
因此,本发明的某些实施方案通常涉及将生物质转化为大量生产型化学品的方法,包括从生物质获得多糖;使多糖与多糖降解或解聚途径接触,从而将多糖转化为适宜的单糖。由此类方法获得的适宜的单糖可以用于任何所需目的。例如,在某些方面,通过使适宜的单糖与生物燃料生物合成途径接触(无论其是作为重组微生物的一部分、体外酶促或化学途径或其组合),从而将单糖转化为大量生产型化学品,可以将适宜的单糖转化为大量生产型化学品(如生物燃料)。
在其它方面,在产生大量生产型化学品如生物燃料时,本文所述,适宜的单糖可以直接从任何可用的来源获得,并通过使适宜的单糖与生物燃料生物合成途径接触,将其转化为大量生产型化学品。除了对本领域技术人员显而易见的其它用途外,此类生物燃料可以随后与精炼的石油产品如喷气和柴油燃料直接混合,以产生富大量生产型化学品的精炼的石油产品。
定义
除非另有定义,否则本文所用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员的通常理解相同的涵义。尽管与本文所述方法和材料相似或等同的任何方法和材料都可以用于实践或检验本发明,但是描述了优选的方法和材料。出于本发明的目的,下面定义了下列术语。本文引用的所有参考文献通过引用全文并入。
冠词“一个(a)和一个(an)”在本文中用于表示物品的一个或多个(即至少一个)语法客体。作为实例,“一个元件”意指一个或多个元件。
“约”意指比参照量、水平、值、数目、频率、百分比、尺度、大小、数量、重量或长度变化差不多30%、25%、20%、25%、10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的量、水平、值、数目、频率、百分比、尺度、大小、数量、重量或长度。
术语“生物活性片段”当用于参照多核苷酸或多肽序列的片段时,指具有至少约0.1%、0.5%、1%、2%、5%、10%、12%、14%、16%、18%、20%、22%、24%、26%、28%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、100%、110%、120%、150%、200%、300%、400%、500%、600%、700%、800%、900%、1000%或更多的参照序列活性的片段。
术语“参照序列”通常指具有本文所述生物活性的任何酶(如糖脱氢酶、醇脱氢酶、脱水酶、裂解酶、转运蛋白、脱羧酶、水解酶等)的核酸编码序列或氨基酸序列,如“野生型”序列,包括例如SEQ ID NOS:1-144和308-313所示的参照序列。参照序列也可以包括本文所述序列的天然存在的功能变体(即直系同源物(ortholog)或同源物)。
包括在本发明范围内的是,长至少约18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、500、600或更多(包括其间所有整数)的邻接(contiguous)核苷酸或氨基酸残基的生物活性片段,其包含或编码具有参照多核苷酸或多肽的酶促活性的多肽。代表性生物活性片段通常参与相互作用,例如分子内或分子间相互作用。分子间相互作用可以是特异性结合相互作用或酶促相互作用。酶促相互作用或活性的实例包括,除了本文所述的以外,糖脱氢酶活性、醇脱氢酶活性、脱水酶活性、裂解酶活性、转运蛋白活性、异构酶活性、激酶活性。生物活性片段通常包含一个或多个本文所述和本领域已知的活性位点或酶促/结合基序。
“编码核酸”意指有助于基因多肽产物密码的任何核酸序列。相反,术语“非编码序列”意指不能有助于基因多肽产物密码的任何核酸序列。
在本文说明书中,除非上下文另有要求,否则词语“包含(comprise)”、“包含(comprises)”以及“包含(comprising)”应理解为意味着包括所述步骤或元件或步骤组或元件组,但不排除任何其它步骤或元件或步骤组或元件组。
“由......组成”意指包括并限于短语“由......组成”后接的那些。因此,短语“由......组成”表示,所列元件是所需的或强制性的,且可以不存在其它元件。
“基本上由......组成”意指包括该短语后所列的任何元件,并限于不干扰或有助于所列元件公开内容中所指的活性或作用的其它元件。因此,短语“基本上由......组成”表示,所列元件是需要的或强制性的,但其它元件是任选的,并且可以存在于或可以不存在,取决于它们是否影响所列元件的活性或作用。
术语“互补”和“互补性”意指碱基配对法则相关的多核苷酸(即核苷酸序列)。例如,序列“A-G-T”与序列“T-C-A”互补。互补性可以是“部分的”,其中仅一些核酸碱基根据碱基配对法则匹配。或者,核酸间存在“完全的”或“全部的”互补性。核酸链间互补性的程度显著影响核酸链间杂交的效率和长度。
“对应于(correspond to)”或“对应于(corresponding to)”意指(a)具有核苷酸序列的多核苷酸,该核苷酸序列与参照多核苷酸序列的全部或部分基本上同一或互补,或编码与肽或蛋白的氨基酸序列同一的氨基酸序列的多核苷酸;或(b)具有氨基酸序列的肽或多肽,该氨基酸序列与参照肽或蛋白的氨基酸序列基本上同一。
“衍生物”意指通过修饰例如通过与其它化学部分偶联或复合(如PEG化(pegylation))或通过本领域所理解的翻译后修饰技术衍生自基本序列的多肽。术语“衍生物”在其范围也包括对亲本序列(parent sequence)已做的变化,包括提供功能等同分子的添加或缺失。
“酶反应条件”意指在环境中任何必需条件条件(如温度、pH、缺少抑制物质等因素)均可用,该条件允许酶发挥功能。酶反应条件可以是体外的,如在试管内,或体内的,如在细胞内。
本文所用术语“功能”和“功能的”等意指生物或酶促功能。
“基因”意指占据染色体上特定基因座且由转录和/或翻译调节序列和/或编码区和/或非翻译序列(即内含子、5’和3’未翻译的序列)组成的遗传单位。
“同源性”指同一或构成保守取代的氨基酸的百分比数量。同源性可以利用序列比较程序测定,如GAP(Deveraux et al.,1984,Nucleic AcidsResearch 12,387-395),在此通过引用将其并入。以此方式,可以通过将空位插入比对中,比较与本文所述的那些具有相似或实质不同长度的序列,所述空位的确定例如通过GAP所用比较算法。
术语“宿主细胞”包括个体细胞或细胞培养物,其可以是或已是本发明的任何重组载体或分离的多核苷酸的受体。宿主细胞包括单个宿主细胞的子代,以及该子代可以由于自然的、偶然的或蓄意的突变或变化而不必与最初的亲代细胞完全相同(在形态或总DNA互补物方面)。宿主细胞包括用本发明的重组载体或多核苷酸体内或体外转染、转化或感染的细胞。包含本发明的重组载体的宿主细胞,是重组宿主细胞、重组细胞或重组微生物。
“分离的”意指实质或基本上游离于在其天然状态时通常伴随它的组分的材料。例如,本文所用“分离的多核苷酸”指已从在天然存在状态时位于其侧翼的序列中纯化的多核苷酸,如已从序列中去除的DNA片段,该序列通常邻近所述片段。可选地,本文所用“分离的肽”或“分离的多肽”等指肽或多肽分子从其天然细胞环境中和从与细胞其它组分的结合中体外分离和/或纯化,即其与体内物质无结合。
“增加的”或“增加”意指与对照微生物如未修饰的微生物或差异修饰的微生物相比,一种或多种微生物产生更大量给定产物或分子(如大量生产型化学品、生物燃料或其中间产物)的能力。“增加的”量通常是“统计上显著的”量,并且可以包括未修饰微生物或差异修饰的微生物所产生量的1、2、3、4、5、6、7、8、9、10、15、20、30或更多倍数(包括其间所有整数和小数点,如1.5、1.6、1.7、1.8等)。
“获得自”意指样品如多核苷酸提取物或多肽提取物分离自或衍生于特定来源,如期望的生物,通常是期望的微生物。“获得自”也可以指多核苷酸或多肽序列分离自或衍生于特定生物或微生物的情况。例如,编码苯甲醛裂解酶的多核苷酸序列可以分离自多种原核或真核微生物,如假单胞菌(Pseudomonas)。
本文所用术语“可操作连接的”意指将基因置于启动子的调节控制下,该启动子随后控制该基因的转录和任选的翻译。在构建异源启动子/结构基因组合时,通常优选距离基因转录起始位点一定的距离放置基因序列或启动子,所述距离与该基因序列或启动子和其处于天然环境中时控制的基因间的距离大致相同;即衍生基因序列或启动子的基因。本领域已知,可以容纳这种距离的某些变化而不丢失功能。相似地,与待置于其控制下的异源基因有关的调节序列元件的优选定位受其天然环境中元件的定位限制;即衍生它的基因。“组成型启动子”通常在大多数条件下是有活性的,即启动子转录。“诱导型启动子”通常在某些条件下是有活性的,如在存在给定的分子因子(如IPTG)或给定的环境条件(如CO2浓度,营养水平、光、热)下。在缺少该条件时,诱导型启动子通常不允许显著的或可测量水平的转录活性。
本文所用的叙述“多肽”或“核酸”命名为mRNA、RNA、cRNA、rRNA、cDNA或DNA。该术语通常指长度至少为10个碱基的核苷酸(即核糖核苷酸或脱氧核糖核苷酸或核苷酸的任一类型的修饰形式)的聚合形式。该术语包括单链或双链形式的DNA。
本领域技术人员应当理解,本发明的多核苷酸序列包括基因组序列、基因组外和质粒编码的序列以及较小的工程化基因片段,其表达或可适用于表达蛋白、多肽、肽等。此类片段可以天然分离或人工合成修饰。
多核苷酸可以是单链的(编码或反义)或双链的,并且可以是DNA(基因组的、cDNA或合成的)或RNA分子。其它编码或非编码序列可以但非必须存在于本发明的多核苷酸内,且多核苷酸可以但非必须与其它分子和/或支持材料连接。
多核苷酸可以包含天然序列(即内源序列),或可以包含此类序列的变体或生物功能等同物。多核苷酸变体可以含有一个或多个取代、添加、缺失和/或插入,如下文所进一步描述的,优选地以致编码的多肽的酶促活性相对于未修饰的多肽未实质减少,且优选地以致编码的多肽的酶促活性相对于未修饰的多肽得到改善(如优化)。对编码的多肽的酶促活性的影响通常可按下文所述进行评价。
本发明的多核苷酸,不管其编码序列自身的长度如何,都可以与其它DNA序列结合,如启动子、多聚腺苷化信号、其它限制酶位点、多克隆位点、其它编码片段等,以致其全长可以进行相当的变化。因此所考虑的是,可以使用几乎任何长度的多核苷酸片段,其总长优选受到制备的便利性和意欲的重组DNA实验方案使用的便利性的限制。
术语“多核苷酸变体”和“变体”等指表现出与本文所述的任何参照多核苷酸序列或基因的实质序列同一性的多核苷酸,并指在下文限定的和本领域已知的低严格性、中等严格性、高严格性或很高的严格性条件下,与本文所述的任何多核苷酸参照序列或本文所述的任何基因或蛋白的任何多核苷酸编码序列杂交的多核苷酸。这些术语也包括通过至少一个核苷酸的添加、缺失或取代而不同于参照多核苷酸的多核苷酸。因此,术语“多核苷酸变体”和“变体”包括其中已添加、缺失一个或多个核苷酸或一个或多个核苷酸被不同的核苷酸取代的多核苷酸。因此,本领域充分理解的是,可以对参照多核苷酸进行包括突变、添加、缺失以及取代在内的某些改变,由此,改变的多核苷酸保持参照多核苷酸的生物功能或活性,或活性相对于参照序列已增加(即优化)。多核苷酸变体包括例如,与本文所述参照多核苷酸具有至少50%(和至少51%-至少99%以及其间所有整数百分比)序列同一性的多核苷酸。
术语“多核苷酸变体”和“变体”也包括编码这些酶的天然存在的等位基因变体。天然存在的变体的实例包括等位基因变体(同一基因座)、同源物(不同基因座)以及直系同源物(不同生物)。诸如这些的天然存在的变体可以利用熟知的分子生物学技术鉴定和分离,包括,例如本领域所知的各种聚合酶链式反应(PCR)和基于杂交的技术。天然存在的变体可以从编码一个或多个具有本文所述的适宜的酶促活性(如C-C连接酶、二醇脱氢酶、果胶酸裂解酶、藻酸盐裂解酶、二醇脱水酶、转运蛋白等)的基因的任何生物分离。
非天然存在的变体可以通过诱变技术制备,所述诱变技术包括应用于多核苷酸、细胞或生物的诱变技术。变体可以含有核苷酸取代、缺失、颠换以及插入。变异可以发生于编码区和非编码区两者或者两者之一中。在某些方面,非天然存在的变体可以已经优化用于给定的微生物(如大肠杆菌)中,所述优化如通过基因工程化和筛选活性、稳定性或任何其它期望的特征增加的酶。变异既可以产生保守氨基酸取代也可以产生非保守氨基酸取代(与最初编码的产物相比)。对于核苷酸序列而言,保守变体包括由于遗传密码的简并性编码参照多肽的氨基酸序列的序列。变异的核苷酸序列也可以包括以合成方式衍生的核苷酸序列,如通过例如使用定点诱变所产生的但仍然编码生物活性多肽的核苷酸序列。通常,特定参照核苷酸序列的变体,与该特定核苷酸序列具有至少约30%、40%、50%、55%、60%、65%、70%,通常至少约75%、80%、85%、90%至95%或更多、甚至约97%或98%或更多的序列同一性,这可由本文其它部分所述的序列比对程序利用缺省参数进行测定。
本文所述术语“在低严格性、中等严格性、高严格性或很高的严格性条件下杂交”描述了杂交和洗涤的条件。进行杂交反应的指南可见于Ausubel et al.,“Current Protocols in Molecular Biology(现代分子生物学实验技术)”,John Wiley & Sons Inc,1994-1998,第6.3.1-6.3.6部分。水性和非水性方法描述与该参考文献中,并且也可以使用。
本文中“低严格性”条件的涵义包括并包含用于42℃下杂交的至少约1%v/v-至少约15%v/v的甲酰胺和至少约1M-至少约2M的盐,以及用于42℃下洗涤的至少约1M-至少约2M的盐。低严格性条件也可以包括用于65℃下杂交的1%牛血清白蛋白(BSA)、1mM EDTA、0.5MNaHPO4(pH 7.2)、7%SDS,以及用于在室温下洗涤的(i)2×SSC、0.1%SDS;或(ii)0.5%BSA、1mM EDTA、40mM NaHPO4(pH 7.2)、5%SDS。低严格性条件的一个实施方案包括在6×氯化钠/柠檬酸钠(SSC)中、约45℃下杂交,随后在0.2×SSC、0.1%SDS中,至少50℃下,进行两次洗涤(对于低严格性条件而言,洗涤的温度可以增加到55℃)。
“中等严格性”条件包括和包含用于在42℃下杂交的至少约16%v/v-至少约30%v/v的甲酰胺和至少约0.5M-至少约0.9M的盐,和用于在55℃下洗涤的至少约0.1M-至少约0.2M的盐。中等严格性条件也可以包括用于在65℃下杂交的1%牛血清白蛋白(BSA)、1mM EDTA、0.5M NaHPO4(pH 7.2)、7%SDS,和用于60-65℃下洗涤的(i)2×SSC、0.1%SDS;或(ii)0.5%BSA、1mM EDTA、40mM NaHPO4(pH 7.2)、5%SDS。中等严格性条件的一个实施方案包括在6×SSC中、约45℃下杂交,随后在0.2×SSC、0.1%SDS中,60℃下,进行一次或多次洗涤。
“高严格性”条件包括和包含用于在42℃下杂交的至少约31%v/v-至少约50%v/v的甲酰胺和约0.01M-约0.15M的盐,和用于在55℃下洗涤的约0.01M-约0.02M的盐。高严格性条件也可以包括用于在65℃下杂交的1%BSA、1mM EDTA、0.5M NaHPO4(pH 7.2)、7%SDS,和用于在高于65℃的温度下洗涤的(i)0.2×SSC、0.1%SDS;或(ii)0.5%BSA、1mM EDTA、40mM NaHPO4(pH 7.2)、1%SDS。高严格性条件的一个实施方案包括在6×SSC中、约45℃下杂交,随后在0.2×SSC、0.1%SDS中,65℃下,进行一次或多次洗涤。
“很高的严格性”条件的一个实施方案包括在0.5M磷酸钠、7%SDS中,65℃下杂交,随后在0.2×SSC、1%SDS中,65℃下,进行一次或多次洗涤。
其它严格性条件在本领域内是熟知的,且本领域技术人员应当认识到,可以操作使用各种因素,优化杂交的特异性。最终洗涤的严格性的优化,可以用来确保高程度杂交。对于详细的实例,参阅Ausubel et al.(同上)的第2.10.1-2.10.16页和Sambrook et al.,Current Protocols in MolecularBiology(现代分子生物学实验技术)(1989)的第1.101-1.104部分。
尽管通常在约42℃-68℃下进行严格洗涤,但本领域技术人员应当理解,其它温度也可以适于严格条件。最大杂交速率于通常在低于形成DNA-DNA杂合体的Tm约20℃-25℃下发生。本领域已充分了解的是,Tm是解链温度或两条互补多核苷酸序列解离的温度。推测Tm的方法在本领域内是熟知的(参阅Ausubel et al.(同上),第2.10.8页)。
通常,完美匹配的DNA双链体的Tm的近似值可以通过公式预测:Tm=81.5+16.6(log10M)+0.41(%G+C)-0.63(%甲酰胺)-(600/长度),其中:M是Na+的浓度,优选范围为0.01-0.4摩尔;%G+C是鸟苷和胞嘧啶碱基之和与碱基总数的百分比,其范围为30%-75%G+C;%甲酰胺是按体积计的甲酰胺浓度百分比;长度是DNA双链体中碱基对的数目。随着随机错配碱基对数量每增加1%,双链体DNA的Tm即降低约1℃。洗涤对于高严格性而言,通常在Tm-15℃下进行,或对于中等严格性而言,在Tm-30℃下进行。
在杂交方法的一个实例中,将含有固定化DNA的膜(如硝酸纤维素膜或尼龙膜)在含有标记的探针的杂交缓冲液(50%去离子剂甲酰胺、5×SSC、5×Reinhardt溶液(0.1%fecal、0.1%聚乙烯吡咯烷酮以及0.1%牛血清白蛋白)、0.1%SDS以及200mg/mL变性的鲑鱼精子DNA)中、42℃下杂交过夜。随后将膜进行两次依次中等严格性洗涤(即45℃下2×SSC、0.1%SDS中15分钟,随后50℃下2×SSC、0.1%SDS中15分钟),随后两次依次更高的严格性洗涤(即55℃下0.2×SSC、0.1%SDS中12分钟,随后65-68℃下0.2×SSC和0.1%SDS溶液中12分钟)。
利用多种本领域内已知的和可用的良好建立的技术中的任何技术,可以制备、操作和/或表达多核苷酸和其融合物。例如,编码本发明的多肽、其融合蛋白或功能等同物的多核苷酸,可以用于重组DNA分子中,指导所选择的酶在适当的宿主细胞中表达。由于遗传密码的固有简并性,也可以产生编码实质上相同或功能等同氨基酸序列的其它DNA序列,且这些序列也可以用来克隆和表达给定的多肽。
本领域技术人员应当理解的是,产生拥有非天然存在的密码子的编码多肽的核苷酸序列,在某些情况下可以是有利的。例如,特定原核或真核宿主偏爱的密码子可以经选择以增加蛋白表达的速率,或产生具有期望的特性的重组RNA转录物,所述特性如比由天然存在的序列所产生的转录物更长的半衰期。此类核苷酸通常称为“密码子优化的”。任何本文所述的核苷酸序列可以用于此类“密码子优化的”形式。例如,来自荧光假单胞菌的苯甲醛裂解酶的核苷酸编码序列可以进行密码子优化,用于在大肠杆菌中表达。
而且,本发明的多核苷酸序列可以利用本领域通常所知的方法进行工程化,以便出于多种原因改变多肽编码序列,所述原因包括但不限于修饰基因产物的克隆、加工、表达和/或活性的改变。
为了表达期望的多肽,可以将编码多肽的核苷酸序列或其功能等同物插入适当的表达载体中,即含有插入的编码序列的转录和翻译所需的元件的载体。可以用本领域技术人员熟知的方法构建含有编码目的多肽的序列和适当的转录及翻译控制元件的表达载体。这些方法包括体外重组DNA技术、合成技术以及体内基因重组。此类技术描述于Sambrook etal.,Molecular Cloning,A Laboratory Manual(分子克隆,实验室手册)(1989)和Ausubel et al.,Current Protocols in Molecular Biology(1989)中。
“多肽”、“多肽片段”、“肽”以及“蛋白”在本文中交换使用,指氨基酸残基的多聚体,并且指其变体和合成的类似物。因此,这些术语适用于氨基酸多聚体,其中一个或多个氨基酸残基是合成的非天然存在的氨基酸,如相应的、天然存在的氨基酸的化学类似物,以及适用于天然存在的氨基酸多聚体。在某些方面,多肽可以包括酶促多肽或“酶“,其通常催化各种化学反应(即增加其速率)。
多肽“变体”这一叙述指通过至少一个氨基酸残基的添加、缺失或取代而不同于参照多肽序列的多肽。在某些实施方案中,多肽变体通过一个或多个取代不同于参照序列,该取代可以是保守的或非保守的。在某些实施方案中,多肽变体包含保守取代,因此,本领域充分理解的是,某些氨基酸可以变成具有广泛相似特性的其它氨基酸,而不改变多肽的活性特性。多肽变体也包括其中已添加、缺失一个或多个氨基酸或一个或多个氨基酸被不同氨基酸残基取代的多肽。
本发明考虑到具有本文所述任何酶促活性的全长多肽的变体、这些全长多肽的截短的片段、截短的片段的变体以及其相关的生物活性片段在本文所述方法中的使用。通常,多肽的生物活性片段可参与相互作用,例如,分子内或分子间相互作用。分子间相互作用可以是特异性结合相互作用或酶促相互作用(如相互作用可以是瞬时的和形成或打开共价键)。具有本文所述酶促活性的多肽/酶的生物活性片段包括这样的肽,该肽包含与(推断的)全长参照多肽序列的氨基酸序列充分相似或由其衍生的氨基酸序列。通常生物活性片段包含具有至少一个酶促活性的结构域或基序,并且可以包括各种活性结构域中的一个或多个(且在某些情况下,所有的结构域)。酶的生物活性片段可以是多肽片段,其例如为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、220、240、260、280、300、320、340、360、380、400、450、500、600或更多(包括其中的整数)个参照多肽序列的邻接氨基酸。在某些实施方案中,生物活性片段包含保守的酶促序列、结构域或基序,如本文其它地方所述和本领域所知的。适宜的是,生物活性片段的活性不低于衍生它的野生型多肽活性的约1%、10%、25%、50%。
术语“外源的”通常指不天然存在于野生型细胞或生物中、但通常通过分子生物学技术引入细胞即进行基因工程产生重组微生物的多核苷酸序列或多肽。“外源”多核苷酸的实例包括编码期望的蛋白或酶的载体、质粒和/或人造核酸构建体。术语“内源的”通常指可以见于给定的野生型细胞或生物中的天然存在的多核苷酸序列或多肽。例如,某些天然存在的细菌或酵母种类通常不含有苯甲醛裂解酶基因,因而不包含编码苯甲醛裂解酶的“内源”多核苷酸序列。因此,还应指出,尽管生物可以包含给定多核苷酸序列或基因的内源拷贝,但是引入编码该序列的质粒或载体以便例如过表达所编码蛋白或调节所编码蛋白的表达,表示该基因或多核苷酸序列的“外源”拷贝。任何本文所述的途径、基因或酶,都可以利用或依赖“内源”序列,或可以被提供而作为一个或多个“外源”多核苷酸序列,和/或可以根据已含于给定微生物内的内源序列来使用。
“重组”微生物通常包含一个或多个外源核苷酸序列,如在质粒或载体中的外源核苷酸序列。
本文所用的“序列同一性”这一叙述,或者例如包括“与......50%同一的序列”,指在比较窗中基于核苷酸与核苷酸或者氨基酸与氨基酸的序列同一程度。因此“序列同一性百分比”的计算可以通过以下进行:在比较窗内比较最佳比对的序列,测定在两条序列中均存在同一核酸碱基(如A、T、C、G、I)或同一氨基酸残基(如Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys以及Met)的位置的数量,以产生匹配位置的数量,以匹配位置的数量除以比较窗中位置的总数(即窗口大小),以及以100乘以所得结果,获得序列同一性百分比。
用于描述两个或更多个多核苷酸或多肽间序列关系的术语包括“参照序列”、“比较窗”、“序列同一性”、“序列同一性百分比”以及“实质同一性”。“参照序列”是长至少12但经常是15-18且通常至少25的单体单元(monomer unit),所述单体单元包括核苷酸和氨基酸残基。因为两个多核苷酸中每一个都可以包含(1)在两个多核苷酸间相似的序列(即仅是完整多核苷酸序列的一部分),和(2)在两个多核苷酸间背离的序列,两个(或更多个)多核苷酸间的序列比较通常通过在“比较窗”内比较两个多核苷酸的序列以鉴定和比较序列相似性的局部区域来进行。“比较窗”指至少6个邻接位置、经常为约5-约100、更经常为约100-约150个位置的概念片段,其中在两个序列最佳比对后,将序列与相同数目的邻接位置的参照序列进行比较。为了对两个序列进行最佳比对,与参照序列(其不包含添加或缺失)相比,比较窗可以包含约20%或更少的添加或缺失(即空位)。用于比对比较窗的序列的最佳比对可以通过以下进行:通过算法(Wisconsin遗传学软件包版本7.0(Wisconsin Genetics Software PackageRelease 7.0)中的GAP、BESTFIT、FASTA以及TFASTA,Genetics ComputerGroup,575Science Drive Madison,WI,USA)的计算机化执行,或者通过检查和所选的各种方法中的任何方法所产生的最佳比对(即在比较窗内产生同源性的最高百分比)。也可以参照BAST程序家族,如Altschul et al.,1997,Nucl.Acids Res.25:3389所公开的。序列分析的详细讨论可见于Ausubel et al.,“Current Protocols in Molecular Biology”,John Wiley & SonsInc,1994-1998,15章的19.3单元。
“转化”通常指细胞中永久的、可遗传的改变,其是由外源DNA摄取和并入宿主细胞基因组所致;还由外源基因从一种生物转移至另一种生物的基因组所致。
“载体”意指由可以插入或克隆入多核苷酸的质粒、噬菌体、酵母或病毒衍生的多核苷酸分子,优选DNA分子。载体优选含有一个或多个独特的限制位点,并且能在限定的宿主细胞中自主复制,所述宿主细胞包括靶细胞或组织或其祖细胞或组织,或可与限定的宿主的基因组整合,从而克隆的序列是可再生的。因此,载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,如线性或闭环质粒、染色体外元件、微型染色体或人工染色体。载体可以含有确保自我复制的任何装置。可选地,载体可以是这样的载体:当其引入宿主细胞时,其整合于基因组并与其整合的染色体一起复制。此类载体可以包含允许重组到宿主染色体特定、所需位点的特异性序列。载体系统可以包含单个载体或质粒、两个或更多个载体或质粒,它们共同含有待引入宿主细胞基因组的总DNA,或转座子。载体的选择通常取决于载体与待引入载体的宿主细胞的相容性。在本发明中,载体优选是在细菌细胞如蓝细菌细胞中可操作地发挥功能的载体。载体可以包含诸如绿色荧光蛋白(GFP)的报告基因,其可以同框(in frame)融合于一个或多个编码的多肽,或单独表达。载体也可以包括可用于选择适宜的转化体的选择标志物如抗生素抗性基因。
术语“野生型”和“天然存在的”可交换使用,指具有从天然存在的来源分离时的该基因或基因产物特征的基因或基因产物。野生型基因或基因产物(如多肽)是在群体中非常频繁地观察到并且因而可以任意设计为基因的“正常”或“野生型”形式的基因或基因产物。
“生物质”的实例包括水生或海洋生物质、基于果实的生物质如果实废弃物,以及基于蔬菜的生物质,如蔬菜废弃物等。水生或海洋生物质的实例包括但不限于海藻、巨藻、海藻、藻类、海洋微生物区系、微藻类、海草等。在某些方面,生物质不包括碳的化石化来源,如通常发现于地壳的顶层内的烃(如天然气、由几乎纯的碳组成的非挥发材料,如无烟煤等)。
果实和/或蔬菜生物质的实例包括但不限于,果胶的任何来源,如植物皮和渣,包括柑橘(citrus)、橙子(orange)、柚子、马铃薯、番茄、葡萄、芒果、醋栗、胡萝卜、甜菜以及苹果等。
生物质的多糖、寡糖、单糖或其它糖类组分的实例包括但不限于,藻酸盐、琼脂、角叉菜聚糖、岩藻依聚糖、果胶、葡糖酸盐、甘露糖醛酸盐、甘露醇、来苏糖、纤维素、半纤维素、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、木聚糖、甘露聚糖、阿拉伯聚糖、阿拉伯糖、葡糖醛酸盐、半乳糖醛酸盐(包括二和三半乳糖醛酸盐)、鼠李糖等。
藻酸盐衍生的多糖的某些实例包括饱和的多糖,如β-D-甘露糖醛酸盐、α-L-葡糖酸盐、二藻酸盐(dialginate)、三藻酸盐(trialginate)、五藻酸盐(pentalginate)、六藻酸盐(hexalginate)、七藻酸盐(heptalginate)、八藻酸盐(octalginate)、九藻酸盐(nonalginate)、十藻酸盐(nondecalginate)、十一藻酸盐(undecalginate)、十二藻酸盐(dodecalginate)和多聚藻酸盐,以及不饱和多糖,如4-脱氧-L-赤(erythro)-5-己酮醣醛酸(hexoseulose uronic acid)、4-(4-脱氧-β-D-mann-4-enuronosyl)-D-甘露糖醛酸盐或L-葡糖酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-二藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-三藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-四藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-五藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-六藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-七藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-八藻酸盐、4-(4-脱氧-β-D-mann-4-enuronosyl)-九藻酸盐、4-(4-脱氧-beta-D-mann-4-enuronosyl)-十一藻酸盐以及4-(4-脱氧-β-D-mann-4-enuronosyl)-十二藻酸盐。
果胶衍生的多糖的某些实例包括饱和的多糖,如半乳糖醛酸盐、二半乳糖醛酸盐、三半乳糖醛酸盐、四半乳糖醛酸盐、五半乳糖醛酸盐、六半乳糖醛酸盐、七半乳糖醛酸盐、八半乳糖醛酸盐、九半乳糖醛酸盐、十半乳糖醛酸盐、十二半乳糖醛酸盐、多聚半乳糖醛酸盐,和鼠李糖多聚半乳糖醛酸盐(rhamnopolygalacturonate),以及饱和的多糖,如4-脱氧-L-苏式-5-hexosuloseuronate、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-二半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-三半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-四半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-五半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-六半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-七半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-八半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-九半乳糖醛酸盐、4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-十半乳糖醛酸盐和4-(4-脱氧-α-D-gluc-4-enuronosyl)-D-十二半乳糖醛酸盐。
可以通过本文所述的微生物将这些多糖或寡糖组分转化为“适宜的单糖”或其它“适宜的糖”,如“适宜的寡糖”,所述微生物能生长于作为碳源(如唯一碳源)的此类多糖或其它糖组分上。
“适宜的单糖”或“适宜的糖”通常指可以由生长于作为碳源或唯一碳源的果胶、藻酸盐或其它糖(如半乳糖醛酸盐、纤维素、半纤维素等)上的重组微生物所产生的任何糖,通常也指可以用于本发明的生物燃料生物合成途径产生烃如生物燃料或生物汽油的任何糖。适宜的单糖或寡糖的实例包括但不限于,2-酮-3-脱氧D-葡糖酸盐(KDG)、D-甘露醇、葡糖酸盐、甘露糖醛酸盐、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸盐(glucuronate)、半乳糖醛酸盐和鼠李糖等。如本文所述,本文所用“适宜的单糖”或“适宜的糖”可以由本发明的工程化或重组微生物产生,或可以从商业可用来源获得。
本文所用“大量生产型化学品”这一叙述,包括任何销售的或适于销售的化学品,其可以直接产生或作为本文所提供方法的副产品产生,包括生物燃料和/或生物汽油。“大量生产型化学品”的一般性实例包括但不限于生物燃料、矿质、多聚体前体、脂肪醇、表面活性剂、可塑剂以及溶剂。本文所用“生物燃料”这一叙述包括至少部分衍生于生物来源如重组微生物的固体、液体或气体燃料。
大量生产型化学品的实例包括但不限于,甲烷、甲醇、乙烷、乙烯、乙醇、正-丙烷、1-丙烯、1-丙醇、丙醛、丙酮、丙酸盐、正-丁烷、1-丁烯、1-丁醇、丁醛、丁酸盐、异丁醛、异丁醇、2-甲基丁醛、2-甲基丁醇、3-甲基丁醛、3-甲基丁醇、2-丁烯、2-丁醇、2-丁酮、2,3-丁二醇、3-羟基-2-丁酮、2,3-丁二酮、乙苯、苯乙烯、2-苯基乙醇、苯乙醛、1-苯基丁烷、4-苯基-1-丁烯、4-苯基-2-丁烯、1-苯基-2-丁烯、1-苯基-2-丁醇、4-苯基-2-丁醇、1-苯基-2-丁酮、4-苯基-2-丁酮、1-苯基-2,3-丁二醇、1-苯基-3-羟基-2-丁酮、4-苯基-3-羟基-2-丁酮、1-苯基-2,3-丁二酮、正-戊烷、乙基苯酚、乙烯基苯酚、2-(4-羟苯基)乙醇、4-羟苯基乙醛、1-(4-羟苯基)丁烷、4-(4-羟苯基)-1-丁烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯基)-2-丁醇、1-(4-羟苯基)-2-丁酮、4-(4-羟苯基)-2-丁酮、1-(4-羟苯基)-2,3-丁二醇、1-(4-羟苯基)-3-羟基-2-丁酮、4-(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-2,3-丁二酮、吲哚乙烷、吲哚乙烯、2-(吲哚-3-)乙醇、正-戊烷、1-戊烯、1-戊醇、戊醛、戊酸盐、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2,3-戊二醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2,3-戊二酮、2-甲基戊烷、4-甲基-1-戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲基-3-戊酮、4-甲基-2,3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、4-甲基-2,3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基-2,3-戊二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2,3-戊二酮、4-甲基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2,3-戊二醇、4-甲基-1-苯基-2,3-戊二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1-(4-羟苯基)戊烷、1-(4-羟苯基)-1-戊烯、1-(4-羟苯基)-2-戊烯、1-(4-羟苯基)-3-戊烯、1-(4-羟苯基)-2-戊醇、1-(4-羟苯基)-3-戊醇、1-(4-羟苯基)-2-戊酮、1-(4-羟苯基)-3-戊酮、1-(4-羟苯基)-2,3-戊二醇、1-(4-羟苯基)-2-羟基-3-戊酮、1-(4-羟苯基)-3-羟基-2-戊酮、1-(4-羟苯基)-2,3-戊二酮、4-甲基-1-(4-羟苯基)戊烷、4-甲基-1-(4-羟苯基)-2-戊烯、4-甲基-1-(4-羟苯基)-3-戊烯、4-甲基-1-(4-羟苯基)-1-戊烯、4-甲基-1-(4-羟苯基)-3-戊醇、4-甲基-1-(4-羟苯基)-2-戊醇、4-甲基-1-(4-羟苯基)-3-戊酮、4-甲基-1-(4-羟苯基)-2-戊酮、4-甲基-1-(4-羟苯基)-2,3-戊二醇、4-甲基-1-(4-羟苯基)-2,3-戊二酮、4-甲基-1-(4-羟苯基)-3-羟基-2-戊酮、4-甲基-1-(4-羟苯基)-2-羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-1-戊烯、1-(吲哚-3)-2-戊烯、1-(吲哚-3)-3-戊烯、1-(吲哚-3)-2-戊醇、1-(吲哚-3)-3-戊醇、1-(吲哚-3)-2-戊酮、1-(吲哚-3)-3-戊酮、1-(吲哚-3)-2,3-戊二醇、1-(吲哚-3)-2-羟基-3-戊酮、1-(吲哚-3)-3-羟基-2-戊酮、1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3-)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲哚-3)-1-戊烯、4-甲基-2-(吲哚-3)-3-戊醇、4-甲基-1-(吲哚-3)-2-戊醇、4-甲基-1-(吲哚-3)-3-戊酮、4-甲基-1-(吲哚-3)-2-戊酮、4-甲基-1-(吲哚-3)-2,3-戊二醇、4-甲基-1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲基-1-(吲哚-3)-2-羟基-3-戊酮、正-己烷、1-己烯、1-己醇、己醛、己酸盐、2-己烯、3-己烯、2-己醇、3-己醇、2-己酮、3-己酮、2,3-己二醇、2,3-己二酮、3,4-己二醇、3,4-己二酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、3-甲基己烷、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲基-3-己酮、2-甲基-3,4-己二醇、2-甲基-3,4-己二酮、5-甲基-2,3-己二醇、5-甲基-2,3-己二酮、4-甲基-2,3-己二醇、4-甲基-2,3-己二酮、2-甲基-3-羟基-4-己酮、2-甲基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟基-3-己酮、4-甲基-3-羟基-2-己酮、2,5-二甲基己烷、2,5-二甲基-2-己烯、2,5-二甲基-3-己烯、2,5-二甲基-3-己醇、2,5-二甲基-3-己酮、2,5-二甲基-3,4-己二醇、2,5-二甲基-3,4-己二酮、2,5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2,3-己二醇、4-甲基-1-苯基-2,3-己二醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2,3-己二酮、4-甲基-1-苯基-2,3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1-(4-羟苯基)-1-己烯、5-甲基-1-(4-羟苯基)-2-己烯、5-甲基-1-(4-羟苯基)-3-己烯、4-甲基-1-(4-羟苯基)-1-己烯、4-甲基-1-(4-羟苯基)-2-己烯、4-甲基-1-(4-羟苯基)-3-己烯、5-甲基-1-(4-羟苯基)-2-己醇、5-甲基-1-(4-羟苯基)-3-己醇、4-甲基-1-(4-羟苯基)-2-己醇、4-甲基-1-(4-羟苯基)-3-己醇、5-甲基-1-(4-羟苯基)-2-己酮、5-甲基-1-(4-羟苯基)-3-己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4-羟苯基)-3-己酮、5-甲基-1-(4-羟苯基)-2,3-己二醇、4-甲基-1-(4-羟苯基)-2,3-己二醇、5-甲基-1-(4-羟苯基)-3-羟基-2-己酮、5-甲基-1-(4-羟苯基)-2-羟基-3-己酮、4-甲基-1-(4-羟苯基)-3-羟基-2-己酮、4-甲基-1-(4-羟苯基)-2-羟基-3-己酮、5-甲基-1-(4-羟苯基)-2,3-己二酮、4-甲基-1-(4-羟苯基)-2,3-己二酮、4-甲基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3)-2-己烯、5-甲基-1-(吲哚-3)-3-己烯、4-甲基-1-(吲哚-3)-1-己烯、4-甲基-1-(吲哚-3)-2-己烯、4-甲基-1-(吲哚-3)-3-己烯、5-甲基-1-(吲哚-3)-2-己醇、5-甲基-1-(吲哚-3)-3-己醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基-1-(吲哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚-3)-2-己酮、4-甲基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二醇、4-甲基-1-(吲哚-3)-2,3-己二醇、5-甲基-1-(吲哚-3)-3-羟基-2-己酮、5-甲基-1-(吲哚-3)-2-羟基-3-己酮、4-甲基-1-(吲哚-3)-3-羟基-2-己酮、4-甲基-1-(吲哚-3)-2-羟基-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二酮、4-甲基-1-(吲哚-3)-2,3-己二酮、正-庚烷、1-庚烯、1-庚醇、庚醛、庚酸盐、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2,3-庚二醇、2,3-庚二酮、3,4-庚二醇、3,4-庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚酮、2-甲基-3,4-庚二醇、2-甲基-3,4-庚二酮、6-甲基-3,4-庚二醇、6-甲基-3,4-庚二酮、5-甲基-3,4-庚二醇、5-甲基-3,4-庚二酮、2-甲基-3-羟基-4-庚酮、2-甲基-4-羟基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚酮、5-甲基-4-羟基-3-庚酮、2,6-二甲基庚烷、2,5-二甲基庚烷、2,6-二甲基-2-庚烯、2,6-二甲基-3-庚烯、2,5-二甲基-2-庚烯、2,5-二甲基-3-庚烯、3,6-二甲基-3-庚烯、2,6-二甲基-3-庚醇、2,6-二甲基-4-庚醇、2,5-二甲基-3-庚醇、2,5-二甲基-4-庚醇、2,6-二甲基-3,4-庚二醇、2,6-二甲基-3,4-庚二酮、2,5-二甲基-3,4-庚二醇、2,5-二甲基-3,4-庚二酮、2,6-二甲基-3-羟基-4-庚酮、2,6-二甲基-4-羟基-3-庚酮、2,5-二甲基-3-羟基-4-庚酮、2,5-二甲基-4-羟基-3-庚酮、正-辛烷、1-辛烯、2-辛烯、1-辛醇、辛醛、辛酸盐、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4,5-辛二醇、4,5-辛二酮、4-羟基-5-辛酮、2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲基-4,5-辛二醇、2-甲基-4,5-辛二酮、3-甲基-4,5-辛二醇、3-甲基-4,5-辛二酮、2-甲基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟基-4-辛酮、2,7-二甲基辛烷、2,7-二甲基-3-辛烯、2,7-二甲基-4-辛烯、2,7-二甲基-4-辛醇、2,7-二甲基-4-辛酮、2,7-二甲基-4,5-辛二醇、2,7-二甲基-4,5-辛二酮、2,7-二甲基-4-羟基-5-辛酮、2,6-二甲基辛烷、2,6-二甲基-3-辛烯、2,6-二甲基-4-辛烯、3,7-二甲基-3-辛烯、2,6-二甲基-4-辛醇、3,7-二甲基-4-辛醇、2,6-二甲基-4-辛酮、3,7-二甲基-4-辛酮、2,6-二甲基-4,5-辛二醇、2,6-二甲基-4,5-辛二酮、2,6-二甲基-4-羟基-5-辛酮、2,6-二甲基-5-羟基-4-辛酮、3,6-二甲基辛烷、3,6-二甲基-3-辛烯、3,6-二甲基-4-辛烯、3,6-二甲基-4-辛醇、3,6-二甲基-4-辛酮、3,6-二甲基-4,5-辛二醇、3,6-二甲基-4,5-辛二酮、3,6-二甲基-4-羟基-5-辛酮、正-壬烷、1-壬烯、1-壬醇、壬醛、壬酸盐、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基-5-壬醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基-4,5-壬二醇、8-甲基-4,5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2,8-二甲基壬烷、2,8-二甲基-3-壬烯、2,8-二甲基-4-壬烯、2,8-二甲基-5-壬烯、2,8-二甲基-4-壬醇、2,8-二甲基-5-壬醇、2,8-二甲基-4-壬酮、2,8-二甲基-5-壬酮、2,8-二甲基-4,5-壬二醇、2,8-二甲基-4,5-壬二酮、2,8-二甲基-4-羟基-5-壬酮、2,8-二甲基-5-羟基-4-壬酮、2,7-二甲基壬烷、3,8-二甲基-3-壬烯、3,8-二甲基-4-壬烯、3,8-二甲基-5-壬烯、3,8-二甲基-4-壬醇、3,8-二甲基-5-壬醇、3,8-二甲基-4-壬酮、3,8-二甲基-5-壬酮、3,8-二甲基-4,5-壬二醇、3,8-二甲基-4,5-壬二酮、3,8-二甲基-4-羟基-5-壬酮、3,8-二甲基-5-羟基-4-壬酮、正-癸烷、1-癸烯、1-癸醇、癸酸盐、2,9-二甲基癸烷、2,9-二甲基-3-癸烯、2,9-二甲基-4-癸烯、2,9-二甲基-5-癸醇、2,9-二甲基-5-癸酮、2,9-二甲基-5,6-癸二醇、2,9-二甲基-6-羟基-5-癸酮、2,9-二甲基-5,6-癸二酮、正-十一烷、1-十一碳烯、1-十一烷醇、十一醛、十一酸盐、正-十二烷、1-十二碳烯、1-十二烷醇、十二醛、十二酸盐、正-十二烷、1-decadecene、1-十二烷醇、十二醛、十二酸盐、正-十三烷、1-十三碳烯、1-十三烷醇、十三醛、十三酸盐、正-十四烷、1-十四碳烯、1-十四烷醇、十四醛、十四酸盐、正-十五烷、1-十五碳烯、1-十五烷醇、十五醛、十五酸盐、正-十六烷、1-十六碳烯、1-十六烷醇、十六醛、十六酸盐、正-十七烷、1-十七碳烯、1-十七烷醇、十七醛、十七酸盐、正-十八烷、1-十八碳烯、1-十八烷醇、十八醛、十八酸盐、正-十九烷、1-十九碳烯、1-十九烷醇、十九醛、十九酸盐、二十烷、1-二十碳烯、1-二十烷醇、二十醛、二十酸盐、3-羟基丙醛、1,3-丙二醇、4-羟基丁醛、1,4-丁二醇、3-羟基-2-丁酮、2,3-丁二醇、1,5-戊二醇、高柠檬酸盐、高异柠檬酸盐、b-羟基己二酸盐、戊二酸盐、glutarsemialdehyde、戊二醛、2-羟基-1-环戊酮、1,2-环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2,3-二羟基-异戊酸盐、2-氧代异戊酸盐、异丁酰辅酶A、异丁酸盐、异丁醛、5-氨基戊醛、1,10-二氨基癸烷、1,10-二氨基-5-癸烯、1,10-二氨基-5-羟基癸烷、1,10-二氨基-5-癸酮、1,10-二氨基-5,6-癸二醇、1,10-二氨基-6-羟基-5-癸酮、苯乙醛、1,4-二苯基丁烷、1,4-二苯基-1-丁烯、1,4-二苯基-2-丁烯、1,4-二苯基-2-丁醇、1,4-二苯基-2-丁酮、1,4-二苯基-2,3-丁二醇、1,4-二苯基-3-羟基-2-丁酮、1-(4-羟苯基)-4-苯基丁烷、1-(4-羟苯基)-4-苯基-1-丁烯、1-(4-羟苯基)-4-苯基-2-丁烯、1-(4-羟苯基)-4-苯基-2-丁醇、1-(4-羟苯基)-4-苯基-2-丁酮、1-(4-羟苯基)-4-苯基-2,3-丁二醇、1-(4-羟苯基)-4-苯基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲哚-3)-4-苯基-2-丁烯、1-(吲哚-3)-4-苯基-2-丁醇、1-(吲哚-3)-4-苯基-2-丁酮、1-(吲哚-3)-4-苯基-2,3-丁二醇、1-(吲哚-3)-4-苯基-3-羟基-2-丁酮、4-羟苯基乙醛、1,4-二(4-羟苯基)丁烷、1,4-二(4-羟苯基)-1-丁烯、1,4-二(4-羟苯基)-2-丁烯、1,4-二(4-羟苯基)-2-丁醇、1,4-二(4-羟苯基)-2-丁酮、1,4-二(4-羟苯基)-2,3-丁二醇、1,4-二(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-4-(吲哚-3-)丁烷、1-(4-羟苯基)-4-(吲哚-3)-1-丁烯、1-二(4-羟苯基)-4-(吲哚-3)-2-丁烯、1-(4-羟苯基)-4-(吲哚-3)-2-丁醇、1-(4-羟苯基)-4-(吲哚-3)-2-丁酮、1-(4-羟苯基)-4-(吲哚-3)-2,3-丁二醇、1-(4-羟苯基-4-(吲哚-3)-3-羟基-2-丁酮、吲哚-3-乙醛、1,4-二(吲哚-3-)丁烷、1,4-二(吲哚-3)-1-丁烯、1,4-二(吲哚-3)-2-丁烯、1,4-二(吲哚-3)-2-丁醇、1,4-二(吲哚-3)-2-丁酮、1,4-二(吲哚-3)-2,3-丁二醇、1,4-二(吲哚-3)-3-羟基-2-丁酮、琥珀酸半醛、己烷-1,8-二羧酸、3-己烯-1,8-二羧酸、3-羟基-己烷-1,8-二羧酸、3-己酮-1,8-二羧酸、3,4-己二醇-1,8-二羧酸、4-羟基-3-己酮-1,8-二羧酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾、磷酸盐等。
本文所用“优化的”这一叙述,指生物活性改变的途径、基因、多肽、酶或其它分子,其例如通过多肽的氨基酸序列的遗传改变,或通过多肽周围细胞环境的改变/修饰,从而相对于原始分子或原始细胞环境(如给定多肽的野生型序列或野生型微生物)改善其功能特征。本文所述的任何多肽或酶可以任选地进行“优化”,且本文所述的任何基因或核苷酸序列都可以任选地编码优化的多肽或酶。本文所述的任何途径都可以任选地含有一种或多种“优化的”酶,或一种或多种编码优化的酶或多肽的核苷酸序列。
通常,多肽、酶或其它分子改善的功能特征涉及多肽或其它分子用于生物途径(如生物合成途径、C-C连接途径)以将单糖或寡糖转化为生物燃料的适宜性。因此,某些实施方案考虑到使用“优化的”生物途径。示例性的“优化的”多肽可以在其氨基酸编码序列中含有一个或多个改变或突变(如点突变、缺失、异源序列的添加),所述改变或突变促进给定微生物系统或微生物中表达和/或稳定性的改善,允许调控与所需底物有关的多肽活性(如诱导型或抑制活性),调节多肽在细胞中的定位(如细胞内定位、细胞外分泌),和/或影响有关所需底物的多肽的总活性水平(如减少或增加酶促活性)。通过改变给定微生物系统或微生物中的一个或多个途径,如改变调控“优化的”多肽或其它分子的表达(如上调)、定位和/或活性的途径,或通过改变最小化不期望的副产品产生的途径等,也可以“优化”多肽或其它分子,供与所述给定微生物系统或生物一起使用。以此方式,在改变或不改变其野生型氨基酸序列或原始化学结构的情况下,可以“优化”多肽或其它分子。根据本领域已知的技术,优化的多肽或生物途径可以通过例如直接诱变或通过所需表型的自然选择获得。
在某些方面,“优化的”基因或多肽可以包含与参照(如野生型)基因或多肽的核苷酸或氨基酸序列50%-99%(包括其中的所有整数)同一的核苷酸编码序列或氨基酸序列。在某些方面,“优化的”多肽或酶的生物活性可以是参照多肽生物活性的约1、2、3、4、5、6、7、8、9、10、20、30、40、50、100(包括其中的所有整数和小数点,如1.2、1.3、1.4、1.5、5.5、5.6、5.7、60、70等)或更多倍。
本发明的某些方面也包括根据本文所述的方法和重组微生物产生的大量生产型化学品,如生物燃料。借助放射性碳定年技术(radio-carbondating techniques),此类生物燃料(如中到长链链烷)可区分于其它燃料,如传统精炼厂从粗碳源产生的燃料。例如,碳具有两个稳定的非放射性同位素:碳-12(12C)和碳-13(13C)。另外,地球上存在痕量不稳定的碳-14(14C)同位素。碳-14的半衰期为5730年,如果不是宇宙射线对地球大气中的氮的持续影响产生更多这种同位素的话,这种同位素可能很久以前已经从地球上消失了。宇宙射线相互作用所产生的中子参与大气中氮分子(N2)的原子的下述核反应:
Figure GPA00001148551100451
植物和其它光合生物通过光合作用摄入大气中的二氧化碳。因为许多植物被动物摄取,地球上每个有生命的生物,在其生活期限内,经常与其环境交换碳-14。然而,一旦生物死亡,这种交换停止,且经放射β衰减,碳-14的量随时间逐渐减少。
大多数基于烃的燃料,如来自采矿作业的原油和天然气,都是古老有机物(如油原)在地质年代的压缩和加热的结果。石油的形成通常发生于烃高温分解,以高温和/或高压下多种通常吸热的反应的形式进行。今天的石油是由史前浮游动物和藻类保存的残余物形成的,这些浮游动物和藻类的残余物在无氧的条件下大量沉积于海底或湖底(另一方面,史前陆地植物的残余物趋向形成煤)。经地质时代,有机物与泥浆混合,并被埋于厚厚的沉积物层之下,导致高水平的热和压(称为岩化作用)。这个过程使有机物发生化学变化,首先变为称为油原的蜡质物质(其发现于全世界的各种油页岩内),随后在称为退化的过程中,以更多的热,变为液态烃和气态烃。大多数衍生于原油的基于烃的燃料,在地质年代内已经历了碳-14衰减过程,因此有很少或者无可检测的碳-14。相反,本发明的活体微生物所产生的某些生物燃料所包含的碳-14水平,可和所有其它现存的生物媲美(即平衡水平)。以此方式,通过测量本发明的基于烃的生物燃料的碳-12与碳-14的比值,并将该比值与衍生于原油的基于烃的燃料进行比较,可以从结构上区分本文所提供的方法所产生的生物燃料与通常来源的基于烃的燃料。
本发明的实施方案包括将多糖转化为适宜单糖的方法,包括(a)获得多糖;和(b)使多糖与重组微生物或包含此类微生物的微生物系统接触足以将多糖转化为适宜的单糖的时间,其中微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因,其中裂解酶和/或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域;(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白以及多糖转运蛋白;以及(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶,从而将多糖转化为适宜的单糖。
可选地,某些方面可以包括将多糖转化为适宜的单糖的方法,包括(a)获得多糖;和(b)使多糖与微生物系统接触足以将多糖转化为适宜的单糖的时间,其中微生物系统包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因;(ii)至少一个编码和表达超通道的基因;以及(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶,从而将多糖转化为适宜的单糖。
在某些实施方案中,微生物系统或分离的微生物能利用多糖(如藻酸盐、果胶等)作为唯一碳源和/或能源而生长。“唯一碳源”通常指生长于作为给定的生长培养基中仅有碳源的给定碳源上的能力。
对于藻酸盐而言,海藻干重的约50%包含各种糖组分,其中藻酸盐和甘露醇是主要的组分,两者分别对应于海藻干重的30%和15%。对于果胶而言,尽管诸如大肠杆菌的微生物通常被认为是合成生物学的宿主生物,且尽管此类微生物能代谢甘露醇,但是它们完全缺乏降解并代谢藻酸盐的能力。因此,许多实验室微生物或野生型微生物,如大肠杆菌,不能生长于作为唯一碳源的藻酸盐上。类似地同样,诸如大肠杆菌的许多生物不能降解和代谢果胶这一在许多生物废品中存在的多糖,因此,不能生长于作为唯一碳源的果胶上。因此,本发明的实施方案包括工程化微生物,如大肠杆菌,或包含此类工程化微生物的微生物系统,其能利用多糖如藻酸盐和果胶作为唯一碳源和/或能源。
藻酸盐是β-D-甘露糖醛酸盐(M)和α-D-葡糖酸盐(G)(M和G是C5-羧基的差向异构体)的嵌段共聚物。每一藻酸盐多聚体都包含所有的M(polyM)、所有G(polyG)和/或M和G混合物(polyMG)的区域。为了利用藻酸盐产生一种或多种适宜的单糖,本发明的某些方面提供了工程化或重组微生物或微生物系统,所述微生物或微生物系统能降解藻酸盐或使其解聚,并能用它作为碳源和/或能源。作为实现此目的的一种方式,此类重组微生物可以将一组多糖降解或解聚酶如藻酸盐裂解酶(ALs)并入微生物系统。
根据其催化作用的作用,Als主要分为两种不同的亚家族:内-作用-(EC 4.2.2.3)ALs和外-作用-(EC 4.2.2.-)ALs。内-作用ALs基于其催化特异性还可以进一步分为:M特异性和G特异性ALs。内-作用ALs经由β-消除机制随机切割藻酸盐,并主要将藻酸盐解聚为二糖、三糖以及四糖。在每个寡糖非还原末端的糖醛酸盐被转化为不饱和的糖醛酸盐、4-脱氧-α-L-赤式-hex-4-烯烃吡喃糖醛酸盐。外-作用ALs进一步催化这些寡糖的解聚,并释放不饱和的单糖,其可以以非酶促的方式被转化为单糖,包括α-酮酸、4-脱氧-α-L-赤式-己酮糖糖醛酸盐(DEHU)。工程化微生物系统或分离的工程化微生物的某些实施方案包括内M-作用ALs、内G-作用ALs以及外-作用ALs,以将水生或海洋生物质多糖如藻酸盐降解或解聚为单糖如DEHU。
本发明的实施方案还可以包括分离自各种来源的裂解酶,如藻酸盐裂解酶,所述来源包括但不限于海洋藻类、软体动物和各种微生物,如假单胞菌属、弧菌属(Vibrio)以及鞘氨醇单胞菌属(Sphingomonas)。许多藻酸盐裂解酶是内-作用M特异性的,几个是G特异性的,很少是外-作用的。例如,分离自鞘氨醇单胞菌(Sphingomonas sp.)菌株A1的ALs包括5个内-作用ALs,即A1-I、A1-II、A1-II’、A1-III以及A1-IV’,和外作用AL即A1-IV。
通常,A1-I、A1-II和A1-III的分子量分别为66kDa、25kDa和40kDa。AI-II和AI-III是A1-I的自剪接产物。AI-II可以是对G更特异性的,且A1-III可以是M特异性的。A1-I可以具有对M和G两者的高活性。A1-IV的分子量为约85kDa,并催化寡藻酸盐(oligoalginate)的外裂解解聚。尽管A1-II’和A1-IV’两者是A1-II和A1-IV的功能同源物,但AI-II’具有内-裂解活性并且可以不具有M或G偏好。A1-IV主要具有内裂解活性。除了这些ALs外,衍生于根癌农杆菌的外-裂解AL Atu3025具有解聚寡藻酸盐的高活性,并且可以用于本发明的某些实施方案中。某些实施方案可以将编码A1-I、A1-II’、A1-IV和Atu3025的基因并入微生物系统或分离的微生物中,并且可以包括用于适宜宿主生物如大肠杆菌的优化的密码子使用。
可用于本文的藻酸盐裂解酶或寡藻酸盐裂解酶的某些实例包括,与SEQ ID NOS:67-68共有至少60%、70%、80%、90%、95%、98%或更多的(包括其中的所有整数)序列同一性的酶或多肽,SEQ ID NOS:67-68表示分离自根癌农杆菌的寡藻酸盐裂解酶Atu3025的核苷酸序列(SEQ IDNO:67)和多肽序列(SEQ ID NO:68)。可用于本文的藻酸盐裂解酶的某些实例包括,与图37所示藻酸盐裂解酶以及灿烂弧菌的Vs24254所编码的分泌的藻酸盐裂解酶共有至少60%、70%、80%、90%、95%、98%或更多的(包括其中的所有整数)序列同一性的酶或多肽。
在某些实施方案中,微生物系统或重组微生物可以经基因工程化,如通过将信号肽或自动转运蛋白结构域并入裂解酶,以向培养基分泌或展示裂解酶或藻酸盐裂解酶(ALs)。因此,通常可以理解,细菌具有至少4种不同类型的蛋白分泌机制(I、II、III以及IV型)。例如,在大肠杆菌中,II型分泌机制用于分泌重组蛋白。II型分泌机制可以包括2步过程:将标有信号肽的未成熟的蛋白转位至周质部分(periplasm fraction)并将其加工成成熟蛋白,随后将其分泌至培养基。
第一过程可以通过三种不同途径中的任何途径进行:secB-依赖性途径、信号识别颗粒(SRP)途径或双精氨酸转位(twin-arginine translocation,TAT)途径。重组蛋白可以分泌至周质部分。成熟蛋白的命运因蛋白的类型而各不相同。例如,某些蛋白通过扩散自发地或通过称为分泌器(secretion apparatus)的分泌物被动地分泌,所述分泌物由12-16个蛋白组成,其它的一些蛋白则留在周质部分,并最后降解。
一些蛋白也可以通过自动转运蛋白器(autotransporter apparatus)分泌,如利用自动转运蛋白结构域。自动转运蛋白结构域所分泌的蛋白通常包含在转位至周质中起作用的N末端信号肽,其可以受secB或SRP途径、信使结构域和/或具有特征性β-桶状结构的C末端转位单元(UT)的介导。UT的β-桶状部分构建了跨越外膜的水性孔通道,并有助于信使结构域向培养基的转运。自动展示的信使蛋白经常受到自动转运蛋白的切割,并被释放至培养基。
I型分泌机制也可以用于在大肠杆菌中分泌重组蛋白。I型分泌机制也可以用于分泌高分子量的毒素和外切酶(exoenzyme)。I型分泌机制由两个内膜蛋白(HlyB和HlyD)和一个内源外膜蛋白(TolC)组成,所述内膜蛋白是ATP结合盒(ATP binding cassette,ABC)转运蛋白家族的成员。基于I型分泌机制的重组蛋白的分泌可以利用α-溶血素(HlyA)的C-末端区域作为信号序列。重组蛋白通过I型分泌机制可以很容易地穿过内膜、周质以及外膜。
取决于本申请的各种实施方案所用的连接子和信号肽的类型,自动转运蛋白和I型分泌机制可以针对细胞表面展示机制而改变。可选地,可使用对细胞表面展示有特异性的系统。例如,在该系统中,可将靶蛋白融合于天然展示于枯草芽孢杆菌的表面上的PgsA蛋白(多聚-γ-谷氨酸合成酶复合体)。
某些实施方案可以包括与I型和II型分泌机制两者所分泌的蛋白中存在的各种信号肽和/或自动转运蛋白结构域融合的裂解酶如藻酸盐裂解酶。其它实施方案可以包括与本文所述转运机制所分泌的或本领域已知的蛋白中存在的信号肽和/或自动转运蛋白结构域的任何组合融合的裂解酶如藻酸盐裂解酶。实施方案也可以包括信号肽或自动转运蛋白结构域,其经实验方式再设计后,使裂解酶如藻酸盐裂解酶向培养基的分泌最大化,也可以包括使用许多不同的融合信号肽、裂解酶和自动转运蛋白的连接子序列,所述信号肽、裂解酶和自动转运蛋白改善裂解酶的分泌或细胞表面呈递的效率。
某些实施方案可以包括微生物系统或分离的微生物,所述微生物系统或分离的微生物包含糖转运蛋白,糖转运蛋白能将单糖(如DEHU)和寡糖从培养基转运至细胞溶胶,以有效利用这些单糖作为碳源和/或能源。例如,编码单糖透性酶(即单糖转运蛋白)如DEHU透性酶的基因,可以从生长于作为碳源和/或能源的多糖如藻酸盐上的细菌中分离,并且可以并入本发明微生物系统或分离的微生物的实施方案。作为其它实例,实施方案也可以包括单糖(如DEHU)转运特异性已改变的再设计的天然透性酶或转运蛋白。
在这一点上,大肠杆菌含有几种能转运单糖的透性酶,其包括但不限于2-酮-3-脱氧-D-葡糖酸盐(KDG)转运蛋白的KdgT,如D-半乳糖醛酸盐和D-葡糖醛酸盐的aldohexuronates转运蛋白的ExuT,葡糖酸盐转运蛋白的GntT、GntU、GntP以及GntT,以及质子驱动的α-酮戊二酸转运蛋白的KgtP。本文所述的微生物系统或重组微生物可以包含这些透性酶中的任何透性酶,除了本领域技术人员已知的和本文未提到的透性酶外,并且也可以包括经再设计转运其它单糖如DEHU的透性酶。
本发明的微生物系统或重组微生物也可以包含催化单糖(如D-甘露糖醛酸盐和D-来苏糖)从培养基向微生物的周质或细胞溶胶转运的透性酶/转运蛋白/超通道/孔蛋白。例如,可以将编码土壤气单孢菌(Aeromonas)中D-甘露糖醛酸透性酶的基因并入本文所述的微生物系统中。
作为一可选的实例,微生物系统或微生物可以包含天然透性酶/转运蛋白,其经再设计改变了它们有效转运单糖如转运D-甘露糖醛酸盐和D-来苏糖的特异性。例如,大肠杆菌含有能转运单糖或糖如D-甘露糖酸盐和D-来苏糖的数种透性酶,包括2-酮-3-脱氧-D-葡糖酸(KDG)转运蛋白的KdgT,诸如D-半乳糖醛酸盐和D-葡糖醛酸盐的aldohexuronates的转运蛋白的ExuT,葡糖酸/果糖酮酸(fructuronate)转运蛋白的GntPTU,葡糖苷酸转运蛋白的uidB,L-海藻糖转运蛋白的fucP,半乳糖转运蛋白的galP,乙醇酸转运蛋白的yghK,D-半乳糖酸转运蛋白的dgoT,己糖磷酸盐转运蛋白的uhpT,乳清酸/柠檬酸转运蛋白的dctA,葡糖酸盐转运蛋白的gntUT,麦芽糖转运蛋白的malEGF:D-阿洛糖酸盐转运蛋白的alsABC,L-艾杜糖酸/D-葡糖酸转运蛋白的idnT,质子驱动的α-酮戊二酸转运蛋白的KgtP,乳糖/半乳糖转运蛋白的lacY,D-木糖转运蛋白的xylEFGH,L-阿拉伯糖转运蛋白的araEFGH,以及D-核糖转运蛋白的rbsABC。在某些实施方案中,微生物系统或重组微生物可以包含上文所述的透性酶或转运蛋白,包括经再设计或优化改善某些单糖如D-甘露糖醛酸盐、DEHU以及D-来苏糖的转运的透性酶或转运蛋白。
某些方面可以使用包含“超通道”的重组微生物,通过所述超通道,水生或海洋生物质多糖,如藻酸盐多聚体,或果实或蔬菜生物质,如果胶多聚体,可以直接并入细胞溶胶,并在微生物系统中降解。例如,一组特征为鞘氨醇单胞菌的细菌能广泛降解对环境有害的化合物,如多氯多环芳香物族化合物(polychlorinated polycyclic aromatics)(二噁英)。这些细菌在其细胞表面含有特征性的巨大褶状分子。因此,某些鞘氨醇单胞菌具有特征为“超通道”的结构,该结构能使细胞直接摄取大分子。
作为包含超通道微生物的一特定实例,鞘氨醇单胞菌菌株A1通过超通道直接并入多糖如藻酸盐。此类超通道可由外膜上的小窝(pit)(如AlgR)、周质中的藻酸盐结合蛋白(如AlgQ1和Alg Q2)以及ATP-结合盒(ABC)转运蛋白(如AlgM1、AlgM2以及AlgS)组成。所并入的多糖,如藻酸盐,可很容易地通过裂解酶如细胞溶胶中所产生的藻酸盐裂解酶解聚。因此,某些实施方案可以并入编码超通道的基因(如ccpA、algS、algM1、algM2、algQ1、algQ2),以将这种能力引入微生物系统或重组微生物。其它实施方案可以包括诸如亚北极鞘氨醇单胞菌(Sphingomonassubarctica)IFO 16058T的微生物,该微生物容纳含有编码超通道的基因的质粒,并且利用海洋或水生生物质多糖如藻酸盐作为碳源和/或能源的能力已获得显著改善。某些重组微生物可以使用这些含于亚北极鞘氨醇单胞菌IFO 16058T内的编码超通道的质粒序列。
可以用于本文中的藻酸盐ABC转运蛋白的某些实例包括,ABC转运蛋白Atu3021、Atu3022、Atu3023、Atu3024、algM1、algM2、AlgQ1、AlgQ2、AlgS、OG2516_05558、OG2516_05563、OG2516_05568以及OG2516_05573,包括其功能变体。除其它的以外,可用于本文中的藻酸盐同向转运蛋白的某些实例可以包括,同向转运蛋白V12B01_24239和V12B01_24194,包括其变体。藻酸盐孔蛋白的一个其它实例包括V12B01_24269和其变体。
如上文所述,某些实施方案可以包括重组微生物,其包含一种或多种单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。就单糖脱氢酶而言,某些微生物系统或重组微生物可以并入将各种单糖(如DEHU、甘露糖醛酸盐)还原为适宜生物燃料生物合成的单糖如2-酮-3-脱氧-D-葡糖酸盐(KDG)或D-甘露醇的酶。此类示例性的酶包括,例如,DEHU脱氢酶和甘露糖醛酸脱氢酶(除了具有DEHU脱氢酶和/或甘露糖醛酸脱氢酶活性的各种醇脱氢酶外,如从根癌农杆菌C58分离的新的ADH1至ADH12酶(参阅例如SEQ ID NOS:69-92))。
对于ADH1至ADH12酶的更多详情,SEQ ID NO:69表示从根癌农杆菌C58分离的ADH1 Atu1557的核苷酸序列,SEQ ID NO:70表示其多肽序列。SEQ ID NO:71表示从根癌农杆菌C58分离的ADH2 Atu2022的核苷酸序列,SEQ ID NO:72表示其多肽序列。SEQ ID NO:73表示从根癌农杆菌C58分离的ADH3 Atu0626的核苷酸序列,SEQ ID NO:74表示其多肽序列。
SEQ ID NO:75表示从根癌农杆菌C58分离的ADH4 Atu5240的核苷酸序列,SEQ ID NO:76表示其多肽序列。SEQ ID NO:77表示从根癌农杆菌C58分离的ADH5 Atu3163的核苷酸序列,SEQ ID NO:78表示其多肽序列。SEQ ID NO:79表示从根癌农杆菌C58分离的ADH6 Atu2151的核苷酸序列,SEQ ID NO:80表示其多肽序列。
SEQ ID NO:81表示从根癌农杆菌C58分离的ADH7 Atu2814的核苷酸序列,SEQ ID NO:82表示其多肽序列。SEQ ID NO:83表示从根癌农杆菌C58分离的ADH8 Atu5447的核苷酸序列,SEQ ID NO:84表示其多肽序列。SEQ ID NO:85表示从根癌农杆菌C58分离的ADH9 Atu4087的核苷酸序列,SEQ ID NO:86表示其多肽序列。
SEQ ID NO:87表示从根癌农杆菌C58分离的ADH10 Atu4289的核苷酸序列,SEQ ID NO:88表示其多肽序列。SEQ ID NO:89表示从根癌农杆菌C58分离的ADH11 Atu3027的核苷酸序列,SEQ ID NO:90表示其多肽序列。SEQ ID NO:91表示从根癌农杆菌C58分离的ADH12 Atu3026的核苷酸序列,SEQ ID NO:92表示其多肽序列。
具有脱氢酶活性的酶的其它实例包括,Atu3026、Atu3027、OG2516_05543、OG2516_05538以及V12B01_24244。本发明的微生物和方法也可以利用这些氢化酶的生物活性片段和变体,包括其优化的变体。
作为另一个实例,利用藻酸盐作为唯一碳源和能源而生长的假单胞菌包含DEHU氢化酶,该酶使用NADPH作为辅因子,当溶液中存在NADP+时更稳定,并且在环境pH下有活性。因此,本文所述的微生物系统或重组微生物的某些实施方案可以并入编码衍生于或获得自各种微生物的氢化酶如DEHU或甘露糖醛酸氢化酶的基因,其中这些微生物能生长于作为碳源和/或能源的多糖如藻酸盐或果胶上。
某些实施方案可以并入微生物系统或分离的微生物的组分,所述微生物系统或分离的微生物能有效生长于作为碳源和能源的单糖如D-甘露糖醛酸盐或D-来苏糖上。例如,气单孢菌和产气气杆菌(Aerobacteraerogenes)PRL-R3包含编码单糖脱氢酶的基因,所述酶如D-甘露糖醛酸氢化酶和D-来苏糖异构酶。因此,某些微生物系统或重组微生物可以包含单糖脱氢酶,如来自气单孢菌、产气气杆菌PRL-R3或各种其它适宜的微生物的D-甘露糖醛酸氢化酶和D-来苏糖异构酶,所述适宜的微生物包括能生长于作为碳源和能源的D-甘露糖醛酸盐或D-来苏糖上的微生物。
某些实施方案可以包括将单糖如D-甘露糖酸盐和D-木酮糖转化为适宜生物燃料合成途径的单糖如KDG的效率提高的微生物系统或分离的微生物。仅通过解释的方式,D-甘露糖酸盐和D-木酮糖是微生物如大肠杆菌中的代谢物。D-甘露糖酸盐通过D-甘露糖酸脱水酶转化成KDG。D-木酮糖进入戊糖磷酸途径。因此,为了增加D-甘露糖酸盐向KDG的转化,外源或内源D-甘露糖酸脱水酶(如uxuA)基因在本发明的重组微生物中可以是过表达的。类似地,在其它实施方案中,适宜的内源或外源基因,如激酶(如kdgK)、nad以及KDG醛缩酶(如kdgA和eda),包括其生物活性变体或片段,如这些基因的优化的变体,可以并入给定的重组微生物或在其中过表达(参见SEQ ID NOS:93-96)。SEQ ID NO:93表示来自大肠杆菌DH10B的2-酮-脱氧葡糖酸激酶(KdgK)的核苷酸序列,SEQID NO:94表示其多肽序列。SEQ ID NO:95表示来自大肠杆菌DH10B的2-酮-脱氧葡糖酸-6-磷酸醛缩酶(KdgA)的核苷酸序列,SEQ ID NO:96表示其多肽序列。
在某些方面,如上所述,能生长于作为唯一碳源的藻酸盐或果胶上的重组微生物,可以利用脱水酶、激酶和/或醛缩酶的天然存在的或内源拷贝。例如,大肠杆菌含有内源脱水酶、激酶和醛缩酶,其能催化多糖转化为适宜的单糖的适当步骤。在这些和其它相关方面,天然存在的脱水酶或激酶也可以是过表达的,如通过提供与高度组成型或诱导型启动子可操作连接的天然存在的脱水酶、激酶或醛缩酶的外源拷贝。
作为用于对重组微生物进行基因工程化使其生长于作为唯一碳源的藻酸盐上的酶的一示例性来源,已知灿烂弧菌能代谢藻酸盐而支持生长。例如,SEQ ID NO:1表示携带某些灿烂弧菌某些基因的分泌蛋白质组区(secretome region)(V12B01_02425-V12B01-02480),其编码II型分泌器。SEQ ID NO:2表示V12B01_24189至V12B01_24249间的完整基因组区的核苷酸序列,其衍生于灿烂弧菌,且当其转化入大肠杆菌中作为fosmid克隆(fosmid clone)时,足以赋予生长于作为唯一碳源的藻酸盐上的能力。SEQ ID NOS:3-64表示含于SEQ ID NO:2中的单个推断的基因。因此,在某些方面,能生长于作为唯一碳源和/或能源的藻酸盐上的重组微生物(如大肠杆菌)可以包含SEQ ID NOS:1-64所述的一个或多个核苷酸或多肽参照序列,包括其生物活性片段或变体,如优化的变体。
在某些方面,能生长于作为唯一碳源的藻酸盐上的重组微生物,可以含有某些含于SEQ ID NOS:2中的编码核苷酸或多肽序列,如SEQ IDNOS:3-64中的序列,或其生物活性片段或变体,包括优化的变体。这些序列在下文做了进一步描述。
SEQ ID NO:3表示推断的蛋白V12B01_24184的核苷酸编码序列。这种推断的序列含于SEQ ID NO:2的多核苷酸序列中,并编码与自动转运蛋白粘附或I型分泌靶标ggxgxdxxx(SEQ ID NO:145)重复相似的多肽。SEQ ID NO:4表示推断的蛋白V12B01_24184的多肽序列,其是由多核苷酸SEQ ID NO:3编码的。这种推断的多肽与自动转运蛋白粘附或I型分泌靶标ggxgxdxxx(SEQ ID NO:145)重复相似。
SEQ ID NO:5表示编码推断的蛋白V12B01_24189的核苷酸序列。SEQ ID NO:6表示推断的蛋白V12B01_24189的多肽序列,其与环己二烯脱水酶相似。
SEQ ID NO:7表示编码推断的蛋白V12B01_24194的核苷酸序列。SEQ ID NO:8表示推断的蛋白V12B01_24194的多肽序列,其与Na/脯氨酸转运蛋白相似。
SEQ ID NO:9表示编码推断的蛋白V12B01_24199的核苷酸序列。SEQ ID NO:10表示推断的蛋白V12B01_24199的多肽序列,其与酮-脱氧-磷酸葡糖酸醛缩酶相似。
SEQ ID NO:11表示编码推断的蛋白V12B01_24204的核苷酸序列。SEQ ID NO:12表示推断的蛋白V12B01_24204的多肽序列,其与2-脱氢-3-脱氧葡糖酸激酶相似。
SEQ ID NO:13表示编码推断的蛋白V12B01_241209的核苷酸序列。SEQ ID NO:14表示推断的蛋白V12B01_241209的多肽序列。
SEQ ID NO:15表示编码推断的蛋白V12B01_24214的核苷酸序列。SEQ ID NO:16表示推断的蛋白V12B01_24214的多肽序列,其与软骨素AC/藻酸盐裂解酶相似。
SEQ ID NO:17表示编码推断的蛋白V12B01_24219的核苷酸序列。SEQ ID NO:18表示推断的蛋白V12B01_24219的多肽序列,其与软骨素AC/藻酸盐裂解酶相似。
SEQ ID NO:19表示编码推断的蛋白V12B01_24224的核苷酸序列。SEQ ID NO:20表示推断的蛋白V12B01_24224的多肽序列,其与2-酮-4-戊烯酸水合酶(pentenoate hydratase)/2-氧代庚(oxohepta)-3-烯-1,7-二酸水合酶相似。
SEQ ID NO:21表示编码推断的蛋白V12B012_4229的核苷酸序列。SEQ ID NO:22表示推断的蛋白V12B01_24229的多肽序列,其与GntR-家族转录调节蛋白相似。
SEQ ID NO:23表示编码推断的蛋白V12B01_24234的核苷酸序列。SEQ ID NO:24表示推断的蛋白V12B01_24234的多肽序列,其与Na+/脯氨酸同向转运蛋白相似。
SEQ ID NO:25表示编码推断的蛋白V12B01_24239的核苷酸序列。SEQ ID NO:26表推断的蛋白V12B01_24239的多肽序列,其与寡藻酸盐裂解酶相似。
SEQ ID NO:27表示编码推断的蛋白V12B01_24244的核苷酸序列。SEQ ID NO:28表示推断的蛋白V12B01_24244的多肽序列,其与3-羟基异丁酸脱氢酶相似。
SEQ ID NO:29表示编码推断的蛋白V12B01_24249的核苷酸序列。SEQ ID NO:30表示推断的蛋白V12B01_24249的多肽序列,其与甲基-接收趋化蛋白相似。
SEQ ID NO:31表示编码推断的蛋白V12B01_24254的核苷酸序列。SEQ ID NO:32表示推断的蛋白V12B01_24254的多肽序列,其与藻酸盐裂解酶相似。
SEQ ID NO:33表示编码推断的蛋白V12B01_24259的核苷酸序列。SEQ ID NO:34表示推断的蛋白V12B01_24259的多肽序列,其与藻酸盐裂解酶相似。
SEQ ID NO:35表示编码推断的蛋白V12B01_24264的核苷酸序列。SEQ ID NO:36推断的蛋白V12B01_24264的多肽序列。
SEQ ID NO:37表示编码推断的蛋白V12B01_24269的核苷酸序列。SEQ ID NO:38表示推断的蛋白V12B01_24269的多肽序列,其与推断的寡半乳糖醛酸盐特异性孔蛋白相似。
SEQ ID NO:39表示编码推断的蛋白V12B01_24274的核苷酸序列。SEQ ID NO:40表示推断的蛋白V12B01_24274的多肽序列,其与藻酸盐裂解酶相似。
图32表示推断的蛋白V12B01_02425的核苷酸编码序列和多肽序列。图32A表示编码推断的蛋白V12B01_02425的核苷酸序列(SEQ IDNO:41).图32B表示推断的蛋白V12B01_02425的多肽序列(SEQ IDNO:42),其与II型分泌途径组分EpsC相似。
SEQ ID NO:43表示编码推断的蛋白V12B01_02430的核苷酸序列。SEQ ID NO:44表示推断的蛋白V12B01_02430的多肽序列,其与II型分泌途径组分EpsD相似。
SEQ ID NO:45表示编码推断的蛋白V12B01_02435的核苷酸序列。SEQ ID NO:46表示推断的蛋白V12B01_02435的多肽序列,其与II型分泌途径组分EpsE相似。
SEQ ID NO:47表示编码推断的蛋白V12B01_02440的核苷酸序列。SEQ ID NO:48表示推断的蛋白V12B01_02440的多肽序列,其与II型分泌途径组分EpsF相似。
SEQ ID NO:49表示编码推断的蛋白V12B01_02445的核苷酸序列。SEQ ID NO:50表示推断的蛋白V12B01_02445的多肽序列,其与II型分泌途径组分EpsG相似。
SEQ ID NO:51表示编码推断的蛋白V12B01_02450的核苷酸序列。SEQ ID NO:52表示推断的蛋白V12B01_02450的多肽序列,其与II型分泌途径组分EpsH相似。
SEQ ID NO:53表示编码推断的蛋白V12B01_02455的核苷酸序列。SEQ ID NO:54表示推断的蛋白V12B01_02455的多肽序列,其与II型分泌途径组分EpsI相似。
SEQ ID NO:55表示编码推断的蛋白V12B01_02460的核苷酸序列。SEQ ID NO:56表示推断的蛋白V12B01_02460的多肽序列,其与II型分泌途径组分EpsJ相似。
SEQ ID NO:57表示编码推断的蛋白V12B01_02465的核苷酸序列。SEQ ID NO:58表示推断的蛋白V12B01_02465的多肽序列,其与II型分泌途径组分EpsK相似。
SEQ ID NO:59表示编码推断的蛋白V12B01_02470的核苷酸序列。SEQ ID NO:60表示推断的蛋白V12B01_02470的多肽序列,其与II型分泌途径组分EpsL相似。
SEQ ID NO:61表示编码推断的蛋白V12B01_02475的核苷酸序列。SEQ ID NO:62表示推断的蛋白V12B01_02475的多肽序列,其与II型分泌途径组分EpsM相似。
SEQ ID NO:63表示编码推断的蛋白V12B01_02480的核苷酸序列。SEQ ID NO:64表示推断的蛋白V12B01_02480的核苷酸序列,其与II型分泌途径组分EpsC相似。
作为用于对微生物进行基因工程化使其生长于藻酸盐上的酶的另一个示例性来源,根癌农杆菌C58能代谢作为唯一碳源和能源的相对小的藻酸盐分子(~1000mers)。因为根癌农杆菌C58在植物生物技术中的应用已经很久,因此,这种生物的遗传学已经研究的相对良好,并且许多基因工具可以利用,并与其它革兰氏阴性细菌如大肠杆菌相容。因此,某些方面可以使用这种微生物或其中的基因,用于产生适宜的单糖。例如,如上所述,本公开提供了一系列新的具有DEHU和甘露糖醛酸氢化酶活性的ADH基因,这些基因是从根癌农杆菌C58获得的(参见SEQ ID NOS:67-92)。
如上所述,某些方面可以包括重组微生物或微生物系统,其能生长于作为唯一碳源和/或能源的果胶上。果胶是形成果胶主链的线性链的α-(1-4)-连接的D-半乳糖醛酸,即同型半乳糖醛酸聚糖。在主链内,存在半乳糖醛酸被(1-2)-连接的L-鼠李糖取代的区域。自鼠李糖,各种中性糖的侧链通常分支。这种类型的果胶称为I型鼠李糖半乳糖醛酸聚糖。在主链中,遍及地,约最多每第25半乳糖醛酸被鼠李糖取代。某些伸展(stretches)由交互的半乳糖醛酸和鼠李糖组成-“多毛区(hairy region)”,其它的具有低密度鼠李糖-“光滑区”。中性糖主要包含D-半乳糖、L-阿拉伯糖以及D-木糖;中性糖的类型和比例随果胶的来源而不同。实际上,约80%的半乳糖醛酸的羧基与甲醇一起酯化。一些植物,如甜菜、马铃薯和梨,除了甲酯外,还含有带有乙酰化的半乳糖醛酸的果胶。乙酰化防止形成凝胶,但使果胶的稳定和乳化作用增加。某些果胶降解和代谢途径示例于图3中。
除了上文所述的基因、酶和生物途径外,某些重组微生物可以并入可以用于生长于作为唯一碳源的果胶上的特征。例如,为了降解和代谢作为唯一碳源的果胶,果胶甲酯酶和乙酰酯酶首先催化果胶上甲酯和乙酯的水解。果胶甲酯酶的实例包括但不限于pemA和pmeB。果胶乙酰酯酶的实例包括但不限于PaeX和PaeY。可用于本文中的果胶甲酯酶的其它实例包括与图40中的果胶酸甲酯酶共有至少60%、70%、80%、90%、95%、98%或更多序列同一性(包括其中的所有整数)的酶或多肽。可用于本文中的果胶酸乙酰酯酶的其它实例包括与图41中所述的果胶酸乙酰酯酶共有至少60%,、70%、80%、90%、95%、98%或更多序列同一性(包括其中的所有整数)的酶或多肽。
进一步为此目的,果胶酸裂解酶和水解酶可以经由β-消除和水解,催化果胶酸盐的内裂解切割,分别产生寡果胶酸盐。可以用于代谢果胶的其它酶包括。果胶酸裂解酶的实例包括但不限于PelA、PelB、PelC、PelD、PelE、Pelf、PelI、PelL以及PelZ。果胶酸水解酶的实例包括但不限于PehA、PehN、PehV、PehW以及PehX。果胶酸裂解酶的其它实例包括与图38所述的果胶酸裂解酶共有少至60%、70%、80%、90%、95%、98%或更多序列同一性(包括其中的所有整数)的多肽或酶。
多聚半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖裂解酶以及鼠李糖半乳糖醛酸聚糖水解酶也可以用于本文中,以降解和代谢果胶。鼠李糖半乳糖醛酸聚糖裂解酶的实例包括与图39A所述的半乳糖醛酸聚糖裂解酶(即鼠李聚糖半乳糖醛酸酶(rhamnogalacturonases))共有至少60%、70%、80%、90%、95%、98%或更多序列同一性(包括其中的所有整数)的多肽或酶。鼠李聚糖半乳糖醛酸水解酶的实例,包括与图39B所述的鼠李聚糖半乳糖醛酸水解酶共有至少60%、70%、80%、90%、95%、98%或更多序列同一性(包括其中的所有整数)的多肽或酶。
因此,为了降解和代谢果胶,除了本领域已知的其它的外,某些本发明的重组微生物和方法可以并入一种或多种上述甲酯酶和乙酰酯酶和/或水解酶。这些酶可以为内源或外源基因编码和表达,也可以包括这些酶的生物活性片段或变体,如其同源物、直系同源物和/或优化的变体。
为了进一步代谢果胶降解产物,寡果胶酸盐可以通过外膜孔蛋白转运至革兰氏阴性细菌的周质部分,在那里,它们进一步降解为如二半乳糖醛酸盐和三半乳糖醛酸盐的组分。外膜孔蛋白的实例包括可以将寡果胶酸盐转运至周质的外膜孔蛋白,包括但不限于kdgN和kdgM。某些重组微生物可以并入这些或相似基因。
随后可将二和三半乳糖醛酸盐转运至细胞溶胶中,用于进一步降解。细菌含有至少两种不同的负责二和三半乳糖醛酸盐转运的转运蛋白系统,包括同向转运蛋白和ABC转运蛋白(如分别为TogT和TogMNAB)。因此,本文所提供的某些重组微生物可以包含一种或多种二或三半乳糖醛酸盐转运系统,如TogT和/或TogMNAB。
一旦二和三半乳糖醛酸盐并入细胞溶胶,短的果胶酸或半乳糖醛酸裂解酶便将它们分解成D-半乳糖醛酸盐和(4S)-4,6-二羟基-2,5-二氧己糖醛酸盐(dioxohexuronate)。短的果胶酸或半乳糖醛酸裂解酶的实例包括但不限于PelW和Ogl,其基因可以以内源或外源方式并入本文所提供的某些重组微生物中。D-半乳糖醛酸盐和(4S)-4,6-二羟基-2,5-二氧己糖醛酸盐随后被转化为5-脱氢-4-脱氧-D-葡糖醛酸盐,并进一步转化为KDG,这些步骤可分别受KduI和KduD催化。KduI酶具有异构酶活性,KduD酶具有脱氢酶活性,如2-脱氧-D-葡糖酸3-脱氢酶活性。因此,本文所提供的某些重组微生物可以包含一种或多种短的果胶酸或半乳糖醛酸裂解酶,如PelW和/或Ogl,并且可以任选地包含一种或多种异构酶,如KduI,以及一种或多种脱氢酶,如KduD,以便将二和三半乳糖醛酸盐转化为为适宜的单糖,如KDG。
在某些方面,能生长于作为唯一碳源和/或能源的果胶或三半乳糖醛酸盐上的重组微生物如大肠杆菌,可以包含一个或多个含于SEQ IDNOS:65和66中的基因序列,包括其生物活性片段或变体,如优化的变体。SEQ ID NO:65表示胡萝卜软腐欧文氏菌马铃薯黑胫亚种(Erwiniacarotovora subsp.Atroseptica)SCRI1043的kdgF-PaeX区的核苷酸序列。SEQ ID NO:66表示胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043的ogl-kdgR的核苷酸序列。
在某些方面,能生长于作为唯一碳源和/或能源的果胶或三半乳糖醛酸盐的重组微生物如大肠杆菌,可以包含菊欧文氏菌(Erwiniachrysanthemi)的一个或多个基因组区,其包含编码酶(kduI、kduD、ogl、pelW以及paeX)、转运蛋白(togM、togN、togA、togB以及kdgM)和负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的数个基因(kdgF、kduI、kduD、pelW、togM、togN、togA、togB、kdgM、paeX、ogl以及kdgR),以及编码果胶酸裂解酶(pelA和pelE)、果胶乙酰酯酶(paeY)和果胶甲酯酶(pem)的数个基因(pelA、pelE、paeY以及pem)(参见实施例2)。
可用于本文的异构酶的其它实例包括葡糖醛酸异构酶,如uxaC家族的葡糖醛酸异构酶,以及4-脱氧-L-苏型-5-己酮糖醛酸异构酶,如KduI家族的4-脱氧-L-苏型-5-己酮糖醛酸异构酶。可用于本文的还原酶的其它实例包括塔格糖醛酸还原酶,如uxaB家族的塔格糖醛酸还原酶。可用于本文的脱水酶的其它实例包括阿卓糖酸脱水酶(altronate dehydratase),如uxaA家族的阿卓糖酸脱水酶。可用于本文的脱氢酶的其它实例包括2-脱氧-D-葡糖酸3-脱氢酶,如kduD家族的2-脱氧-D-葡糖酸3-脱氢酶。
某些方面也可以利用经基因工程化增强KDG降解途径效率的重组微生物。例如,在细菌中,KDG是己糖醛酸盐如D-葡糖醛酸盐和D-半乳糖醛酸盐降解的普通代谢中间物,并进入ED途径(Entner Doudoroffpathway),在那里,其转化为丙酮酸盐和3-磷酸甘油醛(G3P)。在该途径中,KDG首先被KDG激酶(KdgK)磷酸化,随后利用2-酮-3-脱氧-D-6-磷酸-葡糖酸(KDPG)醛缩酶(KdgA)切割成丙酮酸盐和3-磷酸甘油醛(G3P)。与KDG透性酶(如KdgT)同时发生的这些酶的表达被KdgR负调节,并且在基础水平下几乎不存在。加入己糖醛酸盐,显著诱导表达(3-5倍),在生长于藻酸盐的假单胞菌中也有类似结果的报道。因此,为了增加KDG向丙酮酸盐和G3P的转化,可以去除负调节蛋白KdgR。为了进一步改善途径的效率,也可将KdgK和KdgA的外源拷贝并入给定的重组微生物中。
在某些方面,能生长于作为唯一碳源的多糖(如藻酸盐、果胶等)上的重组微生物,可能能使所产生的给定的大量生产型化学品(如乙醇)的量增加,同时生长于该多糖上。例如,经基因工程化而生长于藻酸盐上的大肠杆菌,可以经基因工程,以致所产生的乙醇的量,比未经基因工程化生长于藻酸盐上的大肠杆菌所产生的量增加(参阅实施例11)。因此,某些方面包括重组微生物,其能生长于作为唯一碳源的藻酸盐或果胶酸上,并且通过例如包含一个或多个编码和表达丙酮酸脱羧酶(pdc)和/或醇脱氢酶的基因,包括其功能变体,而能使所产生的乙醇的量增加。在某些方面,此类重组微生物可以包含丙酮酸脱羧酶(pdc)和两种醇脱氢酶(adhA和adhB),其获自运动发酵单孢菌(zymomonas mobilis)。
本发明的实施方案也包括将多糖转化为适宜的单糖的方法,包括(a)获得多糖;(b)使多糖与化学催化或酶促途径接触,从而将多糖转化为第一单糖或寡糖;以及(c)使第一单糖与微生物系统接触足以将第一单糖或寡糖转化为适宜单糖的时间,其中,微生物系统包含(i)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白以及多糖转运蛋白;以及(ii)至少一个编码和表达酶的基因,从而将多糖转化为单糖,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。
在本发明的某些方面,水生或海洋生物质多肽,如藻酸盐,可以利用化学催化剂如酸进行化学降解。类似地,生物质衍生的果胶可以进行化学降解。例如,化学催化剂所催化的反应,通常通过水解,与酶促催化剂所催化的β-消除的反应类型相对。因此,某些实施方案可以包括用强矿物酸沸腾藻酸盐或果胶,以便从D-甘露糖醛酸盐释放二氧化碳,从而形成D-来苏糖,所述D-来苏糖是许多微生物所利用的常见糖类代谢物。除了作为化学催化剂的本领域已知的其它适宜的酸外,此类实施方案可以使用例如,甲酸、盐酸、硫酸。
酶促途径可以利用本文所述的一种或多种酶,其能催化多糖如藻酸盐或果胶的降解。
其它实施方案可以使用与本文所述或本领域技术人员已知的化学催化类似的改变的化学催化,包括适用于生物质相关的多糖的改善的或再设计的化学催化的方法。某些实施方案包括所得的单糖醛酸是D-甘露糖醛酸盐的实施方案。
如上所述,本发明的重组微生物和微生物系统所产生的适宜的单糖或适宜的寡糖,可以用作生产大量生产型化学品如生物燃料以及大量生产型化学品中间物的给料。因此,本发明的某些实施方案通常涉及将适宜的单糖或寡糖转化为大量生产型化学品如生物燃料的方法,包括(a)获得适宜的单糖或寡糖;(b)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖转化为生物燃料的时间,从而将适宜的单糖转化为生物燃料。
某些方面包括将适宜的单糖转化为第一大量生产型化学品如生物燃料的方法,包括(a)获得适宜的单糖;(b)使适宜的单糖与微生物系统接触足以将适宜的单糖转化为第一大量生产型化学品的时间,其中微生物系统包含一个或多个编码醛或酮生物合成途径的基因,从而将适宜的单糖转化为第一大量生产型化学品。
在这些和其它相关方面,取决于所用的特定酮或醛生物合成途径,第一大量生产型化学品可进一步酶促和/或化学还原和脱水为第二大量生产型化学品。此类第二大量生产型化学品的实例包括但不限于丁烯或丁烷;1-苯基丁烯或1-苯基丁烷;戊烯或戊烷;2-甲基戊烯或2-甲基戊烷;1-苯基戊烯或1-苯基戊烷;1-苯基-4-甲基戊烯或1-苯基-4-甲基戊烷;己烯或己烷;2-甲基己烯或2-甲基己烷;3-甲基己烯或3-甲基己烷;2,5-二甲基己烯或2,5-二甲基己烯;1-苯基己烯或1-苯基己烷;1-苯基-4-甲基己烯或1-苯基-4-甲基己烷;1-苯基-5-甲基己烯或1-苯基-5-甲基己烷;庚烯或庚烷;2-甲基庚烯或2-甲基庚烷;3-甲基庚烯或3-甲基庚烷;2,6-二甲基庚烯或2,6-二基庚烷;3,6-二甲基庚烯或3,6-二甲基庚烷;3-甲基辛烯或3-甲基辛烷;2-甲基辛烯或2-甲基辛烷;2,6-二甲基辛烯或2,6-二甲基辛烷;2,7-二甲基辛烯或2,7-二甲基辛烷;3,6-二甲基辛烯或3,6-二甲基辛烷;以及环戊烷或环戊烯。
本发明的某些实施方案也可以包括将适宜的单糖或寡糖转化为大量生产型化学品的方法,包括(a)获得适宜的单糖或寡糖;(b)使适宜的单糖或寡糖与微生物系统接触足以将适宜的单糖或寡糖转化为大量生产型化学品的时间,其中微生物系统包含(i)一个或多个编码生物合成途径的基因;(ii)一个或多个编码和表达C-C连接途径的基因;以及(iii)一个或多个编码和表达还原和脱水途径的基因,其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶,从而将适宜的单糖或寡糖转化为大量生产型化学品。
某些方面也包括重组微生物,其包含(i)一个或多个编码生物合成途径的基因;(ii)一个或多个编码和表达C-C连接途径的基因;以及(iii)一个或多编码和表达还原和脱水途径的基因,其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶。某些方面也包括重组的微生物,其包括单独的或某些组合的上述途径,如包含一个或多个编码生物合成途径的基因的重组微生物,如上文所述。某些方面也可以包括包含本文所述一个或多个编码和表达C-C连接途径的基因的重组微生物。某些方面也可以包括包含一个或多个编码和表达还原和脱水途径的基因的重组微生物,其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶,如本文所述。
对于包含上述途径的组合的重组微生物而言,某些方面也可以包括重组微生物,其包含(i)一个或多个编码生物合成途径的基因;和(ii)一个或多个编码和表达C-C连接途径的基因。某些方面也可以包括重组微生物,其包含(i)一个或多个编码和表达C-C连接途径的基因;和(ii)一个或多个编码和表达还原和脱水途径的基因,其包括二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶。
某些方面也可以包括包含脱水和还原途径的一个或多个单个组分的重组微生物,如包含二醇脱氢酶、二醇脱水酶或次级醇脱氢酶的重组微生物。这些和其它微生物可以用于,例如将适宜的多糖转化为第一大量生产型化学品或其中间物,或将第一大量生产型化学品或其中间物转化为第二大量生产型化学品。
仅以示例的方式,包含C-C连接途径的重组微生物可以用于,将丁醛转化为第一大量生产型化学品或其中间物,如5-羟基-4-辛酮,其通过任何适宜的途径,随后转化为第二大量生产型化学品或其中间物。作为另一个实例,包含C-C连接途径和二醇氢化酶的重组微生物可用于将丁醛依次转化为5-羟基-4-辛酮和随后地4,5-辛酮二醇。包含本文所述单个途径的这些和其它各种组合,以及这些途径的单个组分的各种组合的重组微生物的实例,对本领域技术人员而言是显而易见的,且也可以见于实施例中。
还包括将多糖转化为第一大量生产型化学品或其中间物的方法,其例如利用包含醛或酮生物合成途径的重组微生物。也包括将第一大量生产型化学品或其中间物转化为第二大量生产型化学品的方法,其例如利用任选地包含生物合成途径、任选地包含C-C连接途径和/或任选地包含脱水和还原途径的一个或多个单个组分的重组微生物。仅以示例的方式,包含C-C外源连接酶(如来自荧光假单胞菌的苯甲醛裂解酶)的重组微生物,可用于将第一大量生产型化学品如3-甲基丁醛转化为第二大量生产型化学品如2,7-二甲基-5-羟基-4-辛酮。沿着这一线路的示例说明,包含二醇脱氢酶的相同或不同重组微生物可用于将2,7-二甲基-5-羟基-4-辛酮转化为另一大量生产型化学品如2,7-二甲基-4,5-辛烷二醇的方法(其它实例参阅表2)。作为另一示例性实例,包含外源次级醇脱氢酶的重组微生物可以用于将第一大量生产型化学品如2,7-二甲基-4-辛酮转化为第二大量生产型化学品如2,7-二甲基辛醇的方法。
本申请的微生物系统或分离的微生物的实施方案可以包括天然存在的生物合成途径,和/或已经优化用于改善功能性的工程化的、重新构建的或再设计的生物合成途径。
本发明微生物系统或重组微生物的实施方案可以包括天然或重新构建的生物合成途径,如在诸如丙酮丁醇梭菌(Clostridium acetobutylicum)和天蓝色链霉菌(Streptomyces coelicolor)的微生物中发现的丁醛生物合成途径。作为解说地,丁酸盐和丁醇是诸如梭状芽胞杆菌(Clostridia)的某些细菌种类的常见发酵产物,在这些种类中,丁酸盐和丁醇的产生受合成硫解酶依赖性途径介导,该途径在特征上与脂肪酸降解途径相似。此类途径由两分子的乙酰辅酶A缩合为乙酰乙酰辅酶A启动,其受硫解酶催化。乙酰乙酰辅酶A随后还原为β-羟基丁酰辅酶A,其受NAD(P)H依赖性β-羟基丁酰辅酶A脱氢酶(HBDH)催化。巴豆酸酶催化β-羟基丁酰辅酶A的脱水,形成巴豆酰辅酶A。NADH-依赖性丁酰辅酶A脱氢酶(BCDH)所催化的其它还原反应,使巴豆酰辅酶A的C2的双键饱和,形成丁酰辅酶A。
在某些实施方案中,硫解酶,即该途径中的第一酶,可以过表达,以使产量最大化。在某些实施方案中,硫解酶可以在大肠杆菌中过表达。在这点上,催化下述反应步骤的所有3种酶(如HBDH、巴豆酸酶以及BCDH)见于丙酮丁醇梭菌ATCC824中。在某些实施方案中,BDH、巴豆酸酶以及BCDH可表达或过表达于适宜的微生物如大肠杆菌中。可选地,衍生于恶臭假单胞菌KT2440的短链脂肪族酰基辅酶A脱氢酶可用于本申请的微生物系统或分离的微生物的其它实施方案。
进一步为此目的,通过至少几种不同的途径,可以很容易地将梭状芽胞杆菌的丁酰辅酶A转化为丁醇和/或丁酸盐。在一途径中,经NADH依赖性辅酶A酰化醛脱氢酶(ALDH)所催化,丁酰辅酶A直接还原为丁醛。丁醛经由NADH依赖性丁醇脱氢酶可以进一步还原为丁醇。尽管辅酶A-酰化ALDH催化丁酰辅酶A向丁醛的一步还原,但是因为其混杂的乙酰辅酶A去酰化活性,辅酶A酰化ALDH向微生物系统的并入可以导致乙醛形成。在某些实施方案中,乙醛的形成可以通过再设计相关酶的功能而最小化。
经磷酸丁酰转移酶所催化,在其它生物合成途径中的丁酰辅酶A去酰化,形成磷酸丁酰。磷酸丁酰随后被可逆的磷酸丁酰激酶水解形成丁酸盐。这个反应与由ADP形成ATP偶联。已知通过这些酶的丁酸盐形成显著更特异。某些实施方案可以将磷酸丁酰转移酶和磷酸丁酰激酶包含于微生物系统中。在其它实施方案中,丁酸盐可以通过短链酰基辅酶A硫酯酶由丁酰辅酶A直接形成。
梭状芽胞杆菌中的丁酸盐也可以依次还原为丁醇,其被单个醇/醛脱氢酶催化。某些实施方案可以包含来自诸如恶臭假单胞菌的其它细菌的短链醛脱氢酶,以便补充丁醛在微生物系统中的产生。一个有关使用短链醛脱氢酶的潜在顾虑与由乙酸盐可能形成乙醛有关。某些实施方案可以涉及在微生物系统中使乙酸盐形成最小化,例如通过缺失数个编码与乙酸盐产生有关的酶的基因。
此外,在大肠杆菌中有形成乙酸盐的多种途径,其中之一受丙酮酸盐的丙酮酸加氧酶(POXB)的介导,而另一个受乙酰辅酶A的磷酸转乙酰酶(PTA)和磷酸乙酰激酶(ACKA)的介导。由带有poxB-、pta-和acka-的大肠杆菌突变菌株产生的乙酸显著减少。另外,已知催化由乙酸盐形成乙酰辅酶A的乙酰辅酶A合酶(ACS)的并入显著减少乙酸盐的积聚。某些实施方案可以包含带有POXB、PTA和/或ACKA基因缺失的微生物系统或分离的微生物,其它实施方案也可以单独或与缺失基因一起,包含一个或多个编码和表达ACS的基因。
本文所提供的微生物系统或重组微生物也可以包含戊二醛生物合成途径。作为一实例,酿酒酵母具有赖氨酸生物合成途径,在该途径中,乙酰辅酶A最初缩合为α-酮戊二酸盐(其是柠檬酸循环中常见的代谢物),以形成高柠檬酸盐(homocitrate)。这个反应被衍生于酵母、嗜热栖热菌(Thermus thermophilus)或耐辐射奇球菌(Deinococcus radiodurans)的高柠檬酸合酶催化。衍生于酵母、嗜热栖热菌或耐辐射奇球菌的高乌头酸酶催化高柠檬酸盐和高异柠檬酸盐间的转化。高异柠檬酸盐随后氧化脱羧形成2-酮己二酸盐,其被衍生于酵母、嗜热栖热菌或耐辐射奇球菌的高异柠檬酸脱氢酶催化。高异柠檬酸盐也氧化脱羧形成丁酰辅酶A,其可以被高异柠檬酸脱氢酶催化。因此,某些实施方案可以包含高柠檬酸合酶、高柠檬酸酶和/或高异柠檬酸脱氢酶。
进一步为此目的,在合成2-酮-脂肪半醛(2-keto-adipicsemialdehyde)时,2-酮己二酸盐还原为2-酮-脂肪半醛。该反应可以被二醛脱氢酶催化,其例如可以分离自根癌农杆菌C58。因此,某些实施方案可以将二醛脱氢酶并入微生物系统或重组的微生物。
在合成戊二醛时,酰基辅酶A硫酯酶(ACOT)也可以催化戊二酰辅酶A的水解。编码ω-羧基酰基辅酶A特异性过氧化物酶ACOTs的基因见于许多哺乳动物物种中;衍生于小鼠的ACOT4和ACOT8两者之前已经表达于大肠杆菌中,并且已表明,这两种酶对戊二酰辅酶A形成戊二酸的水解是高活性的。某些实施方案可以包含一种或多种酰基辅酶A硫酯酶。
戊二酸盐依次还原为戊二醛。这种反应可以被戊二醛脱氢酶(CpnE)催化,该酶可以例如分离自丛毛单胞菌(Comomonas sp.)菌株NCIMB9872。某些实施方案可以将戊二醛脱氢酶如CpnE并入微生物系统或分离的微生物。其它的实施方案可以包含ACOT和CpnE酶两者。其它实施方案可以包含经再设计催化1-羟基丙酸和琥珀酸还原为1-羟基丙醛和丁二醛的CpnE酶。
在某些方面,生物合成途径可以包括醛生物合成途径、酮生物合成途径或两者。在某些方面,生物合成途径可以包括下述中的一个或多个:乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、苯乙醛、2-苯乙醛、2-(4-羟苯基)乙醛、2-吲哚-3-乙醛、戊二醛、5-氨基-戊醛、琥珀酸半醛和/或琥珀酸4-羟苯基乙醛生物合成途径,包括其各种组合。
对于生物合成途径的组合,生物合成途径可以包含与下述至少之一组合的乙醛生物合成途径:丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径。在某些方面,生物合成途径可以包含与丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的丙醛生物合成途径。在某些方面,生物合成途径可以包含与异丁醛、2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的丁醛生物合成途径。在某些方面,生物合成途径可以包含与2-甲基-丁醛、3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的异丁醛生物合成途径。在某些方面,生物合成途径可以包含与3-甲基-丁醛或苯乙醛生物合成途径中的至少之一组合的2-甲基-丁醛生物合成途径。在某些方面,生物合成途径可以包含与苯乙醛生物合成途径组合的3-甲基-丁醛生物合成途径。
在某些方面,丙醛生物合成途径可以包含来自诸如大肠杆菌的生物的苏氨酸脱氨酶(ilvA)基因,和来自诸如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)基因,和/或这些酶的功能变体,包括其同源物或直系同源物,以及优化的变体。这些酶通常可以用于将L-苏氨酸转化为丙醛。
在某些方面,丁醛生物合成途径可以包含下述至少之一:来自如大肠杆菌的生物的硫解酶(atoB)基因,来自如丙酮丁醇梭菌(如ATCC 824)的生物的β-羟基丁酰辅酶A脱氢酶(hbd)基因、巴豆酸酶(crt)基因、丁酰辅酶A脱氢酶(bcd)基因、电子转移黄素蛋白A(etfA)基因,和/或电子转移黄素蛋白B(etfB)基因,以及来自诸如拜氏丙酮丁醇梭菌(Clostridiumbeijerinckii acetobutyricum)ATCC 824的生物的辅酶A连接的丁醛脱氢酶(ald)基因。在某些方面,来自诸如丙酮丁醇梭菌ATCC 824的生物的辅酶A连接的醇脱氢酶(adhE2)基因,可以用作ald基因的替代物。
在某些方面,异丁醛生物合成途径可以包含来自如枯草芽孢杆菌的生物的乙酰乳酸合酶(alsS),或来自如肺炎克雷伯氏菌肺炎亚种MGH78578的生物的als基因(对于大肠杆菌蛋白的表达,可以优化密码子使用)。此类途径也可以包含来自如大肠杆菌的生物的乙酰乳酸还原异构酶(ilvC)和/或2,3-二羟基异戊酸脱水酶(ilvD)基因,以及来自诸如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)基因。
在某些方面,3-甲基丁醛和2-甲基丁醛生物合成途径可以包含来自如枯草芽孢杆菌的生物的乙酰乳酸合酶(alsS)基因,或来自如肺炎克雷伯氏菌肺炎亚种MGH 78578的生物的(als)基因(对于大肠杆菌蛋白的表达,可以优化密码子使用)。此类途径的某些方面还可以包含来自如大肠杆菌的生物的乙酰乳酸还原异构酶(ilvC)、2,3-二羟基异戊酸脱水酶(ilvD)、异丙基苹果酸合酶(LeuA)、异丙基苹果酸异构酶(LeuC和LeuD)和3-异丙基苹果酸脱氢酶(LeuB)基因,以及来自如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)。
在某些方面,苯乙醛和4-羟苯基乙醛生物合成途径可以包括下述一种或多种:来自如大肠杆菌的生物的3-脱氧-7-phosphoheptulonate合酶(aroF、aroG和aroH)、3-脱氢奎尼酸合酶(aroB)、3-脱氢奎尼酸脱水酶(aroD)、脱氢莽草酸还原酶(aroE)、莽草酸激酶II(aroL)、莽草酸激酶I(aroK)、5-烯醇丙酮醛莽草酸-3-磷酸合成酶(aroA)、分支酸合酶(chorismatesynthase)(aroC)、融合的分支酸歧化酶P/预苯酸(prephenate)脱水酶(pheA)和/或融合的分支酸歧化酶T/预苯酸脱氢酶(tyrA)基因,以及来自如乳酸乳球菌的生物的酮-异戊酸脱羧酶(kivd)。
在某些方面,如为1,10-二氨基-5-癸醇和1,10-二羧基-5-癸醇的最终产生,生物合成途径可以包含一种或多种来自如耐辐射奇球菌和/或嗜热栖热菌的生物的高柠檬酸合酶、高乌头酸水合酶、高异柠檬酸脱氢酶和/或高异柠檬酸脱氢酶的基因,以及酮-己二酸脱羧酶基因、2-氨基己二酸转氨酶基因和L-2-氨基己二酸-6-半醛:NAD+6-氧化还原酶基因。此类生物合成途径能将α-酮戊二酸转化为5-氨基戊醛。
在某些方面,如对于环戊醇产生中的一个步骤,α-酮己二酸半醛生物合成途径可以包含来自如耐辐射奇球菌和/或嗜热栖热菌的生物的高柠檬酸合酶(hcs)、高乌头酸水合酶和高异柠檬酸脱氢酶的基因,和α-酮己二酸半醛脱氢酶基因。此类生物合成途径能将乙酰辅酶A和α-酮戊二酸转化为α-酮己二酸半醛。
为了产生某些大量生产型化学品(除了其它相似的化学品外,如2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇),生物合成途径(如醛生物合成途径)可以任选地或还包含一个或多个编码羧化酶如吲哚-3-丙酮酸脱羧酶(IPDC)的基因。IPDC可以从例如如巴西固氮螺菌(Azospirillumbrasilense)和多粘类芽孢杆菌(Paenibacillus polymyxa)E681的微生物获得。在这点上,IPDC可用于更有效地催化各种羧酸的脱羧化形成相应的醛,其如本文所述,可以通过还原酶或脱氢酶进一步转化为大量生产型化学品。
在某些方面,2-苯基乙醇、2-(4-羟苯基)乙醇以及2-(吲哚-3-)乙醇生物合成途径可以包含来自大肠杆菌的转酮醇酶(tktA)、3-脱氧-7-phosphoheptulonate合酶(aroF、aroG和aroH)、3-脱氢奎尼酸合酶(aroB)、3-脱氢奎尼酸脱水酶(aroD)、脱氢莽草酸还原酶(aroE)、莽草酸激酶II(aroL)、莽草酸激酶I(aroK)、5-醇烯丙酮酸莽草-3-磷酸合成酶(aroA)、分支酸合酶(aroC)、融合的分支酸歧化酶P/预苯酸脱水酶(pheA)以及融合的预苯酸岐化酶T/预苯酸脱氢(tyrA)基因,和来自如乳酸乳球菌的酮-异戊酸脱羧酶(kivd)、来自酿酒酵母的醇脱氢酶(adh2)、来自巴西固氮螺菌的吲哚-3-丙酮酸脱羧酶(ipdc)、来自红球菌(Rhodococcus sp.)ST-10的苯基乙醇还原酶,和来自荧光假单胞菌的苯甲醛裂解(bal)。
对于本文所述的所有其它途径,本文所述的各生物合成途径的组分都可以内源或外源地存在于重组微生物中。为了改善给定生物合成途径的效率,例如可以上调或过表达内源基因,如通过将该内源基因的其它(即外源)拷贝引入重组微生物中。此类途径的优化也可以通过经由诱变改变基因的内源形式以便改善功能性,随后将改变的基因引入微生物。根据本领域已知的或本文所述的技术,可以上调或下调或甚至除去内源基因的表达。相似地,外源所提供的基因的表达水平可以根据需要进行调节,如通过使用各种组成型或诱导型启动子。此类基因可以是“密码子优化的”,如本文所述或本领域已知的。还包括本文所述基因和酶的功能性的天然存在的变体,包括其同源物或直系同源物。
微生物系统或分离的微生物的某些实施方案可以包含CC连接途径。在某些方面,CC连接途径可以包含ThDP依赖性酶,如C-C连接酶,或优化的C-C连接酶。例如,8个碳单位的分子(丁偶姻)可以通过将两个4碳单位分子(丁醛)缩合在一起而制备。ThDP依赖性酶是一组已知催化C-C键的断裂和形成的酶,并且已经在化学酶促合成中用作催化剂。这些酶催化的化学反应谱的范围从α-酮酸脱羧、氧化脱羧、碳连接(carboligation)到C-C键的切割。
为了提供一些实例,来自荧光假单胞菌的苯甲醛裂解酶(BAL)、来自恶臭假单胞菌的苯甲酰甲酸脱羧酶(benzoylformate decarboxylase,BFD)以及来自运动发酵单孢菌的丙酮脱羧酶(PDC)可以催化两个醛之间的碳连接反应。如本文所示,在这三种酶中,BAL接受最广泛谱系的醛作为底物,从取代的苯甲醛到乙醛等。BAL催化两个醛之间的立体专一碳连接反应,并形成具有超过99%eeR构型的α-羟基酮。从两个苯甲醛分子形成二苯乙醇酮是BAL所催化的有利反应,并且所述形成以快至320μmol(二苯乙醇酮)mg(蛋白)-1分钟-1的速度进行。α-羟基酮的形成可以利用许多不同的醛包括丁醛进行。
BFD和PCD也可以催化两个醛分子间的碳连接反应。BFD和PCD分别接受相对较大和较小的醛分子。在苯甲醛和乙醛存在的情况下,BFD催化二苯乙醇酮和(S)-α-羟基苯基丙酮(2S-HPP)的形成,而PCD则催化(R)-α-羟基苯基丙酮(2R-HPP)和(R)-α-羟基2-丁酮(乙偶姻)的形成。如下文详细所述,本申请的某些微生物系统或分离的微生物可以包含天然的或优化的C-C连接酶(ThDP-依赖性酶),其选自来自荧光假单胞菌的苯甲醛裂解酶(BAL)、来自恶臭假单胞菌的苯甲酰甲酸脱羧酶(BFD)以及来自运动发酵单孢菌的丙酮酸脱羧酶(PDC)。其它实施方案可以包含来自荧光假单胞菌的苯甲醛裂解酶(BAL)(参阅SEQ ID NOS:143-144,分别表示核苷酸序列和多肽序列),包括其生物活性变体,如优化的变体。
本发明的C-C连接途径通常包含一种或多种C-C连接酶,如裂解酶。示例性的裂解酶包括但不限于,乙醛裂解酶、丙醛裂解酶、丁醛裂解酶、异丁醛裂解酶、2-甲基-丁醛裂解酶、3-甲基-丁醛裂解酶(异戊醛)、苯乙醛裂解酶、α-酮己二酸羧基裂解酶、戊醛裂解酶、4-甲基-戊醛裂解酶、己醛裂解酶、庚醛裂解酶、辛醛裂解酶、4-羟苯基乙醛裂解酶、吲哚乙醛裂解酶、吲哚苯乙醛裂解酶。在某些方面,所选的CC-连接酶或裂解酶可以具有一种或多种上文示例性所示的裂解酶活性,如乙醛裂解酶活性、丙醛裂解酶活性、丁醛裂解酶活性和/或异丁醛裂解酶活性等。
如上所述,C-C连接酶可以包含苯甲醛裂解酶,如分离自荧光假单胞菌的苯甲醛裂解酶(SEQ ID NOS:143-144),以及这种参照序列的生物活性片段或变体,如苯甲醛裂解酶的优化的变体。因此,某些方面可以包含与SEQ ID NOS:143-144具有80%、85%、90%、95%、97%、98%、99%序列同一性的核苷酸序列或多肽序列,且其能催化碳连接反应,或其具有C-C裂解酶活性,如上文所述。在某些方面,BAL酶包含一个或多个保守的氨基酸残基,包括G27、E50、A57、G155、P162、P234、D271、G277、G422、G447、D448和/或G512。
荧光假单胞菌因为其具有利用硫胺二磷酸(ThDP)作为辅因子切割偶姻键的苯甲醛裂解酶,所以能生长于作为唯一碳源和能源的R-二苯乙醇酮上。在逆反应中,如本文所用的,苯甲醛裂解酶以高底物和立体专一性催化两个醛的碳连接。与其它蛋白进行的基于结构的比较表明,苯甲醛裂解酶属于一组密切相关的ThDP依赖性酶。这些酶的ThDP辅因子固定于其单独的结构域的两个末端,从而于它们之间悬浮着相当机动的噻唑环。尽管结合ThDP的两个末端的残基是非常保守的,但是,噻唑部分周围活性中心口袋(pocket)的内衬在基团内有很大变化。BAL的活性位点已有描述,如在Kneen et al.(Biochimica et Biophysica Acta 1753:263-271,2005)和Brandt et al.(Biochemistry 47:7734-43,2008)中。本文已经证明,衍生于荧光假单胞菌的苯甲醛裂解酶至少具有乙醛裂解酶活性、丙醛裂解酶活性、丁醛裂解酶活性、3-甲基-丁醛裂解酶活性、戊醛裂解酶活性、4-甲基戊醛裂解酶活性、己醛裂解酶活性、苯乙醛裂解酶活性以及辛醛裂解酶活性(参阅表2),除了其它体内裂解酶活性外(参阅图48-55)。
在某些方面,C-C连接酶,如衍生于荧光假单胞菌的BAL、衍生于恶臭假单胞菌的BFD或衍生于运动发酵单孢菌的PDC,可以包含具有裂解酶活性组合的裂解酶,如除其它组合和活性(如本文所详述的示例性组合)外,还具有丙醛裂解酶裂解酶活性和3-甲基-丁醛裂解酶活性两者的连接酶。仅以示例的方式,具有裂解酶活性组合的裂解酶可以在本文中称为丙醛/3-甲基-丁醛裂解酶。
包含二醇脱氢酶、二醇脱水酶以及次级醇脱氢酶的脱水和还原途径可以用于进一步将醛、酮或相应的醇转化为大量生产型化学品,如生物燃料。
为此,脱水和还原途径可以包含一种或多种二醇脱氢酶。“二醇脱氢酶”通常指催化α-羟基酮和/或其相应的二醇的可逆还原和氧化反应的酶。微生物系统或分离的微生物的某些实施方案可以包含编码二醇脱氢酶的基因,该二醇脱氢酶特异性地催化α-羟基-酮的还原,包括例如4,5,辛二醇脱氢酶。二醇脱氢酶,如4,5,辛二醇脱氢酶,可从多种生物分离,和并入微生物系统或分离的微生物。一组特定的醇脱氢酶具有氧化各种α-羟基醇并还原各种α-羟基酮和α-酮基酮的特征性能力。因此,“二醇脱氢酶”这一叙述还可以包括此类醇脱氢酶。
以有关来自示例性生物的二醇脱氢酶为例,分离自Hansenulaofunaensis的甘油脱氢酶具有广泛的底物特异性,并能以与其天然底物分别地甘油和二羟丙酮相媲美的活性(40-200%),催化各种α-羟基醇包括1,2-辛烷的氧化,以及各种α-羟基酮和α-酮基酮包括3-羟基-2-丁酮和3,4-己二酮的还原。作为一其它实例,在多型汉逊酵母(Hansenulapolumorpha)DI-1中所发现的甘油脱氢酶起相似的作用。在某些实施方案中,微生物系统或重组的微生物可以包含分离自多型汉逊酵母的甘油脱氢酶基因,分离自多型汉逊酵母DI-1的甘油脱氢酶和/或来自肺炎克雷伯氏菌的内消旋-2,3-丁烷二醇脱氢酶。在其它实施方案中,除了本文详述的其它外,微生物系统或分离的微生物可以包含4,5,辛二醇脱氢酶。二醇脱氢酶也可以从短乳杆菌ATCC 367、恶臭假单胞菌KT2440以及肺炎克雷伯氏菌MGH78578获得,如本文所述(参阅实施例5)。
示例性的二醇脱氢酶包括但不限于:2,3-丁二醇脱氢酶、3,4-己二醇脱氢酶、4,5-辛二醇脱氢酶、5,6-癸二醇脱氢酶、6,7-十二烷二醇脱氢酶、7,8-十四烷二醇脱氢酶、8,9-十六烷二醇脱氢酶、2,5-二甲基-3,4-己二醇脱氢酶、3,6-二甲基-4,5-辛二醇脱氢酶、2,7-二甲基-4,5-辛二醇脱氢酶、2,9-二甲基-5,6-癸二醇脱氢酶、1,4-二苯基-2,3-丁二醇脱氢酶、二-1,4-(4-羟苯基)-2,3-丁二醇脱氢酶、1,4-二吲哚-2,3-丁二醇脱氢酶、1,2-环戊二醇脱氢酶、2,3-戊二醇脱氢酶、2,3-己二醇脱氢酶、2,3-庚二醇脱氢酶、2,3-辛二醇脱氢酶、2,3-壬二醇脱氢酶、4-甲基-2,3-戊二醇脱氢酶、4-甲基-2,3-己二醇脱氢酶、5-甲基-2,3-己二醇脱氢酶、6-甲基-2,3-庚二醇脱氢酶、1-苯基-2,3-丁二醇脱氢酶、1-(4-羟苯基)-2,3-丁二醇脱氢酶、1-吲哚-2,3-丁二醇脱氢酶、3,4-庚二醇脱氢酶、3,4-辛二醇脱氢酶、3,4-壬二醇脱氢酶、3,4-癸二醇脱氢酶、3,4-十一烷二醇脱氢酶、2-甲基-3,4-己二醇脱氢酶、5-甲基-3,4-庚二醇脱氢酶、6-甲基-3,4-庚二醇脱氢酶、7-甲基-3,4-辛二醇脱氢酶、1-苯基-2,3-戊二醇脱氢酶、1-(4-羟苯基)-2,3-戊二醇脱氢酶、1-吲哚-2,3-戊二醇脱氢酶、4,5-壬二醇脱氢酶、4,5-癸二醇脱氢酶、4,5-十一烷二醇脱氢酶、4,5-十二烷二醇脱氢酶、2-甲基-3,4-庚二醇脱氢酶、3-甲基-4,5-辛二醇脱氢酶、2-甲基-4,5-辛二醇脱氢酶、8-甲基-4,5-壬二醇脱氢酶、1-苯基-2,3-己二醇脱氢酶、1-(4-羟苯基)-2,3-己二醇脱氢酶、1-吲哚-2,3-己二醇脱氢酶、5,6-十一烷二醇脱氢酶、5,6-十一烷二醇脱氢酶、5,6-十三烷二醇脱氢酶、2-甲基-3,4-辛二醇脱氢酶、3-甲基-4,5-壬二醇脱氢酶、2-甲基-4,5-壬二醇脱氢酶、2-甲基-5,6-癸二醇脱氢酶、1-苯基-2,3-庚二醇脱氢酶、1-(4-羟苯基)-2,3-庚二醇脱氢酶、1-吲哚-2,3-庚二醇脱氢酶、6,7-十三烷二醇脱氢酶、6,7-十四烷二醇脱氢酶、2-甲基-3,4-壬二醇脱氢酶、3-甲基-4,5-癸二醇脱氢酶、2-甲基-4,5-癸二醇脱氢酶、2-甲基-5,6-十一烷二醇脱氢酶、1-苯基-2,3-辛二醇脱氢酶、1-(4-羟苯基)-2,3-辛二醇脱氢酶、1-吲哚-2,3-辛二醇脱氢酶、7,8-十五烷二醇脱氢酶、2-甲基-3,4-癸二醇脱氢酶、3-甲基-4,5-十一烷二醇脱氢酶、2-甲基-4,5-十一烷二醇脱氢酶、2-甲基-5,6-十二烷二醇脱氢酶、1-苯基-2,3-壬二醇脱氢酶、1-(4-羟苯基)-2,3-壬二醇脱氢酶、1-吲哚-2,3-壬二醇脱氢酶、2-甲基-3,4-十一烷二醇脱氢酶、3-甲基-4,5-十二烷二醇脱氢酶、2-甲基-4,5-十二烷二醇脱氢酶、2-甲基-5,6-十三烷二醇脱氢酶、1-苯基-2,3-癸二醇脱氢酶、1-(4-羟苯基)-2,3-癸二醇脱氢酶、1-吲哚-2,3-癸二醇脱氢酶、2,5-二甲基-3,4-庚二醇脱氢酶、2,6-二甲基-3,4-庚二醇脱氢酶、2,7-二甲基-3,4-辛二醇脱氢酶、1-苯基-4-甲基-2,3-戊二醇脱氢酶、1-(4-羟苯基)-4-甲基-2,3-戊二醇脱氢酶、1-吲哚-4-甲基-2,3-戊二醇脱氢酶、2,6-二甲基-4,5-辛二醇脱氢酶、3,8-二甲基-4,5-壬二醇脱氢酶、1-苯基-4-甲基-2,3-己二醇脱氢酶、1-(4-羟苯基)-4-甲基-2,3-己二醇脱氢酶、1-吲哚-4-甲基-2,3-己二醇脱氢酶、2,8-二甲基-4,5-壬二醇脱氢酶、1-苯基-5-甲基-2,3-己二醇脱氢酶、1-(4-羟苯基)-5-甲基-2,3-己二醇脱氢酶、1-吲哚-5-甲基-2,3-己二醇脱氢酶、1-苯基-6-甲基-2,3-庚二醇脱氢酶、1-(4-羟苯基)-6-甲基-2,3-庚二醇脱氢酶、1-吲哚-6-甲基-2,3-庚二醇脱氢酶、1-(4-羟苯基)-4-苯基-2,3-丁二醇脱氢酶、1-吲哚-4-苯基-2,3-丁二醇脱氢酶、1-吲哚-4-(4-羟苯基)-2,3-丁二醇脱氢酶、1,10-二氨基-5,6-癸二醇脱氢酶、1,4-二(4-羟苯基)-2,3-丁二醇、2,3-己二醇-1,6-二羧酸脱氢酶等。
在某些方面,所选的二醇脱氢酶可以具有一种或多种以上示例性示出的二醇脱氢酶活性,如2,3-丁二醇脱氢酶活性、3,4-己二醇脱氢酶活性和/或4,5-辛二醇脱氢酶活性等。
在某些方面,重组微生物可以包含选自SEQ ID NO:97,99和101的核苷酸参照序列所编码的二醇脱氢酶,或具有选自SEQ ID NO:98、100和102的多肽序列的酶,包括其生物活性片段或变体,如优化的变体。某些方面也可以包含与SEQ ID NOS:97-102具有80%、85%、90%、95%、97%、98%、99%序列同一性的核苷酸序列或多肽序列。
其它实施方案可以包含再设计的二醇脱氢酶,用于将1-羟基丙醛、丁二醛和戊二醛分别还原为1,3-丙二醇、1,4-丁二醇和1,5戊二醇等。
本文所述的脱水和还原途径可以包含一种或多种二醇脱水酶。“二醇脱水酶”通常指催化不可逆的二醇脱水的酶。例如,这种酶可以用于使辛二醇脱水,形成4-辛烷。已认识到,存在至少两种不同类型的二醇脱水酶:对于其催化作用,一种依赖于辅酶B12,另一种不依赖于辅酶B12。辅酶B12依赖性二醇脱水酶已知催化由α-羟基醇至醛或酮的基团介导的脱水反应。例如,来自肺炎克雷伯氏菌的二醇脱水酶催化甘油的脱水,形成β-羟丙基醛,接受2,3-丁二醇作为底物,并催化脱水反应形成2-丁酮。
作为另一实例,肉毒梭菌(Clostridium butylicum)含有不依赖辅酶B12的二醇脱水酶。图46表示分离自肉毒梭菌的不依赖辅酶B12的二醇脱水酶(dhaB1)和激活剂(dhaB2)的体内生物活性(参阅实施例9)。图46A表示由1,2-丙二醇体内产生1-丙醇,图46B表示内消旋-2,3丁二醇体内产生2-丁醇,以及图46C表示由反式-1,2-环戊二醇体内产生环戊酮。
因此,本发明的某些实施方案可以包含优化的或再设计的二醇脱水酶,其容纳各种底物,如4,5-辛二醇作为底物,且可以包括分离和/或优化自肺炎克雷伯氏菌和肉毒梭菌(除了本文所述和本领域已知的生物外)的二醇脱水酶。
示例性二醇脱水酶包括但不限于:2,3-丁二醇脱水酶、3,4-己二醇脱水酶、4,5-辛二醇脱水酶、5,6-癸二醇脱水酶、6,7-十二烷二醇脱水酶、7,8-十四烷二醇脱水酶、8,9-十六烷二醇脱水酶、2,5-二甲基-3,4-己二醇脱水酶、3,6-二甲基-4,5-辛二醇脱水酶、2,7-二甲基-4,5-辛二醇脱水酶、2,9-二甲基-5,6-癸二醇脱水酶、1,4-二苯基-2,3-丁二醇脱水酶、二-1,4-(4-羟苯基)-2,3-丁二醇脱水酶、1,4-二吲哚-2,3-丁二醇脱水酶、1,2-环戊二醇脱水酶、2,3-戊二醇脱水酶、2,3-己二醇脱水酶、2,3-庚二醇脱水酶、2,3-辛二醇脱水酶、2,3-壬二醇脱水酶、4-甲基-2,3-戊二醇脱水酶、4-甲基-2,3-己二醇脱水酶、5-甲基-2,3-己二醇脱水酶、6-甲基-2,3-庚二醇脱水酶、1-苯基-2,3-丁二醇脱水酶、1-(4-羟苯基)-2,3-丁二醇脱水酶、1-吲哚-2,3-丁二醇脱水酶、3,4-庚二醇脱水酶、3,4-辛二醇脱水酶、3,4-壬二醇脱水酶、3,4-癸二醇脱水酶、3,4-十一烷二醇脱水酶、2-甲基-3,4-己二醇脱水酶、5-甲基-3,4-庚二醇脱水酶、6-甲基-3,4-庚二醇脱水酶、7-甲基-3,4-辛二醇脱水酶、1-苯基-2,3-戊二醇脱水酶、1-(4-羟苯基)-2,3-戊二醇脱水酶、1-吲哚-2,3-戊二醇脱水酶、4,5-壬二醇脱水酶、4,5-癸二醇脱水酶、4,5-十一烷二醇脱水酶、4,5-十二烷二醇脱水酶、2-甲基-3,4-庚二醇脱水酶、3-甲基-4,5-辛二醇脱水酶、2-甲基-4,5-辛二醇脱水酶、8-甲基-4,5-壬二醇脱水酶、1-苯基-2,3-己二醇脱水酶、1-(4-羟苯基)-2,3-己二醇脱水酶、1-吲哚-2,3-己二醇脱水酶、5,6-十一烷二醇脱水酶、5,6-十一烷二醇脱水酶、5,6-十三烷二醇脱水酶、2-甲基-3,4-辛二醇脱水酶、3-甲基-4,5-壬二醇脱水酶、2-甲基-4,5-壬二醇脱水酶、2-甲基-5,6-癸二醇脱水酶、1-苯基-2,3-庚二醇脱水酶、1-(4-羟苯基)-2,3-庚二醇脱水酶、1-吲哚-2,3-庚二醇脱水酶、6,7-十三烷二醇脱水酶、6,7-十四烷二醇脱水酶、2-甲基-3,4-壬二醇脱水酶、3-甲基-4,5-癸二醇脱水酶、2-甲基-4,5-癸二醇脱水酶、2-甲基-5,6-十一烷二醇脱水酶、1-苯基-2,3-辛二醇脱水酶、1-(4-羟苯基)-2,3-辛二醇脱水酶、1-吲哚-2,3-辛二醇脱水酶、7,8-十五烷二醇脱水酶、2-甲基-3,4-癸二醇脱水酶、3-甲基-4,5-十一烷二醇脱水酶、2-甲基-4,5-十一烷二醇脱水酶、2-甲基-5,6-十二烷二醇脱水酶、1-苯基-2,3-壬二醇脱水酶、1-(4-羟苯基)-2,3-壬二醇脱水酶、1-吲哚-2,3-壬二醇脱水酶、2-甲基-3,4-十一烷二醇脱水酶、3-甲基-4,5-十二烷二醇脱水酶、2-甲基-4,5-十二烷二醇脱水酶、2-甲基-5,6-十三烷二醇脱水酶、1-苯基-2,3-癸二醇脱水酶、1-(4-羟苯基)-2,3-癸二醇脱水酶、1-吲哚-2,3-癸二醇脱水酶、2,5-二甲基-3,4-庚二醇脱水酶、2,6-二甲基-3,4-庚二醇脱水酶、2,7-二甲基-3,4-辛二醇脱水酶、1-苯基-4-甲基-2,3-戊二醇脱水酶、1-(4-羟苯基)-4-甲基-2,3-戊二醇脱水酶、1-吲哚-4-甲基-2,3-戊二醇脱水酶、2,6-二甲基-4,5-辛二醇脱水酶、3,8-二甲基-4,5-壬二醇脱水酶、1-苯基-4-甲基-2,3-己二醇脱水酶、1-(4-羟苯基)-4-甲基-2,3-己二醇脱水酶、1-吲哚-4-甲基-2,3-己二醇脱水酶、2,8-二甲基-4,5-壬二醇脱水酶、1-苯基-5-甲基-2,3-己二醇脱水酶、1-(4-羟苯基)-5-甲基-2,3-己二醇脱水酶、1-吲哚-5-甲基-2,3-己二醇脱水酶、1-苯基-6-甲基-2,3-庚二醇脱水酶、1-(4-羟苯基)-6-甲基-2,3-庚二醇脱水酶、1-吲哚-6-甲基-2,3-庚二醇脱水酶、1-(4-羟苯基)-4-苯基-2,3-丁二醇脱水酶、1-吲哚-4-苯基-2,3-丁二醇脱水酶、1-吲哚-4-(4-羟苯基)-2,3-丁二醇脱水酶、1,10-二氨基-5,6-癸二醇脱水酶、1,4-二(4-羟苯基)-2,3-丁二醇、2,3-己二醇-1,6-二羧酸脱水酶等。
在某些方面,所选的二醇脱水酶可以具有一种或多种以上示例性示出的二醇脱水酶活性,如2,3-丁二醇脱水酶活性、3,4-己二醇脱水酶活性和/或4,5-辛二醇脱水酶活性等。
在某些方面,二醇脱水酶可以从肺炎克雷伯氏菌MGH 78578获得,包括从这种或其它微生物的pduCDE基因获得。在某些方面,重组微生物可以包含一种或多种选自SEQ ID NO:103、105以及107的核苷酸参照序列所编码的二醇脱水酶,或具有选自SEQ ID NO:104、106以及108的多肽序列的酶,包括其生物活性片段或变体,如优化的变体。某些方面也可以包含与SEQ ID NOS:103-108具有80%、85%、90%、95%、97%、98%、99%序列同一性的核苷酸序列或多肽序列。在某些方面,SEQ IDNO:104的多肽可以包含某些保守的氨基酸残基,包括选自下述的保守氨基酸残基:D149、P151、A155、A159、G165、E168、E170、A183、G189、G196、Q200、E208、G215、Y219、E221、T222、S224、Y226、G227、T228、F232、G235、D236、D237、T238、P239、S241、L245、Y249、S251、R252、G253、K255、R257、S260、E265、M268、G269、S275、Y278、L279、E280、C283、G291、Q293、G294、Q296、N297、G298、G312、E329、S341、R344、G356、D371、N372、F374、S377、R392、D393、R412、L477、A486、G499、D500、S516、N522、D523、Y524、G526以及G530.
在某些方面,二醇脱水酶可以包括多肽,所述多肽包含与SEQ IDNOS:308-311具有0%、85%、90%、95%、97%、98%、99%序列同一性的氨基酸序列。SEQ ID NO:308表示PduG的多肽序列,即衍生于肺炎克雷伯氏菌肺炎亚种MGH 78578的二醇脱水酶再激活大亚基。SEQ IDNO:309表示PduH的多肽序列,即衍生于肺炎克雷伯氏菌肺炎亚种MGH78578的二醇脱水酶再激活小亚基。SEQ ID NO:310表示来自丁酸梭菌的不依赖B12的甘油脱水酶的多肽序列。SEQ ID NO:311表示来自丁酸梭菌的甘油脱水酶激活剂的多肽序列。在某些方面,不依赖B12的甘油脱水酶可以包含保守的氨基酸残基,如T36、G74、P87、E88、E97、W126、R221、A263、Q265、R287、D289、E309、R317、G335、G345、G346、N356、P374、R379、G399、G401、P403、D408、G432、C433、N452、C529、G533、G539、G540、S559、G603、N604、A654、G658、R659、D676、N702、Q735、N737、A747、P751、R760、V761、A762、G763、Q776、I780和/或R782。在某些方面,不依赖B12的甘油脱水酶激活剂可以包含某些保守的氨基酸残基,包括D19、G20、G22、R24、F28、G31、C32、C36、W38、C39、N41、P42、C58、C64、C96、G129、T132、G135、G136、D185、R187、N208、R222和/或R264。
本文所述的脱水和还原途径可以包含一种或多种醇脱氢酶或次级醇脱氢酶。作为脱水和还原途径中一部分的“醇脱氢酶”或“次级醇脱氢酶”通常指催化醛或酮取代基转化为醇的酶。例如,4-辛酮可以被次级醇脱氢酶一酶促步骤还原为4-辛醇,其用于将丁偶姻转化为生物燃料。假单胞菌表达至少一种次级醇脱氢酶,其利用NAD+作为辅因子,将4-辛醇氧化为4-辛酮。作为另一实例,红平红球菌(Rhodococcus erythropolis)ATCC4277利用NADH作为辅因子,利用也催化3-癸醇和4-癸醇氧化的酶,催化中到长链次级脂肪醇的氧化。另外,褐色诺卡氏菌(Norcadia fusca)AKU2123含有(S)-特异性次级醇脱氢酶。
编码次级醇脱氢酶的基因可以根据本领域已知的技术从这些和其它生物分离,并且并入本文所述的微生物系统或重组微生物中。在某些实施方案中,微生物系统或分离的微生物可以包含来自假单胞菌(Pseudomonads)、红平红球菌ATCC4277、褐色诺卡氏菌AKU2123或其它适宜的生物的天然或优化的次级醇脱氢酶。
次级醇脱氢酶的实例包括但不限于2-丁醇脱氢酶、3-己醇脱氢酶、4-辛醇脱氢酶、5-癸醇脱氢酶、6-十二烷醇脱氢酶、7-十四烷醇脱氢酶、8-十六烷醇脱氢酶、2,5-二甲基-3-己醇脱氢酶、3,6-二甲基-4-辛醇脱氢酶、2,7-二甲基-4-辛醇脱氢酶、2,9-二甲基-4-癸醇脱氢酶、1,4-二苯基-2-丁醇脱氢酶、二-1,4-(4-羟苯基)-2-丁醇脱氢酶、1,4-二吲哚-2-丁醇脱氢酶、环戊醇脱氢酶、2(或3)-戊醇脱氢酶、2(或3)-己醇脱氢酶、2(或3)-庚醇脱氢酶、2(或3)-辛醇脱氢酶、2(或3)-壬醇脱氢酶、4-甲基-2(或3)-戊醇脱氢酶、4-甲基-2(或3)-己醇脱氢酶、5-甲基-2(或3)-己醇脱氢酶、6-甲基-2(或3)-庚醇脱氢酶、1-苯基-2(或3)-丁醇脱氢酶、1-(4-羟苯基)-2(或3)-丁醇脱氢酶、1-吲哚-2(或3)-丁醇脱氢酶、3(或4)-庚醇脱氢酶、3(或4)-辛醇脱氢酶、3(或4)-壬醇脱氢酶、3(或4)-癸醇脱氢酶、3(或4)-十一烷醇脱氢酶、2-甲基-3(或4)-己醇脱氢酶、5-甲基-3(或4)-庚醇脱氢酶、6-甲基-3(或4)-庚醇脱氢酶、7-甲基-3(或4)-辛醇脱氢酶、1-苯基-2(或3)-戊醇脱氢酶、1-(4-羟苯基)-2(或3)-戊醇脱氢酶、1-吲哚-2(或3)-戊醇脱氢酶、4(或5)-壬醇脱氢酶、4(或5)-癸醇脱氢酶、4(或5)-十一烷醇脱氢酶、4(或5)-十二烷醇脱氢酶、2-甲基-3(或4)-庚醇脱氢酶、3-甲基-4(或5)-辛醇脱氢酶、2-甲基-4(或5)-辛醇脱氢酶、8-甲基-4(或5)-壬醇脱氢酶、1-苯基-2(或3)-己醇脱氢酶、1-(4-羟苯基)-2(或3)-己醇脱氢酶、1-吲哚-2(或3)-己醇脱氢酶、4(或5)-十一烷醇脱氢酶、5(或6)-十一烷醇脱氢酶、5(或6)-十三烷醇脱氢酶、2-甲基-3(或4)-辛醇脱氢酶、3-甲基-4(或5)-壬醇脱氢酶、2-甲基-4(或5)-壬醇脱氢酶、2-甲基-5(或6)-癸醇脱氢酶、1-苯基-2(或3)-庚醇脱氢酶、1-(4-羟苯基)-2(或3)-庚醇脱氢酶、1-吲哚-2(或3)-庚醇脱氢酶、6(或7)-十三烷醇脱氢酶、6(或7)-十四烷醇脱氢酶、2-甲基-3(或4)-壬醇脱氢酶、3-甲基-4(或5)-癸醇脱氢酶、2-甲基-4(或5)-癸醇脱氢酶、2-甲基-5(或6)-十一烷醇脱氢酶、1-苯基-2(或3)-辛醇脱氢酶、1-(4-羟苯基)-2(或3)-辛醇脱氢酶、1-吲哚-2(或3)-辛醇脱氢酶、7(或8)-十五烷醇脱氢酶、2-甲基-3(或4)-癸醇脱氢酶、3-甲基-4(或5)-十一烷醇脱氢酶、2-甲基-4(或5)-十一烷醇脱氢酶、2-甲基-5(或6)-十二烷醇脱氢酶、1-苯基-2(或3)-壬醇脱氢酶、1-(4-羟苯基)-2(或3)-壬醇脱氢酶、1-吲哚-2(或3)-壬醇脱氢酶、2-甲基-3(或4)-十一烷醇脱氢酶、3-甲基-4(或5)-十二烷醇脱氢酶、2-甲基-4(或5)-十二烷醇脱氢酶、2-甲基-5(或6)-十三烷醇脱氢酶、1-苯基-2(或3)-癸醇脱氢酶、1-(4-羟苯基)-2(或3)-癸醇脱氢酶、1-吲哚-2(或3)-癸醇脱氢酶、2,5-二甲基-3(或4)-庚醇脱氢酶、2,6-二甲基-3(或4)-庚醇脱氢酶、2,7-二甲基-3(或4)-辛醇脱氢酶、1-苯基-4-甲基-2(或3)-戊醇脱氢酶、1-(4-羟苯基)-4-甲基-2(或3)-戊醇脱氢酶、1-吲哚-4-甲基-2(或3)-戊醇脱氢酶、2,6-二甲基-4(或5)-辛醇脱氢酶、3,8-二甲基-4(或5)-壬醇脱氢酶、1-苯基-4-甲基-2(或3)-己醇脱氢酶、1-(4-羟苯基)-4-甲基-2(或3)-己醇脱氢酶、1-吲哚-4-甲基-2(或3)-己醇脱氢酶、2,8-二甲基-4(或5)-壬醇脱氢酶、1-苯基-5-甲基-2(或3)-己醇脱氢酶、1-(4-羟苯基)-5-甲基-2(或3)-己醇脱氢酶、1-吲哚-5-甲基-2(或3)-己醇脱氢酶、1-苯基-6-甲基-2(或3)-庚醇脱氢酶、1-(4-羟苯基)-6-甲基-2(或3)-庚醇脱氢酶、1-吲哚-6-甲基-2(或3)-庚醇脱氢酶、1-(4-羟苯基)-4-苯基-2(或3)-丁醇脱氢酶、1-吲哚-4-苯基-2(或3)-丁醇脱氢酶、1-吲哚-4-(4-羟苯基)-2(或3)-丁醇脱氢酶、1,10-二氨基-5-癸醇脱氢酶、1,4-二(4-羟苯基)-2-丁醇脱氢酶、2-己醇-1,6-二羧酸脱氢酶、苯基乙醇脱氢酶、4-羟苯基乙醇脱氢酶、吲哚-3-乙醇脱氢酶等。
在某些方面,所选的醇脱氢酶或次级醇脱氢酶可以具有一种或多种以上示例性示出的醇脱氢酶活性,如2-丁醇脱氢酶活性、3-己醇脱氢酶活性和/或4-辛醇脱氢酶活性等。
在某些方面,重组微生物可以包含选自SEQ ID NO:109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139以及141的核苷酸参照序列所编码的一种或多种次级醇脱氢酶,或具有选自SEQ ID NO:110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140以及142的多肽序列的酶,包括其生物活性片段或变体,如优化的变体。某些方面也可以包含与SEQ IDNOS:109-142具有80%、85%、90%、95%、97%、98%、99%序列同一性的核苷酸序列或多肽序列。
对于上文所涉及的次级醇脱氢酶序列,SEQ ID NO:109是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-1:PP_1946)的核苷酸序列,SEQ ID NO:110是其多肽序列。SEQ ID NO:111是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-2:PP_1817)的核苷酸序列,SEQ ID NO:112是其多肽序列。
SEQ ID NO:113是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-3:PP_1953)的核苷酸序列,SEQ ID NO:114是其多肽序列。SEQ IDNO:115是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-4:PP_3037)的核苷酸序列,SEQ ID NO:116是其多肽序列。
SEQ ID NO:117是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-5:PP_1852)的核苷酸序列,SEQ ID NO:118是其多肽序列。SEQ IDNO:119是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-6:PP_2723)的核苷酸序列,SEQ ID NO:120是其多肽序列。
SEQ ID NO:121是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-7:PP_2002)的核苷酸序列,SEQ ID NO:122是其多肽序列。SEQ IDNO:123是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-8:PP_1914)的核苷酸序列,SEQ ID NO:124是其多肽序列。
SEQ ID NO:125是分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-9:PP_1914)的核苷酸序列,SEQ ID NO:126是其多肽序列。SEQ IDNO:127分离自恶臭假单胞菌KT2440的次级醇脱氢酶(2adh-10:PP_3926)的核苷酸序列,SEQ ID NO:128是其多肽序列。
SEQ ID NO:129是分离自荧光假单胞菌Pf-5的次级醇脱氢酶(2adh-11:PFL_1756)的核苷酸序列,SEQ ID NO:130是其多肽序列。SEQID NO:131是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-12:KPN_01694)的核苷酸序列,SEQ ID NO:132是其多肽序列。
SEQ ID NO:133是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-13:KPN_02061)的核苷酸序列,SEQ ID NO:134是其多肽序列。SEQ ID NO:135是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-14:KPN_00827)的核苷酸序列,SEQ ID NO:136是其多肽序列。
SEQ ID NO:137是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-16:KPN_01350)的核苷酸序列,SEQ ID NO:138是其多肽序列。SEQ ID NO:139是分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的次级醇脱氢酶(2adh-17:KPN_03369)的核苷酸序列,SEQ ID NO:140是其多肽序列。SEQ ID NO:141是分离自肺炎克雷伯氏菌肺炎亚种MGH78578的次级醇脱氢酶(2adh-18:KPN_03363)的核苷酸序列,SEQ IDNO:142是其多肽序列。
在某些方面,醇脱氢酶(如DEHU氢化酶)、次级醇脱氢酶(2ADH),其片段、变体或衍生物,或利用此类活性位点的任何其它酶,可以包含以下至少之一:烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸(NADP+)或NADPH结合基序。在某些实施方案中,NAD+、NADH、NADP+或NADPH结合基序可以选自Y-X-G-G-X-Y、Y-X-X-G-G-X-Y、Y-X-X-X-G-G-X-Y、Y-X-G-X-X-Y、Y-X-X-G-G-X-X-Y、Y-X-X-X-G-X-X-Y、Y-X-G-X-Y、Y-X-X-G-X-Y、Y-X-X-X-G-X-Y以及Y-X-X-X-X-G-X-Y;其中Y独立地选自丙氨酸、甘氨酸以及丝氨酸,其中G是甘氨酸,且其中X独立地选自遗传编码的氨基酸。
作为还原和脱水途径中步骤的一实例,α-羟基环戊酮可以还原为1,2-环戊二醇。例如,分离自Hansenula ofunaensis的甘油脱氢酶有利于α-羟基酮和α-酮基酮的还原,且具有广泛的底物特异性。衍生于多型汉逊酵母的类似的醇脱氢酶和内消旋-2,3-丁二醇脱氢酶具有类似特性。某些实施方案可以将1,2-环戊二醇脱氢酶并入微生物系统或分离的微生物。其它实施方案可以并入来自Hansenula ofunaensis、多型汉逊酵母、肺炎克雷伯氏菌或任何其它适宜生物的甘油脱氢酶。
通过实例的方式,作为还原和脱水途径中的一酶促步骤,化学品或烃,如1,2-环戊二醇,可以脱水形成环戊酮。存在至少两种不同类型的催化化学品如1,2-环戊二醇的脱水反应的二醇脱水酶。包含还原和脱水途径的微生物系统的某些实施方案包含二醇脱水酶,如1,2-环戊二醇脱水酶。
在还原和脱水途径的最后酶促步骤中,此类示例性化学品如α-羟基环戊酮至环戊醇的转化,可以包括环戊酮还原为环戊醇。这个步骤可以为环戊醇脱氢酶催化,其见于丛毛单菌(Comomonas sp.)菌株NCIMB9872,并且已经分离了其基因(cpnA)。微生物系统或分离的微生物的某些实施方案可以包含环戊醇脱氢酶,除了本文所述的其它之外,诸如丛毛单菌菌株NCIMB 9872的cpnA所表达的环戊醇脱氢酶。
如下文所详述的,在某些实施方案中,所选的C-C连接途径可与还原和脱水途径的所选组分或酶组合使用,产生大量生产型化学品或其中间物。
例如,某些实施方案包括方法,其中C-C连接途径可以包含乙醛裂解酶,其中还原和脱水途径可以包含2,3-丁二醇脱氢酶、2,3-丁二醇脱水酶以及2-丁醇脱氢酶中至少之一。其它实施方案可以包括方法,其中C-C连接途径可以包含丙醛裂解酶,且其中还原和脱水途径可以包含3,4-己二醇脱氢酶、3,4-己二醇脱水酶以及3-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛裂解酶,且其中还原和脱水途径可以包含4,5-辛二醇脱氢酶、4,5-辛二醇脱水酶以及4-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛裂解酶,且其中还原和脱水途径可以包含5,6-癸二醇脱氢酶、5,6-癸二醇脱水酶以及5-癸醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛裂解酶,且其中还原和脱水途径包含6,7-十二烷二醇脱氢酶、6,7-十二烷二醇脱水酶以及6-十二烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛裂解酶,且其中还原和脱水途径可以包含7,8-十四烷二醇脱氢酶、7,8-十四烷二醇脱水酶以及7-十四烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛裂解酶,且其中还原和脱水途径可以包含8,9-十六烷二醇脱氢酶、8,9-十六烷二醇脱水酶以及8-十六烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含异丁醛裂解酶,且其中还原和脱水途径可以包含2,5-二甲基-3,4-己二醇脱氢酶、2,5-二甲基-3,4-己二醇脱水酶以及2,5-二甲基-3-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含2-甲基-丁醛裂解酶,且其中还原和脱水途径可以包含3,6-二甲基-4,5-辛二醇脱氢酶、3,6-二甲基-4,5-辛二醇脱水酶以及3,6-二甲基-4-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含3-甲基-丁醛裂解酶,且其中还原和脱水途径可以包含2,7-二甲基-4,5-辛二醇脱氢酶、2,7-二甲基-4,5-辛二醇脱水酶以及2,7-二甲基-4-辛醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含3-甲基-丁醛裂解酶,且其中还原和脱水途径可以包含2,9-二甲基-5,6-癸二醇脱氢酶、2,9-二甲基-4,5-癸二醇脱水酶以及2,9-二甲基-4-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含苯乙醛裂解酶,且其中还原和脱水途径可以包含1,4-二苯基-2,3-丁二醇脱氢酶、1,4-二苯基-2,3-丁二醇脱水酶以及1,4-二苯基-2-丁醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含苯乙醛裂解酶,且其中还原和脱水途径可以包含二-1,4-(4-羟苯基)-2,3-丁二醇脱氢酶、二-1,4-(4-羟苯基)-2,3-丁二醇脱水酶以及二-1,4-(4-羟苯基)-2-丁醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含苯乙醛裂解酶,且其中还原和脱水途径可以包含1,4-二吲哚-2,3-丁二醇脱氢酶、1,4-二吲哚-2,3-丁二醇脱水酶以及1,4-二吲哚-2-丁醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含α-酮己二酸羧基裂解酶,且其中还原和脱水途径可以包含1,2-环戊二醇脱氢酶、1,2-环戊二醇脱水酶以及环戊醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含乙醛/丙醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,3-戊二醇脱氢酶、2,3-戊二醇脱水酶以及2(或3)-戊醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含乙醛/丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,3-己二醇脱氢酶、2,3-己二醇脱水酶以及2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含乙醛/戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,3-庚二醇脱氢酶、2,3-庚二醇脱水酶以及2(或3)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含乙醛/己醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,3-辛二醇脱氢酶、2,3-辛二醇脱水酶以及2(或3)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含乙醛/辛醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,3-壬二醇脱氢酶、2,3-壬二醇脱水酶以及2(或3)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含乙醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含4-甲基-2,3-戊二醇脱氢酶、4-甲基-2,3-戊二醇脱水酶以及4-甲基-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含乙醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含4-甲基-2,3-己二醇脱氢酶、4-甲基-2,3-己二醇脱水酶以及4-甲基-2(或3)-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含乙醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含5-甲基-2,3-己二醇脱氢酶、5-甲基-2,3-己二醇脱氢酶以及5-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含乙醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含6-甲基-2,3-庚二醇脱氢酶、6-甲基-2,3-庚二醇脱氢酶以及6-甲基-2(或3)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含乙醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-丁二醇脱氢酶、1-苯基-2,3-丁二醇脱水酶以及1-苯基-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含乙醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-丁二醇脱氢酶、1-(4-羟苯基)-2,3-丁二醇脱水酶以及1-(4-羟苯基)-2(或3)-丁醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含乙醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-丁二醇脱氢酶、1-吲哚-2,3-丁二醇脱水酶以及1-吲哚-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丙醛/丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含3,4-庚二醇脱氢酶、3,4-庚二醇脱水酶以及3(或4)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丙醛/戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含3,4-辛二醇脱氢酶、3,4-辛二醇脱水酶以及3(或4)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丙醛/己醛裂解酶中至少之一,且其中还原和脱水途径可以包含3,4-壬二醇脱氢酶、3,4-壬二醇脱水酶以及3(或4)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丙醛/庚醛裂解酶中至少之一,且其中还原和脱水途径可以包含3,4-癸二醇脱氢酶、3,4-癸二醇脱水酶以及3(或4)-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丙醛/辛醛裂解酶中至少之一,且其中还原和脱水途径可以包含3,4-十一烷二醇脱氢酶、3,4-十一烷二醇脱水酶以及3(或4)-十一烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丙醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-3,4-己二醇脱氢酶、2-甲基-3,4-己二醇脱水酶以及2-甲基-3(或4)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丙醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含5-甲基-3,4-庚二醇脱氢酶、5-甲基-3,4-庚二醇脱水酶以及5-甲基-3(或4)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丙醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含6-甲基-3,4-庚二醇脱氢酶、6-甲基-3,4-庚二醇脱水酶以及6-甲基-3(或4)-庚醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丙醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含7-甲基-3,4-辛二醇脱氢酶、7-甲基-3,4-辛二醇脱水酶以及7-甲基-3(或4)-辛醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丙醛和苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-戊二醇脱氢酶、1-苯基-2,3-戊二醇脱水酶以及1-苯基-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丙醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-戊二醇脱氢酶、1-(4-羟苯基)-2,3-戊二醇脱水酶以及1-(4-羟苯基)-2(或3)-戊醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丙醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-戊二醇脱氢酶、1-吲哚-2,3-戊二醇脱水酶以及1-吲哚-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛/戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含4,5-壬二醇脱氢酶、4,5-壬二醇脱水酶以及4(或5)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛/己醛裂解酶中至少之一,且其中还原和脱水途径可以包含4,5-癸二醇脱氢酶、4,5-癸二醇脱水酶以及4(或5)-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛/庚醛裂解酶中至少之一,且其中还原和脱水途径可以包含4,5-十一烷二醇脱氢酶、4,5-十一烷二醇脱水酶以及4(或5)-十一烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛/辛醛裂解酶中至少之一,且其中还原和脱水途径可以包含4,5-十二烷二醇脱氢酶、4,5-十二烷二醇脱水酶以及4(或5)-十二烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-3,4-庚二醇脱氢酶、2-甲基-3,4-庚二醇脱水酶以及2-甲基-3(或4)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含3-甲基-4,5-辛二醇脱氢酶、3-甲基-4,5-辛二醇脱水酶以及3-甲基-4(或5)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-4,5-辛二醇脱氢酶、2-甲基-4,5-辛二醇脱水酶以及2-甲基-4(或5)-辛醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含8-甲基-4,5-壬二醇脱氢酶、8-甲基-4,5-壬二醇脱水酶以及8-甲基-4(或5)-壬醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-己二醇脱氢酶、1-苯基-2,3-己二醇脱水酶以及1-苯基-2(或3)-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含丁醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-己二醇脱氢酶、1-(4-羟苯基)-2,3-己二醇脱水酶以及1-(4-羟苯基)-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含丁醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-己二醇脱氢酶、1-吲哚-2,3-己二醇脱水酶以及1-吲哚-2(或3)-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含戊醛/己醛裂解酶中至少之一,且其中还原和脱水途径可以包含5,6-十一烷二醇脱氢酶、4,5-十一烷二醇脱水酶以及4(或5)-十一烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含戊醛/庚醛裂解酶中至少之一,且其中还原和脱水途径可以包含5,6-十一烷二醇脱氢酶、5,6-十一烷二醇脱水酶以及5(或6)-十一烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含戊醛/辛醛裂解酶中至少之一,且其中还原和脱水途径可以包含5,6-十三烷二醇脱氢酶、5,6-十三烷二醇脱水酶以及5(或6)-十三烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含戊醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-3,4-辛二醇脱氢酶、2-甲基-3,4-辛二醇脱水酶以及2-甲基-3(或4)-辛醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含戊醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含3-甲基-4,5-壬二醇脱氢酶、3-甲基-4,5-壬二醇脱水酶以及3-甲基-4(或5)-壬醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含戊醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-4,5-壬二醇脱氢酶、2-甲基-4,5-壬二醇脱水酶以及2-甲基-4(或5)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含戊醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-5,6-癸二醇脱氢酶、2-甲基-5,6-癸二醇脱水酶以及2-甲基-5(或6)-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含戊醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-庚二醇脱氢酶、1-苯基-2,3-庚二醇脱水酶以及1-苯基-2(或3)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含戊醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-庚二醇脱氢酶、1-(4-羟苯基)-2,3-庚二醇脱水酶以及1-(4-羟苯基)-2(或3)-庚醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含戊醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-庚二醇脱氢酶、1-吲哚-2,3-庚二醇脱水酶以及1-吲哚-2(或3)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含己醛/庚醛裂解酶中至少之一,且其中还原和脱水途径可以包含6,7-十三烷二醇脱氢酶、6,7-十三烷二醇脱水酶以及6(或7)-十三烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含己醛/辛醛裂解酶中至少之一,且其中还原和脱水途径可以包含6,7-十四烷二醇脱氢酶、6,7-十四烷二醇脱水酶以及6(或7)-十四烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含己醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-3,4-壬二醇脱氢酶、2-甲基-3,4-壬二醇脱水酶以及2-甲基-3(或4)-壬醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含己醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含3-甲基-4,5-癸二醇脱氢酶、3-甲基-4,5-癸二醇脱水酶以及3-甲基-4(或5)-癸醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含己醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-4,5-癸二醇脱氢酶、2-甲基-4,5-癸二醇脱水酶以及2-甲基-4(或5)-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含己醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-5,6-十一烷二醇脱氢酶、2-甲基-5,6-十一烷二醇脱水酶以及2-甲基-5(或6)-十一烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含己醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-辛二醇脱氢酶、1-苯基-2,3-辛二醇脱水酶以及1-苯基-2(或3)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含己醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-辛二醇脱氢酶、1-(4-羟苯基)-2,3-辛二醇脱水酶以及1-(4-羟苯基)-2(或3)-辛醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含己醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-辛二醇脱氢酶、1-吲哚-2,3-辛二醇脱水酶以及1-吲哚-2(或3)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含庚醛/辛醛裂解酶中至少之一,且其中还原和脱水途径可以包含7,8-十五烷醛脱氢酶、7,8-十五烷醛脱水酶以及7(或8)-十五烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含庚醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-3,4-癸二醇脱氢酶、2-甲基-3,4-癸二醇脱水酶以及2-甲基-3(或4)-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含庚醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含3-甲基-4,5-十一烷二醇脱氢酶、3-甲基-4,5-十一烷二醇脱水酶以及3-甲基-4(或5)-十一烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含庚醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-4,5-十一烷二醇脱氢酶、2-甲基-4,5-十一烷二醇脱水酶以及2-甲基-4(或5)-十一烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含庚醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-5,6-十二烷二醇脱氢酶、2-甲基-5,6-十二烷二醇脱水酶以及2-甲基-5(或6)-十二烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含庚醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-壬二醇脱氢酶、1-苯基-2,3-壬二醇脱水酶以及1-苯基-2(或3)-壬醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含庚醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-壬二醇脱氢酶、1-(4-羟苯基)-2,3-壬二醇脱水酶以及1-(4-羟苯基)-2(或3)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含庚醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-壬二醇脱氢酶、1-吲哚-2,3-壬二醇脱水酶以及1-吲哚-2(或3)-壬醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含辛醛/异丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-3,4-十一烷二醇脱氢酶、2-甲基-3,4-十一烷二醇脱水酶以及2-甲基-3(或4)-十一烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含辛醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含3-甲基-4,5-十二烷二醇脱氢酶、3-甲基-4,5-十二烷二醇脱水酶以及3-甲基-4(或5)-十二烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含辛醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-4,5-十二烷二醇脱氢酶、2-甲基-4,5-十二烷二醇脱水酶以及2-甲基-4(或5)-十二烷醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含辛醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2-甲基-5,6-十三烷二醇脱氢酶、2-甲基-5,6-十三烷二醇脱水酶以及2-甲基-5(或6)-十三烷醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含辛醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-2,3-癸二醇脱氢酶、1-苯基-2,3-癸二醇脱水酶以及1-苯基-2(或3)-癸醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含辛醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-2,3-癸二醇脱氢酶、1-(4-羟苯基)-2,3-癸二醇脱水酶以及1-(4-羟苯基)-2(或3)-癸醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含辛醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-2,3-癸二醇脱氢酶、1-吲哚-2,3-癸二醇脱水酶以及1-吲哚-2(或3)-癸醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含异丁醛/2-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,5-二甲基-3,4-庚二醇脱氢酶、2,5-二甲基-3,4-庚二醇脱水酶以及2,5-二甲基-3(或4)-庚醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含异丁醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,6-二甲基-3,4-庚二醇脱氢酶、2,6-二甲基-3,4-庚二醇脱水酶以及2,6-二甲基-3(或4)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含异丁醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,7-二甲基-3,4-辛二醇脱氢酶、2,7-二甲基-3,4-辛二醇脱水酶以及2,7-二甲基-3(或4)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含异丁醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-4-甲基-2,3-戊二醇脱氢酶、1-苯基-4-甲基-2,3-戊二醇脱水酶以及1-苯基-4-甲基-2(或3)-戊醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含异丁醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-4-甲基-2,3-戊二醇脱氢酶、1-(4-羟苯基)-4-甲基-2,3-戊二醇脱水酶以及1-(4-羟苯基)-4-甲基-2(或3)-戊醇脱氢酶中至少之一。其它实施方案包括方法,且其中C-C连接途径可以包含异丁醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-4-甲基-2,3-戊二醇脱氢酶、1-吲哚-4-甲基-2,3-戊二醇脱水酶以及1-吲哚-4-甲基-2(或3)-戊醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含2-甲基-丁醛/3-甲基-丁醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,6-二甲基-4,5-辛二醇脱氢酶、2,6-二甲基-4,5-辛二醇脱水酶以及2,6-二甲基-4(或5)-辛醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含2-甲基-丁醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含3,8-二甲基-4,5-壬二醇脱氢酶、3,8-二甲基-4,5-壬二醇脱水酶以及3,8-二甲基-4(或5)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含2-甲基-丁醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-4-甲基-2,3-己二醇脱氢酶、1-苯基-4-甲基-2,3-己二醇脱水酶以及1-苯基-4-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含2-甲基-丁醛/4-羟苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-4-甲基-2,3-己二醇脱氢酶、1-(4-羟苯基)-4-甲基-2,3-己二醇脱水酶以及1-(4-羟苯基)-4-甲基-2(或3)-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含2-甲基-丁醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-4-甲基-2,3-己二醇脱氢酶、1-吲哚-4-甲基-2,3-己二醇脱水酶以及1-吲哚-4-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含3-甲基-丁醛/4-甲基-戊醛裂解酶中至少之一,且其中还原和脱水途径可以包含2,8-二甲基-4,5-壬二醇脱氢酶、2,8-二甲基-4,5-壬二醇脱水酶以及2,8-二甲基-4(或5)-壬醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含3-甲基-丁醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-5-甲基-2,3-己二醇脱氢酶、1-苯基-5-甲基-2,3-己二醇脱水酶以及1-苯基-5-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含3-甲基-丁醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-5-甲基-2,3-己二醇脱氢酶、1-(4-羟苯基)-5-甲基-2,3-己二醇脱水酶以及1-(4-羟苯基)-5-甲基-2(或3)-己醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含3-甲基-丁醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-5-甲基-2,3-己二醇脱氢酶、1-吲哚-5-甲基-2,3-己二醇脱水酶以及1-吲哚-5-甲基-2(或3)-己醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含4-甲基-戊醛/苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-苯基-6-甲基-2,3-庚二醇脱氢酶、1-苯基-6-甲基-2,3-庚二醇脱水酶以及1-苯基-6-甲基-2(或3)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含4-甲基-戊醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-6-甲基-2,3-庚二醇脱氢酶、1-(4-羟苯基)-6-甲基-2,3-庚二醇脱水酶以及1-(4-羟苯基)-6-甲基-2(或3)-庚醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含4-甲基-戊醛/吲哚乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-6-甲基-2,3-庚二醇脱氢酶、1-吲哚-6-甲基-2,3-庚二醇脱水酶以及1-吲哚-6-甲基-2(或3)-庚醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含苯乙醛/4-羟苯基乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-(4-羟苯基)-4-苯基-2,3-丁二醇脱氢酶、1-(4-羟苯基)-4-苯基-2,3-丁二醇脱水酶以及1-(4-羟苯基)-4-苯基-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含苯乙醛/吲哚苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-4-苯基-2,3-丁二醇脱氢酶、1-吲哚-4-苯基-2,3-丁二醇脱水酶以及1-吲哚-4-苯基-2(或3)-丁醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含4-羟苯基乙醛/吲哚苯乙醛裂解酶中至少之一,且其中还原和脱水途径可以包含1-吲哚-4-(4-羟苯基)-2,3-丁二醇脱氢酶、1-吲哚-4-(4-羟苯基)-2,3-丁二醇脱水酶以及1-吲哚-4-(4-羟苯基)-2(或3)-丁醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含5-氨基-戊醛(pantaldehyde)裂解酶,且其中还原和脱水途径可以包含1,10-二氨基-5,6-癸二醇脱氢酶、1,10-二氨基-5,6-癸二醇脱水酶以及1,10-二氨基-5-癸醇脱氢酶中至少之一。
其它实施方案包括方法,其中C-C连接途径可以包含4-羟苯基乙醛裂解酶,且其中还原和脱水途径可以包含1,4-二(4-羟苯基)-2,3-丁二醇、1,4-二(4-羟苯基)-2,3-丁二醇脱水酶以及1,4-二(4-羟苯基)-2-丁醇脱氢酶中至少之一。其它实施方案包括方法,其中C-C连接途径可以包含琥珀酸半醛裂解酶,且其中还原和脱水途径可以包含2,3-己二醇-1,6-二羧酸脱氢酶、2,3-己二醇-1,6-二羧酸脱水酶以及2-己醇-1,6-二羧基脱氢酶中至少之一。
微生物系统或重组微生物的某些实施方案可以包含编码能催化(如还原和脱水)4-辛醇转化为辛烯或辛烷的酶的基因。其它实施方案可以包含再设计的或重新设计的该还原和脱水途径的酶。例如,三种再设计的酶可以将4-辛酮转化为3-辛烯和4-辛烯。第一步骤可以被再设计的异柠檬酸脱氢酶催化。这种酶可以催化4-羟基-3(或5)-羧基辛烷的形成。4-羟基可以被再设计的激酶磷酸化。最后,再设计的甲羟戊酸二磷酸脱羧酶催化3(或4)-辛烯的形成。
在其它实施方案中,数种再设计的酶可以将4-辛酮转化为辛烷。例如,4-羟基-3(或5)-羧基辛烷依次还原和脱水,形成3(或5)-羧基辛烷。参与脂肪酸代谢的再设计的酶可以催化这些反应。3(或5)-羧基辛烷可以被醛脱氢酶还原为相应的醛,并且产物可以去羰基化,形成辛烷,其由再设计的脱羰基酶所催化。
如上所述,为了产生某些大量生产型化学品,如2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇等其它相似的化学品,生物合成途径(如醛生物合成途径)可以任选地包含或还包含一个或多个编码脱羧酶的基因,所述酶例如吲哚-3-丙酮酸脱羧酶(IPDC),以便产生醛。在某些方面,IPDC可以包含与SEQ ID NO:312所示氨基酸序列至少80%、90%、95%、98%或99%同一的氨基酸序列。IDPC酶可以包含某些保守的氨基酸残基,如G24、D25、E48、A55、R60、G75、E89、H113、G252、G405、G413、G428、G430和/或N456。
在这些和其它实施方案中,重组微生物可以包含醛还原酶,如苯乙醛还原酶(PAR),以便将醛转化为大量生产型化学品。在某些方面,PAR可以包含与SEQ ID NO:313所示的氨基酸序列至少80%、90%、95%、98%或99%同一的氨基酸序列,SEQ ID NO:313表示衍生于红球菌(Rhodococcus sp.)ST-10的PAR酶的序列。在某些方面,PAR酶可以包含烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸(NADP+)或NADPH结合基序中至少之一。在某些实施方案中,NAD+、NADH、NADP+或NADPH结合基序可以选自Y-X-G-G-X-Y、Y-X-X-G-G-X-Y、Y-X-X-X-G-G-X-Y、Y-X-G-X-X-Y、Y-X-X-G-G-X-X-Y、Y-X-X-X-G-X-X-Y、Y-X-G-X-Y、Y-X-X-G-X-Y、Y-X-X-X-G-X-Y以及Y-X-X-X-X-G-X-Y;其中Y独立地选自丙氨酸、甘氨酸以及丝氨酸,其中G是甘氨酸,并且其中X独立地选自遗传编码的氨基酸。
在某些实施方案中,此类重组微生物也可以或可选地包含具有选自下述至少之一的活性的次级醇脱氢酶:苯基乙醇脱氢酶活性、4-羟苯基乙醇脱氢酶活性以及吲哚-3-乙醇脱氢酶活性,以便将醛还原为其相应的醇(如2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇)。
本发明的实施方案还包括将适宜的单糖转化为大量生产型化学品的方法,包括(a)获得适宜的单糖;(b)使适宜的单糖与微生物系统接触足以将适宜的单糖转化为生物燃料的时间,其中微生物系统包含(i)一个或多个编码和表达脂肪酸生物合成途径、氨基酸生物合成途径和/或短链醇生物合成途径的基因;(ii)一个或多个编码和表达酮酸脱羧酶、醛脱氢酶和/或醇脱氢酶的基因;以及(iii)选自以下的酶还原途径:(1)酶促长链醇还原途径,(2)酶促脱羰基途径,(3)酶促脱羧基途径,以及(4)包括(1)、(2)和/或(3)的酶促还原途径,从而将适宜的单糖转化为大量生产型化学品。
本发明的实施方案可以包含一个或多个编码和表达脂肪酸合成途径中的酶的基因,其可以用于,作为一实例,产生链烷形成的生物燃料,如中到长链烷烃。在某些实施方案中,可以重新校准或再设计微生物系统中脂肪酸生物合成途径的特异性。仅以实例的方式,微生物通常产生长链脂肪酸(如大肠杆菌天然产生大量长链脂肪酸(在全细胞中C16-C19:<95%)和小量中链脂肪酸(在全细胞中C12:2%和C14:5%))的混合物。
在某些实施方案中,重新校准或再基因工程化可以涉及增加中链链烷的产生,其包括但不限于辛酸盐(C8)、癸酸盐(C10)、月桂酸盐(C12)、十四烷酸盐(C14)以及棕榈酸盐(C16),因为由这些脂肪酸所产生的链烷是汽油、柴油以及煤油的主要组分。除了这些脂肪酸以外,其它实施方案可以涉及长链脂肪酸产生的增加,包括但不限于硬脂酸盐(C18)、花生四烯酸盐(C20)、山嵛酸盐(C22)以及更长的脂肪酸,因为由这些脂肪酸所产生的正-链烷是重油中主要组分之一。
例如,萼距花属(Cuphea)主要积聚中链脂肪酸,其作为其种子油的主要组分,且这些组合物因物种不同而不同。特别是,Cuphea pulcherrima积聚辛酸盐(C8:0)96%,Cuphea koehneana积聚癸酸盐(C10:0)95.3%,Cuphea polymorpha积聚月桂酸盐(C12:0)80.1%。本申请的微生物系统或分离的微生物的实施方案可以并入编码参与脂肪酸生物合成途径的酶的、来自各种萼距花属物种的基因,且这些微生物可以部分涉及中链脂肪酸的产生。
在其它实施方案中,衍生于各种物种包括萼距花(Cupheahookeriana)、Cuphea palustris、加利福尼亚桂树(Umbellularia californica)以及樟树(Cinnamomum camphorum)的酰基-酰基载体蛋白(ACP)硫酯酶(TEs),可以在如大肠杆菌的微生物中过表达,其中形成辛酸盐(C8)、癸酸盐(C10)、月桂酸盐(C12)、十四烷酸盐(C14)以及棕榈树盐(C16)的每一中链脂肪酸的特异性活性相对野生型获得改善。某些实施方案可以包括参与脂肪酸生物合成的其它酶组分,如本领域技术人员所知的,其包括但不限于ACP和β-酮酰基ACP合酶(KAS)IV。
本申请的微生物系统和分离的微生物也可以并入脂肪醛脱氢酶,以将脂肪酸还原为脂肪醛。仅以说明的方式,脂肪酸向脂肪醛的转化可以被分离自各种适宜生物的中和/或长链脂肪醛脱氢酶催化。某些实施方案可以并入例如衍生于哈维氏弧菌(Vibrio harveyi)的脂肪醛脱氢酶。
本申请的微生物系统和分离的微生物也可以并入一种或多种催化脂肪醛转化为生物燃料如正链烷的酶,包括例如,包含酶促长链醇还原途径的酶。某些实施方案可以并入来自各种其它来源的编码能催化脂肪酸还原和脱水为生物燃料如链烷的酶的基因。例如,细菌菌株HD-1能产生生物燃料,如各种链长度的正链烷,并且也产生奇数和偶数链烷两者。本文所提供的微生物系统和重组微生物的某些实施方案可以并入编码参与该途径的酶的HD-1基因。
其它实施方案可以并入再设计的或重新设计的该还原途径的酶。例如,本发明的实施方案可以包括再设计的异柠檬酸脱氢酶,其可以催化2-羧基-1-醇的形成。在某些实施方案中,2-羧基-1-醇可以依次还原和脱水,形成2-羧基-链烷,该链烷可以被再设计的参与脂肪酸代谢的酶催化。2-羧基-链烷可以被醛脱氢酶还原为相应的醛,随后脱羰基形成正-链烷,其由下文所讨论的再设计的脱羰基酶所催化。这些微生物系统的某些实施方案可以产生偶数正-链烷、奇数正-链烷,或两者。
本申请的某些实施方案可以并入编码催化脱羰基或酶促脱羰基途径的酶的基因。仅以实例的方式,绿色建群藻布朗葡萄藻(Botyrococcusbraunii)种族A产生线性奇数C27、C29以及C31烃,其总计占该藻类干重的达32%。这种生物的微生物制剂具有脱羰基活性。来自布朗葡萄藻培养物的这种脱羰基酶是含有钴-原卟啉IX的酶。分离的微生物的某些微生物系统可以并入编码来自布朗葡萄藻的脂肪醛脱羰基酶的基因。
其它实施方案可以包括再设计的脱羰基酶,例如其中N末端膜序列被取代。以说明的方式,类似的酶即含有Fe-原卟啉IX(亚铁血红素)细胞色素P450的功能活性通过取代N末端膜相关序列获得改善,且本微生物系统的脱羰基酶的功能活性可以包含类似的取代或改善。
其它实施方案可以并入编码Co-卟啉合酶的基因。以说明的方式,脱羰基酶可以利用Co-原卟啉IX作为辅因子,且破伤风梭菌(Clostridiumtetranomorphum)能将钴并入孵育的原卟啉IX中。某些实施方案可以并入来自破伤风梭菌或来自其它适宜微生物的Co-卟啉合酶。其它实施方案可以利用如Co2+、Fe2+以及Ni2+的无机金属作为催化剂,并入重新设计的脱羰基酶。
某些实施方案可以包含编码负责链烯形成或酶促脱羧基途径的酶的基因。这些基因可以衍生于或分离自各种来源,如高等植物和昆虫。例如,诸如萌发的红花(红花(Carthamus tinctorius L.))的高等植物产许多奇数1-链烯,其除了其相应脂肪酸脱羧所产生的约80-90%1,8,11,14-十七四烯外,还包括1-十五碳烯、1-十七碳烯、1,8-十七碳二烯以及1,8,11-十七碳三烯。某些实施方案可以并入来自诸如红花的高等植物的基因。
其它实施方案可以并入编码负责链烯从微生物形成(如酶促脱羧途径)的酶的基因,所述微生物包括但不限于诸如细菌菌株DH-1。以说明的方式,除正-链烷外,细菌菌株DH-1还产生正-链烯。
其它实施方案可以并入来自用于酶促脱羧途径的重新设计的酶的基因。例如,这些再设计的酶将β-羟基脂肪酸转化为正-链烯。第一步被再设计的激酶催化,该激酶催化β-羟基的磷酸化。再设计的甲羟戊酸二磷酸脱羧酶随后催化正-链烯如正-1-链烯的形成。
任何微生物都可以根据本发明来使用。在某些方面,微生物是真核或原核微生物。在某些方面,微生物是酵母,如酿酒酵母。在某些方面,微生物是细菌,如革兰氏阳性细菌或革兰氏阴性细菌。鉴于其快速生长速率、良好了解的遗传学、多种可利用的遗传工具以及产生异源蛋白的能力,遗传修饰的大肠杆菌可用于本文所述的微生物系统的某些实施方案,无论用于降解和代谢多糖,如藻酸盐或果胶,还是形成或生物合成大量生产型化学品,如生物燃料。
部分基于酶和代谢物与宿主生物的相容性,其它微生物可以根据本发明来使用。例如,诸如以下的其它生物:醋化醋酸杆菌、无色杆菌、嗜酸菌、不动杆菌、马杜拉放线菌、游动放线菌、敏捷好氧炽热球菌、农杆菌、产碱杆菌、菠萝(M)、节杆菌、黑曲霉、米曲霉、蜜蜂曲霉、粉状曲霉、斋藤曲霉、酱油曲霉、宇佐美曲霉、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、浸麻芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、双歧芽孢杆菌、短短芽孢杆菌、洋葱伯克霍尔德氏菌、圆柱念珠菌、皱褶念珠菌、番木瓜(L)、纤维微菌、头孢霉菌、变动毛壳菌、细丽毛壳菌、梭菌、丁酸梭菌、丙酮丁醇梭菌、热纤维素梭菌、(谷氨酸)棒杆菌、Corynebacterium efficiens、大肠杆菌、肠球菌、菊欧文氏菌、葡糖酸杆菌、葡糖酸醋酸杆菌、盐盒菌、特异腐质霉、Humicola nsolens、西唐北里孢菌、克雷伯氏菌、产酸克雷伯氏菌、克鲁维酵母、脆壁克鲁维酵母、乳酸克鲁维酵母、库克菌、Lactlactis、乳酸杆菌、发酵乳酸杆菌、清酒乳酸杆菌、乳球菌、乳酸乳球菌、明串珠菌、甲基孢囊菌、西西里甲烷叶菌、嗜器官产甲烷菌、布氏甲杆菌、蛾微杆菌、溶壁微球菌、小月菌、爪哇毛霉、分枝杆菌、漆斑菌、番木、亚硝化单胞菌、诺卡氏菌、番木瓜、片球菌、嗜盐片球菌、青霉菌、产黄青霉、橘青霉、埃默森青霉、娄地青霉、淡紫青霉、多色青霉、好氧反硝化菌、丙酸杆菌、假单胞菌、荧光假单胞菌、脱氮假单胞杆菌、火球菌、激烈火球菌、堀野氏火球菌、根癌菌、米黑根毛霉、微小根毛霉、根霉、德氏根霉、东京根霉、雪白根霉、米根霉、少孢根霉、红球菌、酿酒酵母、Sclerotina libertina、多食鞘氨醇杆菌、鞘氨醇杆菌、鞘胺醇单胞菌、链球菌、嗜热链球菌Y-1、链霉菌、灰色链霉菌、变铅青链霉菌、鼠灰链霉菌、锈棕色链霉菌、紫红链霉菌、茂原链轮丝菌、四体球菌、栖热菌、泛养硫球菌、栓菌、木霉、长枝木霉、里氏木霉、绿色木霉、潘氏丝孢酵母、溶藻弧菌、黄单胞菌、酵母、鲁氏接合酵母、发酵单胞菌以及运动发酵单胞菌,都可以用作本文所提供的重组微生物,并且可以根据本发明的各种方法而使用。
以示例而非限制的方式提供了下述实施例。
实施例
实施例1
对大肠杆菌进行基因工程化使其生长于作为唯一碳源的藻酸盐上
野生型大肠杆菌不能利用藻酸盐多聚体或降解的藻酸盐作为其唯一的碳源(参阅图4)。然而,灿烂弧菌已知能代谢藻酸盐,维持生长。为了产生利用降解的藻酸盐作为其唯一碳源的重组大肠杆菌,构建灿烂弧菌的fosmid文库(fosmid library),并将其克隆至大肠杆菌。
为了制备灿烂弧菌fosmid文库,利用DNeasy血液和组织试剂盒(DNeasy Blood and Tissue Kit,Qiagen,Valencia,CA),从灿烂弧菌B01(由Martin Polz博士惠赠,MIT)分离基因组DNA。随后利用拷贝对照Fosmid文库产生试剂盒(Copy Control Fosmid Library Production Kit)(Epicentre,Madison,WI),构建fosmid文库。这种文库由插入载体pCC1FOS(Epicentre,Madison,WI)的大约40kb的随机基因组片段组成。
将fosmid文库包装进噬菌体,并用噬菌体文库转染容纳pDONR221质粒(Invitrogen,Carlsbad,CA)的大肠杆菌DH10B细胞,该质粒携带某些灿烂弧菌基因(V12B01_02425至V12B01_02480;编码II型分泌器;参阅SEQ ID NO:1)。这种分泌蛋白质组区编码衍生于灿烂弧菌的II型分泌器,其被克隆至pDONR221质粒中,并导入大肠杆菌菌株DH10B(参阅实施例1)。
选择转化体的氯霉素抗性,随后针对生长于降解的藻酸盐上的能力,对其进行筛选。筛选生长于降解的藻酸盐培养基上的所得转化体。通过在室温下将2%藻酸盐(Sigma-Aldrich,St.Louis,MO)10mM磷酸钠缓冲液、50mM KCl、400mM NaCl与来自黄杆菌(Flavobacterium sp.)的藻酸盐裂解酶(Sigma-Aldrich,St.Louis,MO)一起孵育至少一周,制备降解的藻酸盐培养基。将该降解的藻酸盐稀释至0.8%的浓度,制备生长培养基,其终浓度为1X M9盐、2mM MgSO4、100μM CaCl2、0.007%亮氨酸、0.01%酪蛋白氨基酸、1.5%NaCl(这包括所有的钠来源:M9、稀释的藻酸盐和添加的NaCl)。
分离一个在这种培养基上生长良好的含有fosmid的大肠杆菌克隆。利用FosmidMAX DNA纯化试剂盒(Epicentre,Madison,WI)分离并制备来自这种克隆的fosmid DNA。将这种分离的fosmid转移回DH10B细胞,并检测这些细胞生长于藻酸盐上的能力。
结果示于图4中,其表明,某些含有fosmid的大肠杆菌克隆能生长于作为唯一碳源的藻酸盐上。根癌农杆菌提供了阳性对照(参见同心圆)。作为阴性对照,大肠杆菌DH10B细胞不能生长于藻酸盐上(参见阳性对照的紧邻左侧)。
这些结果也证明,含于该灿烂弧菌衍生fosmid的克隆内的序列足以赋予大肠杆菌生长于作为唯一碳源的降解的藻酸盐上的能力。因此,含于pDONR221载体内的II型分泌机制序列(secretion machinery sequences)(即SEQ ID NO:1)(为最初的DH10B细胞容纳),不是生长于降解的藻酸盐上所必需的。
利用以下引物,通过Elim Biopharmaceuticals(Hayward,CA),对足以赋予在作为唯一碳源的藻酸盐上生长的分离的fosmid进行测序:Uni R3-GGGCGGCCGCAAGGGGTTCGCGTTGGCCGA(SEQ ID NO:147)和PCC1FOS_uni_F-GGAGAAAATACCGCATCAGGCG(SEQ ID NO:148)。测序表明,载体含有基因组DNA部分,该部分含有全长基因V12B01_24189至V12B01_24249(参阅SEQ ID NOS:2-64)。SEQ ID NO:2表示V12B01_24189至V12B01_24249之间的整个区域的核苷酸序列。SEQ ID NOS:3-64表示含于SEQ ID NO:2内的单个推断的基因。在该序列中,在V12B01_24189前存在大基因,其在fosmid克隆中是截短的。大基因V12B01_24184是推断的蛋白,与自动转运蛋白具有相似性,并且属于COG321,其是一簇包括参与亚铁血红素利用或粘附的大外蛋白(exoprotein)的直系同源蛋白。在fosmid克隆中,V12B01_24184是N末端截短的,以便开始的5893bp从预测的可读框(经预测,其总共含有22889bp)丢失。
实施例2
对大肠杆菌进行基因工程化使其生长于作为唯一碳源的果胶上
野生型大肠杆菌不能生长于作为唯一碳源的果胶、二或三半乳糖醛酸盐上。为了鉴定赋予大肠杆菌生长于作为唯一碳源的果胶、二或三半乳糖醛酸盐上的能力的最小组分,对容纳pBBRGal3P质粒和pTrcogl-kdgR质粒的大肠杆菌菌株BL21(DE3)进行基因工程化,并检测其生长于这些多糖上的能力。
pBBRGal3P质粒经基因工程化,以含有胡萝卜软腐欧文氏菌马铃薯黑胫亚种(Erwinia carotovora subsp.Atroseptica)SCRI 1043的某些基因组区,其包括编码某些酶(kduI、kduD、ogl、pelW以及paeX)、转运蛋白(togM、togN、togA、togB以及kdgM)以及负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的几个基因(kdgF,kduI,kduD,pelW,togM,togN,togA,togB,kdgM以及paeX)。SEQ ID NO:65表示来自胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043的kdgF-PaeX区的核苷酸序列。
为了构建这种质粒,编码胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043的kdgF、kduI、kduD、pelW、togM、togN、togA、togB、kdgM、paeX、ogl以及kdgR的DNA序列,通过聚合酶链式反应(PCR)进行扩增:98℃10秒,60℃15秒,72℃6分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGGGATCCAAGTTGCAGGATATGACGAAAGCG-3’)(SEQ ID NO:149)和反向引物(5’-GCTCTAGAAGATTATCCCTGTCTGCGGAAGCGG-3’)(SEQ IDNO:150)、1U Phusion高保真DNA聚合酶(NEB)以及50ng胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043基因组(ATCC),总体积50μl。
载体pBBR1MCS-2随后通过聚合酶链式反应(PCR)进行扩增:98℃10秒,60℃15秒,以及72℃2.5分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGGGTGCCTAATGAGTGAGCTAAC-3’)(SEQ ID NO:151)和反向引物(5’-CGGGATCCGCGTTAATATTTTGTTAAAATTCGC-3’)(SEQ IDNO:152)、1U Phusion高保真DNA聚合酶(NEB)以及50ng pBBR1MCS-2,总体积50μl。两个扩增DNA片段都用BamHI和XbaI消化,并连接。
pTrcogl-kdgR质粒经基因工程化以含有胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043的某些基因组区,包括编码酶(ogl)和负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的两个基因(ogl和kdgR)。SEQ IDNO:66表示来自胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043的ogl-kdgR的核苷酸序列。
为了制备这种构建体,编码胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043的ogl和kdgR的DNA序列,通过聚合酶链式反应(PCR)进行扩增:98℃10秒,60℃15秒以及72℃4分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGTTTATGTCGCACCCGCCGTTGG-3’)(SEQ ID NO:153)和反向引物(5’-CCCAAGCTTAGAAAGGGAAATTGTGGTAGCCC-3’)(SEQ ID NO:154)、1U Phusion高保真DNA聚合酶(NEB)以及50ng胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI 1043基因组(ATCC),总体积50μl。扩增的DNA片段用XbaI和HindIII消化,并连接于用相同的限制酶预消化的pTrc99A。
将质粒pBBRGal3P和pTrcogl-kdgR共转化于大肠杆菌菌株BL21(DE3)中。将单个菌落接种于含有50μg/ml卡那霉素和100μg/ml氨苄青霉素的LB培养基中,并将培养物在200rpm、37C下培养于摇床培养箱(incubation shaker)中。当培养物达到0.6的OD 600nm时,将500μl培养物转运至eppendorf离心管,并离心使细胞沉淀。将细胞重悬浮于50μl含有2mM MgSO4、100uM CaCl2、0.4%二或三半乳糖醛酸盐的M9培养基中,并将5μl这种溶液接种于500μl新鲜的含有2mM MgSO4、100μM CaCl2、0.4%二或三半乳糖醛酸盐/的M9培养基中。将培养物在200rpm、37℃下培养于摇床培养箱中。
图5A中的结果表示,这两种质粒足以提供大肠杆菌生长于作为唯一碳源的二或三半乳糖醛酸盐而非果胶上的能力。特别是,这些结果表明,kdgF-paeX和ogl-kdgR区足以赋予大肠杆菌这种能力。
基于上述实验所获得的信息,要考虑的是,引入果胶酸裂解酶、果胶酸乙酰酯酶以及甲酯酶是否可能赋予大肠杆菌生长于果胶上的能力。为了检测这种假设,大肠杆菌菌株DH5α细菌细胞经基因工程化而既含有pROU2质粒又含有pPEL74质粒。
pROU2质粒含有菊欧文氏菌的某些基因组区,包括编码酶(kduI、kduD、ogl、pelW以及paeX)、转运蛋白(togM、togN、togA、togB以及kdgM)以及负责二和三半乳糖醛酸盐降解的调节蛋白(kdgR)的几个基因(kdgF、kduI、kduD、pelW、togM、togN、togA、togB、kdgM、paeX、ogl以及kdgR)。
pPEL74质粒含有菊欧文氏菌的某些基因组区,包括编码果胶酸裂解酶(pelA和pelE)、果胶酸乙酰酯酶(paeY)以及果胶酸甲酯酶(pem)的几个基因(pelA、pelE、paeY以及pem)。
如图5B所示,用pROU2和pPEL74进行基因工程化的大肠杆菌DH5α能生长于作为唯一碳源的果胶上,表明含于这些质粒中的基因足以赋予该生物这种特性,否则,不能生长于作为唯一碳源的果胶上。
实施例3
藻酸盐体外转化为丙酮酸盐和3-磷酸甘油醛
研究含有藻酸盐降解和代谢所需的所有酶的酶混合物的能力,研究其由藻酸盐产生丙酮酸盐的能力。另外,检测从根癌农杆菌分离的各种新的醇脱氢酶(ADHs),如ADH1-12(参见SEQ ID NOS:69-92)催化DEHU或甘露糖醛酸盐氢化的能力。
藻酸盐降解和代谢的简化代谢途径示于图2中。藻酸盐可以被至少两种不同的方法降解:酶促方法和化学方法。
在酶促降解中,藻酸盐的降解被称为藻酸盐裂解酶的酶家族催化。对于本实验而言,使用Atu3025。Atu3025是在外裂解(exolytically)作用酶,并由藻酸盐多聚体产生DEHU。DEHU被转化为常见的己糖醛酸盐代谢物即KDG。这种反应为醇脱氢酶(如DEHU氢化酶)催化。
酸溶液如甲酸盐所催化的化学降解产生单糖甘露糖醛酸盐。甘露糖醛酸盐随后转化为甘露糖酸盐,这被具有甘露糖酸脱氢酶(甘露糖醛酸还原酶)活性的酶催化。在细菌中,甘露糖酸脱水酶(UxuA)催化甘露糖醛酸盐脱水形成KDG。
KDG易于代谢形成丙酮酸盐和3-磷酸甘油醛(G3P)。KGD首先磷酸化为KDG-6-磷酸(KDGP),其被KDG激酶催化,随后分解成丙酮酸盐和G3P,这被KGDP醛缩酶催化。
衍生于根癌农杆菌C58的寡藻酸盐裂解酶Atu3025的制备:基于pET29质粒骨架(Novagen),构建pETAtu3025。寡藻酸盐裂解酶Atu3025通过PCR扩增:98℃10秒,55℃15秒,以及72℃60秒,重复30次。反应混合物含有1×Phusion缓冲液、2mM dNTP、0.5μM正向引物(5’-GGAATTCCATATGCGTCCCTCTGCCCCGGCC-3’)(SEQ ID NO:155)和反向引物(5’-CGGGATCCTTAGAACTGCTTGGGAAGGGAG-3’)(SEQID NO:156)、2.5U Phusion DNA聚合酶(Finezyme),以及等份根癌农杆菌C58(Eugene Nester教授惠赠,University of Washington)细胞作为模板,总体积100μl。扩增的片段用NdeI和BamHI消化,并用T4 DNA连接酶连接于用相同的酶预消化的pET29,形成pETAtu3025。对构建的质粒进行测序(Elim Biophamaceuticals),并证实插入物的DNA序列。Atu3025插入物的核苷酸序列提供于SEQ ID NO:67中。Atu3025插入物所编码的多肽序列提供于SEQ ID NO:68中。
将pETAtu3025转化于大肠杆菌菌株BL21(DE3)中。将含有pETAtu3025的BL21(DE3)的菌落接种于50ml含有50μg/ml卡那霉素的(Km50)LB培养中。将这种菌株在200rpm、37℃下培养于轨道摇床中。当OD600nm达到0.6时,向培养物添加0.2mM IPTG,并将所诱导的培养物在200rpm、20℃下培养于轨道摇床中。诱导24小时后,通过4,000rpm×g下离心10分钟收获细胞,将沉淀重悬浮液2ml含有10μl ofLysonaseTM生物处理剂(Novagen)的Bugbuster(Novagen)中。将溶液在4,000rpm×g下再次离心10分钟,并获得上清液。
通过pETADH12构建pETADH1:根癌农杆菌C58的ADH1-12的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(表1)和反向引物(表1)、1U Phusion高保真DNA聚合酶(NEB)以及50ng根癌农杆菌C58基因组,总体积50μl。扩增的DNA片段用NdeI和BamHI消化,并连接于以相同的限制酶预消化的pET28。对于具有内NdeI或BamHI位点的DNA序列而言,首先利用所述方法扩增每个ADH的前半部分序列和后半部分序列。所得的两个DNA片段进行凝胶纯化,并通过重叠PCR进行剪接。
表1:用于从根癌农杆菌C58扩增ADH1-12的引物
Figure GPA00001148551101061
ADH1-10的表达和纯化:将所有的质粒转化于大肠杆菌菌株BL21(DE3)中。将含有各醇脱氢酶(ADH)基因的单个BL21(DE3)菌落接种于50ml含有50μg/ml卡那霉素(Km50)的LB培养基中。将这些菌株在200rpm、37℃下培养于轨道摇床。OD600nm达到0.6时,向每个培养物中添加0.2mM IPTG,并将所诱导的培养物在200rpm、20℃下培养于轨道摇床中。诱导24小时后,通过4,000rpm×g下离心10分钟收获细胞,并将沉淀重悬浮于2ml含有LysonaseTM生物处理剂(Novagen)的Bugbuster(Novagen)中。在4,000rpm×g下再次离心溶液10分钟,并获得上清液。
通过酶促降解制备~2%DEHU溶液:酶促制备DEHU溶液。向500ml 20mM Tris-HCl(pH7.5)溶液中添加10g低粘性藻酸盐,制备2%藻酸盐溶液。向藻酸盐溶液中添加约10mg衍生于黄杆菌(从Sigma-aldrich购买)的藻酸盐裂解酶。随后将250ml这种溶液转移至另一瓶中,并添加上节所制备的含有Atu30205的大肠杆菌细胞裂解物。藻酸盐降解在室温下过夜进行。所得的产物通过薄层层析进行分析,并证实DEHU的形成。
通过化学降解制备D-甘露糖醛酸盐溶液:基于Spoehr(Archive ofBiochemistry,14:pp153-155)之前所述操作方法,化学制备D-甘露糖醛酸盐溶液。将50mg藻酸盐溶解于800μL90%的甲酸盐中。溶液在100℃下过夜孵育。随后蒸发甲酸盐,并将残余的物质用无水乙醇洗涤两次。将残余的物质再次溶解于无水乙醇中并过滤。蒸发乙醇,并将残余的物质重悬浮于20mL 20mM Tris-HCl(pH 8.0)中,并过滤溶液,制备D-甘露糖醛酸盐溶液。将这种D-甘露糖醛酸盐溶液稀释5倍,并用于测定。
DEHU氢化酶的测定:为了鉴定DEHU氢化酶,进行NADPH依赖性DEHU氢化测定。将20μl含有每一ADH的所制备细胞裂解物添加于160μl 20倍稀释的上节所制备的DEHU溶液中。添加20μl 2.5mg/mlNADPH溶液(20mM Tris-HCl,pH 8.0),启动氢化反应,因为用根癌农杆菌C58的细胞裂解物的初步研究已经表明,DEHU氢化需要NADPH作为辅因子。利用ThermoMA×96孔板读数器(Molecular Devises)的动力学模式,监控30分钟NADPH消耗的340nm下的吸光率。含有缺少N末端结构域部分的醇脱氢酶(ADH)10的大肠杆菌细胞裂解物被用于对照反应混合物中。
D-甘露糖醛酸氢化酶的测定:为了鉴定D-甘露糖醛酸氢化酶,进行NADPH依赖性D-甘露糖醛酸盐氢化测定。将20μl含有每一ADH的制备的细胞裂解物添加于160μl上节所制备的D-甘露糖醛酸盐溶液中。添加20μl 2.5mg/ml NADPH溶液(20mM Tris-HCl,pH 8.0),启动氢化反应。利用ThermoMAX 96孔板读数器(Molecular Devises)的动力学模式,监控30分钟NADPH消耗的340nm下的吸光率。含有缺少N末端结构域部分的醇脱氢酶(ADH)10的大肠杆菌细胞裂解物被用于对照反应混合物中。
pETkdgK的构建:编码2-酮-脱氧葡糖酸激酶的大肠杆菌的kdgKDNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-AGGTACGGTGAAATAA AGGAGGATATACAT ATGTCCAAAAAGATTGCCGT-3’)(SEQ ID NO:157)和反向引物(5’-TTTTCCTTTTGCGGCCGCCCCGCTGGCATCGCCTCAC-3’)(SEQ ID NO:158)、1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌DH10B基因组,总体积50μl。扩增的DNA片段用NdeI和NotI消化,并连接于用相同的限制酶预消化的pET29中。
pETkdgA的构建:编码2-酮-脱氧葡糖酸-6-磷酸醛缩酶的大肠杆菌的kdgA的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GGCGATGCCAGCGTAAAGGAGGATATACATATGAAAAACTGGAAAACAAG-3’)(SEQ IDNO:159)和反向引物(5’-TTTTCCTTTTGCGGCCGCCCCAGCTTAGCGCCTTCTA-3’)(SEQ ID NO:160)、1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌DH10B基因组,总体积50μl。扩增的DNA片段用NdeI和NotI消化,并连接于用相同的限制酶预消化的pET29中。
蛋白的表达和纯化:将所有的质粒(pETAtu3025、pETADH11、pETADH12、pETkdgA、pETkdgK以及pETuxuA)转化于大肠杆菌菌株BL21(DE3)中。将含有各质粒的单个BL21(DE3)菌落接种于50ml含有50μg/ml卡那霉素(Km50)的LB培养基中。将这些菌株在200rpm、37℃下培养于轨道摇床中。当OD600nm达到0.6时,向每一培养物中添加0.2mMIPTG,并将诱导的培养物在200rpm、20℃下培养于轨道摇床中。诱导24小时后,通过4,000rpm×g下离心10分钟收获细胞,将沉淀重悬浮于2ml含有10μl LysonaseTM生物处理剂(Novagen)和建议量的蛋白酶抑制剂混合物(SIGMA)的Bugbuster(Novagen)。将溶液再次在4,000rpm×g下离心10分钟,获得上清液。将上清液应用于Nickel-NTA旋转柱,纯化His标签蛋白。
ADH1-10的DEHU氢化酶活性和D-甘露糖醛酸氢化酶活性测定的结果显示于图7A和图7B。这些结果证明,新酶ADH1和ADH2表现出显著的DEHU氢化酶活性(图7A),且新酶ADH3、ADH4和ADH9表现出显著的甘露糖醛酸氢化酶活性(图7B)。
丙酮酸盐的体外形成:反应混合物含有溶于pH7.0、20mM Tris-HCl中的1%藻酸盐或~0.5%甘露糖醛酸盐、~5μg纯化的Atu3026(ADH12)Atu3027(ADH11),和~5μg纯化的寡藻酸盐裂解酶(Atu3025)、UxuA、KdgK以及KdgA,2mM ATP,以及0.6mM NADPH。将反应过夜进行,并通过丙酮酸盐测定试剂盒(BioVision,Inc)监测丙酮酸盐的形成。
酶促和化学降解所介导的由藻酸盐体外形成丙酮酸盐的结果分别显示于图6B和图6C中。由这些图可以看出,藻酸盐经由分离的酶转化为丙酮酸盐。这些结果也表明,Atu3026(ADH12)和Atu3027(ADH11)中的每一个都能催化DEHU氢化酶和甘露糖醛酸氢化酶反应。
实施例4
生物合成途径的构建和生物活性
途径的构建:构建包含大肠杆菌的苏氨酸脱氨酶(ilvA)基因和乳酸乳球菌的酮-异戊酸脱羧酶(kivd)的丙醛生物合成途径,并检测其将L-苏氨酸转化为丙醛的能力。
在大肠杆菌中构建丁醛生物合成途径,该途径包含大肠杆菌的硫解酶(atoB)基因,拜氏丙酮丁醇梭菌ATCC 824的β-羟基丁酰辅酶A脱氢酶(hbd)基因、巴豆酸酶(crt)基因、丁酰辅酶A脱氢酶(bcd)基因、电子转移黄素蛋白A(etfA)基因和电子转移黄素蛋白B(etfB)基因,以及来自拜氏丙酮丁醇梭菌ATCC 824的辅酶A连接的丁醛脱氢酶(ald)基因,并检测该途径产生丁醛的能力。还用丙酮丁醇梭菌ATCC 824的辅酶A连接的醇脱氢酶(adhE2)基因作为ald的替代物,并检测其产生丁醇的能力。
构建异丁醛生物合成途径,该途径包含枯草芽孢杆菌(alsS)或肺炎克雷伯氏菌肺炎亚种MGH 78578(als)(优化密码子使用,用于大肠杆菌蛋白表达)的乙酰乳酸合酶,大肠杆菌的乙酰乳酸还原异构酶(ilvC)基因和2,3-二羟基异戊酸脱水酶(ilvD)基因,以及乳酸乳球菌的酮-异戊酸脱羧酶(kivd),并检测其产生异丁醛的能力,这可通过异丁醛产生来测量。
构建3-甲基丁醛和2-甲基丁醛生物合成途径,该途径包含枯草芽孢杆菌(alsS)或肺炎克雷伯氏菌肺炎亚种MGH 78578(als)(优化密码子使用,用于大肠杆菌蛋白表达)的乙酰乳酸合酶,大肠杆菌的乙酰乳酸还原异构酶(ilcC)基因、2,3-二羟基异戊酸脱水酶(ilvD)基因、异丙基苹果酸合酶(LeuA)基因、异丙基苹果酸异构酶(LeuC和LeuD)基因和3-异丙基苹果酸脱氢酶(LeuB)基因,以及乳酸乳球菌的酮-异戊酸脱羧酶(kivd),并检测该途径产生3-异戊醛和2-异戊醛的能力。
构建苯乙醛和4-羟基苯乙醛生物合成途径,该途径包含大肠杆菌的转酮醇酶(tktA)基因、3-脱氧-7-phosphoheptulonate合酶(aroF、aroG以及aroH)基因、3-脱氢奎尼酸合酶(aroB)基因、3-脱氢奎尼酸脱水酶(aroD)基因、脱氢莽草酸还原酶(aroE)基因、莽草酸激酶II(aroL)基因、莽草酸激酶I(aroK)基因、5-烯醇丙酮酰莽草酸-3-磷酸合成酶(aroA)基因、分支酸合酶(aroC)基因、融合的分支酸变位酶P/预苯酸脱水酶(pheA)基因以及融合的分支酸变位酶T/预苯酸脱氢酶(tyrA)基因,和乳酸乳球菌的酮-异戊酸脱羧酶(kivd),并检测该途径产生苯乙醛和/或4-羟基苯乙醛的能力。
构建2-苯基乙醇、2-(4-羟苯基)乙醇以及2-(吲哚-3-)乙醇生物合成途径,该途径包含大肠杆菌的转酮醇酶(tktA)基因、3-脱氧-7-phosphoheptulonate合酶(aroF、aroG以及aroH)基因、3-脱氢奎尼酸合酶(aroB)基因、3-脱氢奎尼酸脱水酶(aroD)基因、脱氢莽草酸还原酶(aroE)基因、莽草酸激酶II(aroL)基因、莽草酸激酶I(aroK)基因、5-烯醇丙酮酰莽草酸-3-磷酸合成酶(aroA)基因、分支酸合酶(aroC)基因、融合的分支酸变位酶P/预苯酸脱水酶(pheA)基因以及融合的分支酸变位酶T/预苯酸脱氢酶(tyrA)基因,乳酸乳球菌的酮-异戊酸脱羧酶(kivd),酿酒酵母的醇脱氢酶(adh2),巴西固氮螺菌的吲哚-3-丙酮酸脱羧酶(ipdc),红球菌ST-10的苯基乙醇还原酶(par),以及荧光假单胞菌的苯甲醛裂解酶(bal),并检测其产生2-苯基乙醇、2-(4-羟苯基)乙醇和/或2-(吲哚-3-)乙醇的能力。
pBADButP的构建:编码丙酮丁醇梭菌ATCC 824的hbd、crt、bcd、etfA以及etfB的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃3分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCTTAGGAGGATTAGTCATGGAAC-3’)(SEQ ID NO:161)和反向引物(5’-GCTCTAGATTATTTTGAATAATCGTAGA AACC-3’)(SEQ IDNO:162)、1U Phusion高保真DNA聚合酶(NEB),以及50ng丙酮丁醇梭菌ATCC 824基因组(ATCC),总体积50μl。扩增的DNA片段用BamHI和XbaI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADButP-atoB的构建:编码大肠杆菌DH10B的atoB的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGAGGATATATATATGAAAAATTGTGTCATCGTC-3’)(SEQ ID NO:163)和反向引物(5’-AACTGCAGTTAATTCAACCGTTCAATCACC-3’)(SEQ ID NO:164)、1UPhusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌DH10B基因组,总体积50μl。扩增的DNA片段用XbaI和PstI消化,并连接于用相同的限制酶预消化的pBADButP。
pBADatoB-ald的构建:编码大肠杆菌DH10B的atoB和拜氏梭菌(Clostridium beijerinckii)的ald的DNA序列单独地通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM的正向引物,对于atoB为5’-CGAGCTC AGGAGGATATATATATGAAAAATTGTGTCATCGTCAGTG-3’)(SEQ ID NO:165),对于ald为5’-GGTTGAATTAAGGAGGATATATATATGAATAAAGACACACTAATACCTAC-3’)(SEQ ID NO:166)和反向引物(对于atoB为5’-GTCTTTATTCATATATATATCCTCCTTAATTCAACCGTTCAATCACCATC-3’(SEQ ID NO:146),对于ald为5’-CCCAAGCTTAGCCGGCAAGTACACATCTTC-3’)(SEQ ID NO:167),1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌DH10B和拜氏梭菌基因组(ATCC),总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱至30μl的EB缓冲液(Qiagen)中。将5μl各DNA溶液合并,且通过另一轮PCR剪接每个DNA片段:98℃10秒,60℃15秒以及72℃2分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAAAAATTGTGTCATCGTCAGTG-3’)(SEQ ID NO:168)和反向引物(5’-CCCAAGCTTAGCCGGCAAGTACACATCTTC-3’)(SEQ ID NO:169)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和HindIII消化,并连接至用相同的限制酶预消化的pBADButP。
pBADButP-atoB-ALD的构建:编码氯霉素乙酰转移酶(CAT)、P15复制原点、araBAD启动子、大肠杆菌DH10B的atoB和拜氏梭菌的ald的DNA片段1,和编码araBAD启动子、丙酮丁醇梭菌ATCC 824的hbd、crt、bcd、etfA以及etfB的DNA片段2,单独地通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃4分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于片段1为5’-AAGGAAAAAAGCGGCCGCCCCTGAACCGACGACCGGGTCG-3’)(SEQ ID NO:170)以及对于片段2为5’-CGGGGTACCACTTTTCATACTCCCGCCATTCAG-3’(SEQ IDNO:274)和反向引物(对于片段1为5’-CGGGGTACCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO:171)以及(对于片段2为5’-AAGGAAAAAAGCGGCCGCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO:172)),1U Phusion高保真DNA聚合酶(NEB),以及50ng pBADatoB-ald和pBADButP,总体积50μl。扩增的DNA片段用NotI和KpnI消化,并彼此连接。
pBADilvCD的构建:编码大肠杆菌DH10B的ilvC和ilvD的DNA片段单独地通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(对于ilvC为5’-GCTCTAGAGGAGGATATATATATGGCTAACTACTTCAATACAC-3’)(SEQ ID NO:173)以及对于ilvD为5’-TGCTGTTGCGGGTTAAGGAGGATATATATATGCCTAAGTACCGTTCCGCC-3’)(SEQ ID NO:174)和反向引物(对于ilvC为5’-AACGGTACTTAGGCATATATATATCCTCCTTAACCCGCAACAGCAATACG-3’)(SEQ ID NO:175)以及对于ilvD为5’-ACATGCATGCTTAACCCCCCAGTTTCGATT-3’)(SEQ ID NO:176))、1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌DH10B基因组(ATCC),总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱至30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液进行合并,每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒以及72℃2分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGAGGATATATATATGGCTAACTACTTCAATACAC-3’)(SEQ ID NO:177)和反向引物(5’-ACATGCATGCTTAACCCCCCAGTTTCGATT-3’)(SEQ ID NO:178),1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用XbaI和SphI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADals-ilvCD的构建:编码肺炎克雷伯氏菌肺炎亚种MGH78578(其密码子使用被优化,用于在大肠杆菌中过表达)的als的DNA片段通过聚合酶链式反应(PCR)进行扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGGATAAACAGTATCCGGT-3’)(SEQ ID NO:179)和反向引物(5’-GCTCTAGATTACAGAATTTGACTCAGGT-3’)(SEQ ID NO:180),1U Phusion高保真DNA聚合酶(NEB),以及50ng pETals,总体积50μl。扩增的DNA片段用SacI和XbaI消化,并连接于用相同的限制酶预消化的pBADilvCD。
pBADalsS-ilvCD的构建:编码枯草芽孢杆菌B26的alsS的前半部分和后半部分的DNA片段通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃0.5分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于前半部分为5’-CCCGAGCTCAGGAGGATATATATATGTTGACAAAAGCAACAAAAG-3’)(SEQ ID NO:181)以及对于后半部分为5’-CGGTACCCTTTCCAGAGATTTAGAG-3’(SEQ ID NO:275)和反向引物(对于前半部分为5’-CTCTAAATCTCTGGAAAGGGTACCG-3’)(SEQ ID NO:182)以及(对于后半部分为5’-GCTCTAGATTAGAGAGCTTTCGTTTTCATG-3’)(SEQ ID NO:183)、1U Phusion高保真DNA聚合酶(NEB),以及50ng枯草芽孢杆菌B26的基因组(ATCC),总体积50μl。将扩增的DNA片段进行凝胶纯化并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液进行合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGTTGACAAAAGCAACAAAAG-3’)(SEQ ID NO:184)和反向引物(5’-GCTCTAGATTAGAGAGCTTTCGTTTTCATG-3’)(SEQ ID NO:185),1U Phusion高保真DNA聚合酶(NEB)。剪接的片段内部无XbaI位点,因此用SacI和XbaI消化,并连接于用相同的限制酶预消化的pBADilvCD。
pBADLeuABCD的构建:编码大肠杆菌BL21(DE3)的leuA、leuB、leuC以及leuD的DNA片段通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃3分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO:186)和反向引物(5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ ID NO:187),1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌BL21(DE3)基因组,总体积50μl。扩增的DNA片段用SacI和XbaI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADLeuABCD2的构建:编码leuA和leuB的DNA片段1,和编码大肠杆菌BL21(DE3)的leuC和leuD的DNA片段2通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(对于片段1为5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO:188)和(对于片段2为5’-AGGGGTGTAAGGAGGATATATATATGGCTAAGACGTTATACGAAAAATTG-3’)(SEQ ID NO:189)和反向引物(对于片段1为5’-CGTCTTAGCCATATATATATCCTCCTTACACCCCTTCTGCTACATAGCGG-3’)(SEQ ID NO:190)和(对于片段2为5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO:191)、1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌BL21(DE3)基因组,总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒,以及72℃3分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO:192)和反向引物(5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO:193)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和XbaI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADLeuABCD4的构建:编码大肠杆菌BL21(DE3)的leuA、leuB、leuC以及leuD的DNA片段通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP,0.5μM正向引物(对于leuA为5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO:194)(对于leuB为5’-GAAACCGTGTGAGGAGGATATATATATGTCGAAGAATTACCATATTGCCG-3’)(SEQ ID NO:195)(对于leuC为5’-AGGGGTGTAAGGAGGATATATATATGGCTAAGACGTTATACGAAAAATTG-3’)(SEQ ID NO:196)和(对于leuD为5’-ACATTAAATAAGGAGGATATATATATGGCAGAGAAATTTATCAAACACAC-3’)(SEQ ID NO:197)和反向引物(对于leuA为5’-ATTCTTCGACATATATATATCCTCCTCACACGGTTTCCTTGTTGTTTTCG-3’)(SEQ ID NO:198)(对于leuB为5’-CGTCTTAGCCATATATATATCCTCCTTACACCCCTTCTGCTACATAGCGG-3’)(SEQ IDNO:199)(对于leuC为5’-TTTCTCTGCCATATATATATCCTCCTTATTTAATGTTGCGAATGTCGGCG-3’)(SEQ ID NO:200)和(对于leuD为5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO:201)、1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌BL21(DE3)基因组,总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒,以及72℃3分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAGCCAGCAAGTCATTATTTTCG-3’)(SEQ ID NO:202)和反向引物(5’-AAAACTGCAGCGTTTGATGACGTGGACGATAGCGG-3’)(SEQID NO:203)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和XbaI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADals-ilvCD-leuABCD、pBADals-ilvCD-leuABCD2、pBADals-ilvCD-leuABCD4、pBADalsS-ilvCD-leuABCD、pBADalsS-ilvCD-leuABCD2、pBADalsS-ilvCD-leuABCD4的构建:编码氯霉素乙酰转移酶(CAT)、P15复制原点、araBAD启动子、肺炎克雷伯氏菌肺炎亚种MGH78578的als(其密码子使用被优化,用于在大肠杆菌中过表达)或枯草芽孢杆菌B26的alsS和大肠杆菌DH10B的ilvC和ilvD的DNA片段1(对于als)和DNA片段2(对于alsS),被单独地通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒,以及72℃4分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-AAGGAAAAAAGCGGCCGCCCCTGAACCGACGACCGGGTCG-3’)(SEQ ID NO:204)和反向引物(5’-CGGGGTACCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO:205)、1U Phusion高保真DNA聚合酶(NEB),以及50ng pBADals-ilvCD和pBADalsS-ilvCD,总体积50μl。
为了从leuC中去除内部SphI限制酶位点,进行重叠PCR。编码araBAD启动子、大肠杆菌BL21(DE3)的leuA、leuB、leuC以及leuD的DNA片段3(对于leuABCD)、片段4(对于leuABCD2)以及片段5(对于leuABCD4)的前半部分和后半部分,被单独地通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒以及72℃4分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(对于前半部分为5’-AAGGAAAAAAGCGGCCGCACTTTTCATACTCCCGCCATTCAG-3’)(SEQ ID NO:206)和(对于后半部分为5’-CAAAGGCCGTCTGCACGCGCCGAAAGGCAAA-3’)(SEQ IDNO:207))和反向引物(对于前半部分为5’-TTTGCCTTTCGGCGCGTGCAGACGGCCTTTG-3’)(SEQ ID NO:208)和(对于后半部分为5’-ACATGCATGCCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ IDNO:209)、1U Phusion高保真DNA聚合酶(NEB),以及50ngpBADleuABCD、pBADleuABCD2和pBADleuABCD4,总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒,以及72℃4分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-AAGGAAAAAAGCGGCCGCACTTTTCATACTCCCGCCATTCAG-3’)(SEQ ID NO:210)和反向引物(5’-ACATGCATGCCGTTTGATGACGTGGACGATAGCGG-3’)(SEQ ID NO:211)、1U Phusion高保真DNA聚合酶(NEB)。所得的片段3、4以及5用SphI和NotI消化,并连接于用相同的限制酶预消化的片段1和2两者。
pBADaroG-tktA-aroBDE的构建:编码大肠杆菌BL21(DE3)的aroG、tktA、aroB、aroD以及aroE的DNA片段通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于aroG为5’-CCCGAGCTCAGGAGGATATATATATGAATTATCAGAACGACGATTTAC-3’)(SEQ ID NO:212),(对于tktA为5’-GCGTCGCGGGTAAGGAGG AAATTTTATGTCCTCACGTAAAGAGCTTGCC-3’)(SEQ IDNO:213),(对于aroB为5’-GAACTGCTGTAAGGAGGTTAAATTATGGAGAGGATTGTCGTTACTCTCG-3’)(SEQ ID NO:214)}(对aroD为5’-CAATCAGCGTAAGGAGGTATATATAATGAAAACCGTAACTGTAAAAGATC-3’)(SEQ ID NO:215)和(对于aroE为5’-TACACCAGGCATAAGGAGGAATTAATTATGGAAACCTATGCTGTTTTTGG-3’)(SEQID NO:216)以及反向引物(对于aroG为5’-TACGTGAGGACATAAAATTTTCCTCCTTACCCGCGACGCGCTTTTACTGC-3’)(SEQ ID NO:217),(对于tktA为5’-CAATCCTCTCCATAATTTTAACCTCCTTACAGCAGTTCTTTTGCTTTCGC-3’)(SEQ ID NO:218),(对于aroB为5’-CAATCAGCGTAAGGAGGTATATATAATGAAAACCGTAACTGTAAAAGATC-3’)(SEQ ID NO:219),(对于aroD为5’-TACGGTTTTCATTATATATACCTCCTTACGCTGATTGACAATCGGCAATG-3’)(SEQ ID NO:220)和(对于aroE为5’-ACATGCATGCTTACGCGGACAATTCCTCCTGCAA-3’)(SEQ ID NO:221),1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌BL21(DE3)基因组,总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒以及72℃3分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB),2mM  dNTP,0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGAATTATCAGAACGACGATTTAC-3’)(SEQ ID NO:222)和反向引物(5’-ACATGCATGCTTACGCGGACAATTCCTCCTGCAA-3’)(SEQ ID NO:223)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和SphI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADpheA-aroLAC的构建:编码大肠杆菌DH10的pheA、aroL、aroA以及aroC的DNA片段通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于pheA为5’-CCCGAGCTCAGGAGGATATATATATGACATCGGAAAACCCGTTACTGG-3’)(SEQ ID NO:224),(对于aroL为5’-GATCCAACCTAAGGAGGAAAATTTTATGACACAACCTCTTTTTCTGATCG-3’)(SEQ IDNO:225),(对于aroA为5’-GATCAATTGTTAAGGAGGTATATATAATGGAATCCCTGACGTTACAACCC-3’)(SEQ ID NO:226)和(对aroC为5’-CAGGCAGCCTAAGGAGGAATTAATTATGGCTGGAAACACAATTGGACAAC-3’)(SEQ ID NO:227)和反向引物(对于pheA为5’-AGGTTGTGTCATAAAATTTTCCTCCTTAGGTTGGATCAACAGGCACTACG-3’)(SEQ ID NO:228),(对于aroL为5’-CAGGGATTCCATTATATATACCTCCTTAACAATTGATCGTCTGTGCCAGG-3’)(SEQ IDNO:229),(对于aroA  为5’-GTTTCCAGCCATAATTAATTCCTCCTTAGGCTGCCTGGCTAATCCGCGCC-3’)(SEQ ID NO:230)和(对于aroC为5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQ ID NO:231),1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌BL21(DE3)基因组,总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μl EB缓冲液(Qiagen)中。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒以及72℃4分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGACATCGGAAAACCCGTTACTGG-3’)(SEQ ID NO:232)和反向引物(5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQID NO:233)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和SphI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADtyrA-aroLAC的构建:编码大肠杆菌DH10的pheA、aroL、aroA以及aroC的DNA片段通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于tyrA为5’-CCCGAGCTCAGGAGGATATATATATGGTTGCTGAATTGACCGCATTAC-3’)(SEQ ID NO:234),(对于aroL为5’-AATCGCCAGTAAGGAGGAAAATTTTATGACACAACCTCTTTTTCTGATCG-3’)(SEQ IDNO:235),(对于aroA为5’-GATCAATTGTTAAGGAGGTATATATAATGGAATCCCTGACGTTACAACCC-3’)(SEQ ID NO:236)和(对于aroC为5’-CAGGCAGCCTAAGGAGGAATTAATTATGGCTGGAAACACAATTGGACAAC-3’)(SEQ ID NO:237),和反向引物(对于tyrA为5’-GAGGTTGTGTCATAAAATTTTCCTCCTTACTGGCGATTGTCATTCGCCTG-3’)(SEQ ID NO:238),(对于aroL为5’-CAGGGATTCCATTATATATACCTCCTTAACAATTGATCGTCTGTGCCAGG-3’)(SEQ IDNO:239),(对于aroA为5’-GTTTCCAGCCATAATTAATTCCTCCTTAGGCTGCCTGGCTAATCCGCGCC-3’)(SEQ ID NO:240)以及(对于aroC为5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQ ID NO:241),1U Phusion高保真DNA聚合酶(NEB),以及50ng大肠杆菌BL21(DE3)基因组,总体积50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μl EB缓冲液(Qiagen)。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒,以及72℃4分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGGTTGCTGAATTGACCGCATTAC-3’)(SEQ ID NO:242)反向引物(5’-ACATGCATGCTTACCAGCGTGGAATATCAGTCTTC-3’)(SEQ IDNO:243)、1U Phusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和SphI消化,并连接于用相同的限制酶预消化的pBAD33。
pBADpheA-aroLAC-aroG-tktA-aroBDE  和pBADtyrA-aroLAC-aroG-tktA-aroBDE的构建:编码氯霉素乙酰转移酶(CAT)、P15复制原点、araBAD启动子,大肠杆菌DH10B的pheA或tyrA,aroL、aroA、aroC的DNA片段1(对于pheA)和2(对于tyrA),和编码araBAD启动子、大肠杆菌DH10B的aroG、tktA、aroB、aroD以及aroE的DNA片段3,被单独地通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒,以及72℃4分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于片段1和2为5’-AAGGAAAAAAGCGGCCGCCCCTGAACCGACGACCGGGTCG-3’)(SEQ ID NO:244)和(对于片段3为5’-GCTCTAGAACTTTTCATACTCCCGCCATTCAG-3’)(SEQ ID NO:245)和反向引物(对于片段1和2为5’-GCTCTAGAGCGGATACATATTTGAATGTATTTAG-3’)(SEQ IDNO:246)和(对于片段3为5’-AAGGAAAAAAGCGGCCGCGCGGATACATATTTGAATGTATTTAG-3’)(SEQ ID NO:247),1U Phusion高保真DNA聚合酶(NEB),以及50ng pBADpheA-aroLAC、pBADtyrA-aroLAC和pBADaroG-tktA-aroBDE,总体积50μl。扩增的DNA片段1和2用NotI和XbaI消化,并连接于用相同的限制酶预消化的片段3。
pTrcBAL的构建:编码苯荧光假单胞菌的乙醛裂解酶(bal)的DNA序列(优化其密码子使用,用于在大肠杆菌中过表达)通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGCTATGATTACTGGTGG-3’)(SEQ ID NO:248)和反向引物(5’-CCCCGAGCTCTTACGCGCCGGATTGGAAATACA-3’)(SEQID NO:249)、1U Phusion高保真DNA聚合酶(NEB)以及50ng pETBAL,总体积50μl。扩增的DNA片段用NcoI和SacI消化,并连接于用相同的限制酶预消化的pTrc99A。
pTrcAdhE2的构建:编码丙酮丁醇梭菌ATCC824的辅酶A连接的醇/醛脱氢酶(adhE2)的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGCCAAAGTTACAAATCAAAAAG-3’)(SEQ ID NO:250)和反向引物(5’-CGAGCTCTTAAAATGATTTTATATAGATATCC-3’)(SEQ IDNO:251)、1U Phusion高保真DNA聚合酶(NEB),以及50ng丙酮丁醇梭菌ATCC824基因组,总体积50μl。扩增的DNA片段用NcoI和SacI消化,并连接于用相同的限制酶预消化的pTrc99A。
pTrcAdh2的构建:编码酿酒酵母的醇脱氢酶(adh2)的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGGTATTCCAGAAACTCAAAAAG-3’)(SEQ ID NO:252)和反向引物(5’-CCCGAGCTCTTATTTAGAAGTGTCAACAACG-3’)(SEQ ID NO:253)、1U Phusion高保真DNA聚合酶(NEB),以及50ng酿酒酵母基因组,总体积50μl。扩增的DNA片段用NcoI和SacI消化,并连接于用相同的限制酶预消化的pTrc99A。
pTrcBALD的构建:编码拜氏梭菌的辅酶A连接的醛脱氢酶(ald)的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCCGAGCTCAGGAGGATATACATATGAATAAAGACACACTAATACC-3’)(SEQ ID NO:254)和反向引物(5’-CCCAAGCTTAGCCGGCAAGTACACATCTTC-3’)(SEQID NO:255)、1U Phusion高保真DNA聚合酶(NEB),以及50ng pETBAL,总体积50μl。扩增的DNA片段用SacI和HndIII消化,并连接于用相同的限制酶预消化的pTrcBAL。
pTrcBALK的构建:编码乳酸乳球菌的酮异戊酸脱羧酶(kivd)的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒,以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGTATACAGTAGGAGATTACC-3’)(SEQ ID NO:256)和反向引物(5’-GCTCTAGATTATGATTTATTTTGTTCAGCAAAT-3’)(SEQ IDNO:257)、1U Phusion高保真DNA聚合酶(NEB),以及50ng pETBAL,总体积50μl。扩增的DNA片段用SacI和XbaI消化,并连接于用相同的限制酶预消化的pTrcBAL。
pTrcAdh-Kivd的构建:编码乳酸乳球菌的酮异戊酸脱羧酶(kivd)的DNA序列通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCCGAGCTCAGGAGGATATATATATGTATACAGTAGGAGATTACC-3’)(SEQ ID NO:258)和反向引物(5’-GCTCTAGATTATGATTTATTTTGTTCAGCAAAT-3’)(SEQ IDNO:259)、1U Phusion高保真DNA聚合酶(NEB),以及50ng pETBAL,总体积50μl。扩增的DNA片段用SacI和XbaI消化,并连接于用相同的限制酶预消化的pTrcAdh2。
pTrcBAL-DDH-2ADH的构建:为了去除内部NcoI位点,进行重叠PCR。编码肺炎克雷伯氏菌肺炎亚种MGH 78578的内消旋-2,3-丁二醇脱氢酶(ddh)以及荧光假单胞菌的次级醇脱氢酶(2adh)的前半部分和后半部分的DNA片段,被单独地通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB),2mM dNTP,0.5μM正向引物(对于ddh的前半部分为5’-CGAGCTCAGGAGGATATATATATGAAAAAAGTCGCACTTGTTACCG-3’)(SEQ ID NO:260),(对于ddh的后半部分为5’-GGCCGGCGGC CGCGCGATGGCGGTGAAAGTG-3’)(SEQ IDNO:261),(对于2adh的前半部分为5’-AACTAATCTAGAGGAGGATATATATATGAGCATGACGTTTTCCGGCCAGG-3’)(SEQ ID NO:262)和(对于2adh的后半部分为5’-CCTTGCGGAGGGCTCGATGGATGAGTTCGAC-3’)(SEQ ID NO:263)和反向引物(对于ddh的前半部分为5’-CACTTTCACCGCCATCGCGCGGCCGCCGGCC-3’)(SEQ IDNO:264),(对于ddh的后半部分为5’-GCTCATATATATATCCTCCTCTAGATTAGTTAAACACCAT CCCGCCGTCG-3’)(SEQ ID NO:265),(对于2adh的前半部分为5’-GTCGAACTCATCCATCGAGCCCTCCGCAAGG-3’)(SEQ ID NO:266)和(对于2adh的后半部分为5’-CCCAAGCTTAGATCGCGGTGGCCCCGCCGTCG-3’)(SEQ ID NO:267),1UPhusion高保真DNA聚合酶(NEB),以及对于ddh为50ng肺炎克雷伯氏菌肺炎亚种MGH 78578基因组,对于2adh为50ng荧光假单胞菌基因组,总体积为50μl。将扩增的DNA片段进行凝胶纯化,并洗脱于30μlEB缓冲液(Qiagen)中。将5μl各DNA溶液合并,并将每一DNA片段通过另一轮PCR进行剪接:98℃10秒,60℃15秒以及72℃2分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CGAGCTCAGGAGGATATATATATGAAAAAAGTCGCACTTGTTACCG-3’)(SEQ ID NO:268)和反向引物(5’-CCCAAGCTTAGATCGCGGTGGCCCCGCCGTCG-3’)(SEQ ID NO:269)、1UPhusion高保真DNA聚合酶(NEB)。剪接的片段用SacI和HindIII消化,并连接于用相同的限制酶预消化的pTrcBAL。
pBBRPduCDEGH的构建:编码肺炎克雷伯氏菌肺炎亚种MGH78578的丙二醇脱水酶中亚基(pduD)和小亚基(pduE)以及丙二醇脱水酶再激活大亚基(pduG)和小亚基(pduH)的DNA序列,通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒以及72℃2分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-GCTCTAGAGGAGGATTTAAAAATGGAAATTAACGAAACGCTGC-3’)(SEQ ID NO:270)和反向引物(5’-TCCCCGCGGTTAAGCATGGCGATCCCGAAATGGAATCCCTTTGAC-3’)(SEQ ID NO:271)、1UPhusion高保真DNA聚合酶(NEB),以及50ng肺炎克雷伯氏菌肺炎亚种MGH 78578,总体积50μl。扩增的DNA片段用SacII和XbaI消化。并连接于用相同的限制酶预消化的pTrc99A,形成pBBRPduDEGH。
编码肺炎克雷伯氏菌肺炎亚种MGH 78578的丙二醇脱水酶大亚基(pduC)的DNA序列,通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CCGCTCGAGGAGGATATATATATGAGATCGAAAAGATTTGAAGC-3’)(SEQ IDNO:272)和反向引物(5’-GCTCTAGATTAGCCAAGTTCATTGGGATCG-3’)(SEQ ID NO:273)、1U Phusion高保真DNA聚合酶(NEB),以及50ng肺炎克雷伯氏菌肺炎亚种MGH 78578,总体积50μl。扩增的DNA片段用XhoI和XbaI消化,并连接于用相同的限制酶预消化的pBBRPduDEGH。
pTrcIpdc-Par的构建:编码巴西固氮螺菌的吲哚-3-丙酮酸(ipdc)和红球菌ST-10的苯基乙醇还原酶(par)的DNA序列,通过聚合酶链式反应(PCR)而扩增:98℃10秒,60℃15秒以及72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(5’-CATGCCATGGGACTGGCTGAGGCACTGCTGC-3’(对于ipdc为SEQ ID NO:314)和对于par为5’-CGAGCTCAGGAGGATATATATATGAAAGCTATCCAGTACACCCGTAT-3’(SEQ ID NO:315)和反向引物(对于ipdc为5’-CGAGCTCTTATTCGCGCGGTGCCGCGTGCAGG-3’(SEQ ID NO:316)和对于par为5’-GCTCTAGATTACAGGCCCGGAACCACAACGGCGC-3’(SEQ ID NO:317)、1U Phusion高保真DNA聚合酶(NEB),以及50ng pTrcIpdc和pTrcPar,总体积50μl。ipdc和par的扩增的DNA片段分别用NcoI/SacI和SacI/XbaI消化,并连接于用NcoI和XbaI预消化的pTrc99A。
检测和结果
为了检测丁醛生物合成途径,将容纳pBADButP-atoB/pTrcBALD和pBADButP-atoB-ALD/pTrcB2DH/pBBRpduCDEGH的DH10B在37℃、200rpm下,在LB培养基中培养过夜,该培养基含有50μg/ml氯霉素(Cm50)和100μg/ml氨苄青霉素(Amp100)。将每一种子培养物的等分试样接种于含有Cm50和Amp100的新鲜TB培养基中,并在37℃、200rpm下,培养于振荡培养箱中。接种3小时后,用13.3mM阿拉伯糖和1mM IPTG诱导培养物,并过夜培养。用等体积的乙酸乙酯提取700μl该培养物,并利用GC-MS分析。
为了检测异丁醛生物合成途径,将容纳pBADals-ilvCD/pTrcBALK或pBADalsS-ilvCD/pTrcBALK的DH10B细胞在37℃、200rpm下,过夜培养于含有50μg/ml氯霉素(Cm50)和100μg/ml氨苄青霉素(Amp100)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm50和Amp100的新鲜TB培养基中,并在37℃、200rpm下,培养于振荡培养箱中。接种3个小时后,用13.3mM阿拉伯糖和1mM IPTG诱导培养物,并过夜培养。用等体积的乙酸乙酯提取700μl该培养物,并利用GC-MS分析异丁醛的产生。图8B表示由这些培养物产生的异丁醛。
为了检测3-甲基丁醛和2-甲基丁醛生物合成途径,将容纳pBADals-ilvCD-LeuABCD/pTrcBALK、pBADals-ilvCD-LeuABCD2/pTrcBALK、pBADals-ilvCD-LeuABCD/pTrcBALK4、pBADalsS-LeuABCD/pTrcBALK、pBADalsS-LeuABCD2/pTrcBALK或pBADalsS-LeuABCD4/pTrcBALK的DH10B在37℃、200rpm下过夜培养于含有50μg/ml氯霉素(Cm50)和100μg/ml氨苄青霉素(Amp100)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm50和Amp100的新鲜TB培养基中,并在37℃、200rpm下,培养于振荡培养箱中。接种3个小时后,用13.3mM阿拉伯糖和1mM IPTG诱导培养物,并过夜培养。用等体积的乙酸乙酯提取700μl该培养物,并利用GC-MS分析。监测2-isovaleralcohol(2-甲基戊基)和3-isovaleralcohol(3-甲基戊醛),因为3-异戊醛和2-异戊醛自发地转化为它们的相应的醇。图8B表示由这些培养物产生的2-甲基戊基和3-甲基戊醛。
为了检测苯乙醛和4-羟苯基乙醛的生物合成途径,将容纳pBADpheA-aroLAC/pTrcBALK、pBADtyrA-aroLAC/pTrcBALK、pBADaroG-tktA-aroBDE/pTrcBALK、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK以及pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK的DH10B细胞在37℃、200rpm下过夜培养于含有50μg/ml氯霉素(Cm50)和100μg/ml氨苄青霉素(Amp100)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm50和Amp100的新鲜TB培养基中,并在37℃、200rpm下,培养于振荡培养箱中。接种3个小时后,用13.3mM阿拉伯糖和1mM IPTG诱导培养物,并过夜培养。用等体积的乙酸乙酯提取700μl该培养物,并利用GC-MS分析。利用GC-MS,监测苯乙醛、4-羟基苯乙醛和其相应的醇的产生。图9B表示由这些培养物产生4-羟苯基乙醇。
为了检测2-苯基乙醇、2-(4-羟苯基)乙醇和2-(吲哚-3)乙醇生物合成途径,将容纳pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcBALK、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcAdh2-Kivd、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcAdh2-Kivd、pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcIpdc-Par和pBADpheA-aroLAC-aroG-tktA-aroBDE/pTrcIpdc-Par的DH10B,在37℃、200rpm下过夜培养于含有50μg/ml氯霉素(Cm50)和100μg/ml氨苄青霉素(Amp100)的LB培养基中。将每一种子培养物的等分试样接种于含有Cm50和Amp100的新鲜TB培养基中,并在37℃、200rpm下,培养于振荡培养箱中。接种3个小时后,用13.3mM阿拉伯糖和1mMIPTG诱导培养物,并培养过夜至一周。用等体积的乙酸乙酯提取700μl该培养物,并利用GC-MS分析。结果在下文进行了详述。
2-苯基乙醇、2-(4-羟苯基)乙醇和/或2-(吲哚-3-)乙醇的产生用GC-MS监测。图42A表示在24小时由这些培养物产生的2-苯基乙醇。图42B表示在24小时由这些培养物产生的2-(4-羟苯基)乙醇。图42C表示在24小时由这些培养物产生的2-(吲哚-3-)乙醇。
图43A表示一周时对照(pBAD33和pTrc99A)的GC-MS层析谱。图43B表示一周时由pBADpheA-aroLAC-aroG-tktA-aroBDE和pTrcBALK产生的2-苯基乙醇(5.97分钟)的GC-MS层析谱。图44表示一周时由pBADtyrA-aroLAC-aroG-tktA-aroBDE和pTrcBALK产生的2-(4-羟苯基)乙醇(9.36分钟)和2-(吲哚-3)乙醇(10.32分钟)的GC-MS层析谱。
实施例5
二醇脱氢酶的分离和生物活性
可用的底物,如3-羟基-2-丁酮(乙偶姻)、4-羟基-3-丁酮(propioin)、5-羟基-4-辛酮(丁偶姻)、6-羟基-5-癸酮(valeroin)以及1,2-环戊二醇,用于测量二醇脱氢酶(ddh)催化大的饱和的α-羟基酮还原产生二醇的能力。除非另有说明,所有的试剂均购买自Sigma-Aldrich Co.和TCI America。
为了克隆和分离DDH多肽,从ATCC获得几个细菌物种(短乳杆菌ATCC 367、恶臭假单胞菌KT2440以及肺炎克雷伯氏菌MGH78578)的基因组DNA,利用以下操作步骤,进行PCR-扩增(在50μL反应中,使用Phusioin聚合酶和1×Phusion缓冲液、0.2mM dNTP、0.5μL Phusion酶、1.5μM引物以及20pg模板DNA):30个循环,98℃/10秒(变性),60℃/15秒(退火),72℃/30秒(延伸)。随后利用限制酶NdeI和BamHI,消化聚合酶链式反应产物,接着连接于NdeI/BamHI消化的pET28的载体。将含有ddh的载体克隆转化于BL21(DE3)感受态细胞,用于蛋白表达。将单个菌落接种于LB培养基中,在OD600=0.6下,用0.1mM IPTG诱导6×His标签目的蛋白的表达。允许表达在22℃下进行15小时。遵循QIAGEN所建议的操作步骤,利用Ni-NTA旋转柱,纯化6×His标签的酶,从而产生浓度范围为1.1-6.5mg/mL(经Bradford测定而测定)的纯化的蛋白。
从短乳杆菌ATCC 367中分离二醇脱氢酶ddh1,从恶臭假单胞菌KT2440中分离二醇脱氢酶ddh2,并从肺炎克雷伯氏菌MGH78578中分离二醇脱氢酶ddh3。编码ddh1的核苷酸序列和ddh1的多肽序列分别显示于SEQ ID NOS:97和98中。编码ddh2的核苷酸序列和ddh2的多肽序列分别显示于SEQ ID NOS:99和100中。编码ddh3的核苷酸序列和ddh3的多肽序列分别显示于SEQ ID NOS:101和102中。
测量DDH多肽生物活性的反应以200μL的终体积按如下进行:25mM底物、0.04mg/mL DDH多肽、0.25mg/mL烟碱辅因子、200mM咪唑、14mM Tris-HCl以及体积比为1.5%的DMSO。利用MolecularDevices Thermomax 96孔板读数器,进行生物活性测定,从而监测340nm的吸光率,其对应于NADH或NADPH的浓度。对于动力学研究,使用0.04mg/mL DDH多肽、0.25mg/mL NADH、20mM Tris HCl缓冲液pH6.5(red)或9.0(ox)、T=25C,总体积为100μL。
图12A表示利用丁偶姻作为底物,ddh1、ddh2以及ddh3的生物活性(三角形表示ddh3的活性)。图12B表示ddh3对1,2-环戊二醇和1,2-环己二醇的氧化活性,这可以由NADH的产生测量。图13概括了在DDH多肽所催化的氧化反应中对各种底物的动力学研究结果。这些反应是NAD+依赖性的。
实施例6
CC-连接酶(裂解酶)和二醇脱氢酶的依次体内生物活性
在大肠杆菌中检测C-C裂解酶和二醇氢化酶进行下述依次反应的能力:
为了产生α-羟基酮和二醇,在大肠杆菌中构建包含分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化了密码子使用,用于大肠杆菌的蛋白表达)和分离自肺炎克雷伯氏菌肺炎亚种MGH 78578的内消旋-2,3-丁二醇脱氢酶(ddh)基因的途径,并检测其缩合下文表2所详述的底物(如乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、苯乙醛以及4-羟基苯乙醛,或其相应的醇),体内形成α-羟基酮和相应的二醇能力。各种α-羟基酮和二醇的产生通过气相色谱-质谱术(gas chromatography-massspectrometry,GC-MS)监测。
表2:底物和产物概要
  底物   所产生的α-羟基酮  所产生的二醇   图
  丁醛   5-羟基-4-辛酮  4,5-辛二醇   17A&B
  正-戊醛   6-羟基-5-癸酮  5,6-癸二醇   18A&B
  3-甲基丁醛   2,7-二甲基-5-羟基-4-辛酮  2,7-二甲基-4,5-辛二醇   19A&B
  正-己醛   7-羟基-6-十二碳酮  6,7-十二烷二醇   20A&B
  4-甲基戊醛   2,9-二甲基-6-羟基-5-癸酮  2,9-二甲基-5,6-癸二醇   21A&B
  正-辛醛   9-羟基-8-十六碳酮  8,9-十六烷二醇   22
  乙醛   3-羟基-2-丁酮  2,3-丁二醇   23
  底物   所产生的α-羟基酮  所产生的二醇   图
  正-丙醛   4-羟基-3-己酮  3,4-己二醇   24A&B
  苯乙醛   1,4-二苯基-3-羟基-2-丁酮  1,4-二苯基-2,3-丁二醇   25
对于小于等于C10的分析:将容纳pTrcBAL-DDH-2ADH的大肠杆菌过夜培养于含有50μg/ml卡那霉素(Km)的LB培养基中。将这种种子培养物接种于含有3%(v/v)甘油、0.5%(g/v)和50μg/ml Km的M9培养基中。将10mL培养物培养至O.D.600=0.7,随后用0.5mM IPTG诱导培养物。在加入各种醛至浓度为5-10mM前,允许细胞表达目的酶3小时。在加入醛后,将培养物加上盖子,并37℃下振荡孵育72小时。用2mL乙酸乙酯提取培养物,并利用下述操作步骤在GC-MS上分析:
1μL注射w/50∶1半品脱(split)
进口温度-150℃
初始炉温-50℃
温度斜坡1-10℃/分钟-150℃
温度斜坡2-50℃/分钟-300℃
GC向MS转移的温度-250℃
MS检测-全扫描MW 35-200
对于大于等于C12的分析:将容纳pTrc99A(对照载体)或pTrcBAL的大肠杆菌DH10B菌株接种于0.75×M9/0.5%LB,该培养基含有0.1mM CaCl2、2mM MgSO4、1mM KCl、1%半乳糖醛酸盐、5μg/mL硫胺、Amp。将该培养物培养至高达0.8的光密度(600n nm),用0.25mMIPTG诱导。允许细胞在37℃下表达蛋白2.5小时,随后添加醛底物,至浓度为5mM,将培养瓶牢固地该上盖子,并在37℃w/振荡200rpm孵育72小时。用0.75mL乙酸乙酯提取1mL最终培养物,离心,促进相分离,随后利用下述方法经由GCMS分析:
1μL注射w/50∶1半品脱
进口温度-250℃
初始炉温-50℃
温度斜坡1-10℃/分钟至125℃
温度斜坡2-30℃/分钟至300℃
最终温度300℃-1分钟
GC向MS转移的温度-250℃
MS检测-全扫描MW 40-260。
结果绘示于图17-图25。图17表示丁醛依次转化为5-羟基-4-辛酮、随后是4,5-辛二醇。图18表示正-戊醛依次转化为6-羟基-5-癸酮和随后地5,6-癸二醇。图19表示3-甲基丁醛转化为2,7-二甲基-5-羟基-4-辛酮和随后地2,7-二甲基-4,5-辛二醇。图20表示正-己醛依次转化为7-羟基-6-十二碳酮和随后地6,7-十二烷二醇。图21表示4-甲基戊醛转化为2,9-二甲基-6-羟基-5-癸酮和随后地2,9-二甲基-5,6-癸二醇。图22表示正-辛醛转化为9-羟基-8-十六碳酮。图23表示乙醛转化为3-羟基-2-丁酮。图24表示正-丙醛依次转化为4-羟基-3-丁酮和随后地3,4-己二醇。图25表示苯乙醛转化为1,4-二苯基-3-羟基-2-丁酮。
与上文相似,在大肠杆菌中构建包含分离自荧光假单胞菌的苯甲醛裂解酶(bal)基因(优化密码子的使用,用于大肠杆菌蛋白的表达)的途径,并检测其催化产生各种α-羟基酮的能力。结果表示所检测的bal基因的广谱C-C连接酶活性,并示于图48-图55中。
实施例7
二醇脱氢酶和二醇脱水酶的依次生物活性
为了检测二醇脱氢酶和二醇脱水酶在脱水和还原途径中的依次生物活性,用丁偶姻作为产生4-辛酮的依次反应的底物。二醇脱氢酶(如ddh)催化α-羟基酮和其相应的二醇如5-羟基-4-辛酮和4,5-辛二醇的可逆的还原和氧化,二醇脱水酶(如pduCDE)催化二醇如4,5-辛二醇的不可逆脱水。
将肺炎克雷伯氏菌MGH 78578的二醇脱氢酶ddh和肺炎克雷伯氏菌MGH 78578的二醇脱水酶pduCDE克隆至细菌表达载体并表达,并且在Ni-NTA柱上纯化,如实施例X所述,除了在二醇脱水酶的表达和纯化过程中的所有时间添加1mM 1,2-丙二醇外。pduCDE多肽的大、中和小亚基分别为SEQ ID NOs:103、105和107的核苷酸序列编码,且多肽序列分别示于SEQ ID NOs:104、106和108中。
将ddh3和pduCDE多肽与丁偶姻和它们的适当辅因子一起孵育,随后用气相色谱质谱术(GC-MS)测定其进行依次反应产生4-辛酮产物的能力。下文的表3给出了反应条件。将反应混合物在37℃下,在0.6mL具有最小头部空间的eppendorf管中孵育40小时。用等体积的乙酸乙酯提取反应产物,储存于玻璃瓶,并送往Thermo Fischer ScientificInstruments Division,用于通过GC-MS的组成分析。
  表3:反应条件
  Rxn成分   浓度
  5-羟基-4-辛酮(丁偶姻)   8.4mM
  腺苷钴胺(辅酶B12)   33.5μM
  KCl   9.6mM
  NADH   18mM
  dDH3酶   0.19mg/mL
  dDOH1酶混合物   0.15mg/mL
  反应缓冲液   10mM Tris HCl pH 7.0
图26A表示GC-MS数据,该数据证实在样品提取物中存在4,5-辛二醇。在5.36分钟时的峰、滞留时间的质谱鉴定为丁偶姻(底物),在6.01、6.09和6.12分钟时,鉴定为4,5-辛二醇的不同异构体。这种化合物是由丁偶姻通过ddh3的还原产生的期望的产物。
图26B表示GC-MS数据,其证实在样品提取物种存在4-辛酮。4.55时的峰、滞留时间的质谱鉴定为4-辛酮。这种化合物是由分别通过ddh3和pduCDE的依此的丁偶姻脱氢和4,5-辛二醇脱水而产生的期望的产物。
图27A和图27B表示样品提取物气相色谱/质谱和4-辛酮标准气相色谱/质谱间的比较。这些结果证明,利用二醇脱氢酶(ddh3)和二醇脱水酶(pduCDE),4-辛酮由丁偶姻产生。孵育的反应混合物的GC-MS分析证实起始材料、中间物和产物,从而证明这些酶对这些特定底物是再适当的。
实施例8
次级醇脱氢酶的分离和生物活性
利用底物如4-辛酮、2,7-二甲基-4-辛酮、环戊酮和相应的醇,测量次级醇脱氢酶(2ADHs)催化大的饱和的酮还原为次级醇的能力。次级醇脱氢酶所催化的反应的实例示例于下文(表示4-辛酮还原为4-辛醇):
Figure GPA00001148551101311
除非另有说明,所有的酶和试剂均分别购买自New England Biolabs和Sigma。
各种次级醇脱氢酶(2ADHs)分离自恶臭假单胞菌KT2440、荧光假单胞菌Pf-5和肺炎克雷伯氏菌MGH 78578。所有的载体在BL21(DE3)感受态细胞中转化,用IPTG(经由T7启动子)诱导编码目的蛋白的基因的表达。裂解细胞,提取蛋白,随后在Ni-NTA柱上纯化。在测定前,将Ni-NTA洗脱物中终蛋白的浓度稀释为0.15mg/mL。
利用THERMOmax微量培养板读数器以动力学模式进行NADPH/NADPH消耗和产生测定,从而监测340nm下的NADPH的吸光率峰,直到反应到达平衡。在表2所述的测定中,检测2ADH-2、2ADH-5、2ADH-8以及2ADH-10催化4-辛醇的氧化或催化4-辛酮的还原的能力。这些反应条件见下文的表4:
Figure GPA00001148551101312
Figure GPA00001148551101321
如下文表5所述,进行其它检测,其中检测2ADH-2、2ADH-11、2ADH-12、2ADH-13、2ADH-14、2ADH-15、2ADH-16、2ADH-17和2ADH-18催化4-辛醇、2,7-二甲基-4-辛醇或环戊醇的氧化或催化4-辛酮、2,7-二甲基-4-辛酮或环戊酮的还原的能力。
表5:
Figure GPA00001148551101322
图30A表示表3的NADH产生测定的结果,其中,在存在NAD+时,2ADH-2催化4-辛醇的氧化,这可由NADH的产生测量。图30B表示表3的NADPH产生测定的结果,其中,在存在NADP+时,2ADH-5、2ADH-8和2ADH-10催化4-辛醇的氧化,这可由NADPH的产生测量。
图31表示4-辛醇通过2ADH-11(图31A)和2ADH-16(图31B)的氧化,可分别由NADH和NADPH的产生测量。图32表示2,7-二甲基辛醇通过2ADH-11和其它(图32A)以及2ADH-16(图32B)的氧化,这分别可以由NADH和NADPH的产生测量。
图33A表示2,7-二甲基辛醇通过2ADH 11和2ADH16的还原,这可由NADPH消耗监测。图33B表示2ADH11和2ADH16两者对各种底物的还原活性。图34表示环戊醇通过2ADH-16的氧化(图34A)和还原(图34B)。
与上文相似,利用2ADH-16,对各种底物进行氧化和还原反应的动力学检测。这些研究的条件如下:0.04mg/mL酶,0.25mg/mL辅因子,20mM Tris HCl缓冲液pH 6.5(red)或9.0(ox),T=25C,总体积100μL。还原反应的计算的速率常数,以及底物的结构,概括于图35中。氧化反应的计算的速率常数,以及底物的结构,概括于图36。这些结果表明,2ADH-16能催化广泛种类底物的氧化和还原两者。
实施例9
不依赖辅酶B12的二醇脱水酶的分离和体外及体内活性
用底物,如1,2-丙二醇、内消旋-2,3-丁二醇以及反式-1,2-环戊二醇检测不依赖B12的二醇脱水酶在脱水和还原途径中的体外和体内生物活性。二醇脱水酶催化二醇如1,2-丙二醇的不可逆的脱水。
对于体外活性,将容纳pETPduCDE(二醇脱水酶亚基)的大肠杆菌BL21(DE3)接种于100mL LB培养基中,培养至OD600=0.7,用0.15mMIPTG诱导,并在22℃下孵育22小时。裂解细胞,并在Ni-NTA旋转柱上纯化目的蛋白。所有三种脱水酶亚基的纯化通过向裂解物和洗涤缓冲液添加5mM 1,2-丙二醇完成。Ni-NTA纯化产生约660μL浓度为2.2mg/mL的蛋白混合物。利用Bradford试剂操作步骤,进行蛋白浓度测定。
用纯化的PduCDE建立体外二醇脱水酶反应。用1,2-丙二醇和内消旋-2,3-丁二醇进行三个测定。还用添加的洗脱缓冲液取代纯化的PduCDE,建立对照反应。在半厌氧条件下,在2mL螺旋盖玻璃瓶中进行体外反应。反应组分和浓度在表6中给出。
Figure GPA00001148551101341
48小时后,用0.5mL乙酸乙酯或己醇提取1mL反应混合物,并通过GCMS分析。
对于所有的实验,用下述GCMS操作步骤:
1μL注射w/50∶1半品脱
进口温度-250℃
初始炉温-50℃
温度斜坡1-10℃/分钟至125℃
温度斜坡2-30℃/分钟至300℃
最终温度300℃-1分钟
GC向MS转移的温度-250℃
MS检测-全扫描MW 40-260
结果显示于图45中。图45A证实由1,2-丙二醇形成1-丙醛,且图45B证实由内消旋-2,3-丁二醇形成2-丁酮,两者都被不依赖B12的二醇脱水酶催化。
对于体内活性,按如下构建pBBRDhaB1/2质粒:编码丁酸梭菌的不依赖B12的甘油脱水酶(dhaB1)和激活剂(dhaB2)的DNA序列,通过聚合酶链式反应(PCR)扩增:98℃10秒,60℃15秒以及对于dhaB1为72℃2分钟和对于dhaB2为72℃1分钟,重复30次。反应混合物分别含有1×Phusion缓冲液(NEB)、2mM dNTP、0.5μM正向引物(对于dhaB1为5’-CCGCTCGAGGAGGATATATATATGATTTCTAAAGGCTTTAGCACCC-3’(SEQ ID NO:318)和对于dhaB2为5’-ACGTGATGTAATCTAGAGGAGGATATATATATGAGCAAAGAAATTAAAGG-3’(SEQ ID NO:319)和反向引物(对于dhaB1为5’-TCTTTGCTCATATATATATCCTCCTCTAGATTACATCACGTGTTCAGTAC-3’(SEQID NO:320)和对于dhaB2为5’-CGAGCTCTTATTCGGCGCCAATGGTGCACGGG-3’(SEQ ID NO:321)、1U Phusion高保真DNA聚合酶(NEB),以及50ng pETdhaB1和pETdhaB2,总体积μl。扩增的片段进行凝胶纯化,并通过另一轮PCR进行剪接:98℃10秒,60℃15秒以及72℃2.5分钟,重复30次。反应混合物含有1×Phusion缓冲液(NEB)、2mMdNTP、0.5μM正向引物(5’-CCGCTCGAGGAGGATATATATATGATTTCTAAAGGCTTTAGCACCC-3’)(SEQ ID NO:322)和反向引物(5’-CGAGCTCTTATTCGGCGCCAATGGTGCACGGG-3’)(SEQ IDNO:323)、1U Phusion高保真DNA聚合酶(NEB),以及50ng每一片段,总体积50μl。扩增的DNA片段用XhoI和SacI消化,并连接于用相同的限制酶预消化的pBBR1MCS-2。
将两株容纳pBBR1MCS-2或pBBRDhaB1/2的大肠杆菌DH10B菌株接种于无甘油的TB培养基中。将培养物培养至OD600=0.5,将底物1,2-丙二醇、内消旋-2,3-丁二醇和反式-1,2-环戊二醇添加于各培养物,至浓度为10mM。在将培养物转移至无氧环境中之前,添加5μg/ml辅酶S-腺苷甲硫氨酸。将培养物在37℃下孵育48小时。
48小时后,用0.5mL乙酸乙酯或己醇提取1mL提取物,并通过GCMS分析,如上文所述。结果显示于图46中。图46A表示由1,2-丙二醇体内产生1-丙醇。图46B表示由内消旋-2,3丁二醇体内产生2-丁醇。图46C表示由反式-1,2-环戊二醇体内产生环戊酮。
实施例10
足以生长于作为唯一碳源的藻酸盐上的分泌的藻酸
盐裂解酶和基因组区的鉴定
为了鉴定分泌的或外部藻酸盐裂解酶,以及为了鉴定灿烂弧菌的足以赋予生长于作为唯一碳源的藻酸盐上的基因组区,利用Invitrogen(Carlsbad,CA)的gateway系统制备下列克隆。首先,通过将PCR片段TOPO克隆于pENTR/D/TOPO中,制备入门载体(entry vectors)。利用灿烂弧菌B01基因组DNA作为模板,产生PCR片段,并用下述引物对扩增:
Vs24214-24249:对应于V12B01_24214至V12B01_24249的基因标示符的基因组区(参阅实施例1)。
表7
24214F  cacc caagcgatagtttatatagcgt(SEQ ID NO:324)
24249R  gaaatgaacggatattacgt(SEQ ID NO:325)
Vs24189-24209:对应于V12B01_24189至V12B01_24209的基因标示符的基因组区(参阅实施例1)。
表8
24189R    cggaacaggtgattgtggt(SEQ ID NO:326)
24209F    cacc gcccacttcaagatgaagctgt(SEQ ID NO:327)
Vs24214-24239:对应于V12B01_24214至V12B01_24239的基因标示符的基因组区(参阅实施例1)。
表9
24214F    cacc caagcgatagtttatatagcgt(SEQ ID NO:328)
24239R_1  gtggctaagtacatgccggt(SEQ ID NO:329)
利用LR重组酶(Invitrogen),将入门载体与目的载体(destination vector)pET-DEST42(Invitrogen)重组。随后将这些目的载体放入电转感受态DH10B或BL21细胞中。
消化(利用酶Nde I和Bam HI)利用灿烂弧菌12B01基因组DNA作为模板而产生并用下述引物对扩增的PCR产物,制备藻酸盐裂解酶克隆:
表10
           V12B01_24214的正向引物:GGAATTC CAT atgacaaagaatatgacgac
24214ndeF  taaac(SEQ ID NO:330)
           V12B01_24214的反向引物:CG GGATCC ttattatttcccctgccctgcagt
24214bamR  (SEQ ID NO:331)
           V12B01_24219的正向引物:GGAATTC CAT atgagctatcaaccacttttac
24219ndeF  (SEQ ID NO:332)
           V12B01_24219的反向引物:CG GGATCC ttacagttgagcaaatgatcc
24219bamR  (SEQ ID NO:333)
随后将消化的PCR产物连接于切割的pET28载体。对于分泌的藻酸盐裂解酶的存在,检测灿烂弧菌B01的某些克隆的基因组区,检测上述构建体的各种组合赋予生长于作为唯一碳源的藻酸盐上的能力。
灿烂弧菌的Vs24254(SEQ ID NO:32)区编码功能性外部藻酸盐裂解酶。表达pET28载体的Vs24254的BL21细胞能分解生长培养基中的藻酸盐。当培养于LB+2%藻酸盐+0.1mM异丙基β-D-1-硫代半乳糖苷(IPTG)中时,仅表达Vs24254基因的细胞产生了粉红的阳性TBA测定结果。通过旋转培养于上述培养基上的过夜培养物,进行这种测定。随后将培养基与0.8%硫代巴比妥酸(TBA)按1∶1的比例混合,99摄氏度下加热10分钟,测定粉红着色。图47表示这种测定的结果。图47中左侧的试管表示取自表达Vs24254细胞的过夜培养物的培养基,而右手的试管表示使用表达Vs24259的细胞的培养基的TBA反应(阴性对照)。阴性对照缺少粉红着色表示没有发生藻酸盐多聚体的切割或者发生了很少的切割。不表达任何重组蛋白的野生型大肠杆菌细胞与作为阴性对照Vs24259表现相同着色(数据未显示)。
为了检测重组大肠杆菌生长于作为唯一碳源的藻酸盐上的能力,将转化的细胞在30摄氏度下在96孔板中温和震荡培养19小时。每一孔容纳222μl具有0.66%碳源的基本培养基(参见基本培养基说明的生长条件),该碳源采用降解的藻酸盐或葡萄糖的形式(生长的阳性对照)。所有的细胞是无质粒的BL21(BL21-阴性对照)、具有1个质粒的BL21(Da或3a)或具有2个质粒的BL21(Dk3a和Da3k)。质粒以小写字母表示:“a”指质粒骨架pET-DEST42,“k”指pENTR/D/TOPO骨架。“D”表示质粒含有基因组区Vs24214-24249,而“3”表示质粒含有基因组区Vs24189-24209。因此,Da是pET-DEST42-Vs24214-24249,Da3k是pET-DEST42-Vs24214-24249以pENTR/D/TOPO-Vs24189-24209等。
如图56A所示,两个载体构建体pET-DEST42-Vs24214-24249和pENTR/D/TOPO-Vs24189-24209,当与大肠杆菌组合时,赋予在作为唯一碳源的降解的藻酸盐上的生长。当将这些基因组插入物转换至相反的载体(pET-DEST42-Vs24189-24209和pENTR/D/TOPO-Vs24214-24249)时,观察到这种相同的结果。图56B表示在作为阳性对照的葡萄糖上的生长。因此,组合的灿烂弧菌的基因组区Vs24214-24249和Vs24189-24209足以赋予大肠杆菌在作为唯一碳源的藻酸盐上生长的能力。
实施例11
乙醇由藻酸盐的产生
检测通过培养于作为碳源的藻酸盐上的重组大肠杆菌产生乙醇的能力。为了产生重组的大肠杆菌,将编码运动发酵单孢菌的丙酮酸脱羧酶(pdc)和两种醇脱氢酶(adhA和adhB)的DNA序列通过聚合酶链式反应(PCR)扩增。将这些扩增的片段进行凝胶纯化,并通过另一轮PCR剪接在一起。最终的扩增的DNA片段用BamHI和XbaI消化,并连接于用相同的限制酶预消化的pBBR1MCS-2。所得的质粒称为pBBRPdc-AdhA/B。
用pBBRPdc-AdhA/B或pBBRPdc-AdhA/B+1.5Fos(含有V12B01_24189至V12B01_24249的基因组区的fosmid克隆;这些序列赋予大肠杆菌利用藻酸盐作为唯一碳源的能力,参阅实施例1和10)转化大肠杆菌,将其培养于含有藻酸盐的m9培养基中,并检测乙醇的产生。结果显示于图57,其证明,容纳pBBRPdc-AdhA/B+1.5FOS的菌株,当生长于藻酸盐上时,表现出显著更高的乙醇产量。这些结果表明,pBBRPdc-AdhA/B+1.5FOS在产生乙醇时,能利用藻酸盐作为碳源。
将下述出版物的全部内容通过引用并入本文。
1.T.Y.Wong,L.A.Preston,N.L.Schiller,Annu Rev Microbiol 54,289(2000).
2.W.Hashimoto,O.Miyake,A.Ochiai,K.Murata,J Biosci Bioeng 99,48(Jan,2005).
3.M.Yamasaki,K.Ogura,W.Hashimoto,B.Mikami,K.Murata,J Mol Biol 352,11(Sep 9,2005).
4.M.Yamasaki et al.,Acta Crystallogr Sect F Struct Biol Cryst Commun 61,288(Mar 1,2005).
5.O.Miyake,A.Ochiai,W.Hashimoto,K.Murata,J Bacteriol 186,2891(May,2004).
6.O.Miyake,W.Hashimoto,K.Murata,Protein Expr Purif 29,33(May,2003).
7.H.J.Yoon,B.Mikami,W.Hashimoto,K.Murata,J Mol Biol 290,505(Jul 9,1999).
8.H.J.Yoon,W.Hashimoto,O.Miyake,K.Murata,B.Mikami,J Mol Biol 307,9(Mar 16,2001).
9.W.Hashimoto,O.Miyake,K.Momma,S.Kawai,K.Murata,J Bacteriol 182,4572(Aug,2000).
10.H.J.Yoon et al.,Protein Expr Purif 19,84(Jun,2000).
11.T.Osawa,Y.Matsubara,T.Muramatsu,M.Kimura,Y.Kakuta,J Mol Biol 345,1111(Feb 4,2005).
12.A.Ochiai,W.Hashimoto,K.Murata,Res Microbiol 157,642(Sep,2006).
13.F.J.Mergulhao,D.K.Summers,G.A.Monteiro,Biotechnol Adv 23,177(May,2005).
14.J.H.Choi,S.Y.Lee,Appl Microbiol Biotechnol 64,625(Jun,2004).
15.M.P.DeLisa,D.Tullman,G.Georgiou,Proc Natl Acad Sci U S A 100,6115(May 13,2003).
16.N.Blaudeck,G.A.Sprenger,R.Freudl,T.Wiegert,J Bacteriol 183,604(Jan,2001).
17.N.Pradel et al.,Biochem Biophys Res Commun 306,786(Jul 4,2003).
18.L.Masip et al.,Science 303,1185(Feb 20,2004).
19.C.M.Barrett,N.Ray,J.D.Thomas,C.Robinson,A.Bolhuis,Biochem BiophysRes Commun 304,279(May 2,2003).
20.R.Binet,S.Letoffe,J.M.Ghigo,P.Delepelaire,C.Wandersman,FoliaMicrobiol(Praha)42,179(1997).
21.I.Gentschev,G.Dietrich,W.Goebel,Trends Microbiol 10,39(Jan,2002).
22.V.Koronakis,FEBS Lett 555,66(Nov 27,2003).
23.J.Jose,Appl Microbiol Biotechnol 69,607(Feb,2006).
24.J.Jose,D.Betscheider,D.Zangen,Anal Biochem 346,258(Nov 15,2005).
25.M.Ashiuchi,H.Misono,Appl Microbiol Biotechnol 59,9(Jun,2002).
26.J.Narita et al.,Appl Microbiol Biotechnol 70,564(May,2006).
27.Y.Aso et al,Nat Biotechnol 24,188(Feb,2006).
28.W.Hashimoto et al.,Biosci Biotechnol Biochem 69,673(Apr,2005).
29.A.E.Lagarde,F.R.Stoeber,J Bacteriol 129,606(Feb,1977).
30.M.A.Mandrand-Berthelot,P.Ritzenthaler,M.Mata-Gilsinger,J Bacteriol 160,600(Nov,1984).
31.J.Pouyssegur,F.Stoeber,J Bacteriol 117,641(Feb,1974).
32.J.Preiss,G.Ashwell,J Biol Chem 237,309(Feb,1962).
33.J.Preiss,G.Ashwell,J Biol Chem 237,317(Feb,1962).
34.G.M.Bird,P.Haas,Biochemical Journal 25,403(1931).
35.L.H.Cretcher,W.L.Nelson,Science 67,537(May 25,1928).
36.W.L.Nelson,L.H.Cretcher,Journal of the American Chemical Society 51,1914(1929).
37.W.L.Nelson,L.H.Cretcher,Journal of the American Chemical Society 52,2130(1930).
38.W.L.Nelson,L.H.Cretcher,Journal of the American Chemical Society 54,3409(1932).
39.E.Schoeffel,K.P.Link,Journal of Biological Chemistry 95,213(1932).
40.E.Schoeffel,K.P.Link,Journal of Biological Chemistry 100,397(1933).
41.H.A.Spoehr,Archive of Biochemistry 14,153(1947).
42.J.J.Farmer,3rd,R.G.Eagon,J Bacteriol 97,97(Jan,1969).
43.R.L.Anderson,D.P.Allison,J Biol Chem 240,2367(Jun,1965).
44.W.J.Lennarz,R.J.Light,K.Bloch,Proc Natl Acad Sci U S A 48,840(May,1962).
45.S.A.Graham,Crit Rev Food Sci Nutr 28,139(1989).
46.E.Wiberg,P.Edwards,J.Byrne,S.Stymne,K.Dehesh,Planta 212,33(Dec,2000).
47.L.Yuan,T.A.Voelker,D.J.Hawkins,Proc Natl Acad Sci U S A 92,10639(Nov7,1995).
48.K.Dehesh,A.Jones,D.S.Knutzon,T.A.Voelker,Plant J 9,167(Feb,1996).
49.K.Dehesh,P.Edwards,T.Hayes,A.M.Cranmer,J.Fillatti,Plant Physiol 110,203(Jan,1996).
50.K.M.Mayer,J.Shanklin,BMC Plant Biol 7,1(2007).
51.J.K.Jha et al.,Plant Physiol Biochem 44,645(Nov-Dec,2006).
52.B.S.Schutt,M.Brummel,R.Schuch,F.Spener,Planta 205,263(Jun,1998).
53.K.Dehesh,P.Edwards,J.Fillatti,M.Slabaugh,J.Byrne,Plant J 15,383(Aug,1998).
54.J.M.Leonard,S.J.Knapp,M.B.Slabaugh,Plant J13,621(Mar,1998).
55.M.Vedadi,R.Szittner,L.Smillie,E.Meighen,Biochemistry 34,16725(Dec 26,1995).
56.M.O.Park,J Bacteriol 187,1426(Feb,2005).
57.M.O.Park,K.Heguri,K.Hirata,K.Miyamoto,J Appl Microbiol 98,324(2005).
58.M.O.Park,M.Tanabe,K.Hirata,K.Miyamoto,Appl Microbiol Biotechnol 56,448(Aug,2001).
59.M.Morikawa,T.Iwasa,S.Yanagida,T.Imanaka,Journal of Fermentation andBioengineering 85,243(1998).
60.M.Dennis,P.E.Kolattukudy,Proc Natl Acad Sci U S A 89,5306(Jun 15,1992).
61.T.M.Cheesbrough,P.E.Kolattukudy,J Biol Chem 263,2738(Feb 25,1988).
62.M.C.Chang,R.A.Eachus,W.Trieu,D.K.Ro,J.D.Keasling,Nat Chem Biol 3,274(May,2007).
63.R.J.Porra,B.D.Ross,Biochem J 94,557(Mar,1965).
64.X.Chen,W.Guo,L.Zhao,Q.Fu,Y.Ma,J Phys Chem A 111,3566(May 10,2007).
65.L.Zhao,W.Guo,R.Zhang,S.Wu,X.Lu,Chemphyschem 7,1345(Jun 12,2006).
66.L.Zhao,R.Zhang,W.Guo,S.Wu,X.Lu,Chemical Physics Letters 414,28(2005).
67.G.Gorgen,W.Boland,Eur J Biochem 185,237(Nov 6,1989).
68.P.Ney,W.Boland,Eur J Biochem 162,203(Jan 2,1987).
69.Z.L.Boynton,G.N.Bennett,F.B.Rudolph,Appl Environ Microbiol 62,2758(Aug,1996).
70.R.T.Yan,J.S.Chen,Appl Environ Microbiol 56,2591(Sep,1990).
71.R.V.Nair,G.N.Bennett,E.T.Papoutsakis,J Bacteriol 176,871(Feb,1994).
72.D.P.Wiesenborn,F.B.Rudolph,E.T.Papoutsakis,Appl Environ Microbiol 55,317(Feb,1989).
73.D.K.Thompson,J.S.Chen,Appl Environ Microbiol 56,607(Mar,1990).
74.M.G.Hartmanis,J Biol Chem 262,617(Jan 15,1987).
75.K.X.Huang,S.Huang,F.B.Rudolph,G.N.Bennett,J Mol MicrobiolBiotechnol 2,33(Jan,2000).
76.L.Fontaine et al.,J Bacteriol 184,821(Feb,2002).
77.B.McMahon,M.E.Gallagher,S.G.Mayhew,FEMS Microbiol Lett 250,121(Sep 1,2005).
78.M.Li,S.Yao,S.K.,Microbial Biotechnology 23,573(2007).
79.T.B.Causey,S.Zhou,K.T.Shanmugam,L.O.Ingram,Proc Natl Acad Sci U SA 100,825(Feb 4,2003).
80.D.E.Chang,S.Shin,J.S.Rhee,J.G.Pan,J Bacteriol 181,6656(Nov,1999).
81.C.R.Dittrich,R.V.Vadali,G.N.Bennett,K.Y.San,Botechnol Prog 21,627(Mar-Apr,2005).
82.H.Lin,N.M.Castro,G.N.Bennett,K.Y.San,Appl Microbiol Biotechnol 71,870(Aug,2006).
83.U.Schorken,G.A.Sprenger,Biochim Biophys Acta 1385,229(Jun 29,1998).
84.G.A.Sprenger,M.Pohl,Journal of Molecular Catalysis B:Enzymatic 6,145(1999).
85.G.A.Sprenger,M.Pohl,Journal of Molecular Catalysis B:Enzymic 6,145(1999).
86.B.Gonzalez,R.Vicuna,J Bacteriol 171,2401(May,1989).
87.P.Hinrichsen,I.Gomez,R.Vicuna,Gene 144,137(Jun 24,1994).
88.E.Janzen et al.,Bioorg Chem 34,345(Dec,2006).
89.M.M.Kneen,I.D.Pogozheva,G.L.Kenyon,M.J.McLeish,Biochim BiophysActa 1753,263(Dec 1,2005).
90.K.Yamada-Onodera,A.Nakajima,Y.Tani,J Biosci Bioeng 102,545(Dec,2006).
91.K.Yamada-Onodera,M.Fukui,Y.Tani,J Biosci Bioeng 103,174(Feb,2007).
92.T.Tobimatsu,M.Azuma,S.Hayashi,K.Nishimoto,T.Toraya,Biosci BiotechnolBiochem 62,1774(Sep,1998).
93.T.Tobimatsu et al.,J Biol Chem 271,22352(Sep 13,1996).
94.T.Toraya,T.Shirakashi,T.Kosuga,S.Fukui,Biochem Biophys Res Commun 69,475(Mar 22,1976).
95.M.Yamanishi et al.,Eur J Biochem 269,4484(Sep,2002).
96.J.R.O′Brien et al.,Biochemistry 43,4635(Apr 27,2004).
97.C.Raynaud,P.Sarcabal,I.Meynial-Salles,C.Croux,P.Soucaille,Proc NatlAcad Sci U S A 100,5010(Apr 29,2003).
98.B.Ludwig,A.Akundi,K.Kendall,Appl Environ Microbiol 61,3729(Oct,1995).
99.S.X.Xie,J.Ogawa,S.Shimizu,Biosci Biotechnol Biochem 63,1721(Oct,1999).
100.T.Zelinski,J.Peters,M.R.Kula,J Biotechnol 33,283(Apr 15,1994).
101.M.C.Hunt,A.Rautanen,M.A.Westin,L.T.Svensson,S.E.Alexson,Faseb J20,1855(Sep,2006).
102.M.A.Westin,S.E.Alexson,M.C.Hunt,J BiolChem 279,21841(May 21,2004).
103.M.A.Westin,M.C.Hunt,S.E.Alexson,J Biol Chem 280,38125(Nov 18,2005).
104.H.Iwaki,Y.Hasegawa,S.Wang,M.M.Kayser,P.C.Lau,Appl EnvironMicrobiol 68,5671(Nov,2002).
序列表
 
<110>生物结构实验室公司
     Kashiyama,Yuki
     Yoshikuni,Yasuo
     Siegel,Justin B.
     Baker,David
 
<120>生物燃料生产
 
<130>150097.40101
 
<140>PCT
<141>2008-10-03
 
<160>313
 
<170>FastSEQ for Windows Version 4.0
 
<210>1
<211>12066
<212>DNA
<213>灿烂弧菌
 
<400>1
ggggacaagt ttgtacaaaa aagcaggctt gacgcttatc acatttagta gaagcttatg 60
tggaggcgat tggctttttt ttcaaggaag attacaaaat agctcaggta atgccgattt 120
atagatttgc tatgatatag ttcaggatct tatgctttta ataagcagga acagaattta 180
tgaacaaaaa agctgatagt ttagtaggtt acagctttat tcgttataga aagggttagg 240
gaacgtgaac tttttagagc tcaaacttcg catggataac tctccggtgc tgagccgatt 300
tttagagaat ggatttttac tccagcagaa actgagcctt gttctttgtt gtgtgttgat 360
cgcagcttct gcatggattt taggacagct tgcatggttt attgaacctg ctgagcaaac 420
cgtcgtgcca tggacagcaa cggcttcctc gtcttcaacg cctcaatcga ctcttgatat 480
ctcttctttg cagcagagca acatgtttgg tgcttataac ccaaccacgc ctgctgtggt 540
tgagcagcaa gttatccaag atgcgccaaa gacgcgactg aacctcgttt tagtgggtgc 600
agtagccagt tctaatccaa agctgagctt ggctgtgatt gccaatcgcg gcacacaagc 660
aacctacggc attaatgaag agatcgaagg tacgcgagct aagttaaaag cggtattagt 720
cgatcgcgtg attattgata actcaggtcg agacgaaacc ttgatgcttg aaggcattga 780
gtacaagcgt ttgtctgtat cagcacctgc gccacctcgt acctcttctt ctgtgcgtgg 840
caacaaccca gcttctgcag aagagaagct agatgaaatt aaagcgaaga taatgaaaga 900
tccgcaacaa atcttccaat atgttcgact gtctcaggtg aaacgcgacg ataaagtgat 960
tggttatcgt gtgagccctg gcaaagattc agaacttttt aactctgttg ggctccaaaa 1020
cggagatatt gccactcagt taaatggaca agacctgaca gaccctgctg ctatgggcaa 1080
catattccgt tctatctcag agctgacaga gctaaacctc gtcgtcgaga gagatggtca 1140
acaacatgaa gtgtttattg aattttagaa ctttgcgtct aacgaaggac gaaagtgtag 1200
gagaagtacg tgaagcattg gtttaagaaa agtgcatggt tattggcagg aagcttaatc 1260
tgcacacccg cagccatcgc gagtgatttt agtgccagct ttaaaggcac tgatattcaa 1320
gagtttatta atattgttgg tcgtaaccta gagaagacga tcatcgttga cccttcggtg 1380
cgcggaaaaa tcgatgtacg cagctacgac gtactcaatg aagagcaata ctacagcttc 1440
ttcctaaacg tattggaagt gtatggctac gcggttgtcg aaatggactc gggtgttctt 1500
aagatcatca aggccaaaga ttcgaaaaca tcggcaattc cagtcgttgg agacagtgac 1560
acgatcaaag gcgacaatgt ggtgacacgt gttgtgacgg ttcgtaatgt ctcggtgcgt 1620
gaactttctc ctctgcttcg tcaactaaac gacaatgcag gcgcgggtaa cgttgtgcac 1680
tacgacccag ccaacatcat ccttattaca ggccgagcgg cggtagtaaa ccgtttagct 1740
gaaatcatca agcgtgttga ccaagcgggt gataaagaga ttgaagtcgt tgagctaaag 1800
aatgcttctg cggcagaaat ggtacgtatc gttgatgcgt taagcaaaac cactgatgcg 1860
aaaaacacac ctgcatttct acaacctaaa ttagttgccg atgaacgtac caatgcgatt 1920
cttatctcag gcgaccctaa agtacgtagc cgtttaagaa ggctgattga acagcttgat 1980
gttgaaatgg caaccaaggg caataaccaa gttatttacc ttaaatatgc aaaagccgaa 2040
gatctagttg atgtgctgaa aggcgtgtcg gacaacctac aatcagagaa gcagacatca 2100
accaaaggaa gttcatcgca gcgtaaccaa gtgatgatct cagctcacag tgacaccaac 2160
tctttagtga ttaccgcaca gccggacatc atgaatgcgc ttcaagatgt gatcgcacag 2220
ctggatattc gtcgtgctca agtattgatt gaagcactga ttgtcgaaat ggccgaaggt 2280
gacggcgtta accttggtgt gcagtggggt aaccttgaaa cgggtgccat gattcagtac 2340
agcaacactg gcgcttccat tggcggtgtg atggttggtt tagaagaagc gaaagacagc 2400
gaaacgacaa ccgctgttta tgattcagac ggtaaattct tacgtaatga aaccacgacg 2460
gaagaaggtg actattcaac attagcttcc gcactttctg gtgttaatgg tgcggcaatg 2520
agtgtggtaa tgggtgactg gaccgccttg atcagtgcag tagcgaccga ttcaaattca 2580
aatatcctat cttctccaag tatcaccgtg atggataacg gcgaagcgtc attcattgtg 2640
ggtgaagagg tgcctgttct aaccggttct acagcaggct caagtaacga caacccattc 2700
caaacagttg aacgtaaaga agtgggtatc aagcttaaag tggtgccgca aatcaatgaa 2760
ggtgattcgg ttcaactgca aatagaacaa gaagtatcga acgtattagg cgccaatggt 2820
gcggttgatg tgcgttttgc taagcgacag ctaaatacat cagtgattgt tcaagacggt 2880
caaatgctgg tgttgggtgg cttgattgac gagcgagcat tggaaagtga atctaaggtg 2940
ccgttcttgg gagatattcc tgtgcttgga cacttgttca aatcaaccag tactcaggtt 3000
gagaaaaaga acctaatggt cttcatcaaa ccaaccatta ttcgtgatgg tatgacagcc 3060
gatggtatca cgcagcgtaa atacaacttc atccgtgctg agcagttgta caaggctgag 3120
caaggactga agttaatggc agacgataac atcccagtat tgcctaaatt tggtgccgac 3180
atgaatcacc cggctgaaat tcaagccttc atcgatcaaa tggaacaaga ataatggctg 3240
aattggtagg ggcggcacgt acttatcagc gcttgccgtt tagctttgcg aatcgctaca 3300
agatggtgtt ggaataccaa catccagagc gcgcaccgat actttattat gttgagccac 3360
tgaaatcggc ggcgatcatt gaagtgagtc gtgttgtgaa aaatggtttc acgccacaag 3420
cgattactct cgatgagttt gataaaaaac taaccgatgc ttatcagcgt gactcgtcag 3480
aagctcgtca gctcatggaa gacattggtg ctgatagtga tgatttcttc tcactagcgg 3540
aagaactgcc tcaagacgaa gacttacttg aatcagaaga tgatgcacca atcatcaagt 3600
taatcaatgc gatgctgggt gaggcgatca aagagggtgc ttcggatata cacatcgaaa 3660
cctttgaaaa gtcactttgt atccgtttcc gagttgatgg tgtgctgcgt gatgttctag 3720
cgccaagccg taaactggct ccgctattgg tttcacgtgt caaggttatg gctaaactgg 3780
atattgcgga aaaacgcgtg ccacaagatg gtcgtatttc tctgcgtatt ggtggccgag 3840
cggttgatgt tcgtgtttca accatgcctt cttcgcatgg tgagcgtgtg gtaatgcgtc 3900
tgttggacaa aaatgccact cgtctagact tgcacagttt aggtatgaca gccgaaaacc 3960
atgaaaactt ccgtaagctg attcagcgcc cacatggcat tatcttggtg accggcccga 4020
caggttcagg taaatcgacg accttgtacg caggtctgca agaactcaac agcaatgaac 4080
gaaacatttt aaccgttgaa gacccaatcg aattcgatat cgatggcatt ggtcaaacac 4140
aagtgaaccc taaggttgat atgacctttg cgcgtggttt acgtgccatt cttcgtcaag 4200
atcctgatgt tgttatgatt ggtgagatcc gtgacttgga gaccgcagag attgctgtcc 4260
aggcctcttt gacaggtcac ttagttatgt cgactctgca taccaatact gccgtcggtg 4320
cgattacacg tctacgtgat atgggcattg aacctttctt gatctcttct tcgctgctgg 4380
gtgttttggc tcagcgcttg gttcgtactt tatgtaacga atgtaaagaa ccttatgaag 4440
ccgataaaga gcagaagaaa ctgtttgggt tgaagaagaa agaaagcttg acgctttacc 4500
atgccaaagg ttgtgaagag tgtggccata agggttatcg aggtcgtacg ggtattcatg 4560
agctgttgat gattgatgat tcagtacaag agctgattca cagtgaagcg ggtgagcagg 4620
cgattgataa agcaattcgt ggcacaacac caagtattcg agatgatggc ttgagcaaag 4680
ttctgaaagg ggtaacgtcc ctagaagaag tgatgcgcgt gaccaaggaa gtctagtatg 4740
gcggcatttg aatacaaagc actggatgcc aaaggcaaaa gtaaaaaagg ctcaattgaa 4800
gcagataatg ctcgtcaggc tcgccaaaga ataaaagagc ttggcttgat gccggttgag 4860
atgaccgagg ctaaagcaaa aacagcaaaa ggtgctcagc catcgaccag ctttaaacgc 4920
ggcatcagta cgcctgatct tgcgcttatt actcgtcaaa tatccacgct cgttcaatct 4980
ggtatgccgc tagaagagtg tttgaaagcc gttgccgaac agtctgagaa acctcgtatt 5040
cgcaccatgc tactcgcggt gagatctaag gtgactgaag gttattcgtt agcagacagc 5100
ttgtctgatt atccccatat cttcgatgag ctattcagag ccatggttgc tgctggtgag 5160
aagtcagggc atctagatgc ggtattggaa cgattggctg actacgcaga aaaccgtcag 5220
aagatgcgtt ctaagttgct gcaagcgatg atctacccca tcgtgctggt ggtgtttgcg 5280
gtgacgattg tgtcgttcct actggcaacg gtagtgccga agatcgttga gcctattatc 5340
caaatgggac aagagctccc tcagtcgaca caatttttat tagcatcgag tgaatttatc 5400
cagaattggg gcatccaatt actggtgttg accattggtg tgattgtgtt ggttaagact 5460
gcgctgaaaa agccgggcgt tcgcatgagc tgggatcgca aattattgag catcccgctg 5520
ataggcaaga tagcgaaagg gatcaacacc tctcgttttg cacgaacact ttctatctgt 5580
acctctagtg cgattcctat ccttgaaggg atgaaggtcg cggtagatgt gatgtcgaat 5640
catcacgtga aacaacaagt attacaggca tcagatagcg ttagagaagg ggcaagcctg 5700
cgtaaagcgc ttgatcaaac caaactcttt cccccgatga tgctgcatat gatcgccagt 5760
ggtgagcaga gtggccaatt ggaacagatg ctgacaagag cggcagataa tcaggatcaa 5820
agctttgaat cgaccgttaa tatcgcgtta ggcattttta ccccagcgct tattgcgttg 5880
atggctggct tagtgctgtt tatcgtgatg gcgacgctga tgccaatgct tgaaatgaac 5940
aatttaatga gtggttaacc tgccgctcat cagacgttag tttttggatt atcgagaaga 6000
aggacatcat tcccctcaac tcgctatctg taatttggag aaaataatga aaaataaaat 6060
gaaaaaacaa tcaggcttta ccctattaga agtcatggtt gttgtcgtta tccttggtgt 6120
tctagcaagt tttgttgtac ctaacctgtt gggcaacaaa gagaaggcgg atcaacaaaa 6180
agccatcact gatattgtgg cgctagagaa cgcgctcgac atgtacaaac tggataacag 6240
cgtttaccca acaacggatc aaggcctgga cgggttggtg acaaagccaa gcagtccaga 6300
gcctcgtaac taccgagacg gcggttacat caagcgtcta cctaacgacc catggggcaa 6360
tgagtaccaa tacctaagtc ctggtgataa cggcacaatt gatatcttca ctcttggcgc 6420
agatggtcaa gaaggtggtg aaggtattgc tgcagatatc ggcaactgga acatgcagga 6480
cttccaataa gcttcggctt gttgtcggtt gatacgttcc tgttgtttga ttcgttatcg 6540
ttgcttgata cgttattgat ggtagtacgc aaaaaatgga gtctacaagg tgaaaactaa 6600
gcaaacacag ccaggtttca ccttgattga gattcttttg gtgttggtat tactgtcagt 6660
atcggcggtc gcggtgatct cgaccatccc taccaatagc aaagatgttg ctaaaaaata 6720
cgctcaaagc ttttatcagc gaattcagct actcaatgaa gaggctattt tgagtggctt 6780
agattttggt gttcgtgttg atgaaaaaaa atcgacttac gttctgatga ctttgaagtc 6840
tgatggctgg caagaaacgg agttcgaaaa gatcccttct tcaactgaat taccggaaga 6900
actggcactg tcgctgacat taggtggtgg cgcgtgggaa gacgatgatc ggttgttcaa 6960
tccaggaagc ttatttgatg aagatatgtt tgctgatctt gaagaggaaa agaagccgaa 7020
accaccacag atctacatct tgtcgagtgc tgaaatgacg ccatttgtac tgtcgtttta 7080
cccaaatacc ggtgacacaa tacaagatgt ttggcgcatt cgagtattgg ataatggtgt 7140
gattcgatta ctcgagccgg gagaagaaga tgaagaagaa taaccgttct ccttatcgtt 7200
ctcgcggtat gcctcttggt tctcgaggaa tgactctgct tgaagtattg gttgcgctgg 7260
ctatcttcgc tacggcggcg atcagtgtga ttcgtgctgt cacccagcac atcaatacgc 7320
tcagttatct cgaagaaaaa accttcgcgg cgatggtcgt tgataatcaa atggccctag 7380
tcatgctaca tcctgagatg cttaaaaaag cgcagggcac gcaagagtta gcgggaagag 7440
aatggttctg gaaggtgact cccatcgata ccagcgataa tttattaaag gcgtttgatg 7500
tgagtgcggc aaccagtaag aaagcgtctc cagtcgttac ggtgcgcagt tatgtggtta 7560
attaagagaa tgtggtcaat taagagcatg ttattaatta agaacagctc gctaactaag 7620
agcgtgtcgc taactaagag catgtcggaa aataagcgta cgccgcgtaa acaaggtcta 7680
ccttcaaaag ggagaggctt taccttaatt gaagtcttgg tctcgattgc tatctttgcc 7740
acgctaagta tggcggctta tcaggtggtt aatcaggtgc agcgaagcaa cgagatctct 7800
attgagcgca gtgctcgttt gaaccaactg caacgcagtt tagtcatttt agataatgat 7860
tttcgccaga tggcggtgcg aaaatttcgt accaacggtg aagaagcatc atctaagctg 7920
atcttaatga aagagtattt attggactcc gacagtgtag gcatcatgtt tactcgtcta 7980
ggttggcaca acccacaaca gcagtttcct cgcggtgaag tcacgaaggt tggctaccgt 8040
attaaagaag aaacacttga gcgtgtatgg tggcgttatc ccgatacacc ttcaggccaa 8100
gaaggtgtga ttacccctct gcttgatgat gttgaaagct tggaattcga gttttatgac 8160
ggaagccgct gggggaaaga gtggcaaacc gataaatcac tgccgaaagc ggtgaggctt 8220
aagctgacac tgaaagacta tggtgagata gagcgtgttt atctcactcc cggtggcacc 8280
ctagatcagg ccgatgattc ttcaaacagt gactcttcag gcagtagtga ggggaataat 8340
gactcatcga actaataagc gtttagcgac aaggtcagcc ttgggacgta aacaacgtgg 8400
tgtcgcgctg atcattattt tgatgctatt ggcgatcatg gcaaccattg ctggcagcat 8460
gtccgagcgt ttgtttacgc aattcaagcg cgttggtaac caactgaatt accaacaggc 8520
ttactggtac agcattggtg tggaagcgct tgtgcaaaac ggtattaggc aaagttacaa 8580
agacagtgat accgtgaacc taagccaacc atgggcgtta gaagagcagg tatacccatt 8640
ggattatggc caagttaagg gccgcattgt tgatgctcag gcatgtttta atcttaatgc 8700
cttagccgga gtggcgacca cttcaagtaa ccagactcct tatttaatca cggtttggca 8760
aaccttattg gaaaaccaag acgttgagcc ttatcaggct gaggttatcg caaattcaac 8820
gtgggaattt gttgatgcgg atacacgaac cacctcttcg tctggtgtag aagacagcac 8880
gtatgaagcg atgaagccct cttatttggc ggcgaatggc ttaatggccg atgaatccga 8940
gctacgagcg gtttatcaag tcactggtga agtgatgaat aaggttcgcc cctttgtttg 9000
cgctctgcca accgatgatt tccgcttgaa tgtgaatact ctcacggaaa aacaagcacc 9060
gttattggaa gcgatgtttg cgccaggctt aagtgaatcg gatgccaaac agctgataga 9120
taaacgccca tttgatggct gggatacggt agatgctttc atggctgaac ctgccattgt 9180
tggtgtaagt gccgaagtca gcaagaaagc gaaagcatat ttaactgtag atagcgccta 9240
ttttgagcta gatgcagagg tattagttga gcagtcacgt gtacgtatac ggacgctttt 9300
ctatagtagt aatcgagaaa cagtgacggt agtacgccgt cgttttggag gaatcagtga 9360
gcgagtttct gaccgttcga ctgagtagcg aaccacaaag ccctgtgcag tggttagttt 9420
ggtcgacaag ccaacaagaa gtgatagcaa gcggtgaact gtctagctgg gaacagcttg 9480
acgagttaac gccttacgct gaaaagcgca gctgtatcgc tttattgccg ggaagtgaat 9540
gcttaattaa gcgtgttgag atcccgaaag gtgctgctcg ccagtttgat tctatgctgc 9600
cgttcttatt agaagacgaa gtcgcacaag atatcgaaga cttacacctg actattttag 9660
ataaagatgc cactcacgct accgtgtgtg gtgtggatcg tgaatggcta aaacaagctt 9720
tagacctgtt tcgcgaagcc aatataatct tccgtaaggt gctaccagat acactagccg 9780
tgccttttga agaacaaggc atcagtgcgt tgcagataga tcagcattgg ttattgcgcc 9840
aaggtcactc tcaacgtcaa ggtcactatc aagccgtatc gatcagtgaa gcatggttac 9900
cgatgttttt gcaaagtgat tgggttgtcg ctggtgagga agagcaagcg acgactatct 9960
tcagctatac cgcgatgccg agcgacgacg ttcaacagca aagcggcctc gagtggcaag 10020
caaagcctgc ggaattggtg atgtctttat tgagtcagca agcgatcaca agcggcgtaa 10080
atttactgac tggcaccttt aaaaccaaat cttcattcag taaatattgg cgtgtttggc 10140
agaaagtggc gattgctgct tgtttgctgg tggccgtgat tgtgactcag caagtgttga 10200
aggttcagca atacgaagcg caagcacaag cctaccgcat ggagagtgag cgtatcttta 10260
gagctgtgct gcctggcaaa caacgcattc cgaccgtgag ttacctcaag cgtcagatga 10320
atgatgaagc taagaaatac ggtggttcag gcgaaggtga ttctttactt ggttggttag 10380
ctttgctgcc tgaaacctta gggcaagtga agacgatcga agttgaaagc attcgctacg 10440
atggcaaccg ttctgaggtt cgactgcagg ctaaaagttc tgacttccaa cactttgaga 10500
ccgcaagggt gaagctcgaa gagaagtttg tcgttgagca agggccattg aaccgtaatg 10560
gcgatgccgt atttggcagt tttactctta aaccccatca ataacctgcg taaggagatc 10620
agtgatgaga aatatgattg aaccactcca agcgtggtgg gcttcaataa gtcagcggga 10680
acaacgatta gtcattggtt gttctatttt attgatactg ggcgttgtct attggggatt 10740
aatacaacca cttagccaac gagccgagct tgcacaaagc cgcattcaaa gtgagaagca 10800
acttctggct tgggtaacgg acaaagcgaa tcaagtggtt gaactacgag gcagtggtgg 10860
catcagtgcc agtcagcctt tgaaccaatc tgtgcctgct tctatgcgcc gttttaacat 10920
cgagctgata cgcgtgcaac cacgcggtga gatgctgcaa gtttggatta agcctgtgcc 10980
atttaataag ttcgttgact ggctgacata cctgaaagaa aagcagggtg ttgaggttga 11040
gtttatggat attgatcgct ctgatagccc tggggttatt gagatcaacc gactacagtt 11100
taaacgaggt taatgtgaaa cgcggtttat ctttcaaata cggcctgtta ttcagcgtca 11160
tttttatcgt ttttttctcg gtaagcttgt tgctgcattt gcctgccgct tttgctctca 11220
agcatgcacc cgtcgtgcgt ggtttaagca ttgaaggcgt tgagggcacc gtttggcaag 11280
gtcgcgctaa caatatcgcg tggcagcgtg tcaattacgg ctcagtgcag tgggacttcc 11340
agttctctaa actattccaa gccaaagcag aacttgcggt tcgctttggc cgcaacagcg 11400
acatgaactt atcaggtaaa ggacgtgtcg gatatagcat gagtggtgct tacgcggaaa 11460
acttagtggc atcaatgcca gccagcaacg tgatgaaata tgcgccagct atcccagtgc 11520
ctgtgtctat tgcagggcaa gttgaactga cgatcaaaca tgcggttcat gctcaacctt 11580
ggtgtcaatc aggtgaaggt acgcttgctt ggtctggtgc agcagtcgac tcgccagtgg 11640
gttcgttaga ccttggccct gtgattgcgg acataacgtg tgaagacagc acaattgcag 11700
ccaaaggcac tcagaagagc gatcaggtag acagcgagtt ctcagcgagc gtaacaccta 11760
accaacgcta cacctcggca gcatggttta agccaggcgc tgaattcccg ccagcaatgc 11820
agagtcagct taagtggttg ggcaatcctg atagccaagg taaataccaa tttacttatc 11880
aaggccgctt ttagcccggt atttacttca gagctagtat ctgaagtaaa tttggcgatc 11940
aaatcgcgaa ctataaaaaa cgggcacctc actgaggtgc ccgttttgtt tgttctgaga 12000
atctagagga tatctgacgg ttaaagagag caaactcacc cagctttctt gtacaaagtg 12060
gtcccc                                                            12066
 
<210>2
<211>54080
<212>DNA
<213>灿烂弧菌
 
<400>2
gtgctttgtg acaacggggg atgtatggat attgaagttt cgcgccaggt tgcggtagtt 60
gaagctacga gtggagatgt cgtcgtagtt aagccagacg gcagcgcaag aaaagtttca 120
gttggcgata ccatccgtga aaatgagatc gtgattacgg ccaacaagtc agagcttgta 180
ttaggcgttc agaatgattc gattccggtt gcagagaatt gcgtcggttg tgttgatgaa 240
aacgctgcat gggtagatgc cccaatagct ggtgaggtta attttgactt acagcaagca 300
gacgcagaaa ccttcactga agacgacctt gctgcaattc aagaagccat tttaggtggt 360
gccgatccga ctcaaatctt agaagcaacg gctgctggtg gcggactagg ttctgcaaat 420
gctggctttg tgacgattga ctataactac actgaaactc atccatcgac tttctttgag 480
accgctggtc tagcagaaca aactgttgat gaagacagag aagaattcag atctatcact 540
cgttcatcag gtggccaatc aatcagtgaa acactgactg aaggctccat atctggcaat 600
acctatcccc aatctgtaac aacgacagaa acgattattg ctggtagttt agctctcgcc 660
cctaactctt tcattccaga aactttatcc ctcgcttcac tacttagtga attaaacagc 720
gacattactt caagtggtca gtccgttatc ttcacctatg acgcgacgac taattctatc 780
gttggtgttc aagataccga cgaagtatta cgtatcgaca ttgatgccgt cagtgttggc 840
aataacattg agctttctct aaccacaacg atttcccagc cgattgatca tgtaccgtcg 900
gttggcggtg gtcaggtttc ttacactggc gatcaaatag atattgcctt tgatattcaa 960
ggtgaagaca ccgctgggaa cccgctagca acacccgtta acgcacaagt ttcagtgttt 1020
gacgggatag atccgtctgt tgaaagtgtc aatatcacta acgttgaaac tagcagcgcg 1080
gcaatcgaag ggacgttctc aaatattggt agtgataacc ttcaatcagc cgtatttgat 1140
gcaagtgcac tggaccagtt tgatgggttg ctcagtgata atcaaaacac gcttgcgaga 1200
ctttctgatg atggaacaac gattactctg tccatccaag gtcgaggtga ggttgttctc 1260
actatctctc tagataccga tggcacctat aaattcgagc agtctaatcc gatagaacaa 1320
gtgggtaccg attcactgac gttcgctttg ccaatcacga ttaccgattt tgaccaagat 1380
gttgtaacca atacgatcaa cattgccatt actgatggcg atagccctgt tattactaat 1440
gttgacagta ttgatgttga tgaagcgggc attgttggcg gctcacaaga gggcacggcg 1500
ccagtgtctg gcactggcgg tatcaccgcg gacatttttg aaagtgacat cattgaccat 1560
tatgagctag aacccactga atttaatact aatggcacct tggtttcaaa tggcgaggct 1620
gtgctacttg agttgattga tgaaaccaac ggtgtaagaa cttacgaagg ttatgttgag 1680
gtcaatggtt cgagaattac ggtctttgac gttaaaattg atagcccttc attgggcaac 1740
tatgagttta atctttatga agaactttct catcaaggcg ctgaagatgc gctgttaact 1800
tttgcattgc caatttatgc tgttgatgca gatggcgacc gttctgcact gtctggaggt 1860
tcgaacacac cagaagctgc tgagatcctc gttaatgtta aagacgatgt cgttgaatta 1920
gttgataagg ttgaatcagt caccgagccg accttagcgg gcgatactat tgtttcgtat 1980
aacctgttca attttgaagg cgcagatggt tctacaattc aatcgtttaa ctacgacggt 2040
gttgattact cactcgatca aagcctgctc cccgatgcta cccagatttt cagttttact 2100
gaaggtgtcg tcactatctc attaaacggt gacttcagtt ttgaagtcgc tcgtgatatc 2160
gaccactcaa gcagtgaaac tatcgtcaaa cagttctcat ttttagccga agatggtgat 2220
ggggatactg atagttcgac gcttgagtta agtattaccg atggccaaga tccgatcatt 2280
gatttgatcc cgcctgtgac tctctctgaa accaacctta atgacggctc tgctcccagc 2340
ggaagtacag ttagcgcaac cgagacgatt acctttaccg caggcagcga cgatgtagca 2400
agtttccgta ttgaaccaac agagtttaat gtgggcggtg cacttaaatc gaatggattt 2460
tcggttgaga taaaagaaga ttcggctaat ccgggtactt acattggctt tattaccaac 2520
ggttcgggcg ctgaaatccc agtgtttacg attgctttct ctacgagcac attgggtgaa 2580
tacaccttta ctctgcttga agcgttagac catgtagatg gtttagataa gaacgatctg 2640
agctttgatc tgcctattta tgcggttgat acggacggcg acgattcatt ggtgtctcag 2700
cttaatgtga ctatcggtga tgatgttcaa atcatgcaag acggtacgtt agatatcacc 2760
gagccaaatc ttgctgacgg tacaatcaca accaacacca ttgatgtaat gccaaatcaa 2820
agtgctgatg gcgcgacgat cactcggttc acttatgacg gtgtcgtaaa cacactggat 2880
caaagtattt caggagaaca gcagttcagc ttcacagaag gcgaactgtt tatcaccctt 2940
gaaggtgaag tgcgctttga gcctaatcgc gatctagacc actcagtgag tgaagatatc 3000
gtgaagtcga ttgtggtgac ttcaagcgac ttcgataacg atccggtgac ttcaaccatt 3060
acgctgacga tcactgatgg tgataacccg acgattgatg ttattccaag tgttacgctt 3120
tctgaaatta acctgagcga tggctctgct ccaagtggca gcgcggtaag ctcgactcaa 3180
actattactt ttaccaatca aagtgatgat gtggttcgtt tccgtattga gtcaacggag 3240
ttcaatacta acgatgatct taaatcgaac ggtttagctg ttgagttacg tgaagacccg 3300
gcagggtcgg gtgactacat tggttttacg accagtgcga cgaacgtaga aactccagta 3360
ttcacattaa gctttaattc tggatcatta ggtgaataca cgttcacact catcgaagcg 3420
ttggaccacc aagatgcccg tggcaacaac gacctcagtt ttgatttacc tgtttacgcg 3480
gtagatagtg atggcgatga ttcattggtg tctccgttaa acgtcactat cggtgatgat 3540
gttcaaatca tgcaagatag tacgttagat atcgtcgagc caaccgtcgc agatttggcc 3600
gctggcacag tgacaactaa caccattgat gtgatgccaa atcaaagtgc cgatggcgca 3660
acggtgacgc aattcactta tgatggccag cttcgaacac ttgaccaaaa tgacaatggt 3720
gagcagcaat ttagcttcac agaaggtgaa ctgttcatca cgcttcaagg tgatgtgcgc 3780
tttgagccta atcgtaatct agaccacaca ctcagcgaag acatcgtgaa atcaatcgtg 3840
gtgacatcta gcgattccga taacgatgtg ttgacctcaa ccgtcactct gaccattacc 3900
gatggtgata tcccaaccat tgataatgtt ccaactgtga acttgtctga aactaatctg 3960
agtgatggct ctgcacctag cggaagcgcg gtgagttcaa ctcaaactat tacttacacc 4020
actcaaagtg atgatgtgac aagcttccgt attgaaccga ctgaatttaa tgttggtggc 4080
gctctcacat caaacggatt ggcagtcgag ttaaaagctg atccaaccac accgggtggc 4140
tacatcggtt ttgtgactga tggttcgaac gttgaaacta acgtgttcac gattagcttc 4200
tcagatacca atttaggcca gtacaccttc accttacttg aagcgttaga ccatgtggat 4260
ggtttagcga acaatgatct gacctttgat ctgcctgttt atgcagttga tagcgatggc 4320
gacgattcac tggtgtctca gttaaatgta accatcggtg atgatgttca aatcatgcaa 4380
ggtggtacgt tagatatcac tgagccaaat cttgcagacg gcacaattac aaccaatacc 4440
atcgatgtga tgccagagca aagcgccgat ggtgcgacga tcactcagtt cacttatgac 4500
ggtcaagttc gaacactgga tcaaacggac aatggtgagc agcaatttag cttcactgaa 4560
ggcgagttgt tcatcactct tcaaggtgac gtgcgtttcg aacccaatcg caacctagat 4620
cacacagcta gcgaagatat cgtgaagtcg atagtggtga cttcaagcga tttagataac 4680
gatgtggtga cgtcaacggt cactctgacg attactgatg gtgatatccc aaccattgat 4740
gcagtgccaa gcgttactct gtctgaaatc aatcttagtg acggctctgc gccaagtggc 4800
actgcagtta gtcaaactga gacgattacc ttcaccaatc aaagtgatga tgtgaccagt 4860
ttccgtattg agccaataga gttcaatgtg ggcggtgcac tgaaatcgaa tggatttgcg 4920
gttgagataa aagaagattc ggctaatccg ggtacttaca ttggctttat taccaacggt 4980
tcgggcgctg aaatcccagt gtttacgatt gctttctcta cgagctcatt gggtgaatac 5040
acctttactc tgcttgaagc gttagaccat gtagatggtt tagataagaa cgatctgagc 5100
ttcgatctgc ctgtttatgc ggtcgatacg gacggcgatg attcattggt gtctcagcta 5160
aacgtgacca tcggtgatga tgtccaaatc atgcaagacg gtacgttaga tatcatcgag 5220
ccaaatctgg ctgatggaac aatcacaacc agcactattg atgtgatgcc aaaccaaagt 5280
gctgatggtg cgacgatcac tcagtttact tatgacggtc agctaagaac gcttgatcaa 5340
aatgacactg gcgaacagca gttcagcttc acagaaggcg agttgtttat cacccttgaa 5400
ggtgaagtgc gctttgagcc aaaccgagac ctagaccaca ccgcgagtga agatattgtt 5460
aagtcgattg tggtcacttc aagtgatttc gataacgact ctctgacttc taccgtaacg 5520
ctgaccatta ctgatggtga taaccctacg atcgacgtca ttccaagcgt taccctttct 5580
gaaactaatc tgagtgatgg ctctgctcca agtggcagcg cggtaagctc gactcaaact 5640
attactttta ccaatcaaag tgatgatgtg gttcgtttcc gtattgagcc aacggagttc 5700
aatactaacg atgatcttaa atcgaacggt ttagccgttg agttacgtga agacccggct 5760
gggtcgggtg actacattgg ttttactact agtgcgacga atgtcgaaac cacggtattt 5820
acgctgagtt tttctagcac cacattaggt gaatatacct tcactttgct tgaagcgttg 5880
gaccaccaag atgcccgtgg caacaacgac ctcagttttg aactgcctgt ttatgcggta 5940
gacagtgatg gcgatgattc actgatgtct ccgttaaacg tcaccatcgg cgatgatgtt 6000
caaatcatgc aagacggtac gttagatatc gtcgagccaa ccgtcgcaga tttggccgct 6060
ggcattgtga caactaacac cattgatgtg atgccaaatc aaagtgccga tggcgcgacg 6120
atcactcaat tcacttatga tggccaactt cgaacacttg accaaaatga caatggcgaa 6180
caacagttta gcttcacgga aggtgaacta ttcatcactc ttgaaggtga agtgcgcttt 6240
gagcctaatc gtaatctaga ccacacgctg aacgaagaca tcgtgaaatc gatcgtggtg 6300
acgtctagtg actccgataa cgatgtgttg acctcaaccg tcactctgac cattaccgat 6360
ggtgatatcc caaccattga taatgtgcca acagtgagct tgtcagaaac aagtctgagt 6420
gacggctctt caccaagtgg cagcgcagtt agctcaactc aaaccatcac ttacaccact 6480
caaagtgatg atgtaaccag cttccgtatt gaaccgactg agttcaatgt tggcggtgct 6540
ctcaaatcaa atggattggc ggttgagctg aaggccgatc caaccactcc gggcggctac 6600
atcggctttg tgactgatgg ttcgaacgtt gaaactaacg tgttcacgat tagcttctcg 6660
gataccaatt taggtcaata caccttcacc ttgcttgaag cgttggatca tgcggatagc 6720
cttgcaaata acgatctgag ctttgatctg ccagtctacg ccgtcgatag tgatggcgat 6780
gattcactgg tgtctcaact caatgtaacc atcggtgatg atgttcaaat catgcaaggt 6840
ggtacgttag atatcactga gccaaacctt gcagacggca caaccacaac taacaccatc 6900
gatgtgatgc cagaacaaag tgccgatggt gcgacgatca ctcagtttac gtatgacggg 6960
caagttcgca ctctggatca aactgacaat ggtgagcagc aatttagctt cactgaaggc 7020
gagttgttca tcactcttca aggtgacgtg cgtttcgaac ccaatcgcaa cctagatcac 7080
acagctagcg aagacatcgt gaagtcgata gtggtgactt caagcgattc agataacgat 7140
gtggtgacgt caacggtcac tctgactatt actgatggtg atctcccaac cattgatgca 7200
gtgccaagcg ttactctgtc tgaaactaat cttagtgacg gctctgcgcc aagtggcagc 7260
gcagtcagtc aaactgagac catcaccttt accaatcaaa gtgatgatgt ggcgagtttc 7320
cgtattgagc caaccgagtt taatgtgggc ggtgcactga aatcgaatgg gtttgcggtt 7380
gagataaaag aagactctgc taatccgggt acttacattg gctttattgc caatggttcg 7440
agcgctgaaa tcccagtgtt cacgattgct ttctctacga gtacgttggg tgaatacacc 7500
tttactctgc ttgaagcgtt agaccatgcg gatggtttag ataagaacga tctgagcttt 7560
gagcttccgg tttacgcggt tgatacagac ggtgatgatt cattggtatc tcagcttaat 7620
gtgaccattg gtgatgatgt tcaaatcatg caagatggta cgttagacgt tatcgagcca 7680
aatcttgcag acggcacaat cacaaccaac accattgatg tgatgcccga gcaaagtgct 7740
gatggtgcga cgatcactca gtttacttat gacggtcagc taagaacgct tgatcaaaat 7800
gacactggtg aacagcagtt cagcttcaca gaaggcgagt tgtttatcac ccttgaaggt 7860
gaagtgcgct ttgaacctaa tcgcgatcta gaccattccg ttagcgaaga catcgtgaag 7920
tcgatagtag tgacttcaag cgacttcgat aacgatccgg tgacttcagc cattacgctg 7980
accattactg atggtgataa tccgactatc gattcggtac cgagcgttgt acttgaagaa 8040
gctgatttaa ctgatggctc atcgccaagt ggcagcgcgg ttagtcaaac ggaaaccatc 8100
actttcacta atcaaagtga cgatgttgag aaattccgtt tagaaccaag tgaatttaat 8160
actaacaacg cgctcaagtc cgatggcttg atcattgaga ttcgagagga accaacagga 8220
tccggcaatt atattggttt cacgaccgat atttcgaatg tcgaaaccac tgtgtttaca 8280
ctcgatttca gcagtaccac tttgggtgag tacaccttca cgcttctgga agcgattgac 8340
cacacgcctg ttcaaggcaa taacgatcta acattcaact tgccagtcta cgcggttgat 8400
agcgacggtg atgattcgct aatgtcatca ctatcggtga cgattactga tgatgttcaa 8460
gtgatggtga gtggttcgct tagtatcgaa gagcctactg ttgccgactt ggctgcaggc 8520
acgccaacaa catcagtatt tgatgtatta acatccgcga gtgctgatgg ggcgaccatt 8580
actcagttca cttatgatgg tggggcggta ttaacgcttg atcaaaacga tacaggtgag 8640
cagaagttcg tggttgctga tggggcatta tatatcactc tgcaaggcga tattcgtttc 8700
gaaccaagtc gtaaccttga ccatactggt ggcgatatcg tcaagtcgat agtcgtaact 8760
tcaagtgatt ccgatagcga tcttgtgtct tcaacggtaa cgctaaccat tactgatggc 8820
gatatcccaa cgattgacac ggtgccaagc gttactctgt cagaaacgaa tctgagcgac 8880
ggatctgctc cgaatgcaag tgcggtaagt tcaactcaaa ccattacctt tactaaccaa 8940
agtgatgacg tgacgagttt ccgtattgaa ccgactgatt ttaatgttgg tggtgctctg 9000
aaatcgaacg gattggcggt cgaactgaaa gcggacccaa ctacaccggg tggctacatc 9060
ggttttgtga ctgatggttc gaacgttgaa actaacgtgt ttacgattag cttctcggat 9120
accaatttag gtcaatacac cttcaccctg cttgaagcgt tggatcatgt agatggctta 9180
gtgaagaatg atctgacttt tgatcttcct gtttatgcgg ttgatagcga tggtgatgat 9240
tcactggtgt ctcaactgaa tgtgaccatt ggtgatgatg tacaggtcat gcaaaaccaa 9300
gcgcttaata ttattgagcc aacggttgct gatttggctg caggtactcc gacgacagcc 9360
actgttgatg tgatgcctag ccaaagtgcc gatggcgcga caatcactca gtttacttac 9420
gatggcgggg cggcaataac actcgaccaa aacgacaccg gtgaacagaa gtttgtattt 9480
actgaaggtt cactgtttat caccttgcaa ggtgaagtgc gtttcgagcc aaatcgcaat 9540
ctaaaccaca cagcgagcga agacatcgtg aagtcgattg tggtgacttc aagcgattta 9600
gataacgatg tactgacgtc aacggtcact ctgactatta ctgatggtga tatcccaacc 9660
attgatgcag tgccaagcgt tactctgtct gaaactaatc ttagtgacgg ctcagcgcca 9720
agcagcagtg ctgtaagtca aacagagacg attaccttca tcaatcaaag tgatgatgtg 9780
gcgagtttcc gtattgagcc aacagagttc aatgtgggcg gtgcactgaa atcgaatgga 9840
tttgcggttg agataaaaga agattcggct aatccgggta cttatatcgg ttttattacc 9900
gatggttcga atactgaagt tcctgtattc acgattgctt tctctacaag tacgttgggc 9960
gaatacacct tcaccttact tgaagcgcta gaccatgcaa atggcctaga taagaacgat 10020
ctgagttttg atcttcctgt ttatgcggta gacagtgatg gcgatgattc actggtgtct 10080
caactgaatg tgaccattgg tgatgatgtc caaataatgc aagacggtac gttagatatc 10140
actgagccaa atcttgcaga cggaacaatc acaaccaaca ccattgatgt gatgccaaat 10200
cagagtgccg atggtgcgac gatcactgaa ttctcatttg gcggtattgt caaaacactc 10260
gatcaaagca tcgtaggtga gcagcagttt agtttcaccg aaggtgagct attcatcact 10320
cttcaaggtc aagtgcgctt tgaaccaaat cgtgaccttg accactctgc cagcgaagac 10380
atcgtgaagt cgatagtggt tacttcaagt gattttgata acgatcctgt gacttcaacc 10440
gttacgctga ccattaccga tggtgatatt ccaactatcg atgcggtacc aagtgttacg 10500
ctttcagaaa caaacctagc tgatggttct gcgccaagtg gtagtgcggt tagtcaaacg 10560
gagacgatta cttttaccaa tcaaagtgat gatgtggttc gcttccgtct ggaaccaacc 10620
gagttcaata ctaacgatgc acttaaatcg aatggcttag cggtcgaact gcgcgaagaa 10680
cctcaaggct ctggtcagta cattggcttt accaccagtt cgtctaatgt tgagacaaca 10740
gtatttacgt tggactttaa ctccggaacc ttaggtgaat acacatttac tttaatcgaa 10800
gctctggatc atcaagatgc gcgtggcaac aacgatttaa gctttaatct acctgtgtat 10860
gcggtggata gtgatggcga tgactcgtta gtctctcagc ttggcgtgac cattggcgac 10920
gatgtgcagt tgatgcaaga cggcacaatc accagtcgtg agcctgcagc aagtgttgaa 10980
acatcaaata cctttgatgt gatgccaaac caaagtgctg atggagccaa agtcacttca 11040
tttgttttcg atggtaagac tgcagaaagt cttgatttga atgtgaatgg tgaacaagag 11100
ttcgtcttca cggaaggttc ggtatttatt acgacggaag gtgagatacg attcgagccg 11160
gtacgtaatc aaaatcatgc tggtggtgat attaccaagt cgattgaggt gacgtctgtt 11220
gacctcgatg gcgatattgt cacatcgaca gtgacactga agattgttga tggtgacctt 11280
cctactatcg accttgttcc cggaattacg ttatctgaag tggatctggc cgatggctct 11340
gtgccaaccg gtaatccagt gacaatgaca caaaccatta cctacacagc gggtagtgac 11400
gacgtaagcc atttcagaat tgaccctacg cagttcaata cttcaggggt tttgaaatcg 11460
aacggcctag atgtcgaaat aaaagagcag ccagctaatt ctggtaatta cattggcttc 11520
gtcaaagacg gttctaacgt agaaaccaac gtcttcacga tcagcttctc gacgagcaat 11580
ttagggcaat acacgttcac actacttgaa gcgttagatc atgtagatgg attgcaaaac 11640
aatatactaa gcttcgatgt ccctgtttta gcggttgatg cggatggtga tgattctgca 11700
atgtcgccta tgacggttgc gatcaccgat gacgtacaag gtgttcaaga tggcaccttg 11760
agtatcactg agccttcatt agctgatttg gcatcgggta cgccaccaac gacggcaatc 11820
attgatgtta tgccaacgca gagtgctgat ggcgcgaaag taacacagtt tacttacgat 11880
ggtggcacag ctgtaacgtt agacccaagc atcgccacag aacaagtctt taccgtaacc 11940
gatggcttac tgtacatcac cattgaaggg gaggttcgtt ttgagccgag ccgagatcta 12000
gaccattcat ctggcgatat cgtaagaacg attgtcgtca ccaccagtga ttttgataac 12060
gatacagata ccgcggatgt cactttgacg atcaaagacg gtatcaatcc cgttatcaat 12120
gtggttccag atgttaactt atcggaagtt aatctagcgg atggctcgac gccaagtggt 12180
tctgcagtca gttcgactca cacaatcact tacaccgaag gaagtgatga ttttagtcac 12240
tttagaattg cgaccaacga attcaatcct ggcgatctgt tgaaatcaag tggtcttgtt 12300
gttcaactaa aagaagatcc tgcttctgct ggtgattaca ttggttatac cgatgatggt 12360
atgggtaacg ttaccgatgt atttaccatt agctttgata gtgcaaacaa agctcagttt 12420
acatttacct tgattgaggc gcttgatcac cttgatggtg tgctttacaa cgatcttacg 12480
ttccgtttgc ctatctatgc tgttgataca gatgattctg aatcaacaaa gcgcgatgtg 12540
gtggttacga tagaagatga catccagcaa atgcaagatg gcttcttaac cattaccgag 12600
ccaaattctg gtactccaac aacaactacc gttgatgtga tgccaatacc aagtgcagac 12660
ggtgcgacta ttacgcagtt cacgtatgac ggtggttctc caattactct gaatcaaagc 12720
atcagcggcg aacaagagtt tgttttcact gaaggttcac tgtttgtgac actagatggt 12780
gatgtaaggt ttgagccaaa tagaaacctt gatcactctg cgggcgacat tgttaaatcg 12840
attgtgttca cgtcttcaga ctttgataac gacatcttct catcaaaagt cactctcacc 12900
attgttgatg gtgatgggcc aacaatcgac gttgtgccgg gtgtggcatt gtcagaaagc 12960
ttacttgcgg atggttcgac gcctagcgta aatcccgtga gtatgactca aaccattact 13020
tcacttgcaa gtagtgatga tattgctgaa atagtggtgg aagtcgggtt gttcaatacc 13080
aacggcgcgt tgaagtcgga tggtttgtca ctgagtttac gtgaagaccc tgtaaattca 13140
ggcgactaca ttgcatttac tactaatggt tcgggtgttg agaaagttat cttcactctg 13200
gattttgatg atacgaatcc gagtcaatat acgtttactc tgcttgaacg tttagaccat 13260
gttgatggct taggaaataa cgatctgagt tttgatcttt ctgtttatgc agaagatacc 13320
gatggtgata tttcagcgtc taaaccgctt acagtcacca tcaccgatga tgttcagctc 13380
atgcaatccg gtgcgctcaa cattactgag ccaaccacag gaacaccgac tacagcagtc 13440
tttgatgtga tgcctgcgca aagtgcagat ggcgcgacaa tcactaagtt tacctatggc 13500
agccaacctg aagagtctct ggtacaaacc gtcacgggtg agcaagaatt tgtgttcact 13560
gaaggttctc tgtttatcaa tcttgaaggt gatgtacgtt tcgaacctaa ccgtaatctc 13620
gatcattcgg gtggtaacat cgttaagacc attacggtga catcggaaga taaagatggc 13680
gatattgtca cttcaacagt gacgctgact attgtagatg gcgcgccacc agtaatagac 13740
acagtaccaa cggttgcatt ggaagaagcg aatctggtcg acggatcttc accgggttta 13800
cctgttagcc aaactgaaat cattactttc acagcaggaa gtgatgatgt gagccacttc 13860
cgtattgatc cggctcaatt caacacatca ggcgatctga aagcggatgg tttggtggtt 13920
cagttaaaag aagatcctct aaacagcgat aattatattg gttacgttga aagcggcggt 13980
gtccaaacgg atatcttcac catcaccttt agcagcgtgg ttctaggaga gtacacattc 14040
accttgttgg aagagttaga tcacctgcct gtacaaggta acaatgatca aatcttcacc 14100
ttgccagtga tcgcagtcga caaagacaac actgactcag cggtgaaacc tcttacggtg 14160
accattaccg atgatgttcc aaccattact gacaccaccg gcgccagtac gtttgtggtt 14220
gatgaagatg atttgggcac tctggcacaa gcgacgggtt cgtttgtaac cacagaaggt 14280
gcagatcaag tcgaggttta cgaactacgt aatatatcaa cgttggaagc aacgctatcg 14340
tcgggcagtg aaggtattaa gatcactgag atcacaggtg ctgctaacac gaccacctac 14400
caaggggcga ccgacccaag tggaacgcca attttcacat tagtgctgac tgatgatggt 14460
gcctacacct ttaccttgct tggccctctc aatcacgcta cgacaccgag taacctcgat 14520
acattaacaa taccatttga tgttgttgcc gttgacggtg atggcgatga ttctaaccaa 14580
tatgtattgc caatcgaggt gctagatgat gtgcctgtaa tgacggcgcc gacgggtgaa 14640
acggttgttg atgaagacga tcttactggc attggttccg atcaatctga agatacaatt 14700
atcaatggac tgttcaccgt tgatgaaggt gcggatggcg ttgtgctgta tgagctggtt 14760
gatgaagatt tggttctgac gggcttaacc tctgatggag aaagcttaga gtggctagct 14820
gtttcacaaa acggcacaac atttacttac gttgctcaaa ctgcaacgag taatgaagcg 14880
gtgttcgaga ttattttcga cacctcggat aacagctacc aatttgaatt atttaagcca 14940
ctgaagcacc ctgacggtgc aaacgagaac gcgatagatc ttgatttctc aatcgttgct 15000
gaagattttg atcaagacca atcggatgcg atcggtctaa aaattacggt aaccgatgat 15060
gttccgttag tgacaactca atcgattact cgtcttgaag gtcaggggta tggcaactct 15120
aaagtcgaca tgtttgccaa tgcaacagat gtgggggctg atggcgcggt actgagtcga 15180
attgagggta tctcaaataa tggtgcagat attgttttcc gtagcgggaa caatgggcca 15240
tatagtagcg gcttcgattt aaacagcggt agccaacaag ttcgagtcta cgagcaaaca 15300
aatggcggtg ctgatactcg tgaacttggc cgtctacgca tcaactcaaa tggtgaggtt 15360
gaattcagag ctaacggcta tctcgatcat gacggtgatg acaccatcga cttctcgatt 15420
aacgtgattg ccacagatgg agatttagac acctctgaaa caccgttaga tattacgatt  15480
actgataggg attctacaag aattgcgctg aaagtgacga ccttcgagga tgcgggtaga  15540
gactcaacca taccttacgc aacaggtgat gagccgactc ttgagaatgt tcaagataac  15600
caaaatggtt tgccgaatgc gccagcgcaa gttgcgctgc aagttagtct gtatgaccaa  15660
gataacgctg aatctattgg gcagttgacg attaaaagcc cgaacggagg tgatagtcat  15720
caaggtactt tttattactt tgatggtgct gactacatag aattagtgcc tgagtcaaat  15780
gggagcatta tatttggctc tcctgaactc gaacaaagct tcgctccaaa cccgagtgaa  15840
ccaagacaaa ctatcgcgac gatagacaac ctgttctttg ttccagacca acacgctagt  15900
tcggatgaaa ctggtgggcg agttcgttat gagcttgaaa ttgagaaaaa tggcagtacg  15960
gatcacaccg ttaattcaaa cttcagaatt gagattgaag ctgtagctga tattgcgact  16020
tgggatgatt ccaacagcac gtatcagtat caagtcaacg aagatgaaga caatgtcacg  16080
ttgcagctga acgcagagtc tcaagataac agtaatactg agacgattac ctatgaactt  16140
gaagccgttc aaggcgacgg gaagtttgag ttacttgatc aaaatggcaa tgtgttaacg  16200
cccgttaatg gtgtttatat catcgcatct gctgatatca atagcaccgt agttaaccct  16260
attgataact tctcagggca gattgagttc aaagcgacgg caattacgga agagacgctt  16320
aacccatacg atgattcaga caacggtgga gcaaacgata agacgacggc tcgttctgtg  16380
gaacaaagta ttgttattga tgtgaccgca gatgcggacc ctggcacatt cagtgttagt  16440
cgaattcaga tcaacgaaga caatatcgat gatccagatt acgtcgggcc tttggacaat  16500
aaagacgcgt tcacgttaga cgaagtcatc accatgacag ggtcggtcga ttctgacagt  16560
tctgaagaac tgtttgtgcg catcagtaat gttacggaag gagctgtgct ttacttctta  16620
ggcaccacga cagtcgttcc gaccatcacg atcaatggtg tggattatca agaaatcgcg  16680
tattccgatt tggctaacgt tgaggttgtt ccaaccaaac acagtaatgt cgatttcacc  16740
ttcgatgtta cgggagtggt caaagatacg gcaaatctat ccacgggcgc ccaaatcgat  16800
gaggagatac taggaactaa aaccgtcaac gttgaagtca aaggcgttgc cgatactcct  16860
tatggtggaa cgaatggcac ggcttggagt gcaattacag atggcactac atctggtgtt  16920
caaaccacga ttcaagagag ccaaaatggt gatacctttg ctgagcttga tttcaccgtg  16980
ttgtcgggag agagaagacc agatactggc actacaccat tagctgacga tgggtcagaa  17040
tcaataaccg ttattctatc gggtataccc gatggggttg ttctagaaga cggtgacggt  17100
acagtgattg accttaactt tgtcggttat gaaaccggac cgggcggtag tcctgactta  17160
tccaaaccta tctacgaagc gaacattact gaggcgggta aaacttcagg cattcgcatc  17220
agacctgtcg actcttcaac cgagaatatt cacattcaag gtaaagtgat tgtgactgag  17280
aacgatggtc acacgcttac gtttgatcaa gaaattcgag tgcttgttat acctcgaatc  17340
gacacatcag caacttatgt caatacgact aacggtgatg aagatacggc tatcaatatt  17400
gattggcacc ctgaaggcac ggattacatt gatgacgatg agcatttcac taagataact  17460
attaatggaa taccactggg tgttactgca gtagtcaacg gtgatgtgac cgttgatgac  17520
tcaaccccag gaacattgat tataacgcct aaagatgctt cccaaactcc tgaacaattt  17580
actcaaattg cattagctaa taacttcatt caaatgacgc ctccggctga ttctagtgca  17640
gattttacgt tgaccaccga acttaaaatg gaagagcgag atcatgagta tacgtctagc  17700
ggcctagagg atgaagatgg tggttatgtc gaagccgatc cagatataac cggaatcatt  17760
aacgttcaag tacgacctgt ggttgaacct ggagatgccg acaacaagat tgtcgtttca  17820
aacgaagatg gctctggaga tctcactacg attacggctg atgctaatgg tgtcattaaa  17880
tttacaacta acagtgataa ccaaacgact gatactaacg gagacgaaat ctgggacggt  17940
gaatacgtcg tccgatacca agaaacggat ttaagcacag tagaagagca agtcgacgaa  18000
gtgattgttc agctgactaa caccgatgga agcgcgttat ctgatgatat tttagggcaa  18060
cttttagtaa ctggtgcctc ttacgaaggc ggtggccgat gggttgtgac caatgaagat  18120
gcctttagcg tcagtgcgcc caatggatta gatttcaccc ctgccaatga tgcggatgat  18180
gtagctactg atttcaatga tatcaagatg acaattttca ctttggtctc agatcctggt  18240
gatgctaaca atgaaacgtc cgcccaagtg caacgcaccg gagaagtaac gctttcttat  18300
cctgaagtgc tgacggcacc tgacaaagtt gccgcagata ttgcgattgt gccagacagt  18360
gttatcgacg ctgttgagga tactcagctt gatctcggcg cggcactcaa cggcattttg  18420
agcttgacgg gtcgcgatga ttctactgac caagtgacgg tgatcatcga tggcactctg  18480
gtcattgatg ctacaacatc attcccaatt agcctgtcgg gaacaagtga tgttgacttt  18540
gtgaatggga aatatgttta cgagacgact gttgagcagg gcgtagccgt cgattcatcg  18600
ggtttgttat tgaatctgcc accaaactac tctggtgact ttaggttgcc aatgaccatc  18660
gtgaccaaag atttacaatc tggtgatgag aagaccttag tgactgaagt tatcatcaaa  18720
gtcgcaccag atgctgagac ggatccaacg attgaggtga atgtcgtggg ttcgcttgat  18780
gatgccttta atcctgttga taccgacggt caagctgggc aagatccggt gggttacgaa  18840
gacacctata ttcaactcga cttcaattcg accatttcgg atcaggtttc cggcgtcgaa  18900
ggcggccaag aagcgtttac gtccattact ttaacgttgg acgacccttc tataggtgca  18960
ttctatgaca acacgggtac ttcattaggt acatctgtta cgtttaatca ggctgaaata  19020
gcagcgggtg cactcgataa cgtgctcttt agggcaatcg aaaattaccc aacgggtaat  19080
gatattaacc aagtgcaggt taatgtcagc ggtacagtca cagataccgc aacctataat  19140
gatcctgctt ctcctgcggg tacggcaaca gactcagata ctttctctac gagtgtcagc 19200
tttgaagtcg ttcctgtggt cgatgacgtg tctgtcactg gaccgggtag cgatcctgat 19260
gttatcgaga ttactggcaa cgaagaccag ctcatttctt tgtcggggac agggcctgta 19320
tcgattgcac tgactgacct tgatggttca gaacagtttg tatcgattaa gttcacagat 19380
gtccctgatg gcttccaaat gcgtgcagat gctggctcga catataccgt gaaaaataat 19440
ggtaatggag agtggagtgt tcaactgcct caagcttcgg ggttgtcatt cgatttaagt 19500
gagatttcga tcttgccgcc taaaaacttc agtggtaccg ctgagtttgg tgtggaagtc 19560
ttcactcaag aatcgttgct gggtgtgcct actgcggcgg caaacttgcc aagcttcaaa 19620
ctgcatgtgg tacctgttgg tgacgatgtt gataccaatc cgactgattc tgtaacaggc 19680
aacgaaggcc aaaacattga tatcgaaatc aatgcgacta ttttggataa agaattgtct 19740
gcaacaggaa gcgggacgta taccgagaat gcgcccgaaa cgcttcgagt tgaagtggcg 19800
ggtgttcctc aagatgcttc tattttctat ccagatggca cgacattggc tagctacgat 19860
ccggcgacgc agctctggac tctcgatgtt ccagctcagt cgttagataa gatcgtattt 19920
aactctggcg aacataatag tgatacaggc aatgtactgg gtatcaatgg tccactgcag 19980
attacggtac gttcagtaga tactgatgct gataatacag agtacctagg tacgccaacc 20040
agcttcgatg tcgatctggt gattgatcct attaacgatc aaccgatctt tgtgaacgta 20100
acgaatattg aaacatcgga agacatcagt gttgccatcg acaactttag tatctacgac 20160
gtcgacgcaa actttgataa tccagatgct ccgtatgaac tgacgcttaa agtcgaccaa 20220
acactgccgg gagcgcaagg tgtgtttgag tttaccagct ctcctgacgt gacgtttgta 20280
ttgcaacctg acggctcatt ggtgattacc ggtaaagaag ccgacattaa taccgcattg 20340
actaatggag ctgtgacttt caaacccgac ccagaccaga actacctcaa ccagactggt 20400
ttagtcacaa tcaatgcaac gctcgatgat ggtggtaata acggtttgat tgacgcggtt 20460
gatccgaata ccgctcaaac caatcaaact accttcacca ttaaggtgac ggaagtgaat 20520
gacgctcctg tggcgactaa cgttgattta ggctcgattg cggaagacgc tcaaatcgtg 20580
attgttgaga gtgacttgat tgcagccagt tctgatctag aaaaccataa tctcacagta 20640
accggtgtga ctcttactca agggcaaggt cagcttacac gctatgaaaa tgctggtggt 20700
gctgatgacg cagcgattac ggggccattc tggatattca ttgcagataa tgatttcaac 20760
ggcgacgtta aattcaatta ctccattatc gatgatggta ccaccaacgg tgtggatgat 20820
tttaaaaccg atagcgctga aatcagcctt gtagttactg aagtcaatga ccagccagtg 20880
gcatcgaaca ttgatttggg caccatgctt gaagaaggac agctggtcat taaagaggaa 20940
gacctgattt ccgcaaccac tgatccggaa aacgacacga ttactgtgaa cagtttggtg 21000
ctcgatcaag gtcagggcca attacaacgc tttgagaacg tgggcggtgc tgatgatgct 21060
acgatcactg gcccgtactg ggtatttact gcagccaacg aatacaacgg tgatgttaag 21120
ttcacttata ccgttgagga cgatggtaca accaacggcg ctgatgattt cttaacagat 21180
accggcgaaa ttagcgttgt ggtaacggaa gtgaatgatc aaccggtggc aacggatatc 21240
gacttaggaa acatccttga agaagggcag ttgatcatca aagaggaaga cttaattgct 21300
gctacgagcg atccggaaaa cgacacgatt accgtgacca atctggtgct cgacgaaggc 21360
caaggccagt tacagcgctt tgagaacgtg ggcggtgctg atgacgctat gattactggc 21420
ccgtactgga tatttacggc tgctgatgaa tacaacggta acgttaagtt cacctatacc 21480
gtcgaggatg atggtacaac caacggcgct aatgatttcc taacggatac tgcagagatc 21540
acagcgattg tcgacggagt gaacgatacg cctgttgtta atggtgacag tgtcactacg 21600
attgttgacg aggatgctgg tcagctattg agtggtatca atgtcagtga cccagattat 21660
gtggatgcat tttctaatga cttgatgaca gtcacgctga cagtggatta cggtacattg 21720
aacgtatcac ttccggcagt gacgacagtg atggtcaacg gcaacaacac tggttcggtt 21780
atcttagttg gtactttgag tgacctgaat gcgctgattg atacgccaac cagtccaaac 21840
ggtgtctacc tcgatgcgag cttgtctcca accaatagca ttggcttaga agtaatcgcc 21900
aaagacagcg gtaacccttc tggtatcgcg attgaaactg caccagtggt ttataatatc 21960
gcagtgacac cagtcgctaa tgcgccaacc ttgtctattg atccggcatt taactatgtg 22020
agaaacatta cgaccagctc atctgtggtc gctaatagtg gagtcgcttt agttggaatt 22080
gtcgctgcat tgacggacat tactgaagag ttaacgttga agatcagcga tgttccggat 22140
ggtgttgatg taaccagtga tgtgggtacg gtttcgttgg tgggtgatac ttggatagcg 22200
accgctgatg cgatcgatag tctcagactc gtagagcagt catcattagg taaaccgttg 22260
accccgggta attacacctt gaaagttgag gcgctatctg aagagactga caacaacgat 22320
attgcgatat ctcaaaacat cgatctgaat ctcaatattg ttgccaatcc aatagatctc 22380
gatctgtctt ctgaaacaga cgatgtgcaa cttttagcga gtaactttga tactaacctc 22440
actggcggaa ctggaaatga ccgacttgta ggtggagcgg gtgacgatac gctggttggc 22500
ggtgacggta acgacacact cattggtggc ggcggttccg atattctaac cggtggcaat 22560
ggtatggatt cgtttgtatg gctcaatatt gaagatggcg ttgaagacac cattaccgat 22620
ttcagcctgt ctgaaggaga ccaaatcgac ctacgagaag tattacctga gttgaagaat 22680
acatctccag acatgtctgc attgctacaa cagatagacg cgaaagtgga aggggatgat 22740
attgagctta cgatcaagtc tgatggttta ggcactacgg aacaggtgat tgtggttgaa 22800
gaccttgctc ctcagctaac cttaagtggc accatgcctt cggatatttt ggatgcgtta 22860
gtgcaacaaa atgtcatcac tcacggttaa cgcctaattg gaggctagct attagaatct 22920
aacgattaaa ctaaaagcgg accatttaac cataacgaaa gaggccagca ttgctggcct 22980
cttttttgtc actgtataaa tcgtaaagag ttacttaaga gagttgtgga tcaggaactc 23040
ttcttcgacg cctttcaatt tcatctcatc cataatgaag ttcactgtgt tcaacaagcg 23100
ttgttcacct tttggtatca ggtaaccgaa ttgactgttg gtaaacggtg tttcacagcg 23160
tgccgcttca agacgttcgt ccgtcacttg atagaacaga ccttcaggag tttctgtcac 23220
cattacatca actttacctt ccgcaacggc ttgcggaacg tctaggttgt tctcgtaacg 23280
cgtaaagctc gcgtcttgca agttagcatc cgcaaacatc tcattagtcc caccgatatt 23340
gacgccaaca cgcacagaag agaggttcac tttctcaatg ctgttgtatt gttctgcttt 23400
gcctttcgca actaagaaac acttgccaaa ggtcatgtaa ccttgagttt gttctgcgtt 23460
taactgacgc tgcattttac gcgtgatacc gcccatcgcg atgtcgtatt tatcgctgtc 23520
tagatcggtc agtagatctt tccatgtggt acgaacaatc tgtaattcaa cgcccaactg 23580
ctctgcaaca tgtttggcta cgtcaatgtc ataaccagag taggttttgc cgtcgaagta 23640
agaaaaaggt ttgtagtcgc ctgtggtgcc gacgcgaagt gtgcctgatt tttgaatgtc 23700
ttctagctgg tcagcttgta ctacaccaga aagtgccaga gtaatggaag caagtaatag 23760
tgatgttttt ttcattgtaa ttatctgttg tgtttgtgtt gttattcaaa gtaacagaaa 23820
caatcagaga aagagatcaa accattggaa aggttgtaaa agaagataaa acgagggcag 23880
gagataggta acgctattga tttgtgaaca ttgataaaca tgtgtttcat attccatttt 23940
gataaaccgt agacaaacaa aaagcccatg ttatcgaata acatgggctt cattttggtt 24000
taacttgtta gctgcttatt tagctgctta tttagctgtt tagctgttta gctgtttagc 24060
tacttagcaa ctgactcgtt gttcatctta gccggagctt tagatgcgtt aaccagcagg 24120
ataccaacgg tgagtaccat cgaaccacat agtaggaaca acaagcgtcc tgttggttcg 24180
tttggaatca gagccattgc taggataccg aaacctgctg tgctgataag cttaccaagc 24240
attgaacgct gtttagtatc taggttctgc tgctcttcac cttccgctac tagcggcgta 24300
ttccagttag tgaatagttg gtcaacttct ttctcacgtt caggcgatag gcctttgtag 24360
aagcgagaag ttaggatgaa gtaaccacca gtaaacacta cgtgagcagc taagctaaga 24420
ccaactttca agtcgctcca ttcacggcca gtaagcgctg tttccatacc aaataggtgc 24480
tcgatgtctt ctgcttgaag cgagataccg aagatgtaag aaacgaagcc accaacgatt 24540
aacgtagacc aaccagccca gtcaggcgtc ttacgaatcc acataccaag tagtacaggg 24600
ataagcattg ggaagccaat taacgcacct acgttcatta cgatatcgaa caagctcaaa 24660
tgacgtagag agttaatgaa caagccaatc gcgatgatga taatacccat catgatagtg 24720
gttagcttac ttacaataac cagctctttc tgagttgcgt tttgacgtag aatagggctg 24780
tagaagttca ttacaaagat gccagcgtta cggttcaaac ctgaatccat agaagacatt 24840
gttgcagcga acattgctga cataagaaga ccaaccatac ctgctggcat tacgttctgt 24900
acgaatgcta ggtaagcagc atcaccagct ttatcaccca ttgaagcgta ctccaatgcg 24960
aaatcaggca tgaatgcact tacgtaccaa ggtggtagga accagattag tgggccaaca 25020
accataagga tacatgctag gcctgccgct ttacgtgcgt tttcactgtc tttcgcacat 25080
aggtaacggt aagcgttgat gctgttgttc attacaccga actgcttcac gaagatgaat 25140
acaacccaaa gaacgaagat gctcatgtag tttaggttat tacctaacat gaagtcgccg 25200
tcgaaatttg caacgatgtt agttaggcca ccaccgtgga agtaagctgc aaccgcacaa 25260
gtaatcgtaa ccgccatgat aacaagcatt tgcatgaagt cagaagcaac aaccgcccaa 25320
gagccgcctg ttactgccat caatactaga accatacccg ttaccacaat ggttgcttcc 25380
attgggatgt tgaataccgc tgctacgaag atagctagac catttagcca gatacccgca 25440
gagataaggc tgtcaggcat acctgcccat gtgaagaact gttcagacgt tttaccaaag 25500
cgctgacgaa tagcttcgat cgccgttacc acacgaagtt ggcggaactt tggagcgaag 25560
tacatatagt tcatgaagta gccaaaagca ttggctaaga ataggattac aataacgaaa 25620
ccgtcattga acgcgcgtcc tgcggcacct gtaaacgtcc atgctgaaaa ctgtgtcatg 25680
aaggcggttg caccaaccat ccaccacaac attttgccgc cccctctgaa gtaatcacta 25740
gtcgacgtgg tgaacttacg gaacatccaa ccaatagcga ttaaaaagaa gaagtaggcg 25800
agaacaacaa aagtatcgat agtcatcttt tcagcctttt aaatatcata attaactggg 25860
cttagattaa cgcgttcaaa ggtttatttg tactacaata tgtctttagt atgatctagg 25920
tcgcattgat ttttgggtgc acacgataag ttaatttaac ctactgtttt tattgatttt 25980
aattgttttt atgaattgct ctagatccaa gataaattga agttcaaatg tttatatgta 26040
ttacaatata agtaatgagg ctttagttta ccttatttat aagattttaa ttataaccgt 26100
aacaaatatg ctacaactga gcgtggttgt gcgacgacat tcacgttaat ttggaactct 26160
attctggaaa ttcttgtatt aggatttcaa gtgtagctca ttgttttcac ttcgctattt 26220
tgtgtttgtc tgcggttctg tcgcctttcc atgctattga ttaatttttt cgtgctagag 26280
agacgcgtat ttggaatgtt tgtcactgag tgggcgttaa actggacgac gggacactct 26340
ttcggctcac tttgtctatt gtggtcttca gtgcatgcta tgagaaatgt ttgacgacgt 26400
attgaaaagg aatattgtcg gataaaggga tgggtaagga gctggataag cggtagggag 26460
ccccagtaac gcttcgctag atgcatactg aggttgcttg aaagccttac atcactcgtt 26520
cttgcctgtc ttagtcacgg agctgtacga ggccataggg agaacggtga tagggtatgg 26580
ggaaacagaa cgttgattga gcgtgtttta cggttagtca gcgcaataaa cgccagataa 26640
taaaaagccc caccgaggtg aggctttatc acgaaatcta aaacagatta agcgttaacg 26700
tgatcaactg cgtcacgaac aagcttgcct agttcgtccc acttaccttc atcgataagg 26760
ttagttggaa ccatccaagt accgccacac gcaagaacag aagggatcga taggtattca 26820
tcaacattct tcaagcttac gccaccagta ggcatgaatt taacagggta aactgctgtt 26880
agtgctttaa gcatgccagt accgcctgaa ggctcagcag ggaagaactt caacgtgcga 26940
agacccattt ccattgcttg ctcaactagg cttgggttgt taacacccgg tacgattgca 27000
atacctttat cgatacagta ttgaacagta cgtgggttaa aacctgggct tacgatgaaa 27060
tcaacaccag cttcgataga tgcgtcaact tgctcgttag tcagtacagt acctgaaccg 27120
attagcatgt ctgggaattc tttacgcatg atgcgaatcg cttcgattgc acattctgta 27180
cgtagtgtaa tttctgcaca tggcatgcca ttttcaacca acgctttacc tagagggata 27240
gcgtcttcag cacggttgat cgcgattaca ggaattactt ttaggtttgc tagttgttca 27300
tttaatgtcg tcatgaattc tttctcacgt taaatgtggg cctgctttca actaagcaaa 27360
cccttgatta atagttaaag tgcgtaatta tagagacaga tcaggcgtcg cttctagagg 27420
aatgatagca cctggatgct gaatcacggt tcctgccaca atatgacctg caaatgcagc 27480
atcacgagca ctaccgccgc tcaagcgctt ggccaagaag cctgcactga acgagtcgcc 27540
agcggcagtc gtatcaacga tgttgtctac agggttgggt gcaacgtatt gagcgctttg 27600
gctttcaacc actaagcagt ctttcgcgcc acgtttaatg acgatctctt tcacaccaga 27660
ctctgacgta cgtgtaatac attgttcaat gctttcgtcg ccgtatagct cttgctcatc 27720
atcaaacgtc agcagagccg tatctgtgta cttaagcatt ttcaagtacc aagaaatcgc 27780
ttcttgttgg ctttcccaaa gtttaggtcg gtagttattg tcgaagaata cttggccgcc 27840
ttgagctttg aatttgtcta agaagttgaa tagctgcgtg cgaccatttt ctgtcaagat 27900
tgccagcgta ataccactta agtaaatcgc gtcaaaagag aacagcttat caagaagagc 27960
aggcgtgtct tcctgatcaa acatgaactt cgctgcagca tcactacgcc agtagtggaa 28020
actgcgttca ccagtttcat cggtctcgat gtagtaaagc cctggttgtt tgtggtccag 28080
ctgagcaatt aagctcgtgt cgataccttc cgcttgccaa ttttttaaca tgtcggtact 28140
gaatgggtca gtgcctagtg cagttacgta gctcgtgttg atatcttgct cttttgttaa 28200
gcgtgacaag taaagtgcag tattcagcgt atcgccacca aaactttgct taagcccgtc 28260
ttgtttcttt tgtagctcaa ccatgcactc gccaatgacc gcgatgttta atgatttcat 28320
atgcttacct tagcaactga ggttgcgcta gttattattt taggaaatct tcacgcgcag 28380
gattgaagat atcaagaagg atgctgtctt gttctagagc aactgcaccg tgcatcatgt 28440
gtttacgagc gaagtaagca tcgccttctt taagcacttt cttctcgccg tcgatttcag 28500
cttcgaagct accacgaaca acataaccga tttggtcgtg aatttcgtga gtatgagggt 28560
ggccaatcgc gcccttatca aagcataggt gtactgccat tagatcgtca gtgtaagcaa 28620
cgattttacg cttaatgccg ccaccaagtt cttcccatgg attttcatct aggataaaga 28680
aagagttcat tgtgtatctc ctaatctgtt taaatctttt aagtgttact taacttgcat 28740
ccatcataag ggaatgagtt caattgtaat acaatatatc taaatttgtg tgatattgat 28800
caagcgatag tttatatagc gtaaatgaat caacaactta agaattgctt ggtatctggc 28860
attagttagc tgcatcaatg gcttacggtg aattatgtga ctctactcat catttggcga 28920
cgaataggta taattaaagc tcatattgta ttactttata tggagtttga aaatttaatc 28980
aaagtttaag cagataaact ctttattgag ggtgacaaag aatatgacga ctaaaccagt 29040
attgttgact gaagctgaaa tcgaacagct tcatcttgaa gtgggccgtt ctagcttaat 29100
gggcaaaacc attgcagcga acgcgaaaga cctagaagca ttcatgcgtt tacctattga 29160
tgttccaggt cacggtgaag ctgggggtta cgaacataac cgccacaagc aaaattacac 29220
gtacatgaac ctagctggtc gcatgttctt gatcactaaa gagcaaaaat acgctgactt 29280
tgttacagaa ttactagaag agtacgcaga caaatatcta acgtttgatt accacgtaca 29340
gaaaaacacc aacccaacag gtcgtttgtt ccaccaaatc ctaaacgaac actgctggtt 29400
aatgttctca agcttagctt attcttgtgt tgcttcaaca ctgacacaag atcagcgtga 29460
caatattgag tctcgcattt ttgaacccat gctagaaatg ttcacggtta aatacgcaca 29520
cgacttcgac cgtattcaca atcacggtat ttgggcagta gccgctgtgg gtatctgtgg 29580
tcttgcttta ggcaaacgtg aatacctaga aatgtcagtg tacggcatcg accgtaatga 29640
tactggcggt ttcctagcgc aagtttctca gctatttgca ccttctggct actacatgga 29700
aggtccttac taccatcgtt atgcgattcg cccaacgtgt gtgttcgctg aagtgattca 29760
ccgtcatatg cctgaagttg atatctacaa ctacaaaggc ggcgtgattg gtaacacagt 29820
acaagctatg cttgcgacag cgtacccgaa cggcgagttc ccggctctga atgatgcttc 29880
tcgtactatg ggtatcacag acatgggtgt tcaggttgcg gtcagtgttt acagtaagca 29940
ttactcttct gaaaacggtg tagaccaaaa cattctgggt atggcgaaga ttcaagacgc 30000
agtatggatg catccatgtg gtcttgagct atctaaagca tacgaagccg catctgcaga 30060
gaaagaaatc ggcatgcctt tctggccaag tgttgaattg aatgaaggcc ctcaaggtca 30120
caacggcgcg caaggcttta tccgtatgca ggataagaaa ggcgacgttt ctcaacttgt 30180
gatgaactac ggccaacacg gcatgggtca cggcaacttt gatacgctgg gtatttcttt 30240
ctttaaccgc ggtcaagaag tgctacgtga atacggcttc tgtcgttggg ttaacgttga 30300
gccaaaattc ggcggccgtt acctagacga aaacaaatct tacgctcgtc aaacgattgc 30360
tcacaatgca gttacgattg atgaaaaatg tcagaacaac tttgacgttg aacgtgcaga 30420
ctcagtacat ggtttacctc acttctttaa agtagaagac gatcaaatca acggtatgag 30480
tgcatttgct aacgatcatt accaaggctt tgacatgcaa cgcagcgtgt tcatgctaaa 30540
tcttgaagaa ttagaatctc cgttattgtt agacctatac cgcttagatt ctacaaaagg 30600
cggcgaaggc gagcaccaat acgactattc acaccaatat gcgggtcaga ttgttcgcac 30660
taacttcgaa taccaagcga acaaagagct aaacactcta ggtgacgatt tcggttacca 30720
acatctatgg aacgtcgcaa gcggtgaagt gaagggcaca gcaattgtaa gttggctaca 30780
aaacaacacc tactacacat ggctaggtgc aacgtctaac gataatgctg aagtaatatt 30840
tactcgcact ggcgctaacg acccaagttt caatctacgt tcagagcctg cgttcattct 30900
acgcagcaaa ggcgaaacaa cactgtttgc ttctgttgtt gaaacgcacg gttatttcaa 30960
cgaagaattc gagcaatctg tcaatgcacg tggtgttgtg aaagacatca aagtcgtggc 31020
tcacaccaat gtcggttcgg tagttgagat caccacagag aaatcaaacg tgacagtgat 31080
gatcagcaac caacttggcg cgactgacag cactgaacac aaagtagaac tgaacggcaa 31140
agtatacagc tggaaaggct tctactcagt agagacaact ttacaagaaa cgaattcaga 31200
agaacttagc actgcagggc aggggaaata ataatgagct atcaaccact tttacttaac 31260
tttgatgaag cagctgaact tcgtaaagaa cttggcaagg atagcctatt aggtaacgca 31320
ctgactcgcg acattaaaca aactgacgct tacatggctg aagttggcat tgaagtacca 31380
ggtcacggtg aaggcggcgg ttacgagcac aaccgtcata agcaaaacta catccatatg 31440
gatctagcag gccgtttgtt ccttatcact gaggaaacaa aataccgaga ttacatcgtt 31500
gatatgctaa cagcgtacgc gacggtatac ccaacacttg aaagcaacgt aagccgtgac 31560
tctaaccctc cgggtaagct gttccaccaa acgttgaacg agaacatgtg gatgctttac 31620
gcttcttgtg cgtacagctg catctaccac acgatctctg aagagcaaaa gcgtctgatc 31680
gaagacgatc ttcttaagca aatgatcgaa atgttcgttg tgacttacgc acacgacttc 31740
gatatcgtac acaaccacgg cttatgggca gtggcagcag taggtatctg tggttacgca 31800
atcaacgatc aagagtctgt agacaaagca ctatacggcc tgaaactaga caaagtcagc 31860
ggcggtttct tagcgcaact agaccaactg ttttcgccag acggctacta catggaaggt 31920
ccttactacc accgtttctc tctgcgtcca atctacctgt tcgcagaagc gattgaacgt 31980
cgtcagcctg aagttggtat ctatgaattc aacgattcag tgatcaagac aacgtcttac 32040
tctgtattca aaacggcatt cccagacggt acattgcctg ctctgaacga ttcatcgaag 32100
acaatctcta tcaacgatga aggcgttatc atggcaacgt ctgtgtgtta ccaccgttac 32160
gagcaaactg aaactctact tggtatggct aaccaccagc aaaacgtttg ggttcatgct 32220
tcaggtaaaa cactgtctga cgcggttgat gcagcagacg acatcaaagc attcaactgg 32280
ggtagcctgt ttgtaaccga cggccctgaa ggcgaaaaag gcggcgtaag catccttcgt 32340
caccgtgacg aacaagatga cgacacgatg gcgttgatct ggtttggtca acacggttct 32400
gatcaccagt accactctgc tctagaccac ggtcactacg atggcctgca cctaagcgta 32460
tttaaccgtg gccacgaagt gctgcacgat ttcggcttcg gtcgctgggt aaacgttgag 32520
cctaagtttg gcggtcgtta catcccagag aacaagtctt actgtaagca gacggttgct 32580
cacaacacag taacggttga tcagaaaacg cagaacaact tcaacacagc attggctgag 32640
tctaagtttg gtcagaagca cttcttcgta gcagacgacc agtctctaca aggcatgagc 32700
ggcacaattt ctgagtacta cactggcgta gacatgcaac gcagcgtgat tcttgctgaa 32760
cttcctgagt tcgagaagcc acttgtaatc gacgtatacc gcatcgaagc tgacgctgaa 32820
caccagtacg acctacccgt tcaccactct ggtcagatca tccgtactga cttcgattac 32880
aacatggaaa aaacgcttaa gccgctaggt gaagacaacg gttaccagca cttatggaac 32940
gtggcttcag gcaaagtgaa cgaagaaggt tctctagtaa gctggctaca tgacagcagc 33000
tactacagcc tagtaaccag cgcgaatgcg ggcagcgaag tgatttttgc tcgcactggt 33060
gctaacgatc cagacttcaa ccttaagagt gagcctgcgt tcatcttacg tcagtctggt 33120
caaaaccacg tgtttgcttc tgtactagaa acgcatggtt actttaacga gtctatcgaa 33180
gcctctgtag gcgctcgtgg tctagttaaa tcagtatctg ttgtgggcca taacagtgtc 33240
gggactgttg ttcgcattca gactacttct ggcaacactt accactacgg tatctcaaac 33300
caagctgaag acacgcagca agcaactcac actgttgagt tcgcgggtga gacatactcg 33360
tgggaaggat catttgctca actgtaaatg attaacatac atgccgttta acgatggcat 33420
gtattgatgt ggtgctttgc gggaacgaag catcacattg aattcagtcg tgattgcaaa 33480
tcgttcgttg ataccaacaa cgactgaata catcgggaat aagtcaaacc gagtaactca 33540
ctgcgagttg ctcggttttt ttatgcgtgc tgcttttata agaaggggga aagaggatgg 33600
ggcaacggag cttccctttt ccttcgaatc ttacagagtg ggctaaagta taatttagga 33660
tttaaaaata aagggattca aggatgaagt ggttattggc aatagttgcg atgtctggtg 33720
tcgcattggc ggcagaaaat aagaatgttg aggtgagcag tgagcatttc gtccgttatc 33780
aataccaaga caaaatcagc tatggaaagc tagacaatga cgcagtgtta ccggtcagcg 33840
gcgatctctt tggcgaatat tcggtagcaa aaaattcgat cccgttagag tcggttgagg 33900
tgttactacc gacaaaacca gagaaagtct tcgccgtcgg gatgaacttc gctagccact 33960
tagcctcacc tgccgatgca ccaccgccga tgtttcttaa acttccttct tctttgattc 34020
tcacgggcga agtgattcaa gtgccaccaa aagcaagaaa tgttcatttt gaaggcgagc 34080
tggtggttgt gattggtaga gagctcagtc aagccagtga agaagaagcc gaacaagcga 34140
tctttggcgt cacggtgggc aacgatatta ctgaaagaag ttggcaaggc gccgatttac 34200
aatggctccg agcgaaagct tccgatggtt ttggcccggt tggcaacaca attgtgcgcg 34260
gcattgatta caacaatatt gagttaacca ctcgtgttaa cggtaaagtg gttcaacaag 34320
aaaatacttc gttcatgatc cacaagccaa gaaaagtcgt gagctatttg agctattatt 34380
ttaccctcaa accgggcgat ctaattttca tgggcacgcc aggtagaact tatgctctgt 34440
ccgacaaaga tcaagtgagt gtcacgattg aaggggtagg gactgtggta aatgaagtgc 34500
ggttctgatg gaattgaatt agcgttggga gctacagagc ttatgtctga atttgcagta 34560
cgtagacgac ttgaacctat taatttgaac taggttaact tgtgtagtga ataaactaac 34620
cgtttttcgg ttccattatt ttagcccaat tgagtgatgt ttttggaagc gagcagagaa 34680
aacgagaatg acgaacctac atgctcggcg agggttttgt tagtggtgta acacagtgtt 34740
tctagctaag agaaattaga tgctttctaa gtgtttgatt aattgaataa attaacaggt 34800
actatccgct ttgattttac tcaattggct gtaggtttaa atactgttat agtgttcctt 34860
aaataataca taaacataac atataaataa gcgaacttat ggctagcact tttaattcaa 34920
tttcgggctc gaagcgtagc ctgcacgtgc aagtagcacg cgaaatcgct cgaggaattt 34980
tgtctggtga tctgccgcaa ggttctatta ttcctggtga aatggcgttg tgtgaacagt 35040
ttggtatcag ccgaacggca cttcgtgaag cagttaaact actgacctct aaaggtctgt 35100
tagagtctcg ccctaaaatt ggtactcgcg tagtcgaccg cgcatactgg aacttccttg 35160
atcctcaact gattgaatgg atggacggac taaccgacgt agaccaattc tgttctcagt 35220
ttttaggcct tcgccgtgcg atcgagcctg aagcgtgtgc actggcggca aaatttgcga 35280
cagctgaaca acgtatcgag ctttcagaga tcttccaaaa gatggtcgaa gtggatgaag 35340
ctgaagtgtt tgaccaagaa cgttggacag acattgatac tcgtttccat agcttgatct 35400
tcaatgcgac cggtaacgac ttctatctac cgttcggtaa tattctgact actatgttcg 35460
ttaacttcat agtgcattct tctgaagagg gaagcacatg catcaatgaa caccgcagaa 35520
tctatgaagc tatcatggcc ggtgattgtg acaaggctag aattgcttct gctgttcact 35580
tgcaagatgc caaccaccgt ttggcaacag cataatagaa atgatttaaa gcgcacctga 35640
gccatctcac atcgagatga acaccctcac gttcggataa acgactttaa aaggtatgcc 35700
tagtgcatgc cttttttggt ttttagaccg cgtgttgcac tatctgtagc actattttgg 35760
gtcagtcttt tcgctacgtc tgttaagcta ttcttccacg ttacaacccg ccttgttttt 35820
aacgtctacg taacaatccc caagcatcgt tctaaacaca tttttagact gtctgtacct 35880
gacaagtagt tatgcgacag ccgggatttt tcacctctca gtattctaaa tctgggatta 35940
aacaaacagg gttctcggat ttaatattta gatatttaaa tcgaattcta atgatattac 36000
ccactcgatt tcgtaaaaaa cactggttta ttgtgtgatg aatgatgtgg gtttggtcaa 36060
ggattctctt ttattatttt tgagaacttt atgtttatat gtgtttgatt gtatttgtta 36120
ataagtgtgc aaagtctcac ttttatttta agttgttgtt tttaatgttt aatttatttt 36180
gagtgtttga tcttttgggt ttttacctaa aaccctaaca atttccttaa tggattagcc 36240
atattccatc ctatgtcata tatataatta acttaatcaa tcaaaataag atcaccatca 36300
cttatttgga ttattgtact acaaataaag agtcgaattt cctatagtcc tcgtaacaaa 36360
ttaaaacgga caaaggatac acgatggaac tcaacacgat tattgtcggc atttatttcc 36420
tattcttgat tgcgataggt tggatgttta gaacatttac aagtactact agtgactact 36480
tccgcggggg cggtaacatg ttgtggtgga tggttggtgc aaccgccttt atgacccagt 36540
ttagtgcatg gacattcacc ggtgcagcag gtaaagcgta taacgatggt ttcgctgtag 36600
cggtcatctt cgtagccaac gcatttggtt acttcatgaa ctacgcgtac ttcgcgccga 36660
aattccgtca acttcgcgtt gttacggtaa tcgaagcgat tcgtatgcgt tttggtgcga 36720
ccaacgaaca agtattcact tggtcttcaa tgccaaactc agtggtatct gcgggtgtgt 36780
ggttaaacgc attggcaatc atcgcttcgg gtatcttcgg tttcgacatg aacatgacta 36840
tctgggtgac tggcctagtg gtattggcaa tgtcggtaac aggtggttca tgggcggtaa 36900
tcgcatctga cttcatgcag atggttatca tcatggcggt aacggtaact tgtgcggttg 36960
tagcggttgt tcaaggtggc ggtgttggtg agattgttaa caacttccca gtacaagatg 37020
gtggttcgtt cctttggggc aacaacatca actacctaag catctttacg atttgggcat 37080
tcttcatctt cgttaagcag ttctcaatca cgaacaacat gcttaactct taccgttacc 37140
tagcggctaa agactcaaag aacgctaaga aagctgcact gcttgcttgt gtgttgatgt 37200
tgtgtggtgt gtttatttgg ttcatgcctt cttggttcat tgcaggccaa ggtgttgatt 37260
tatcagcggc ttacccgaat gcaggtaaaa aagcgggtga ctttgcttac ctatacttcg 37320
tacaagagta catgccagca ggtatggttg gtctattagt tgccgcgatg tttgcagcga 37380
caatgtcttc aatggactca ggtctaaacc gtaactcagg tatttttgtt aagaacttct 37440
acgaaacaat cgttcgtaaa ggtcaagcat cagagaaaga gctagtaacc gtatctaaaa 37500
ttacttcagc ggtatttggt ttcgctatta tcctaatcgc acagttcatc aactcattaa 37560
aaggcttaag cctgtttgat acgatgatgt acgtaggtgc gttaatcggc ttccctatga 37620
cgattcctgc attccttggt ttcttcatca agaagactcc ggactgggct ggttggggaa 37680
cgctagttgt tggtggtatc gtatcttatg tggttggttt tgttatcaac gcggagatgg 37740
tagcagcggc gtttggtctt gatactctaa caggacgtga atggtctgat gttaaagttg 37800
cgattggtct gattgctcac atcacgctaa ccggtggctt cttcgtacta tctacgatgt 37860
tctacaagcc tctatcaaaa gaacgtcaag cggatgttga taagttcttt ggcaacttag 37920
ataccccatt agtagctgaa tcggcagagc aaaaagtgtt ggataacaaa caacgtcaaa 37980
tgcttggtaa actgattgcg gtagcgggtg ttggtattat gctgatggct cttctgacta 38040
acccaatgtg ggggcgccta gtcttcatct tatgtggtgt gatagtgggt ggtgtcggta 38100
ttctacttgt gaaagcggtc gatgacggcg gcaagcaagc gaaagcagta accgaaagct 38160
aatacataga aaacgtttat aatagaatgc gacgactcga aagggcgtcg cattttttat 38220
tctgcggaac tggaaaaccg tcaggtgaaa gatatctgac ctaaatcacg aaaactgtac 38280
aaagtggttc aatcgaatcg aaatatattc aattgtccta caataagacg tatattgttg 38340
ctaattcctt tcaatcaact tgaaaaataa gtgagttaga atgagcgacc aaaaatctct 38400
tgatgcaatc aggaagatga agctggaaaa cgatacttca gcaggtaatc ttgtagacct 38460
actccctatc gaagttcaaa cacgtgactt cgacctatca ttcctagaca ccttgagcga 38520
agcacgtccg cgtcttcttg ttcaagctga tcagctagaa gaattcaaag caaaagtgaa 38580
agctgatcaa gctcactgta tgtttgatga tttctacaac aactctaccg ttaagttcct 38640
tgagactgct cctttcgaag agcctcaagc gtacccagct gagacggtag gtaaagcttc 38700
tctatggcgt ccttattggc gtcaaatgta cgttgattgc caaatggcac tgaacgcgac 38760
acgtaaccta gcgattgctg gtgttgtaaa agaagacgaa gcgctcattg cgaaagcaaa 38820
agcttggact ctaaaactgt ctacgtacga tccagaaggc gtgacttctc gtggctataa 38880
cgatgaagcg gctttccgtg ttatcgctgc tatggcttgg ggttacgatt ggctacacgg 38940
ctacttcacc gatgaagaac gccagcaagt tcaagatgct ttgattgagc gtctagacga 39000
aatcatgcac cacctgaaag tgacggttga tctattgaac aacccactaa atagccacgg 39060
tgttcgttct atctcttctg ctatcatccc aacgtgtatc gcgctttacc acgatcaccc 39120
gaaagcaggc gagtacattg catacgcgct agaatactac gcagtacatt acccaccatg 39180
gggcggtgta gacggcggtt gggctgaagg tcctgattac tggaacacgc aaactgcatt 39240
cctaggcgaa gcattcgacc tattgaaagc atactgtggt gtagacatgt ttaacaaaac 39300
attctacgaa aacacaggtg atttcccgct ttactgcatg ccagttcact ctaagcgcgc 39360
gagcttctgt gaccagtctt caatcggcga tttcccaggt ttaaaactgg cttacaacat 39420
caagcactac gcaggtgtta accagaagcc tgagtacgtt tggtactata accagcttaa 39480
aggccgtgat actgaagcac acaccaaatt ctacaacttc ggttggtggg acttcggtta 39540
tgacgatctt cgttttaact tcctttggga tgcacctgaa gagaaagccc catcgaacga 39600
tccactgttg aaagtattcc caatcacggg ttgggctgca ttccacaaca agatgactga 39660
gcgtgataac catattcaca tggtattcaa atgttctccg tttggctcaa tcagccactc 39720
tcacggtgac caaaacgcat ttacgcttca cgcatttggt gaaacgctag cgtcagtaac 39780
aggttactat ggtggtttcg gtgtagacat gcacacgaaa tggcgtcgtc aaacgttctc 39840
taaaaacctg ccactatttg gcggtaaagg tcagtacggc gagaacaaga acacaggcta 39900
cgaaaaccac caagatcgct tttgtatcga agcgggcggc actatctctg acttcgacac 39960
tgaatctgat gtgaagatgg ttgaaggtga tgcaacggca tcttacaagt acttcgttcc 40020
tgaaatcgaa tcttacaagc gtaaagtctg gttcgttcaa ggtaaagtct tcgtaatgca 40080
agacaaggca acgctttctg aagagaaaga catgacttgg ctaatgcaca caactttcgc 40140
aaacgaagtg gcagacaagt ctttcactat ccgtggcgaa gttgcgcacc tagacgtaaa 40200
cttcatcaac gagtctgctg ataacatcac gtcagttaag aacgttgaag gctttggcga 40260
agttgaccca tacgagttca aagatcttga gatccaccgt cacgtggaag tggaattcaa 40320
gccatcgaaa gagcacaaca tcctgacgct tcttgttcct aataagaatg aaggcgagca 40380
agttgaagtg tttcacaagc ttgaaggcaa cacgctactg ctaaatgttg acggcgaaac 40440
ggtttcaatc gaactgtaat ccgctgaagt aacagaagtt agatactaaa aactccgagt 40500
gaaagctcgg agtttttttg tttggctagc caattaagtt ggagttggat aagtcagtta 40560
agttgtatta gttgacaacg ttggcaaacc gatcaggttg aaagaaaact taattggcca 40620
gagataaata gcttctcgat gccaagtcag tggctgaggg ctaaatctgg acattgatgc 40680
acataaagac cggcatgtac ttagccacta tgctcaatga aatgtgcagg agtcgtataa 40740
gagactcgta tatatcgctc tgttagaaga acagggcgcc aacgcctgtt tcctagcaat 40800
tgttatgact tacttttccg tgaacagtct tatcactggc tgagtaaggg agtagtgaac 40860
tatacatagg taaaggcgta gcttgttctt actaatcgta tgacatttaa cgtacgttat 40920
tcgttattat aatgaacata taatcataca atactatatt tggagtttga acatgactaa 40980
acctgtaatc ggtttcattg gcctaggtct tatgggcggc aacatggttg aaaacctaca 41040
aaagcgcggc taccacgtaa acgtaatgga tctaagcgct gaagctgttg ctcgcgtaac 41100
agatcgcggc aacgcaactg cattcacttc tgctaaagaa ctagctgctg caagtgacat 41160
cgttcagttt tgtctgacaa cttctgctgt tgttgaaaaa atcgtttacg gcgaagacgg 41220
cgttctagcg ggcatcaaag aaggcgcagt actagtagac ttcggtactt ctatccctgc 41280
ttctactaag aaaatcggcg cagctcttgc tgaaaaaggc gcgggcatga tcgacgcacc 41340
tctaggtcgt actcctgcac acgctaaaga tggtcttctg aacatcatgg ctgctggcga 41400
catggaaact ttcaacaaag ttaaacctgt tcttgaagag caaggcgaaa acgtattcca 41460
cctaggggct ctaggttctg gtcacgtgac taagcttgta aacaacttca tgggtatgac 41520
gactgttgcg actatgtctc aagctttcgc tgttgctcaa cgcgctggtg ttgatggcca 41580
acaactgttt gacatcatgt ctgcaggtcc atctaactct ccgttcatgc aattctgtaa 41640
gttctacgcg gtagacggcg aagagaagct aggtttctct gttgctaacg caaacaaaga 41700
ccttggttac ttccttgcac tttgtgaaga gctaggtact gagtctctaa tcgctcaagg 41760
tactgcaaca agcctacaag ctgctgttga tgcaggcatg ggtaacaacg acgtaccagt 41820
aatcttcgac tacttcgcta aactagagaa gtaatcgacg tacgacctcg ctagggtatt 41880
gcttgtcttc taggcggcga tacctcagcg aggttcgttt ttatctgcca tacccaaccc 41940
tttgttccct tgttaaaatc ttctacttct acttctactt ctacttcaat ttcctcagtt 42000
acacctaatc aaaactctgt ttaactctgt tactgcctca attcctattt ttttctatat 42060
ctatttctaa cggtaaattc aaaaccttct agcaccaact cattcactca tttttcctcg 42120
caagctcaaa ctcaacgcgc ttacatgatt gttggtgatg gcttaacacc gctcgtatat 42180
cggtcctgaa aagaaagtaa aaaaaaagcc cacacagctg gtgactgtat gggcatgttc 42240
ggacgagccg tctggacaaa caaatgagca atagtaagtg aaaaaacgaa taacgagatc 42300
ccccgacagt ttctacgtta aacgcgttca atgaccttaa agcggctgct tcaattatca 42360
ctttgaattg aacaaaagca tccagaaaga acttaagtta tgattcaaat acaccatagt 42420
acaagactta ttgtattaca aataaatttt aagattgaat gcctttagtg aatggttagt 42480
tggtagaagt gtgagttaag actcattttt tcactcagct gggtgaggta aagaagaaga 42540
gttttcgaaa agatgttatc ggaaaaatga tgagctaatt atctaaaaat cgatctattt 42600
taatgtgtta tgcgtcaatg tttaacttcg aacaaaatcc aaactcataa atgataccta 42660
tgtcacaggg cggttttagc cagttttaat atatcaagat cgctcacaga atgtctggtc 42720
aattaaacat acaatattaa ttaagttgat ggttgtgacg atggatcggc atgaacaagt 42780
ttcgctttcc gtatcttcga aaatgtaaaa aatggccatt tcattcggat gaaaataata 42840
gacataggtt gatatggatg atgagtttta tgaattcaaa attgtctcta gggtttaaag 42900
gaaaattgat tttaatggta gcggtcgtca gttctagtgc tttggcattt acgaactggt 42960
ttacgcttaa cttggccact gaacaggtaa accaaacgat ttataacgag attgatcact 43020
cgcttacgat agaaatcaat caaatagaaa gtaccgttca gcgcaccatc gataccgtta 43080
actctgttgc acaagagttc atgaaatccc cttaccaagt gccgaatgaa gcactcatgc 43140
attatgccgc taagcttggt ggcattgaca agattgtggt gggttttgac gacggccgtt 43200
cttatacctc tcgcccttca gagtctttcc ctaacggtgt tggaataaaa gaaaaataca 43260
atccaaccac tcgaccttgg tatcaacaag cgaaattgaa atcaggctta tcttttagtg 43320
gtctgttttt cactaagagt actcaagtgc ctatgatcgg tgtgacctac tcataccaag 43380
atcgtgtcat catggccgat atacgctttg acgatttgga aacgcagctt gaacagctgg 43440
acagcatcta cgaagccaaa ggcattatca tcgacgaaaa ggggatggtg gtcgcttcaa 43500
caatcgaaaa cgtgcttccg caaaccaata tatcttctgc agacactcaa atgaaactca 43560
acagtgccat tgaacagcct gatcaattca ttgagggtgt gattgatggt aaccagagaa 43620
tcttgatggc caagaaagtg gatattggca gccagaaaga gtggttcatg atctccagta 43680
ttgaccctga actcgcgctc aatcagctga atggcgtgat gtcgagtgcg cgcatcctta 43740
tcgtcgcttg tgtacttggc tcggtgatat tgatgatttt acttctgaat cgtttctacc 43800
gcccaatcgt gtcactgcgc aaaatcgtcc acgatctatc acaaggtaac ggagacctca 43860
ctcaaaggct tgctgagaag gggaatgatg acttagggca tatcgccaaa gacatcaact 43920
tgttcattat cggcttacaa gagatggtta aggatgtgaa atacaagaac tcggatctcg 43980
ataccaaggt actgagtatt cgcgaaggtt gtaaagaaac cagcgatgta ctgaaagttc 44040
atactgatga aacggttcaa gtggtctctg cgattaacgg cttgtctgaa gcatcaaacg 44100
aagtagagaa gagttctcag tcggcggcag aagcagcaag agaggccgct gtgttcagtg 44160
atgagacgaa acagattaac acggtgacgg aaacctatat cagtgatctt gagaagcaag 44220
tctgcaccac ttctgatgac attcgctcaa tggccaatga aacgcagagc atccagtcta 44280
tcgtgtctgt gattggcgga attgcggaac aaactaattt gctggcattg aatgcgtcaa 44340
ttgaagcggc gagggcgggt gaacatggtc gaggtttcgc ggtggttgct gatgaagtcc 44400
gtgcgctagc caaccgaacg caaatcagta cctctgaaat tgatgaagcg ttatctggct 44460
tgcagtctaa atcagatggt ttggttaaat ctattgagtt gaccaaaagt aactgtgaac 44520
tgactcgcgc tcaagttgtt caagctgtaa acatgttggc gaagctaacc gagcagatgg 44580
aaacagtaag tcgttttaat aatgacattt cgggttcgtc tgttgagcaa aacgccctta 44640
ttcagagcat tgctaagaac atgcataaga ttgaaagctt tgttgaggag cttaataaac 44700
taagccaaga tcagttaact gaatcagcag aaatcaaaac acttaacggt agcgttagtg 44760
aattgatgag cagctttaag gtttaatgtt tctaatattt atacctaaaa atcaacatgt 44820
taagtttagt tgttgatctg aaggccactc aataactgtc gagtttagag tggcttttct 44880
gcgttgttct tgagtctaac tctacgtaat atccgttcat ttcacttcat ttgccgcatc 44940
tcacattctg ataaatagac aattgacata aaatagtaca aatatacatt gtcactctac 45000
tcttatggat aagtgagata aatgtgaata agccaatctt tgtcgtcgta ctcgcttcgc 45060
ttacgtatgg ctgcggtgga agcagctcca gtgactctag tgacccttct gataccaata 45120
actcaggagc atcttatggt gttgttgctc cctatgatat tgccaagtat caaaacatcc 45180
tttccagctc agatcttcag gtgtctgatc ctaatggaga ggagggcaat aaaacctctg 45240
aagtcaaaga tggtaacttc gatggttatg tcagtgatta tttttatgct gacgaagaga 45300
cggaaaatct gatcttcaaa atggcgaact acaagatgcg ctctgaagtt cgtgaaggag 45360
aaaacttcga tatcaatgaa gcaggcgtaa gacgcagtct acatgcggaa ataagcctac 45420
ctgatattga gcatgtaatg gcgagttctc ccgcagatca cgatgaagtg accgtgctac 45480
agatccacaa taaaggtaca gacgagagtg gcacgggtta tatccctcat ccgctattgc 45540
gtgtggtttg ggagcaagaa cgagatggcc tcacaggtca ctactgggca gtcatgaaaa 45600
ataatgccat tgactgtagc agtgccgctg actcttcgga ttgttatgcc acttcatata 45660
atcgctacga tttgggagag gcggatctcg ataacttcac caagtttgat ctttctgttt 45720
atgaaaatac cctttcgatc aaagtgaacg atgaagttaa agtcgacgaa gacatcacct 45780
actggcagca tctactgagt tactttaaag cgggtatcta caatcaattt gaaaatggtg 45840
aagccacggc tcactttcag gcactgcgat acaccaccac acaggtcaac ggctcaaacg 45900
attgggatat taatgattgg aagttgacga ttcctgcgag taaagacact tggtatggaa 45960
gtgggggtga cagtgcggct gaactagaac ctgagcgctg cgaatcgagc aaagaccttc 46020
tcgccaacga cagtgatgtc tacgacagcg atattggtct ttcttatttc aataccgatg 46080
aagggagagt gcactttaga gcggatatgg gatatggcac ctctaccgaa aattctagct 46140
atattcgctc tgagctcagg gagttgtatc aaagcagtgt tcaaccggat tgtagcacca 46200
gcgatgaaga tacaagttgg tatttggacg acactagaac gaacgctacc agtcacgagt 46260
taaccgcaag cttacgaatt gaagactacc cgaacattaa taaccaagac ccgaaagtgg 46320
tgcttgggca aatacacggt tggaagatca atcaagcatt ggtgaagttg ttatgggaag 46380
gcgagagtaa gccagtaaga gtgatactga actctgattt tgagcgcaac aaccaagact 46440
gtaaccattg tgacccgttc agtgtcgagt taggtactta ttcggcaagt gaagagtggc 46500
gatatacgat tcgagccaat caagacggta tctacttagc gactcatgat ttagatggaa 46560
ctaatacggt ttctcattta atcccttggg gacaagatta cacagataaa gatggggaca 46620
cggtctcgtt gacgtcagat tggacatcga cagacatcgc tttctatttc aaagcgggca 46680
tctacccaca atttaagcct gatagcgact atgcgggtga agtgtttgat gtgagcttta 46740
gttctctaag agcagagcat aactgagttc tctgatgttt ggttagccat gtcggtaatg 46800
aagaagacca tattgatgcc tacaatgtgg tctttttttg tttttggaca cttacagtga 46860
tgtgttttga aggacaaatg ttctgctcga atcatgcaaa tacacacgat tacagctcgc 46920
ttgttctgcc cttgctagct catttcgcat tccaaattct tatatattgt cttttatcaa 46980
taggaaatgt gatccagtta aagtatggaa aaatcggaaa gtgttcctag tctcatttat 47040
ccaacgaagt gttttatttg tattataaga ttacgtaata ttttcgtgtt atcgcaaata 47100
ctgataggtg aatcgcctta tagctcgtgt ttgctgattt agctttcact tacgaacgct 47160
gtctttgtat tataataatg gattaaatat gaaacaaatt actctaaaaa ctttactcgc 47220
ttcttctatt ctacttgcgg ttggttgtgc gagcacgagc acgcctactg ctgattttcc 47280
aaataacaaa gaaactggtg aagcgcttct gacgccagtt gctgtttccg ctagtagcca 47340
tgatggtaac ggacctgatc gtctcgttga ccaagaccta actacacgtt ggtcatctgc 47400
gggtgacggc gagtgggcaa cgctagacta tggttcagta caggagtttg acgcggttca 47460
ggcatctttc agtaaaggta atcagcgcca atctaaattt gatatccaag tgagtgttga 47520
tggcgaaagc tggacaacgg tactagaaaa ccaactaagc tcaggtaaag cgatcggcct 47580
agagcgtttc caatttgagc cagtagtgca agcacgctac gtaagatacg ttggtcacgg 47640
taacaccaaa aacggttgga acagtgtgac tggattagcg gcggttaact gtagcattaa 47700
cgcatgtcct gctagccata tcatcacttc agacgtggtt gcagcagaag ccgtgattat 47760
tgctgaaatg aaagcggcag aaaaagcacg taaagatgcg cgcaaagatc tacgctctgg 47820
taacttcggt gtagcagcgg tttacccttg tgagacgacc gttgaatgtg acactcgcag 47880
tgcacttcca gttccgacag gcctgccagc gacaccagtt gcaggtaact cgccaagcga 47940
aaactttgac atgacgcatt ggtacctatc tcaaccattt gaccatgaca aaaatggcaa 48000
acctgatgat gtgtctgagt ggaaccttgc aaacggttac caacaccctg aaatcttcta 48060
cacagctgat gacggcggcc tagtattcaa agcttacgtg aaaggtgtac gtacctctaa 48120
aaacactaag tacgcgcgta cagagcttcg tgaaatgatg cgtcgtggtg atcagtctat 48180
tagcactaaa ggtgttaata agaataactg ggtattctca agcgctcctg aatctgactt 48240
agagtcggca gcgggtattg acggcgttct agaagcgacg ttgaaaatcg accatgcaac 48300
aacgacgggt aatgcgaatg aagtaggtcg ctttatcatt ggtcagattc acgatcaaaa 48360
cgatgaacca attcgtttgt actaccgtaa actgccaaac caagaaacgg gtgcggttta 48420
cttcgcacat gaaagccaag acgcaactaa agaggacttc taccctctag tgggcgacat 48480
gacggctgaa gtgggtgacg atggtatcgc gcttggcgaa gtgttcagct accgtattga 48540
cgttaaaggc aacacgatga ctgtaacgct aatacgtgaa ggcaaagacg atgttgtaca 48600
agtggttgat atgagcaaca gcggctacga cgcaggcggc aagtacatgt acttcaaagc 48660
cggtgtttac aaccaaaaca tcagcggcga cctagacgat tactcacaag cgactttcta 48720
tcagctagat gtatcgcacg atcaatacaa aaagtaatct aatcgaataa cacttaatat 48780
taaaggtatt gcaatagcct ccagccttag ggtttggagg cttttttgtg cctgctgttg 48840
gttgggctta agcgtatgat ttaattgagt aggagagggg tagttatcag ttgcacagag 48900
tttaagacat tatcattaag ctcattcagt attaacttta gtcattatca gtcactatta 48960
ccccccaagc gccgatcaca attaacctag ctcatgatta atctcagtta ccaataggct 49020
agcctgtagc ggattcaaac ccaaataatg tcgtgatgtt tatcggaatc accatagctc 49080
gaaaactttg accttgttct caaggctttg ccaatgcacg aacgtattat gtgcgtggtt 49140
tactaataag cgttagctcg gctgactact catactgttc ttgaaaccgt tactcttggg 49200
ttgtttagct agactcctag caacagccat aaatagtgct ctaactcttt cataattaga 49260
agggtagggt tagccattct attggttcca atgctttatg aaatactagg cgggctcaag 49320
tcgatgatca aacgactcta acagcttaag gttatgcgct tttgcgttag ttacctgcag 49380
gccgtaaatg ccctgattgt agttgtacgg tgacgctgaa taataatttg taggattagt 49440
atagaactga gagactttgt ctatctatga tcgatacagg ctttgagagg gctggatcag 49500
tagaaagaca gaatgacaat tagcactaga gttattttgg tttttaatta gagttaataa 49560
aatagatatt tggtttgtta aatttaatcg tgtcataagc tctgtgtttt aaaaaataaa 49620
aaaagccata gcagttgcta tggctttgaa taagtcaggt tctaaggtaa gcaaacagca 49680
agtcaacttg tctgttttga tattcttagt cttagttcaa gatattttct ttacctgccg 49740
cagtgttcac tgcagatggt tgtgcgtaga tggctgtatt tcttatatct ttaccgttgt 49800
cagctgaaag tagggttttg taaccattga acgtattgct ttcaatagtg acattacagc 49860
caaggttatc atcactattc tttatgacgg cactgctaga atcaccaact ttaattccgc 49920
ccacatcact accaccagag ttaatagtga atgtattatt tgtgatttgt gaaccaaatc 49980
gcccgttgtc actactacag ttaatacgaa ttgcattatt ttggaaactg ccacttaaac 50040
cgacaaattc gctattgtct aatgtaaagt aacctcgaga gaataaccaa cttgcttttt 50100
tagtacctag atcatcttcg gtaatgccgt ttgcatcgaa ctttaggttt tcaagtgcta 50160
caggatctga atctttacca attttaccaa taacgatcgc accagtttca ttatctgaag 50220
taccagctga ctccctacca aaacacccgg ccaaattgtc gttagcaaaa gtcatgtttt 50280
tgatacctgc accgggtgca gtgacatcaa tacaagcatc tccggtaatg gttgctaaac 50340
cagcaccatc aattgtgaca gctttattta gctcaataac accggtatca aacgtacctt 50400
cagatgataa atcaataatc gcgccatctt ctgctgatgc aatcgcagcg ttcacatcat 50460
cgactgattt aggttttcca tcatcggcat tttctaatgc agttataaca gattcatctg 50520
taatctctgt tgctgagtaa gctgtttcta cgtcatcttt ttcacaggtc atatctagct 50580
gttgctcagt cactgtgtaa gtacagtcct taccttcaaa ggaaacaaca ccttcttctt 50640
cagcagtata tattgaactc tcaaaagtga agccattagc tacgtctcca ctgtaaatgc 50700
ttagagcacg agtaccttcc tcattattat caaagcgata tggtgaagtt ccgctgagtg 50760
actgtgcagc aacagcacca cctgtcagat cccaatagac gttttctata gagtaaactt 50820
caacaggttc aacagggtct gttccgcctg gatctgttgg aataggtaaa ccatcactgt 50880
tacaaccaaa taataaacct gtcgaaagag cgacagctgt agcgacttta gaaatttgca 50940
taaaatattc tctttatgat attaaatcca tatgtaaatc acataagaaa tagataatga 51000
atagtcgtta aatatttatt aggatgaagc taattctgat tagaacatcc tattatttaa 51060
aataaagtaa ttaaaatatg cccaaataaa ttacaagagg agagggctat tttatatttt 51120
gactatttta ttattagaat gagtaagcaa taccaacacg gtatttagct tcacgatctt 51180
ttgaagatga actgatatca gaagaccaga tttcagcaaa aggtttccaa gaaccgaact 51240
tgtagtttac ctttaagcca gcatcccatt cccagtcatc actattataa agaagtacgt 51300
tatccaaaga ttttacatag tttgcttcgt aagaaaggcc aagcttaggt agagattcaa 51360
ttttgtaaga gcccgtcagt gtaactttag acttttgagc tgattctaaa cgctcgccag 51420
tttcagaatc tttgtcgcca aattgtgtgt ggttacggaa gtcagcatat tcatgacggt 51480
aacgaatagc agttgttaaa cccatatctg ctttatagcc aacgcggaac tgaggtttaa 51540
acgtaacctt tttcatcttc cagtcgccat cgttagcatt aggctcatcc caatcccaag 51600
caataggcat acccatttgt agataccaat tattgtctat tttgtatgtc gcagtgttat 51660
cgatctccat accatagatg taccaattgc catcgtaaaa actctggctg tttgctgatt 51720
taacagaacc tgaatcttca tcatagtaag agtcatcacc gtggaactta agttctagac 51780
cagtagagtg cttccacttg tctgacagct taaagctttc acctagctta actcggtgtt 51840
gatggcgagc gtctacgtga gccgtatcac cattagtctt tgtataatcc gtcgcagcac 51900
gatactcgta acgataatca agagatgcac cagcagctgt gcccgctaaa agagtacatg 51960
caacagctgc agcaattttt gtaacagaat tcataccttt gtctcactat tattttttta 52020
ttttggatac atccaatgta cccctgactc acaaaccaat accttacatg gtattaaatt 52080
aatgtatgac aaatatggta tttattccta gggtagattt ctgtgagatc tatcaaaagt 52140
tccgactaat ggcctattta tatagctaaa tgttatgaat atctcaattt aaggcttacc 52200
aatcaaatca atcatgactc agttctcata ttaacaaacc ttgtaagctc agttggttgt 52260
atgtgttaaa ataatacaaa tataagaata ttcccacact ttcatatcga tgttctagtt 52320
gttgtggttt aaacataacg gcgcatgttg agggatatag atataaacca ccgccaaatg 52380
tttggtaaaa gttaaaagat ggcgaaatgt aaattctatt tattggttgg tttatttaag 52440
tcgaagagaa aatatttagt actaattcgt gttcaaaagt agtttctgtg ctgagagtgt 52500
actcagtatc tgttaacaat aaaggatgag tcatgtttaa gaaaaacata ttagcagtgg 52560
cgttattagc gactgtgcca atggttactt tcgcaaataa cggtgtttct taccccgtac 52620
ctgccgataa attcgatatg cataattgga aaataaccat accttcagat attaatgaag 52680
atggtcgcgt tgatgaaata gaaggggtcg ctatgatgag ctactcacat agtgatttct 52740
tccatcttga taaagacggc aaccttgtat ttgaagtgca gaaccaagcg attacgacga 52800
aaaactcgaa gaatgcgcgt tctgagttac gccagatgcc aagaggcgca gatttctcta 52860
tcgatacggc tgataaagga aaccagtggg cactgtcgag tcacccagcg gctagtgaat 52920
acagtgctgt gggcggaaca ttagaagcga cattaaaagt gaatcacgtc tcagttaacg 52980
ctaagttccc agaaaaatac ccagctcatt ctgttgtggt tggtcagatt catgctaaaa 53040
aacacaacga gctaatcaaa gctggaaccg gttatgggca tggtaatgaa ccactaaaga 53100
tcttctataa gaagtttcct gaccaagaaa tgggttcagt attctggaac tatgaacgta 53160
acctagagaa aaaagatcct aaccgtgccg atatcgctta tccagtgtgg ggtaacacgt 53220
gggaaaaccc tgcagagccg ggtgaagccg gtattgctct tggtgaagag tttagctaca 53280
aagtggaagt gaaaggcacc atgatgtacc taacgtttga aaccgagcgt cacgataccg 53340
ttaagtatga aatcgacctg agtaagggca tcgatgaact tgactcacca acgggctatg 53400
ctgaagatga tttttactac aaagcgggcg catacggcca atgtagcgtg agcgattctc 53460
accctgtatg ggggcctggt tgtggcggta ctggcgattt cgctgtcgat aaaaagaatg 53520
gcgattacaa cagtgtgact ttctctgcgc ttaagttaaa cggtaaatag cacatagcat 53580
aaccaatagt ctagctagac gcagtcctta aggaatattt tcgaagacca cttaaccgaa 53640
tgttgagtgg tctttttgtt ttatatgagt tttaagatga acttggtatt aatgtgacct 53700
tggtatcaat gagggtgtac gtgaagccta ccaatgaaag gtacagctaa aacaatacaa 53760
ccttgtcaaa agacaaggtt gcattcagaa agcgtaggaa gattttagga cgacaactcg 53820
atacggagtt tagtcataca tcaactcttt ggctttgtcg gcatcaaact ctttaagaga 53880
ctttcgagcc aagtgacgga atgggaaagc tttcacgact tcttcgaatg gttggatggc 53940
aaatgcccaa aagatagaac cgtctaatcc aaagatgatc aatgcacaca atggaattga 54000
aattacccat tgaccagtaa agttgatttt gaagactgcg gtcgtttttc ctagggctct 54060
taatacattc ccatgaaccg                                             54080
 
<210>3
<211>22890
<212>DNA
<213>灿烂弧菌
 
<400>3
gtgctttgtg acaacggggg atgtatggat attgaagttt cgcgccaggt tgcggtagtt 60
gaagctacga gtggagatgt cgtcgtagtt aagccagacg gcagcgcaag aaaagtttca 120
gttggcgata ccatccgtga aaatgagatc gtgattacgg ccaacaagtc agagcttgta 180
ttaggcgttc agaatgattc gattccggtt gcagagaatt gcgtcggttg tgttgatgaa 240
aacgctgcat gggtagatgc cccaatagct ggtgaggtta attttgactt acagcaagca 300
gacgcagaaa ccttcactga agacgacctt gctgcaattc aagaagccat tttaggtggt 360
gccgatccga ctcaaatctt agaagcaacg gctgctggtg gcggactagg ttctgcaaat 420
gctggctttg tgacgattga ctataactac actgaaactc atccatcgac tttctttgag 480
accgctggtc tagcagaaca aactgttgat gaagacagag aagaattcag atctatcact 540
cgttcatcag gtggccaatc aatcagtgaa acactgactg aaggctccat atctggcaat 600
acctatcccc aatctgtaac aacgacagaa acgattattg ctggtagttt agctctcgcc 660
cctaactctt tcattccaga aactttatcc ctcgcttcac tacttagtga attaaacagc 720
gacattactt caagtggtca gtccgttatc ttcacctatg acgcgacgac taattctatc 780
gttggtgttc aagataccga cgaagtatta cgtatcgaca ttgatgccgt cagtgttggc 840
aataacattg agctttctct aaccacaacg atttcccagc cgattgatca tgtaccgtcg 900
gttggcggtg gtcaggtttc ttacactggc gatcaaatag atattgcctt tgatattcaa 960
ggtgaagaca ccgctgggaa cccgctagca acacccgtta acgcacaagt ttcagtgttt 1020
gacgggatag atccgtctgt tgaaagtgtc aatatcacta acgttgaaac tagcagcgcg 1080
gcaatcgaag ggacgttctc aaatattggt agtgataacc ttcaatcagc cgtatttgat 1140
gcaagtgcac tggaccagtt tgatgggttg ctcagtgata atcaaaacac gcttgcgaga 1200
ctttctgatg atggaacaac gattactctg tccatccaag gtcgaggtga ggttgttctc 1260
actatctctc tagataccga tggcacctat aaattcgagc agtctaatcc gatagaacaa 1320
gtgggtaccg attcactgac gttcgctttg ccaatcacga ttaccgattt tgaccaagat 1380
gttgtaacca atacgatcaa cattgccatt actgatggcg atagccctgt tattactaat 1440
gttgacagta ttgatgttga tgaagcgggc attgttggcg gctcacaaga gggcacggcg 1500
ccagtgtctg gcactggcgg tatcaccgcg gacatttttg aaagtgacat cattgaccat 1560
tatgagctag aacccactga atttaatact aatggcacct tggtttcaaa tggcgaggct 1620
gtgctacttg agttgattga tgaaaccaac ggtgtaagaa cttacgaagg ttatgttgag 1680
gtcaatggtt cgagaattac ggtctttgac gttaaaattg atagcccttc attgggcaac 1740
tatgagttta atctttatga agaactttct catcaaggcg ctgaagatgc gctgttaact 1800
tttgcattgc caatttatgc tgttgatgca gatggcgacc gttctgcact gtctggaggt 1860
tcgaacacac cagaagctgc tgagatcctc gttaatgtta aagacgatgt cgttgaatta 1920
gttgataagg ttgaatcagt caccgagccg accttagcgg gcgatactat tgtttcgtat 1980
aacctgttca attttgaagg cgcagatggt tctacaattc aatcgtttaa ctacgacggt 2040
gttgattact cactcgatca aagcctgctc cccgatgcta cccagatttt cagttttact 2100
gaaggtgtcg tcactatctc attaaacggt gacttcagtt ttgaagtcgc tcgtgatatc 2160
gaccactcaa gcagtgaaac tatcgtcaaa cagttctcat ttttagccga agatggtgat 2220
ggggatactg atagttcgac gcttgagtta agtattaccg atggccaaga tccgatcatt 2280
gatttgatcc cgcctgtgac tctctctgaa accaacctta atgacggctc tgctcccagc 2340
ggaagtacag ttagcgcaac cgagacgatt acctttaccg caggcagcga cgatgtagca 2400
agtttccgta ttgaaccaac agagtttaat gtgggcggtg cacttaaatc gaatggattt 2460
tcggttgaga taaaagaaga ttcggctaat ccgggtactt acattggctt tattaccaac 2520
ggttcgggcg ctgaaatccc agtgtttacg attgctttct ctacgagcac attgggtgaa 2580
tacaccttta ctctgcttga agcgttagac catgtagatg gtttagataa gaacgatctg 2640
agctttgatc tgcctattta tgcggttgat acggacggcg acgattcatt ggtgtctcag 2700
cttaatgtga ctatcggtga tgatgttcaa atcatgcaag acggtacgtt agatatcacc 2760
gagccaaatc ttgctgacgg tacaatcaca accaacacca ttgatgtaat gccaaatcaa 2820
agtgctgatg gcgcgacgat cactcggttc acttatgacg gtgtcgtaaa cacactggat 2880
caaagtattt caggagaaca gcagttcagc ttcacagaag gcgaactgtt tatcaccctt 2940
gaaggtgaag tgcgctttga gcctaatcgc gatctagacc actcagtgag tgaagatatc 3000
gtgaagtcga ttgtggtgac ttcaagcgac ttcgataacg atccggtgac ttcaaccatt 3060
acgctgacga tcactgatgg tgataacccg acgattgatg ttattccaag tgttacgctt 3120
tctgaaatta acctgagcga tggctctgct ccaagtggca gcgcggtaag ctcgactcaa 3180
actattactt ttaccaatca aagtgatgat gtggttcgtt tccgtattga gtcaacggag 3240
ttcaatacta acgatgatct taaatcgaac ggtttagctg ttgagttacg tgaagacccg 3300
gcagggtcgg gtgactacat tggttttacg accagtgcga cgaacgtaga aactccagta 3360
ttcacattaa gctttaattc tggatcatta ggtgaataca cgttcacact catcgaagcg 3420
ttggaccacc aagatgcccg tggcaacaac gacctcagtt ttgatttacc tgtttacgcg 3480
gtagatagtg atggcgatga ttcattggtg tctccgttaa acgtcactat cggtgatgat 3540
gttcaaatca tgcaagatag tacgttagat atcgtcgagc caaccgtcgc agatttggcc 3600
gctggcacag tgacaactaa caccattgat gtgatgccaa atcaaagtgc cgatggcgca 3660
acggtgacgc aattcactta tgatggccag cttcgaacac ttgaccaaaa tgacaatggt 3720
gagcagcaat ttagcttcac agaaggtgaa ctgttcatca cgcttcaagg tgatgtgcgc 3780
tttgagccta atcgtaatct agaccacaca ctcagcgaag acatcgtgaa atcaatcgtg 3840
gtgacatcta gcgattccga taacgatgtg ttgacctcaa ccgtcactct gaccattacc 3900
gatggtgata tcccaaccat tgataatgtt ccaactgtga acttgtctga aactaatctg 3960
agtgatggct ctgcacctag cggaagcgcg gtgagttcaa ctcaaactat tacttacacc 4020
actcaaagtg atgatgtgac aagcttccgt attgaaccga ctgaatttaa tgttggtggc 4080
gctctcacat caaacggatt ggcagtcgag ttaaaagctg atccaaccac accgggtggc 4140
tacatcggtt ttgtgactga tggttcgaac gttgaaacta acgtgttcac gattagcttc 4200
tcagatacca atttaggcca gtacaccttc accttacttg aagcgttaga ccatgtggat 4260
ggtttagcga acaatgatct gacctttgat ctgcctgttt atgcagttga tagcgatggc 4320
gacgattcac tggtgtctca gttaaatgta accatcggtg atgatgttca aatcatgcaa 4380
ggtggtacgt tagatatcac tgagccaaat cttgcagacg gcacaattac aaccaatacc 4440
atcgatgtga tgccagagca aagcgccgat ggtgcgacga tcactcagtt cacttatgac 4500
ggtcaagttc gaacactgga tcaaacggac aatggtgagc agcaatttag cttcactgaa 4560
ggcgagttgt tcatcactct tcaaggtgac gtgcgtttcg aacccaatcg caacctagat 4620
cacacagcta gcgaagatat cgtgaagtcg atagtggtga cttcaagcga tttagataac 4680
gatgtggtga cgtcaacggt cactctgacg attactgatg gtgatatccc aaccattgat 4740
gcagtgccaa gcgttactct gtctgaaatc aatcttagtg acggctctgc gccaagtggc 4800
actgcagtta gtcaaactga gacgattacc ttcaccaatc aaagtgatga tgtgaccagt 4860
ttccgtattg agccaataga gttcaatgtg ggcggtgcac tgaaatcgaa tggatttgcg 4920
gttgagataa aagaagattc ggctaatccg ggtacttaca ttggctttat taccaacggt 4980
tcgggcgctg aaatcccagt gtttacgatt gctttctcta cgagctcatt gggtgaatac 5040
acctttactc tgcttgaagc gttagaccat gtagatggtt tagataagaa cgatctgagc 5100
ttcgatctgc ctgtttatgc ggtcgatacg gacggcgatg attcattggt gtctcagcta 5160
aacgtgacca tcggtgatga tgtccaaatc atgcaagacg gtacgttaga tatcatcgag 5220
ccaaatctgg ctgatggaac aatcacaacc agcactattg atgtgatgcc aaaccaaagt 5280
gctgatggtg cgacgatcac tcagtttact tatgacggtc agctaagaac gcttgatcaa 5340
aatgacactg gcgaacagca gttcagcttc acagaaggcg agttgtttat cacccttgaa 5400
ggtgaagtgc gctttgagcc aaaccgagac ctagaccaca ccgcgagtga agatattgtt 5460
aagtcgattg tggtcacttc aagtgatttc gataacgact ctctgacttc taccgtaacg 5520
ctgaccatta ctgatggtga taaccctacg atcgacgtca ttccaagcgt taccctttct 5580
gaaactaatc tgagtgatgg ctctgctcca agtggcagcg cggtaagctc gactcaaact 5640
attactttta ccaatcaaag tgatgatgtg gttcgtttcc gtattgagcc aacggagttc 5700
aatactaacg atgatcttaa atcgaacggt ttagccgttg agttacgtga agacccggct 5760
gggtcgggtg actacattgg ttttactact agtgcgacga atgtcgaaac cacggtattt 5820
acgctgagtt tttctagcac cacattaggt gaatatacct tcactttgct tgaagcgttg 5880
gaccaccaag atgcccgtgg caacaacgac ctcagttttg aactgcctgt ttatgcggta 5940
gacagtgatg gcgatgattc actgatgtct ccgttaaacg tcaccatcgg cgatgatgtt 6000
caaatcatgc aagacggtac gttagatatc gtcgagccaa ccgtcgcaga tttggccgct 6060
ggcattgtga caactaacac cattgatgtg atgccaaatc aaagtgccga tggcgcgacg 6120
atcactcaat tcacttatga tggccaactt cgaacacttg accaaaatga caatggcgaa 6180
caacagttta gcttcacgga aggtgaacta ttcatcactc ttgaaggtga agtgcgcttt 6240
gagcctaatc gtaatctaga ccacacgctg aacgaagaca tcgtgaaatc gatcgtggtg 6300
acgtctagtg actccgataa cgatgtgttg acctcaaccg tcactctgac cattaccgat 6360
ggtgatatcc caaccattga taatgtgcca acagtgagct tgtcagaaac aagtctgagt 6420
gacggctctt caccaagtgg cagcgcagtt agctcaactc aaaccatcac ttacaccact 6480
caaagtgatg atgtaaccag cttccgtatt gaaccgactg agttcaatgt tggcggtgct 6540
ctcaaatcaa atggattggc ggttgagctg aaggccgatc caaccactcc gggcggctac 6600
atcggctttg tgactgatgg ttcgaacgtt gaaactaacg tgttcacgat tagcttctcg 6660
gataccaatt taggtcaata caccttcacc ttgcttgaag cgttggatca tgcggatagc 6720
cttgcaaata acgatctgag ctttgatctg ccagtctacg ccgtcgatag tgatggcgat 6780
gattcactgg tgtctcaact caatgtaacc atcggtgatg atgttcaaat catgcaaggt 6840
ggtacgttag atatcactga gccaaacctt gcagacggca caaccacaac taacaccatc 6900
gatgtgatgc cagaacaaag tgccgatggt gcgacgatca ctcagtttac gtatgacggg 6960
caagttcgca ctctggatca aactgacaat ggtgagcagc aatttagctt cactgaaggc 7020
gagttgttca tcactcttca aggtgacgtg cgtttcgaac ccaatcgcaa cctagatcac 7080
acagctagcg aagacatcgt gaagtcgata gtggtgactt caagcgattc agataacgat 7140
gtggtgacgt caacggtcac tctgactatt actgatggtg atctcccaac cattgatgca 7200
gtgccaagcg ttactctgtc tgaaactaat cttagtgacg gctctgcgcc aagtggcagc 7260
gcagtcagtc aaactgagac catcaccttt accaatcaaa gtgatgatgt ggcgagtttc 7320
cgtattgagc caaccgagtt taatgtgggc ggtgcactga aatcgaatgg gtttgcggtt 7380
gagataaaag aagactctgc taatccgggt acttacattg gctttattgc caatggttcg 7440
agcgctgaaa tcccagtgtt cacgattgct ttctctacga gtacgttggg tgaatacacc 7500
tttactctgc ttgaagcgtt agaccatgcg gatggtttag ataagaacga tctgagcttt 7560
gagcttccgg tttacgcggt tgatacagac ggtgatgatt cattggtatc tcagcttaat 7620
gtgaccattg gtgatgatgt tcaaatcatg caagatggta cgttagacgt tatcgagcca 7680
aatcttgcag acggcacaat cacaaccaac accattgatg tgatgcccga gcaaagtgct 7740
gatggtgcga cgatcactca gtttacttat gacggtcagc taagaacgct tgatcaaaat 7800
gacactggtg aacagcagtt cagcttcaca gaaggcgagt tgtttatcac ccttgaaggt 7860
gaagtgcgct ttgaacctaa tcgcgatcta gaccattccg ttagcgaaga catcgtgaag 7920
tcgatagtag tgacttcaag cgacttcgat aacgatccgg tgacttcagc cattacgctg 7980
accattactg atggtgataa tccgactatc gattcggtac cgagcgttgt acttgaagaa 8040
gctgatttaa ctgatggctc atcgccaagt ggcagcgcgg ttagtcaaac ggaaaccatc 8100
actttcacta atcaaagtga cgatgttgag aaattccgtt tagaaccaag tgaatttaat 8160
actaacaacg cgctcaagtc cgatggcttg atcattgaga ttcgagagga accaacagga 8220
tccggcaatt atattggttt cacgaccgat atttcgaatg tcgaaaccac tgtgtttaca 8280
ctcgatttca gcagtaccac tttgggtgag tacaccttca cgcttctgga agcgattgac 8340
cacacgcctg ttcaaggcaa taacgatcta acattcaact tgccagtcta cgcggttgat 8400
agcgacggtg atgattcgct aatgtcatca ctatcggtga cgattactga tgatgttcaa 8460
gtgatggtga gtggttcgct tagtatcgaa gagcctactg ttgccgactt ggctgcaggc 8520
acgccaacaa catcagtatt tgatgtatta acatccgcga gtgctgatgg ggcgaccatt 8580
actcagttca cttatgatgg tggggcggta ttaacgcttg atcaaaacga tacaggtgag 8640
cagaagttcg tggttgctga tggggcatta tatatcactc tgcaaggcga tattcgtttc 8700
gaaccaagtc gtaaccttga ccatactggt ggcgatatcg tcaagtcgat agtcgtaact 8760
tcaagtgatt ccgatagcga tcttgtgtct tcaacggtaa cgctaaccat tactgatggc 8820
gatatcccaa cgattgacac ggtgccaagc gttactctgt cagaaacgaa tctgagcgac 8880
ggatctgctc cgaatgcaag tgcggtaagt tcaactcaaa ccattacctt tactaaccaa 8940
agtgatgacg tgacgagttt ccgtattgaa ccgactgatt ttaatgttgg tggtgctctg 9000
aaatcgaacg gattggcggt cgaactgaaa gcggacccaa ctacaccggg tggctacatc 9060
ggttttgtga ctgatggttc gaacgttgaa actaacgtgt ttacgattag cttctcggat 9120
accaatttag gtcaatacac cttcaccctg cttgaagcgt tggatcatgt agatggctta 9180
gtgaagaatg atctgacttt tgatcttcct gtttatgcgg ttgatagcga tggtgatgat 9240
tcactggtgt ctcaactgaa tgtgaccatt ggtgatgatg tacaggtcat gcaaaaccaa 9300
gcgcttaata ttattgagcc aacggttgct gatttggctg caggtactcc gacgacagcc 9360
actgttgatg tgatgcctag ccaaagtgcc gatggcgcga caatcactca gtttacttac 9420
gatggcgggg cggcaataac actcgaccaa aacgacaccg gtgaacagaa gtttgtattt 9480
actgaaggtt cactgtttat caccttgcaa ggtgaagtgc gtttcgagcc aaatcgcaat 9540
ctaaaccaca cagcgagcga agacatcgtg aagtcgattg tggtgacttc aagcgattta 9600
gataacgatg tactgacgtc aacggtcact ctgactatta ctgatggtga tatcccaacc 9660
attgatgcag tgccaagcgt tactctgtct gaaactaatc ttagtgacgg ctcagcgcca 9720
agcagcagtg ctgtaagtca aacagagacg attaccttca tcaatcaaag tgatgatgtg 9780
gcgagtttcc gtattgagcc aacagagttc aatgtgggcg gtgcactgaa atcgaatgga 9840
tttgcggttg agataaaaga agattcggct aatccgggta cttatatcgg ttttattacc 9900
gatggttcga atactgaagt tcctgtattc acgattgctt tctctacaag tacgttgggc 9960
gaatacacct tcaccttact tgaagcgcta gaccatgcaa atggcctaga taagaacgat 10020
ctgagttttg atcttcctgt ttatgcggta gacagtgatg gcgatgattc actggtgtct 10080
caactgaatg tgaccattgg tgatgatgtc caaataatgc aagacggtac gttagatatc 10140
actgagccaa atcttgcaga cggaacaatc acaaccaaca ccattgatgt gatgccaaat 10200
cagagtgccg atggtgcgac gatcactgaa ttctcatttg gcggtattgt caaaacactc 10260
gatcaaagca tcgtaggtga gcagcagttt agtttcaccg aaggtgagct attcatcact 10320
cttcaaggtc aagtgcgctt tgaaccaaat cgtgaccttg accactctgc cagcgaagac 10380
atcgtgaagt cgatagtggt tacttcaagt gattttgata acgatcctgt gacttcaacc 10440
gttacgctga ccattaccga tggtgatatt ccaactatcg atgcggtacc aagtgttacg 10500
ctttcagaaa caaacctagc tgatggttct gcgccaagtg gtagtgcggt tagtcaaacg 10560
gagacgatta cttttaccaa tcaaagtgat gatgtggttc gcttccgtct ggaaccaacc 10620
gagttcaata ctaacgatgc acttaaatcg aatggcttag cggtcgaact gcgcgaagaa 10680
cctcaaggct ctggtcagta cattggcttt accaccagtt cgtctaatgt tgagacaaca 10740
gtatttacgt tggactttaa ctccggaacc ttaggtgaat acacatttac tttaatcgaa 10800
gctctggatc atcaagatgc gcgtggcaac aacgatttaa gctttaatct acctgtgtat 10860
gcggtggata gtgatggcga tgactcgtta gtctctcagc ttggcgtgac cattggcgac 10920
gatgtgcagt tgatgcaaga cggcacaatc accagtcgtg agcctgcagc aagtgttgaa 10980
acatcaaata cctttgatgt gatgccaaac caaagtgctg atggagccaa agtcacttca 11040
tttgttttcg atggtaagac tgcagaaagt cttgatttga atgtgaatgg tgaacaagag 11100
ttcgtcttca cggaaggttc ggtatttatt acgacggaag gtgagatacg attcgagccg 11160
gtacgtaatc aaaatcatgc tggtggtgat attaccaagt cgattgaggt gacgtctgtt 11220
gacctcgatg gcgatattgt cacatcgaca gtgacactga agattgttga tggtgacctt 11280
cctactatcg accttgttcc cggaattacg ttatctgaag tggatctggc cgatggctct 11340
gtgccaaccg gtaatccagt gacaatgaca caaaccatta cctacacagc gggtagtgac 11400
gacgtaagcc atttcagaat tgaccctacg cagttcaata cttcaggggt tttgaaatcg 11460
aacggcctag atgtcgaaat aaaagagcag ccagctaatt ctggtaatta cattggcttc 11520
gtcaaagacg gttctaacgt agaaaccaac gtcttcacga tcagcttctc gacgagcaat 11580
ttagggcaat acacgttcac actacttgaa gcgttagatc atgtagatgg attgcaaaac 11640
aatatactaa gcttcgatgt ccctgtttta gcggttgatg cggatggtga tgattctgca 11700
atgtcgccta tgacggttgc gatcaccgat gacgtacaag gtgttcaaga tggcaccttg 11760
agtatcactg agccttcatt agctgatttg gcatcgggta cgccaccaac gacggcaatc 11820
attgatgtta tgccaacgca gagtgctgat ggcgcgaaag taacacagtt tacttacgat 11880
ggtggcacag ctgtaacgtt agacccaagc atcgccacag aacaagtctt taccgtaacc 11940
gatggcttac tgtacatcac cattgaaggg gaggttcgtt ttgagccgag ccgagatcta 12000
gaccattcat ctggcgatat cgtaagaacg attgtcgtca ccaccagtga ttttgataac 12060
gatacagata ccgcggatgt cactttgacg atcaaagacg gtatcaatcc cgttatcaat 12120
gtggttccag atgttaactt atcggaagtt aatctagcgg atggctcgac gccaagtggt 12180
tctgcagtca gttcgactca cacaatcact tacaccgaag gaagtgatga ttttagtcac 12240
tttagaattg cgaccaacga attcaatcct ggcgatctgt tgaaatcaag tggtcttgtt 12300
gttcaactaa aagaagatcc tgcttctgct ggtgattaca ttggttatac cgatgatggt 12360
atgggtaacg ttaccgatgt atttaccatt agctttgata gtgcaaacaa agctcagttt 12420
acatttacct tgattgaggc gcttgatcac cttgatggtg tgctttacaa cgatcttacg 12480
ttccgtttgc ctatctatgc tgttgataca gatgattctg aatcaacaaa gcgcgatgtg 12540
gtggttacga tagaagatga catccagcaa atgcaagatg gcttcttaac cattaccgag 12600
ccaaattctg gtactccaac aacaactacc gttgatgtga tgccaatacc aagtgcagac 12660
ggtgcgacta ttacgcagtt cacgtatgac ggtggttctc caattactct gaatcaaagc 12720
atcagcggcg aacaagagtt tgttttcact gaaggttcac tgtttgtgac actagatggt 12780
gatgtaaggt ttgagccaaa tagaaacctt gatcactctg cgggcgacat tgttaaatcg 12840
attgtgttca cgtcttcaga ctttgataac gacatcttct catcaaaagt cactctcacc 12900
attgttgatg gtgatgggcc aacaatcgac gttgtgccgg gtgtggcatt gtcagaaagc 12960
ttacttgcgg atggttcgac gcctagcgta aatcccgtga gtatgactca aaccattact 13020
tcacttgcaa gtagtgatga tattgctgaa atagtggtgg aagtcgggtt gttcaatacc 13080
aacggcgcgt tgaagtcgga tggtttgtca ctgagtttac gtgaagaccc tgtaaattca 13140
ggcgactaca ttgcatttac tactaatggt tcgggtgttg agaaagttat cttcactctg 13200
gattttgatg atacgaatcc gagtcaatat acgtttactc tgcttgaacg tttagaccat 13260
gttgatggct taggaaataa cgatctgagt tttgatcttt ctgtttatgc agaagatacc 13320
gatggtgata tttcagcgtc taaaccgctt acagtcacca tcaccgatga tgttcagctc 13380
atgcaatccg gtgcgctcaa cattactgag ccaaccacag gaacaccgac tacagcagtc 13440
tttgatgtga tgcctgcgca aagtgcagat ggcgcgacaa tcactaagtt tacctatggc 13500
agccaacctg aagagtctct ggtacaaacc gtcacgggtg agcaagaatt tgtgttcact 13560
gaaggttctc tgtttatcaa tcttgaaggt gatgtacgtt tcgaacctaa ccgtaatctc 13620
gatcattcgg gtggtaacat cgttaagacc attacggtga catcggaaga taaagatggc 13680
gatattgtca cttcaacagt gacgctgact attgtagatg gcgcgccacc agtaatagac 13740
acagtaccaa cggttgcatt ggaagaagcg aatctggtcg acggatcttc accgggttta 13800
cctgttagcc aaactgaaat cattactttc acagcaggaa gtgatgatgt gagccacttc 13860
cgtattgatc cggctcaatt caacacatca ggcgatctga aagcggatgg tttggtggtt 13920
cagttaaaag aagatcctct aaacagcgat aattatattg gttacgttga aagcggcggt 13980
gtccaaacgg atatcttcac catcaccttt agcagcgtgg ttctaggaga gtacacattc 14040
accttgttgg aagagttaga tcacctgcct gtacaaggta acaatgatca aatcttcacc 14100
ttgccagtga tcgcagtcga caaagacaac actgactcag cggtgaaacc tcttacggtg 14160
accattaccg atgatgttcc aaccattact gacaccaccg gcgccagtac gtttgtggtt 14220
gatgaagatg atttgggcac tctggcacaa gcgacgggtt cgtttgtaac cacagaaggt 14280
gcagatcaag tcgaggttta cgaactacgt aatatatcaa cgttggaagc aacgctatcg 14340
tcgggcagtg aaggtattaa gatcactgag atcacaggtg ctgctaacac gaccacctac 14400
caaggggcga ccgacccaag tggaacgcca attttcacat tagtgctgac tgatgatggt 14460
gcctacacct ttaccttgct tggccctctc aatcacgcta cgacaccgag taacctcgat 14520
acattaacaa taccatttga tgttgttgcc gttgacggtg atggcgatga ttctaaccaa 14580
tatgtattgc caatcgaggt gctagatgat gtgcctgtaa tgacggcgcc gacgggtgaa 14640
acggttgttg atgaagacga tcttactggc attggttccg atcaatctga agatacaatt 14700
atcaatggac tgttcaccgt tgatgaaggt gcggatggcg ttgtgctgta tgagctggtt 14760
gatgaagatt tggttctgac gggcttaacc tctgatggag aaagcttaga gtggctagct 14820
gtttcacaaa acggcacaac atttacttac gttgctcaaa ctgcaacgag taatgaagcg 14880
gtgttcgaga ttattttcga cacctcggat aacagctacc aatttgaatt atttaagcca 14940
ctgaagcacc ctgacggtgc aaacgagaac gcgatagatc ttgatttctc aatcgttgct 15000
gaagattttg atcaagacca atcggatgcg atcggtctaa aaattacggt aaccgatgat 15060
gttccgttag tgacaactca atcgattact cgtcttgaag gtcaggggta tggcaactct 15120
aaagtcgaca tgtttgccaa tgcaacagat gtgggggctg atggcgcggt actgagtcga 15180
attgagggta tctcaaataa tggtgcagat attgttttcc gtagcgggaa caatgggcca 15240
tatagtagcg gcttcgattt aaacagcggt agccaacaag ttcgagtcta cgagcaaaca 15300
aatggcggtg ctgatactcg tgaacttggc cgtctacgca tcaactcaaa tggtgaggtt 15360
gaattcagag ctaacggcta tctcgatcat gacggtgatg acaccatcga cttctcgatt 15420
aacgtgattg ccacagatgg agatttagac acctctgaaa caccgttaga tattacgatt 15480
actgataggg attctacaag aattgcgctg aaagtgacga ccttcgagga tgcgggtaga 15540
gactcaacca taccttacgc aacaggtgat gagccgactc ttgagaatgt tcaagataac 15600
caaaatggtt tgccgaatgc gccagcgcaa gttgcgctgc aagttagtct gtatgaccaa 15660
gataacgctg aatctattgg gcagttgacg attaaaagcc cgaacggagg tgatagtcat 15720
caaggtactt tttattactt tgatggtgct gactacatag aattagtgcc tgagtcaaat 15780
gggagcatta tatttggctc tcctgaactc gaacaaagct tcgctccaaa cccgagtgaa 15840
ccaagacaaa ctatcgcgac gatagacaac ctgttctttg ttccagacca acacgctagt 15900
tcggatgaaa ctggtgggcg agttcgttat gagcttgaaa ttgagaaaaa tggcagtacg 15960
gatcacaccg ttaattcaaa cttcagaatt gagattgaag ctgtagctga tattgcgact 16020
tgggatgatt ccaacagcac gtatcagtat caagtcaacg aagatgaaga caatgtcacg 16080
ttgcagctga acgcagagtc tcaagataac agtaatactg agacgattac ctatgaactt 16140
gaagccgttc aaggcgacgg gaagtttgag ttacttgatc aaaatggcaa tgtgttaacg 16200
cccgttaatg gtgtttatat catcgcatct gctgatatca atagcaccgt agttaaccct 16260
attgataact tctcagggca gattgagttc aaagcgacgg caattacgga agagacgctt 16320
aacccatacg atgattcaga caacggtgga gcaaacgata agacgacggc tcgttctgtg 16380
gaacaaagta ttgttattga tgtgaccgca gatgcggacc ctggcacatt cagtgttagt 16440
cgaattcaga tcaacgaaga caatatcgat gatccagatt acgtcgggcc tttggacaat 16500
aaagacgcgt tcacgttaga cgaagtcatc accatgacag ggtcggtcga ttctgacagt 16560
tctgaagaac tgtttgtgcg catcagtaat gttacggaag gagctgtgct ttacttctta 16620
ggcaccacga cagtcgttcc gaccatcacg atcaatggtg tggattatca agaaatcgcg 16680
tattccgatt tggctaacgt tgaggttgtt ccaaccaaac acagtaatgt cgatttcacc 16740
ttcgatgtta cgggagtggt caaagatacg gcaaatctat ccacgggcgc ccaaatcgat 16800
gaggagatac taggaactaa aaccgtcaac gttgaagtca aaggcgttgc cgatactcct 16860
tatggtggaa cgaatggcac ggcttggagt gcaattacag atggcactac atctggtgtt 16920
caaaccacga ttcaagagag ccaaaatggt gatacctttg ctgagcttga tttcaccgtg 16980
ttgtcgggag agagaagacc agatactggc actacaccat tagctgacga tgggtcagaa 17040
tcaataaccg ttattctatc gggtataccc gatggggttg ttctagaaga cggtgacggt 17100
acagtgattg accttaactt tgtcggttat gaaaccggac cgggcggtag tcctgactta 17160
tccaaaccta tctacgaagc gaacattact gaggcgggta aaacttcagg cattcgcatc 17220
agacctgtcg actcttcaac cgagaatatt cacattcaag gtaaagtgat tgtgactgag 17280
aacgatggtc acacgcttac gtttgatcaa gaaattcgag tgcttgttat acctcgaatc 17340
gacacatcag caacttatgt caatacgact aacggtgatg aagatacggc tatcaatatt 17400
gattggcacc ctgaaggcac ggattacatt gatgacgatg agcatttcac taagataact 17460
attaatggaa taccactggg tgttactgca gtagtcaacg gtgatgtgac cgttgatgac 17520
tcaaccccag gaacattgat tataacgcct aaagatgctt cccaaactcc tgaacaattt 17580
actcaaattg cattagctaa taacttcatt caaatgacgc ctccggctga ttctagtgca 17640
gattttacgt tgaccaccga acttaaaatg gaagagcgag atcatgagta tacgtctagc 17700
ggcctagagg atgaagatgg tggttatgtc gaagccgatc cagatataac cggaatcatt 17760
aacgttcaag tacgacctgt ggttgaacct ggagatgccg acaacaagat tgtcgtttca 17820
aacgaagatg gctctggaga tctcactacg attacggctg atgctaatgg tgtcattaaa 17880
tttacaacta acagtgataa ccaaacgact gatactaacg gagacgaaat ctgggacggt 17940
gaatacgtcg tccgatacca agaaacggat ttaagcacag tagaagagca agtcgacgaa 18000
gtgattgttc agctgactaa caccgatgga agcgcgttat ctgatgatat tttagggcaa 18060
cttttagtaa ctggtgcctc ttacgaaggc ggtggccgat gggttgtgac caatgaagat 18120
gcctttagcg tcagtgcgcc caatggatta gatttcaccc ctgccaatga tgcggatgat 18180
gtagctactg atttcaatga tatcaagatg acaattttca ctttggtctc agatcctggt 18240
gatgctaaca atgaaacgtc cgcccaagtg caacgcaccg gagaagtaac gctttcttat 18300
cctgaagtgc tgacggcacc tgacaaagtt gccgcagata ttgcgattgt gccagacagt 18360
gttatcgacg ctgttgagga tactcagctt gatctcggcg cggcactcaa cggcattttg 18420
agcttgacgg gtcgcgatga ttctactgac caagtgacgg tgatcatcga tggcactctg 18480
gtcattgatg ctacaacatc attcccaatt agcctgtcgg gaacaagtga tgttgacttt 18540
gtgaatggga aatatgttta cgagacgact gttgagcagg gcgtagccgt cgattcatcg 18600
ggtttgttat tgaatctgcc accaaactac tctggtgact ttaggttgcc aatgaccatc 18660
gtgaccaaag atttacaatc tggtgatgag aagaccttag tgactgaagt tatcatcaaa 18720
gtcgcaccag atgctgagac ggatccaacg attgaggtga atgtcgtggg ttcgcttgat 18780
gatgccttta atcctgttga taccgacggt caagctgggc aagatccggt gggttacgaa 18840
gacacctata ttcaactcga cttcaattcg accatttcgg atcaggtttc cggcgtcgaa 18900
ggcggccaag aagcgtttac gtccattact ttaacgttgg acgacccttc tataggtgca 18960
ttctatgaca acacgggtac ttcattaggt acatctgtta cgtttaatca ggctgaaata 19020
gcagcgggtg cactcgataa cgtgctcttt agggcaatcg aaaattaccc aacgggtaat 19080
gatattaacc aagtgcaggt taatgtcagc ggtacagtca cagataccgc aacctataat 19140
gatcctgctt ctcctgcggg tacggcaaca gactcagata ctttctctac gagtgtcagc 19200
tttgaagtcg ttcctgtggt cgatgacgtg tctgtcactg gaccgggtag cgatcctgat 19260
gttatcgaga ttactggcaa cgaagaccag ctcatttctt tgtcggggac agggcctgta 19320
tcgattgcac tgactgacct tgatggttca gaacagtttg tatcgattaa gttcacagat 19380
gtccctgatg gcttccaaat gcgtgcagat gctggctcga catataccgt gaaaaataat 19440
ggtaatggag agtggagtgt tcaactgcct caagcttcgg ggttgtcatt cgatttaagt 19500
gagatttcga tcttgccgcc taaaaacttc agtggtaccg ctgagtttgg tgtggaagtc 19560
ttcactcaag aatcgttgct gggtgtgcct actgcggcgg caaacttgcc aagcttcaaa 19620
ctgcatgtgg tacctgttgg tgacgatgtt gataccaatc cgactgattc tgtaacaggc 19680
aacgaaggcc aaaacattga tatcgaaatc aatgcgacta ttttggataa agaattgtct 19740
gcaacaggaa gcgggacgta taccgagaat gcgcccgaaa cgcttcgagt tgaagtggcg 19800
ggtgttcctc aagatgcttc tattttctat ccagatggca cgacattggc tagctacgat 19860
ccggcgacgc agctctggac tctcgatgtt ccagctcagt cgttagataa gatcgtattt 19920
aactctggcg aacataatag tgatacaggc aatgtactgg gtatcaatgg tccactgcag 19980
attacggtac gttcagtaga tactgatgct gataatacag agtacctagg tacgccaacc 20040
agcttcgatg tcgatctggt gattgatcct attaacgatc aaccgatctt tgtgaacgta 20100
acgaatattg aaacatcgga agacatcagt gttgccatcg acaactttag tatctacgac 20160
gtcgacgcaa actttgataa tccagatgct ccgtatgaac tgacgcttaa agtcgaccaa 20220
acactgccgg gagcgcaagg tgtgtttgag tttaccagct ctcctgacgt gacgtttgta 20280
ttgcaacctg acggctcatt ggtgattacc ggtaaagaag ccgacattaa taccgcattg 20340
actaatggag ctgtgacttt caaacccgac ccagaccaga actacctcaa ccagactggt 20400
ttagtcacaa tcaatgcaac gctcgatgat ggtggtaata acggtttgat tgacgcggtt 20460
gatccgaata ccgctcaaac caatcaaact accttcacca ttaaggtgac ggaagtgaat 20520
gacgctcctg tggcgactaa cgttgattta ggctcgattg cggaagacgc tcaaatcgtg 20580
attgttgaga gtgacttgat tgcagccagt tctgatctag aaaaccataa tctcacagta 20640
accggtgtga ctcttactca agggcaaggt cagcttacac gctatgaaaa tgctggtggt 20700
gctgatgacg cagcgattac ggggccattc tggatattca ttgcagataa tgatttcaac 20760
ggcgacgtta aattcaatta ctccattatc gatgatggta ccaccaacgg tgtggatgat 20820
tttaaaaccg atagcgctga aatcagcctt gtagttactg aagtcaatga ccagccagtg 20880
gcatcgaaca ttgatttggg caccatgctt gaagaaggac agctggtcat taaagaggaa 20940
gacctgattt ccgcaaccac tgatccggaa aacgacacga ttactgtgaa cagtttggtg 21000
ctcgatcaag gtcagggcca attacaacgc tttgagaacg tgggcggtgc tgatgatgct 21060
acgatcactg gcccgtactg ggtatttact gcagccaacg aatacaacgg tgatgttaag 21120
ttcacttata ccgttgagga cgatggtaca accaacggcg ctgatgattt cttaacagat 21180
accggcgaaa ttagcgttgt ggtaacggaa gtgaatgatc aaccggtggc aacggatatc 21240
gacttaggaa acatccttga agaagggcag ttgatcatca aagaggaaga cttaattgct 21300
gctacgagcg atccggaaaa cgacacgatt accgtgacca atctggtgct cgacgaaggc 21360
caaggccagt tacagcgctt tgagaacgtg ggcggtgctg atgacgctat gattactggc 21420
ccgtactgga tatttacggc tgctgatgaa tacaacggta acgttaagtt cacctatacc 21480
gtcgaggatg atggtacaac caacggcgct aatgatttcc taacggatac tgcagagatc 21540
acagcgattg tcgacggagt gaacgatacg cctgttgtta atggtgacag tgtcactacg 21600
attgttgacg aggatgctgg tcagctattg agtggtatca atgtcagtga cccagattat 21660
gtggatgcat tttctaatga cttgatgaca gtcacgctga cagtggatta cggtacattg 21720
aacgtatcac ttccggcagt gacgacagtg atggtcaacg gcaacaacac tggttcggtt 21780
atcttagttg gtactttgag tgacctgaat gcgctgattg atacgccaac cagtccaaac 21840
ggtgtctacc tcgatgcgag cttgtctcca accaatagca ttggcttaga agtaatcgcc 21900
aaagacagcg gtaacccttc tggtatcgcg attgaaactg caccagtggt ttataatatc 21960
gcagtgacac cagtcgctaa tgcgccaacc ttgtctattg atccggcatt taactatgtg 22020
agaaacatta cgaccagctc atctgtggtc gctaatagtg gagtcgcttt agttggaatt 22080
gtcgctgcat tgacggacat tactgaagag ttaacgttga agatcagcga tgttccggat 22140
ggtgttgatg taaccagtga tgtgggtacg gtttcgttgg tgggtgatac ttggatagcg 22200
accgctgatg cgatcgatag tctcagactc gtagagcagt catcattagg taaaccgttg 22260
accccgggta attacacctt gaaagttgag gcgctatctg aagagactga caacaacgat 22320
attgcgatat ctcaaaacat cgatctgaat ctcaatattg ttgccaatcc aatagatctc 22380
gatctgtctt ctgaaacaga cgatgtgcaa cttttagcga gtaactttga tactaacctc 22440
actggcggaa ctggaaatga ccgacttgta ggtggagcgg gtgacgatac gctggttggc 22500
ggtgacggta acgacacact cattggtggc ggcggttccg atattctaac cggtggcaat 22560
ggtatggatt cgtttgtatg gctcaatatt gaagatggcg ttgaagacac cattaccgat 22620
ttcagcctgt ctgaaggaga ccaaatcgac ctacgagaag tattacctga gttgaagaat 22680
acatctccag acatgtctgc attgctacaa cagatagacg cgaaagtgga aggggatgat 22740
attgagctta cgatcaagtc tgatggttta ggcactacgg aacaggtgat tgtggttgaa 22800
gaccttgctc ctcagctaac cttaagtggc accatgcctt cggatatttt ggatgcgtta 22860
gtgcaacaaa atgtcatcac tcacggttaa                                  22890
 
<210>4
<211>7629
<212>PRT
<213>灿烂弧菌
 
<400>4
Met Leu Cys Asp Asn Gly Gly Cys Met Asp Ile Glu Val Ser Arg Gln
 1               5                  10                  15
Val Ala Val Val Glu Ala Thr Ser Gly Asp Val Val Val Val Lys Pro
            20                  25                  30
Asp Gly Ser Ala Arg Lys Val Ser Val Gly Asp Thr Ile Arg Glu Asn
        35                  40                  45
Glu Ile Val Ile Thr Ala Asn Lys Ser Glu Leu Val Leu Gly Val Gln
    50                  55                  60
Asn Asp Ser Ile Pro Val Ala Glu Asn Cys Val Gly Cys Val Asp Glu
65                  70                  75                  80
Asn Ala Ala Trp Val Asp Ala Pro Ile Ala Gly Glu Val Asn Phe Asp
                85                  90                  95
Leu Gln Gln Ala Asp Ala Glu Thr Phe Thr Glu Asp Asp Leu Ala Ala
            100                 105                 110
Ile Gln Glu Ala Ile Leu Gly Gly Ala Asp Pro Thr Gln Ile Leu Glu
        115                 120                 125
Ala Thr Ala Ala Gly Gly Gly Leu Gly Ser Ala Asn Ala Gly Phe Val
    130                 135                 140
Thr Ile Asp Tyr Asn Tyr Thr Glu Thr His Pro Ser Thr Phe Phe Glu
145                 150                 155                 160
Thr Ala Gly Leu Ala Glu Gln Thr Val Asp Glu Asp Arg Glu Glu Phe
                165                 170                 175
Arg Ser Ile Thr Arg Ser Ser Gly Gly Gln Ser Ile Ser Glu Thr Leu
             180                 185                 190
Thr Glu Gly Ser Ile Ser Gly Asn Thr Tyr Pro Gln Ser Val Thr Thr
        195                 200                 205
Thr Glu Thr Ile Ile Ala Gly Ser Leu Ala Leu Ala Pro Asn Ser Phe
    210                 215                 220
Ile Pro Glu Thr Leu Ser Leu Ala Ser Leu Leu Ser Glu Leu Asn Ser
225                 230                 235                 240
Asp Ile Thr Ser Ser Gly Gln Ser Val Ile Phe Thr Tyr Asp Ala Thr
                245                 250                 255
Thr Asn Ser Ile Val Gly Val Gln Asp Thr Asp Glu Val Leu Arg Ile
            260                 265                 270
Asp Ile Asp Ala Val Ser Val Gly Asn Asn Ile Glu Leu Ser Leu Thr
        275                 280                 285
Thr Thr Ile Ser Gln Pro Ile Asp His Val Pro Ser Val Gly Gly Gly
    290                 295                 300
Gln Val Ser Tyr Thr Gly Asp Gln Ile Asp Ile Ala Phe Asp Ile Gln
305                 310                 315                 320
Gly Glu Asp Thr Ala Gly Asn Pro Leu Ala Thr Pro Val Asn Ala Gln
                325                 330                 335
Val Ser Val Phe Asp Gly Ile Asp Pro Ser Val Glu Ser Val Asn Ile
            340                 345                 350
Thr Asn Val Glu Thr Ser Ser Ala Ala Ile Glu Gly Thr Phe Ser Asn
        355                 360                 365
Ile Gly Ser Asp Asn Leu Gln Ser Ala Val Phe Asp Ala Ser Ala Leu
    370                 375                 380
Asp Gln Phe Asp Gly Leu Leu Ser Asp Asn Gln Asn Thr Leu Ala Arg
385                 390                 395                 400
Leu Ser Asp Asp Gly Thr Thr Ile Thr Leu Ser Ile Gln Gly Arg Gly
                405                 410                 415
Glu Val Val Leu Thr Ile Ser Leu Asp Thr Asp Gly Thr Tyr Lys Phe
            420                 425                 430
Glu Gln Ser Asn Pro Ile Glu Gln Val Gly Thr Asp Ser Leu Thr Phe
        435                 440                 445
Ala Leu Pro Ile Thr Ile Thr Asp Phe Asp Gln Asp Val Val Thr Asn
    450                 455                 460
Thr Ile Asn Ile Ala Ile Thr Asp Gly Asp Ser Pro Val Ile Thr Asn
465                 470                 475                 480
Val Asp Ser Ile Asp Val Asp Glu Ala Gly Ile Val Gly Gly Ser Gln
                485                 490                 495
Glu Gly Thr Ala Pro Val Ser Gly Thr Gly Gly Ile Thr Ala Asp Ile
            500                 505                 510
Phe Glu Ser Asp Ile Ile Asp His Tyr Glu Leu Glu Pro Thr Glu Phe
        515                 520                 525
Asn Thr Asn Gly Thr Leu Val Ser Asn Gly Glu Ala Val Leu Leu Glu
    530                 535                 540
Leu Ile Asp Glu Thr Asn Gly Val Arg Thr Tyr Glu Gly Tyr Val Glu
545                 550                 555                 560
Val Asn Gly Ser Arg Ile Thr Val Phe Asp Val Lys Ile Asp Ser Pro
                565                 570                 575
Ser Leu Gly Asn Tyr Glu Phe Asn Leu Tyr Glu Glu Leu Ser His Gln
            580                 585                 590
Gly Ala Glu Asp Ala Leu Leu Thr Phe Ala Leu Pro Ile Tyr Ala Val
        595                 600                 605
Asp Ala Asp Gly Asp Arg Ser Ala Leu Ser Gly Gly Ser Asn Thr Pro
    610                 615                 620
Glu Ala Ala Glu Ile Leu Val Asn Val Lys Asp Asp Val Val Glu Leu
625                 630                 635                 640
Val Asp Lys Val Glu Ser Val Thr Glu Pro Thr Leu Ala Gly Asp Thr
                645                 650                 655
Ile Val Ser Tyr Asn Leu Phe Asn Phe Glu Gly Ala Asp Gly Ser Thr
            660                 665                 670
Ile Gln Ser Phe Asn Tyr Asp Gly Val Asp Tyr Ser Leu Asp Gln Ser
        675                 680                 685
Leu Leu Pro Asp Ala Thr Gln Ile Phe Ser Phe Thr Glu Gly Val Val
    690                 695                 700
Thr Ile Ser Leu Asn Gly Asp Phe Ser Phe Glu Val Ala Arg Asp Ile
705                 710                 715                 720
Asp His Ser Ser Ser Glu Thr Ile Val Lys Gln Phe Ser Phe Leu Ala
                725                 730                 735
Glu Asp Gly Asp Gly Asp Thr Asp Ser Ser Thr Leu Glu Leu Ser Ile
            740                 745                 750
Thr Asp Gly Gln Asp Pro Ile Ile Asp Leu Ile Pro Pro Val Thr Leu
        755                 760                 765
Ser Glu Thr Asn Leu Asn Asp Gly Ser Ala Pro Ser Gly Ser Thr Val
    770                 775                 780
Ser Ala Thr Glu Thr Ile Thr Phe Thr Ala Gly Ser Asp Asp Val Ala
785                 790                 795                 800
Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn Val Gly Gly Ala Leu Lys
                805                 810                 815
Ser Asn Gly Phe Ser Val Glu Ile Lys Glu Asp Ser Ala Asn Pro Gly
            820                 825                 830
Thr Tyr Ile Gly Phe Ile Thr Asn Gly Ser Gly Ala Glu Ile Pro Val
        835                 840                 845
Phe Thr Ile Ala Phe Ser Thr Ser Thr Leu Gly Glu Tyr Thr Phe Thr
    850                 855                 860
Leu Leu Glu Ala Leu Asp His Val Asp Gly Leu Asp Lys Asn Asp Leu
865                 870                 875                 880
Ser Phe Asp Leu Pro Ile Tyr Ala Val Asp Thr Asp Gly Asp Asp Ser
                885                 890                 895
Leu Val Ser Gln Leu Asn Val Thr Ile Gly Asp Asp Val Gln Ile Met
            900                 905                 910
Gln Asp Gly Thr Leu Asp Ile Thr Glu Pro Asn Leu Ala Asp Gly Thr
        915                 920                 925
Ile Thr Thr Asn Thr Ile Asp Val Met Pro Asn Gln Ser Ala Asp Gly
    930                 935                 940
Ala Thr Ile Thr Arg Phe Thr Tyr Asp Gly Val Val Asn Thr Leu Asp
945                 950                 955                 960
Gln Ser Ile Ser Gly Glu Gln Gln Phe Ser Phe Thr Glu Gly Glu Leu
                965                 970                 975
Phe Ile Thr Leu Glu Gly Glu Val Arg Phe Glu Pro Asn Arg Asp Leu
            980                 985                 990
Asp His Ser Val Ser Glu Asp Ile Val Lys Ser Ile Val Val Thr Ser
        995                 1000                1005
Ser Asp Phe Asp Asn Asp Pro Val Thr Ser Thr Ile Thr Leu Thr Ile
    1010                1015                1020
Thr Asp Gly Asp Asn Pro Thr Ile Asp Val Ile Pro Ser Val Thr Leu
1025                1030                1035                1040
Ser Glu Ile Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly Ser Ala Val
                1045                1050                1055
Ser Ser Thr Gln Thr Ile Thr Phe Thr Asn Gln Ser Asp Asp Val Val
            1060                1065                1070
Arg Phe Arg Ile Glu Ser Thr Glu Phe Asn Thr Asn Asp Asp Leu Lys
        1075                1080                1085
Ser Asn Gly Leu Ala Val Glu Leu Arg Glu Asp Pro Ala Gly Ser Gly
    1090                1095                1100
Asp Tyr Ile Gly Phe Thr Thr Ser Ala Thr Asn Val Glu Thr Pro Val
1105                1110                1115                1120
Phe Thr Leu Ser Phe Asn Ser Gly Ser Leu Gly Glu Tyr Thr Phe Thr
                1125                1130                1135
Leu Ile Glu Ala Leu Asp His Gln Asp Ala Arg Gly Asn Asn Asp Leu
            1140                1145                1150
Ser Phe Asp Leu Pro Val Tyr Ala Val Asp Ser Asp Gly Asp Asp Ser
        1155                1160                1165
Leu Val Ser Pro Leu Asn Val Thr Ile Gly Asp Asp Val Gln Ile Met
    1170                1175                1180
Gln Asp Ser Thr Leu Asp Ile Val Glu Pro Thr Val Ala Asp Leu Ala
1185                1190                1195                1200
Ala Gly Thr Val Thr Thr Asn Thr Ile Asp Val Met Pro Asn Gln Ser
                1205                1210                1215
Ala Asp Gly Ala Thr Val Thr Gln Phe Thr Tyr Asp Gly Gln Leu Arg
            1220                1225                1230
Thr Leu Asp Gln Asn Asp Asn Gly Glu Gln Gln Phe Ser Phe Thr Glu
        1235                1240                1245
Gly Glu Leu Phe Ile Thr Leu Gln Gly Asp Val Arg Phe Glu Pro Asn
    1250                1255                1260
Arg Asn Leu Asp His Thr Leu Ser Glu Asp Ile Val Lys Ser Ile Val
1265                1270                1275                1280
Val Thr Ser Ser Asp Ser Asp Asn Asp Val Leu Thr Ser Thr Val Thr
                1285                1290                1295
Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr Ile Asp Asn Val Pro Thr
            1300                1305                1310
Val Asn Leu Ser Glu Thr Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly
        1315                1320                1325
Ser Ala Val Ser Ser Thr Gln Thr Ile Thr Tyr Thr Thr Gln Ser Asp
    1330                1335                1340
Asp Val Thr Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn Val Gly Gly
1345                1350                1355                1360
Ala Leu Thr Ser Asn Gly Leu Ala Val Glu Leu Lys Ala Asp Pro Thr
                1365                1370                1375
Thr Pro Gly Gly Tyr Ile Gly Phe Val Thr Asp Gly Ser Asn Val Glu
            1380                1385                1390
Thr Asn Val Phe Thr Ile Ser Phe Ser Asp Thr Asn Leu Gly Gln Tyr
        1395                1400                1405
Thr Phe Thr Leu Leu Glu Ala Leu Asp His Val Asp Gly Leu Ala Asn
    1410                1415                1420
Asn Asp Leu Thr Phe Asp Leu Pro Val Tyr Ala Val Asp Ser Asp Gly
1425                1430                1435                1440
Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly Asp Asp Val
                1445                1450                1455
Gln Ile Met Gln Gly Gly Thr Leu Asp Ile Thr Glu Pro Asn Leu Ala
            1460                1465                1470
Asp Gly Thr Ile Thr Thr Asn Thr Ile Asp Val Met Pro Glu Gln Ser
        1475                1480                1485
Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly Gln Val Arg
    1490                1495                1500
Thr Leu Asp Gln Thr Asp Asn Gly Glu Gln Gln Phe Ser Phe Thr Glu
1505                1510                1515                1520
Gly Glu Leu Phe Ile Thr Leu Gln Gly Asp Val Arg Phe Glu Pro Asn
                1525                1530                1535
Arg Asn Leu Asp His Thr Ala Ser Glu Asp Ile Val Lys Ser Ile Val
            1540                1545                1550
Val Thr Ser Ser Asp Leu Asp Asn Asp Val Val Thr Ser Thr Val Thr
        1555                1560                1565
Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr Ile Asp Ala Val Pro Ser
    1570                1575                1580
Val Thr Leu Ser Glu Ile Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly
1585                1590                1595                1600
Thr Ala Val Ser Gln Thr Glu Thr Ile Thr Phe Thr Asn Gln Ser Asp
                1605                1610                1615
Asp Val Thr Ser Phe Arg Ile Glu Pro Ile Glu Phe Asn Val Gly Gly
            1620                1625                1630
Ala Leu Lys Ser Asn Gly Phe Ala Val Glu Ile Lys Glu Asp Ser Ala
        1635                1640                1645
Asn Pro Gly Thr Tyr Ile Gly Phe Ile Thr Asn Gly Ser Gly Ala Glu
    1650                1655                1660
Ile Pro Val Phe Thr Ile Ala Phe Ser Thr Ser Ser Leu Gly Glu Tyr
1665                1670                1675                1680
Thr Phe Thr Leu Leu Glu Ala Leu Asp His Val Asp Gly Leu Asp Lys
                1685                1690                1695
Asn Asp Leu Ser Phe Asp Leu Pro Val Tyr Ala Val Asp Thr Asp Gly
            1700                1705                1710
Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly Asp Asp Val
        1715                1720                1725
Gln Ile Met Gln Asp Gly Thr Leu Asp Ile Ile Glu Pro Asn Leu Ala
    1730                1735                1740
Asp Gly Thr Ile Thr Thr Ser Thr Ile Asp Val Met Pro Asn Gln Ser
1745                1750                1755                1760
Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly Gln Leu Arg
                1765                1770                1775
Thr Leu Asp Gln Asn Asp Thr Gly Glu Gln Gln Phe Ser Phe Thr Glu
            1780                1785                1790
Gly Glu Leu Phe Ile Thr Leu Glu Gly Glu Val Arg Phe Glu Pro Asn
        1795                1800                1805
Arg Asp Leu Asp His Thr Ala Ser Glu Asp Ile Val Lys Ser Ile Val
    1810                1815                1820
Val Thr Ser Ser Asp Phe Asp Asn Asp Ser Leu Thr Ser Thr Val Thr
1825                1830                1835                1840
Leu Thr Ile Thr Asp Gly Asp Asn Pro Thr Ile Asp Val Ile Pro Ser
                1845                1850                1855
Val Thr Leu Ser Glu Thr Asn Leu Ser Asp Gly Ser Ala Pro Ser Gly
            1860                1865                1870
Ser Ala Val Ser Ser Thr Gln Thr Ile Thr Phe Thr Asn Gln Ser Asp
        1875                1880                1885
Asp Val Val Arg Phe Arg Ile Glu Pro Thr Glu Phe Asn Thr Asn Asp
    1890                1895                1900
Asp Leu Lys Ser Asn Gly Leu Ala Val Glu Leu Arg Glu Asp Pro Ala
1905                1910                1915                1920
Gly Ser Gly Asp Tyr Ile Gly Phe Thr Thr Ser Ala Thr Asn Val Glu
                1925                1930                1935
Thr Thr Val Phe Thr Leu Ser Phe  Ser Ser Thr Thr Leu Gly Glu Tyr
            1940                1945                1950
Thr Phe Thr Leu Leu Glu Ala Leu Asp His Gln Asp Ala Arg Gly Asn
        1955                1960                1965
Asn Asp Leu Ser Phe Glu Leu Pro Val Tyr Ala Val Asp Ser Asp Gly
    1970                1975                1980
Asp Asp Ser Leu Met Ser Pro Leu Asn Val Thr Ile Gly Asp Asp Val
1985                1990                1995                2000
Gln Ile Met Gln Asp Gly Thr Leu Asp Ile Val Glu Pro Thr Val Ala
                2005                2010                2015
Asp Leu Ala Ala Gly Ile Val Thr Thr Asn Thr Ile Asp Val Met Pro
            2020                2025                2030
Asn Gln Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly
        2035                2040                2045
Gln Leu Arg Thr Leu Asp Gln Asn Asp Asn Gly Glu Gln Gln Phe Ser
    2050                2055                2060
Phe Thr Glu Gly Glu Leu Phe Ile Thr Leu Glu Gly Glu Val Arg Phe
2065                2070                2075                2080
Glu Pro Asn Arg Asn Leu Asp His Thr Leu Asn Glu Asp Ile Val Lys
                2085                2090                2095
Ser Ile Val Val Thr Ser Ser Asp Ser Asp Asn Asp Val Leu Thr Ser
            2100                2105                2110
Thr Val Thr Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr Ile Asp Asn
        2115                2120                2125
Val Pro Thr Val Ser Leu Ser Glu Thr Ser Leu Ser Asp Gly Ser Ser
    2130                2135                2140
Pro Ser Gly Ser Ala Val Ser Ser Thr Gln Thr Ile Thr Tyr Thr Thr
2145                2150                2155                2160
Gln Ser Asp Asp Val Thr Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn
                2165                2170                2175
Val Gly Gly Ala Leu Lys Ser Asn Gly Leu Ala Val Glu Leu Lys Ala
            2180                2185                2190
Asp Pro Thr Thr Pro Gly Gly Tyr Ile Gly Phe Val Thr Asp Gly Ser
        2195                2200                2205
Asn Val Glu Thr Asn Val Phe Thr Ile Ser Phe Ser Asp Thr Asn Leu
2210                2215                2220
Gly Gln Tyr Thr Phe Thr Leu Leu Glu Ala Leu Asp His Ala Asp Ser
2225                2230                2235                2240
Leu Ala Asn Asn Asp Leu Ser Phe Asp Leu Pro Val Tyr Ala Val Asp
                2245                2250                2255
Ser Asp Gly Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly
            2260                2265                2270
Asp Asp Val Gln Ile Met Gln Gly Gly Thr Leu Asp Ile Thr Glu Pro
        2275                2280                2285
Asn Leu Ala Asp Gly Thr Thr Thr Thr Asn Thr Ile Asp Val Met Pro
    2290                2295                2300
Glu Gln Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly
2305                2310                2315                2320
Gln Val Arg Thr Leu Asp Gln Thr Asp Asn Gly Glu Gln Gln Phe Ser
                2325                2330                2335
Phe Thr Glu Gly Glu Leu Phe Ile Thr Leu Gln Gly Asp Val Arg Phe
            2340                2345                2350
Glu Pro Asn Arg Asn Leu Asp His Thr Ala Ser Glu Asp Ile Val Lys
        2355                2360                2365
Ser Ile Val Val Thr Ser Ser Asp Ser Asp Asn Asp Val Val Thr Ser
    2370                2375                2380
Thr Val Thr Leu Thr Ile Thr Asp Gly Asp Leu Pro Thr Ile Asp Ala
2385                2390                2395                2400
Val Pro Ser Val Thr Leu Ser Glu Thr Asn Leu Ser Asp Gly Ser Ala
                2405                2410                2415
Pro Ser Gly Ser Ala Val Ser Gln Thr Glu Thr Ile Thr Phe Thr Asn
            2420                2425                2430
Gln Ser Asp Asp Val Ala Ser Phe Arg Ile Glu Pro Thr Glu Phe Asn
        2435                2440                2445
Val Gly Gly Ala Leu Lys Ser Asn Gly Phe Ala Val Glu Ile Lys Glu
    2450                2455                2460
Asp Ser Ala Asn Pro Gly Thr Tyr Ile Gly Phe Ile Ala Asn Gly Ser
2465                2470                2475                2480
Ser Ala Glu Ile Pro Val Phe Thr Ile Ala Phe Ser Thr Ser Thr Leu
                2485                2490                2495
Gly Glu Tyr Thr Phe Thr Leu Leu Glu Ala Leu Asp His Ala Asp Gly
            2500                2505                2510
Leu Asp Lys Asn Asp Leu Ser Phe Glu Leu Pro Val Tyr Ala Val Asp
        2515                2520                2525
Thr Asp Gly Asp Asp Ser Leu Val Ser Gln Leu Asn Val Thr Ile Gly
    2530                2535                2540
Asp Asp Val Gln Ile Met Gln Asp Gly Thr Leu Asp Val Ile Glu Pro
2545                2550                2555                2560
Asn Leu Ala Asp Gly Thr Ile Thr Thr Asn Thr Ile Asp Val Met Pro
                2565                2570                2575
Glu Gln Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr Tyr Asp Gly
            2580                2585                2590
Gln Leu Arg Thr Leu Asp Gln Asn Asp Thr Gly Glu Gln Gln Phe Ser
        2595                2600                2605
Phe Thr Glu Gly Glu Leu Phe Ile Thr Leu Glu Gly Glu Val Arg Phe
    2610                2615                2620
Glu Pro Asn Arg Asp Leu Asp His Ser Val Ser Glu Asp Ile Val Lys
2625                2630                2635                2640
Ser Ile Val Val Thr Ser Ser Asp Phe Asp Asn Asp Pro Val Thr Ser
                2645                2650                2655
Ala Ile Thr Leu Thr Ile Thr Asp Gly Asp Asn Pro Thr Ile Asp Ser
            2660                2665                2670
Val Pro Ser Val Val Leu Glu Glu Ala Asp Leu Thr Asp Gly Ser Ser
        2675                2680                2685
Pro Ser Gly Ser Ala Val Ser Gln Thr Glu Thr Ile Thr Phe Thr Asn
    2690                2695                2700
Gln Ser Asp Asp Val Glu Lys Phe Arg Leu Glu Pro Ser Glu Phe Asn
2705                2710                2715                2720
Thr Asn Asn Ala Leu Lys Ser Asp Gly Leu Ile Ile Glu Ile Arg Glu
                2725                2730                2735
Glu Pro Thr Gly Ser Gly Asn Tyr Ile Gly Phe Thr Thr Asp Ile Ser
            2740                2745                2750
Asn Val Glu Thr Thr Val Phe Thr Leu Asp Phe Ser Ser Thr Thr Leu
        2755                2760                2765
Gly Glu Tyr Thr Phe Thr Leu Leu Glu Ala Ile Asp His Thr Pro Val
    2770                2775                2780
Gln Gly Asn Asn Asp Leu Thr Phe Asn Leu Pro Val Tyr Ala Val Asp
2785                2790                2795                2800
Ser Asp Gly Asp Asp Ser Leu Met Ser Ser Leu Ser Val Thr Ile Thr
                2805                2810                2815
Asp Asp Val Gln Val Met Val Ser Gly Ser Leu Ser Ile Glu Glu Pro
            2820                2825                2830
Thr Val Ala Asp Leu Ala Ala Gly Thr Pro Thr Thr Ser Val Phe Asp
        2835                2840                2845
Val Leu Thr Ser Ala Ser Ala Asp Gly Ala Thr Ile Thr Gln Phe Thr
    2850                2855                2860
Tyr Asp Gly Gly Ala Val Leu Thr Leu Asp Gln Asn Asp Thr Gly Glu
2865                2870                2875                2880
Gln Lys Phe Val Val Ala Asp Gly Ala Leu Tyr Ile Thr Leu Gln Gly
                2885                2890                2895
Asp Ile Arg Phe Glu Pro Ser Arg Asn Leu Asp His Thr Gly Gly Asp
            2900                2905                2910
Ile Val Lys Ser Ile Val Val Thr Ser Ser Asp Ser Asp Ser Asp Leu
        2915                2920                2925
Val Ser Ser Thr Val Thr Leu Thr Ile Thr Asp Gly Asp Ile Pro Thr
    2930                2935                2940
Ile Asp Thr Val Pro Ser Val Thr Leu Ser Glu Thr Asn Leu Ser Asp
2945                2950                2955                2960
Gly Ser Ala Pro Asn Ala Ser Ala Val Ser Ser Thr Gln Thr Ile Thr
                2965                2970                2975
Phe Thr Asn Gln Ser Asp Asp Val Thr Ser Phe Arg Ile Glu Pro Thr
            2980                2985                2990
Asp Phe Asn Val Gly Gly Ala Leu Lys Ser Asn Gly Leu Ala Val Glu
        2995                3000                3005
Leu Lys Ala Asp Pro Thr Thr Pro Gly Gly Tyr Ile Gly Phe Val Thr
    3010                3015                3020
Asp Gly Ser Asn Val Glu Thr Asn Val Phe Thr Ile Ser Phe Ser Asp
3025                3030                3035                3040
Thr Asn Leu Gly Gln Tyr Thr Phe Thr Leu Leu Glu Ala Leu Asp His
                3045                3050                3055
Val Asp Gly Leu Val Lys Asn Asp Leu Thr Phe Asp Leu Pro Val Tyr
            3060                3065                3070
Ala Val Asp Ser Asp Gly Asp Asp Ser Leu Val Ser Gln Leu Asn Val
        3075                3080                3085
Thr Ile Gly Asp Asp Val Gln Val Met Gln Asn Gln Ala Leu Asn Ile
    3090                3095                3100
Ile Glu Pro Thr Val Ala Asp Leu Ala Ala Gly Thr Pro Thr Thr Ala
3105                3110                3115                3120
Thr Val Asp Val Met Pro Ser Gln Ser Ala Asp Gly Ala Thr Ile Thr
                3125                3130                3135
Gln Phe Thr Tyr Asp Gly Gly Ala Ala Ile Thr Leu Asp Gln Asn Asp
            3140                3145                3150
Thr Gly Glu Gln Lys Phe Val Phe Thr Glu Gly Ser Leu Phe Ile Thr
        3155                3160                3165
Leu Gln Gly Glu Val Arg Phe Glu Pro Asn Arg Asn Leu Asn His Thr
    3170                3175                3180
Ala Ser Glu Asp Ile Val Lys Ser Ile Val Val Thr Ser Ser Asp Leu
3185                3190                3195                3200
Asp Asn Asp Val Leu Thr Ser Thr Val Thr Leu Thr Ile Thr Asp Gly
               3205                3210                3215
Asp Ile Pro Thr Ile Asp Ala Val Pro Ser Val Thr Leu Ser Glu Thr
            3220                3225                3230
Asn Leu Ser Asp Gly Ser Ala Pro Ser Ser Ser Ala Val Ser Gln Thr
        3235                3240                3245
Glu Thr Ile Thr Phe Ile Asn Gln Ser Asp Asp Val Ala Ser Phe Arg
    3250                3255                3260
Ile Glu Pro Thr Glu Phe Asn Val Gly Gly Ala Leu Lys Ser Asn Gly
3265                3270                3275                3280
Phe Ala Val Glu Ile Lys Glu Asp Ser Ala Asn Pro Gly Thr Tyr Ile
                3285                3290                3295
Gly Phe Ile Thr Asp Gly Ser Asn Thr Glu Val Pro Val Phe Thr Ile
            3300                3305                3310
Ala Phe Ser Thr Ser Thr Leu Gly Glu Tyr Thr Phe Thr Leu Leu Glu
        3315                3320                3325
Ala Leu Asp His Ala Asn Gly Leu Asp Lys Asn Asp Leu Ser Phe Asp
    3330                3335                3340
Leu Pro Val Tyr Ala Val Asp Ser Asp Gly Asp Asp Ser Leu Val Ser
3345                3350                3355                3360
Gln Leu Asn Val Thr Ile Gly Asp Asp Val Gln Ile Met Gln Asp Gly
                3365                3370                3375
Thr Leu Asp Ile Thr Glu Pro Asn Leu Ala Asp Gly Thr Ile Thr Thr
            3380                3385                3390
Asn Thr Ile Asp Val Met Pro Asn Gln Ser Ala Asp Gly Ala Thr Ile
        3395                3400                3405
Thr Glu Phe Ser Phe Gly Gly Ile Val Lys Thr Leu Asp Gln Ser Ile
    3410                3415                3420
Val Gly Glu Gln Gln Phe Ser Phe Thr Glu Gly Glu Leu Phe Ile Thr
3425                3430                3435                3440
Leu Gln Gly Gln Val Arg Phe Glu Pro Asn Arg Asp Leu Asp His Ser
                3445                3450                3455
Ala Ser Glu Asp Ile Val Lys Ser Ile Val Val Thr Ser Ser Asp Phe
            3460                3465                3470
Asp Asn Asp Pro Val Thr Ser Thr Val Thr Leu Thr Ile Thr Asp Gly
        3475                3480                3485
Asp Ile Pro Thr Ile Asp Ala Val Pro Ser Val Thr Leu Ser Glu Thr
    3490                3495                3500
Asn Leu Ala Asp Gly Ser Ala Pro Ser Gly Ser Ala Val Ser Gln Thr
3505                3510                3515                3520
Glu Thr Ile Thr Phe Thr Asn Gln Ser Asp Asp Val Val Arg Phe Arg
                3525                3530                3535
Leu Glu Pro Thr Glu Phe Asn Thr Asn Asp Ala Leu Lys Ser Asn Gly
            3540                3545                3550
Leu Ala Val Glu Leu Arg Glu Glu Pro Gln Gly Ser Gly Gln Tyr Ile
        3555                3560                3565
Gly Phe Thr Thr Ser Ser Ser Asn Val Glu Thr Thr Val Phe Thr Leu
    3570                3575                3580
Asp Phe Asn Ser Gly Thr Leu Gly Glu Tyr Thr Phe Thr Leu Ile Glu
3585                3590                3595                3600
Ala Leu Asp His Gln Asp Ala Arg Gly Asn Asn Asp Leu Ser Phe Asn
                3605                3610                3615
Leu Pro Val Tyr Ala Val Asp Ser Asp Gly Asp Asp Ser Leu Val Ser
            3620                3625                3630
Gln Leu Gly Val Thr Ile Gly Asp Asp Val Gln Leu Met Gln Asp Gly
        3635                3640                3645
Thr Ile Thr Ser Arg Glu Pro Ala Ala Ser Val Glu Thr Ser Asn Thr
    3650                3655                3660
Phe Asp Val Met Pro Asn Gln Ser Ala Asp Gly Ala Lys Val Thr Ser
3665                3670                3675                3680
Phe Val Phe Asp Gly Lys Thr Ala Glu Ser Leu Asp Leu Asn Val Asn
                3685                3690                3695
Gly Glu Gln Glu Phe Val Phe Thr Glu Gly Ser Val Phe Ile Thr Thr
            3700                3705                3710
Glu Gly Glu Ile Arg Phe Glu Pro Val Arg Asn Gln Asn His Ala Gly
        3715                3720                3725
Gly Asp Ile Thr Lys Ser Ile Glu Val Thr Ser Val Asp Leu Asp Gly
    3730                3735                3740
Asp Ile Val Thr Ser Thr Val Thr Leu Lys Ile Val Asp Gly Asp Leu
3745                3750                3755                3760
Pro Thr Ile Asp Leu Val Pro Gly Ile Thr Leu Ser Glu Val Asp Leu
                3765                3770                3775
Ala Asp Gly Ser Val Pro Thr Gly Asn Pro Val Thr Met Thr Gln Thr
            3780                3785                3790
Ile Thr Tyr Thr Ala Gly Ser Asp Asp Val Ser His Phe Arg Ile Asp
        3795                3800                3805
Pro Thr Gln Phe Asn Thr Ser Gly Val Leu Lys Ser Asn Gly Leu Asp
    3810                3815                3820
Val Glu Ile Lys Glu Gln Pro Ala Asn Ser Gly Asn Tyr Ile Gly Phe
3825                3830                3835                3840
Val Lys Asp Gly Ser Asn Val Glu Thr Asn Val Phe Thr Ile Ser Phe
                3845                3850                3855
Ser Thr Ser Asn Leu Gly Gln Tyr Thr Phe Thr Leu Leu Glu Ala Leu
            3860                3865                3870
Asp His Val Asp Gly Leu Gln Asn Asn Ile Leu Ser Phe Asp Val Pro
        3875                3880                3885
Val Leu Ala Val Asp Ala Asp Gly Asp Asp Ser Ala Met Ser Pro Met
    3890                3895                3900
Thr Val Ala Ile Thr Asp Asp Val Gln Gly Val Gln Asp Gly Thr Leu
3905                3910                3915                3920
Ser Ile Thr Glu Pro Ser Leu Ala Asp Leu Ala Ser Gly Thr Pro Pro
                3925                3930                3935
Thr Thr Ala Ile Ile Asp Val Met Pro Thr Gln Ser Ala Asp Gly Ala
            3940                3945                3950
Lys Val Thr Gln Phe Thr Tyr Asp Gly Gly Thr Ala Val Thr Leu Asp
        3955                3960                3965
Pro Ser Ile Ala Thr Glu Gln Val Phe Thr Val Thr Asp Gly Leu Leu
    3970                39753                980
Tyr Ile Thr Ile Glu Gly Glu Val Arg Phe Glu Pro Ser Arg Asp Leu
3985                3990                3995                4000
Asp His Ser Ser Gly Asp Ile Val Arg Thr Ile Val Val Thr Thr Ser
                4005                4010                4015
Asp Phe Asp Asn Asp Thr Asp Thr Ala Asp Val Thr Leu Thr Ile Lys
            4020                4025                4030
Asp Gly Ile Asn Pro Val Ile Asn Val Val Pro Asp Val Asn Leu Ser
        4035                4040                4045
Glu Val Asn Leu Ala Asp Gly Ser Thr Pro Ser Gly Ser Ala Val Ser
    4050                4055                4060
Ser Thr His Thr Ile Thr Tyr Thr Glu Gly Ser Asp Asp Phe Ser His
4065                4070                4075                4080
Phe Arg Ile Ala Thr Asn Glu Phe Asn Pro Gly Asp Leu Leu Lys Ser
                4085                4090                4095
Ser Gly Leu Val Val Gln Leu Lys Glu Asp Pro Ala Ser Ala Gly Asp
            4100                4105                4110
Tyr Ile Gly Tyr Thr Asp Asp Gly Met Gly Asn Val Thr Asp Val Phe
        4115                4120                4125
Thr Ile Ser Phe Asp Ser Ala Asn Lys Ala Gln Phe Thr Phe Thr Leu
    4130                4135                4140
Ile Glu Ala Leu Asp His Leu Asp Gly Val Leu Tyr Asn Asp Leu Thr
4145                4150                4155                4160
Phe Arg Leu Pro Ile Tyr Ala Val Asp Thr Asp Asp Ser Glu Ser Thr
                4165                4170                4175
Lys Arg Asp Val Val Val Thr Ile Glu Asp Asp Ile Gln Gln Met Gln
            4180                4185                4190
Asp Gly Phe Leu Thr Ile Thr Glu Pro Asn Ser Gly Thr Pro Thr Thr
        4195                4200                4205
Thr Thr Val Asp Val Met Pro Ile Pro Ser Ala Asp Gly Ala Thr Ile
    4210                4215                4220
Thr Gln Phe Thr Tyr Asp Gly Gly Ser Pro Ile Thr Leu Asn Gln Ser
4225                4230                4235                4240
Ile Ser Gly Glu Gln Glu Phe Val Phe Thr Glu Gly Ser Leu Phe Val
                4245                4250                4255
Thr Leu Asp Gly Asp Val Arg Phe Glu Pro Asn Arg Asn Leu Asp His
            4260                4265                4270
Ser Ala Gly Asp Ile Val Lys Ser Ile Val Phe Thr Ser Ser Asp Phe
        4275                4280                4285
Asp Asn Asp Ile Phe Ser Ser Lys Val Thr Leu Thr Ile Val Asp Gly
    4290                4295                4300
Asp Gly Pro Thr Ile Asp Val Val Pro Gly Val Ala Leu Ser Glu Ser
4305                4310                4315                4320
Leu Leu Ala Asp Gly Ser Thr Pro Ser Val Asn Pro Val Ser Met Thr
                4325                4330                4335
Gln Thr Ile Thr Ser Leu Ala Ser Ser Asp Asp Ile Ala Glu Ile Val
            4340                4345                4350
Val Glu Val Gly Leu Phe Asn Thr Asn Gly Ala Leu Lys Ser Asp Gly
        4355                4360                4365
Leu Ser Leu Ser Leu Arg Glu Asp Pro Val Asn Ser Gly Asp Tyr Ile
    4370                4375                4380
Ala Phe Thr Thr Asn Gly Ser Gly Val Glu Lys Val Ile Phe Thr Leu
4385                4390                4395                4400
Asp Phe Asp Asp Thr Asn Pro Ser Gln Tyr Thr Phe Thr Leu Leu Glu
                4405                4410                4415
Arg Leu Asp His Val Asp Gly Leu Gly Asn Asn Asp Leu Ser Phe Asp
            4420                4425                4430
Leu Ser Val Tyr Ala Glu Asp Thr Asp Gly Asp Ile Ser Ala Ser Lys
        4435                4440                4445
Pro Leu Thr Val Thr Ile Thr Asp Asp Val Gln Leu Met Gln Ser Gly
    4450                4455                4460
Ala Leu Asn Ile Thr Glu Pro Thr Thr Gly Thr Pro Thr Thr Ala Val
4465                4470                4475                4480
Phe Asp Val Met Pro Ala Gln Ser Ala Asp Gly Ala Thr Ile Thr Lys
                4485                4490                4495
Phe Thr Tyr Gly Ser Gln Pro Glu Glu Ser Leu Val Gln Thr Val Thr
            4500                4505                4510
Gly Glu Gln Glu Phe Val Phe Thr Glu Gly Ser Leu Phe Ile Asn Leu
        4515                4520                4525
Glu Gly Asp Val Arg Phe Glu Pro Asn Arg Asn Leu Asp His Ser Gly
    4530                4535                4540
Gly Asn Ile Val Lys Thr Ile Thr Val Thr Ser Glu Asp Lys Asp Gly
4545                4550                4555                4560
Asp Ile Val Thr Ser Thr Val Thr Leu Thr Ile Val Asp Gly Ala Pro
                4565                4570                4575
Pro Val Ile Asp Thr Val Pro Thr Val Ala Leu Glu Glu Ala Asn Leu
            4580                4585                4590
Val Asp Gly Ser Ser Pro Gly Leu Pro Val Ser Gln Thr Glu Ile Ile
        4595                4600                4605
Thr Phe Thr Ala Gly Ser Asp Asp Val Ser His Phe Arg Ile Asp Pro
    4610                4615                4620
Ala Gln Phe Asn Thr Ser Gly Asp Leu Lys Ala Asp Gly Leu Val Val
4625                4630                4635                4640
Gln Leu Lys Glu Asp Pro Leu Asn Ser Asp Asn Tyr Ile Gly Tyr Val
                4645                4650                4655
Glu Ser Gly Gly Val Gln Thr Asp Ile Phe Thr Ile Thr Phe Ser Ser
            4660                4665                4670
Val Val Leu Gly Glu Tyr Thr Phe Thr Leu Leu Glu Glu Leu Asp His
        4675                4680                4685
Leu Pro Val Gln Gly Asn Asn Asp Gln Ile Phe Thr Leu Pro Val Ile
    4690                4695                4700
Ala Val Asp Lys Asp Asn Thr Asp Ser Ala Val Lys Pro Leu Thr Val
4705                4710                4715                4720
Thr Ile Thr Asp Asp Val Pro Thr Ile Thr Asp Thr Thr Gly Ala Ser
                4725                4730                4735
Thr Phe Val Val Asp Glu Asp Asp Leu Gly Thr Leu Ala Gln Ala Thr
            4740                4745                4750
Gly Ser Phe Val Thr Thr Glu Gly Ala Asp Gln Val Glu Val Tyr Glu
        4755                4760                4765
Leu Arg Asn Ile Ser Thr Leu Glu Ala Thr Leu Ser Ser Gly Ser Glu
    4770                4775                4780
Gly Ile Lys Ile Thr Glu Ile Thr Gly Ala Ala Asn Thr Thr Thr Tyr
4785                4790                4795                4800
Gln Gly Ala Thr Asp Pro Ser Gly Thr Pro Ile Phe Thr Leu Val Leu
                4805                4810                4815
Thr Asp Asp Gly Ala Tyr Thr Phe Thr Leu Leu Gly Pro Leu Asn His
            4820                4825                4830
Ala Thr Thr Pro Ser Asn Leu Asp Thr Leu Thr Ile Pro Phe Asp Val
        4835                4840                4845
Val Ala Val Asp Gly Asp Gly Asp Asp Ser Asn Gln Tyr Val Leu Pro
    4850                4855                4860
Ile Glu Val Leu Asp Asp Val Pro Val Met Thr Ala Pro Thr Gly Glu
4865                4870                4875                4880
Thr Val Val Asp Glu Asp Asp Leu Thr Gly Ile Gly Ser Asp Gln Ser
                4885                4890                4895
Glu Asp Thr Ile Ile Asn Gly Leu Phe Thr Val Asp Glu Gly Ala Asp
            4900                4905                4910
Gly Val Val Leu Tyr Glu Leu Val Asp Glu Asp Leu Val Leu Thr Gly
        4915                4920                4925
Leu Thr Ser Asp Gly Glu Ser Leu Glu Trp Leu Ala Val Ser Gln Asn
    4930                4935                4940
Gly Thr Thr Phe Thr Tyr Val Ala Gln Thr Ala Thr Ser Asn Glu Ala
4945                4950                4955                4960
Val Phe Glu Ile Ile Phe Asp Thr Ser Asp Asn Ser Tyr Gln Phe Glu
                4965                4970                4975
Leu Phe Lys Pro Leu Lys His Pro Asp Gly Ala Asn Glu Asn Ala Ile
            4980                4985                4990
Asp Leu Asp Phe Ser Ile Val Ala Glu Asp Phe Asp Gln Asp Gln Ser
        4995                5000                5005
Asp Ala Ile Gly Leu Lys Ile Thr Val Thr Asp Asp Val Pro Leu Val
    5010                5015                5020
Thr Thr Gln Ser Ile Thr Arg Leu Glu Gly Gln Gly Tyr Gly Asn Ser
5025                5030                5035                5040
Lys Val Asp Met Phe Ala Asn Ala Thr Asp Val Gly Ala Asp Gly Ala
                5045                5050                5055
Val Leu Ser Arg Ile Glu Gly Ile Ser Asn Asn Gly Ala Asp Ile Val
            5060                5065                5070
Phe Arg Ser Gly Asn Asn Gly Pro Tyr Ser Ser Gly Phe Asp Leu Asn
        5075                5080                5085
Ser Gly Ser Gln Gln Val Arg Val Tyr Glu Gln Thr Asn Gly Gly Ala
    5090                5095                5100
Asp Thr Arg Glu Leu Gly Arg Leu Arg Ile Asn Ser Asn Gly Glu Val
5105                5110                5115                5120
Glu Phe Arg Ala Asn Gly Tyr Leu Asp His Asp Gly Asp Asp Thr Ile
                5125                5130                5135
Asp Phe Ser Ile Asn Val Ile Ala Thr Asp Gly Asp Leu Asp Thr Ser
            5140                5145                5150
Glu Thr Pro Leu Asp Ile Thr Ile Thr Asp Arg Asp Ser Thr Arg Ile
        5155                5160                5165
Ala Leu Lys Val Thr Thr Phe Glu Asp Ala Gly Arg Asp Ser Thr Ile
    5170                5175                5180
Pro Tyr Ala Thr Gly Asp Glu Pro Thr Leu Glu Asn Val Gln Asp Asn
5185                5190                5195                5200
Gln Asn Gly Leu Pro Asn Ala Pro Ala Gln Val Ala Leu Gln Val Ser
                5205                5210                5215
Leu Tyr Asp Gln Asp Asn Ala Glu Ser Ile Gly Gln Leu Thr Ile Lys
            5220                5225                5230
Ser Pro Asn Gly Gly Asp Ser His Gln Gly Thr Phe Tyr Tyr Phe Asp
        5235                5240                5245
Gly Ala Asp Tyr Ile Glu Leu Val Pro Glu Ser Asn Gly Ser Ile Ile
    5250                5255                5260
Phe Gly Ser Pro Glu Leu Glu Gln Ser Phe Ala Pro Asn Pro Ser Glu
5265                5270                5275                5280
Pro Arg Gln Thr Ile Ala Thr Ile Asp Asn Leu Phe Phe Val Pro Asp
                5285                5290                5295
Gln His Ala Ser Ser Asp Glu Thr Gly Gly Arg Val Arg Tyr Glu Leu
            5300                5305                5310
Glu Ile Glu Lys Asn Gly Ser Thr Asp His Thr Val Asn Ser Asn Phe
        5315                5320                5325
Arg Ile Glu Ile Glu Ala Val Ala Asp Ile Ala Thr Trp Asp Asp Ser
    5330                5335                5340
Asn Ser Thr Tyr Gln Tyr Gln Val Asn Glu Asp Glu Asp Asn Val Thr
5345                5350                5355                5360
Leu Gln Leu Asn Ala Glu Ser Gln Asp Asn Ser Asn Thr Glu Thr Ile
                5365                5370                5375
Thr Tyr Glu Leu Glu Ala Val Gln Gly Asp Gly Lys Phe Glu Leu Leu
            5380                5385                5390
Asp Gln Asn Gly Asn Val Leu Thr Pro Val Asn Gly Val Tyr Ile Ile
        5395                5400                5405
Ala Ser Ala Asp Ile Asn Ser Thr Val Val Asn Pro Ile Asp Asn Phe
    5410                5415                5420
Ser Gly Gln Ile Glu Phe Lys Ala Thr Ala Ile Thr Glu Glu Thr Leu
5425                5430                5435                5440
Asn Pro Tyr Asp Asp Ser Asp Asn Gly Gly Ala Asn Asp Lys Thr Thr
                5445                5450                5455
Ala Arg Ser Val Glu Gln Ser Ile Val Ile Asp Val Thr Ala Asp Ala
            5460                5465                5470
Asp Pro Gly Thr Phe Ser Val Ser Arg Ile Gln Ile Asn Glu Asp Asn
        5475                5480                5485
Ile Asp Asp Pro Asp Tyr Val Gly Pro Leu Asp Asn Lys Asp Ala Phe
    5490                5495                5500
Thr Leu Asp Glu Val Ile Thr Met Thr Gly Ser Val Asp Ser Asp Ser
5505                5510                5515                5520
Ser Glu Glu Leu Phe Val Arg Ile Ser Asn Val Thr Glu Gly Ala Val
                5525                5530                5535
Leu Tyr Phe Leu Gly Thr Thr Thr Val Val Pro Thr Ile Thr Ile Asn
            5540                5545                5550
Gly Val Asp Tyr Gln Glu Ile Ala Tyr Ser Asp Leu Ala Asn Val Glu
        5555                5560                5565
Val Val Pro Thr Lys His Ser Asn Val Asp Phe Thr Phe Asp Val Thr
    5570                5575                5580
Gly Val Val Lys Asp Thr Ala Asn Leu Ser Thr Gly Ala Gln Ile Asp
5585                5590                5595                5600
Glu Glu Ile Leu Gly Thr Lys Thr Val Asn Val Glu Val Lys Gly Val
                5605                5610                5615
Ala Asp Thr Pro Tyr Gly Gly Thr Asn Gly Thr Ala Trp Ser Ala Ile
            5620                5625                5630
Thr Asp Gly Thr Thr Ser Gly Val Gln Thr Thr Ile Gln Glu Ser Gln
        5635                5640                5645
Asn Gly Asp Thr Phe Ala Glu Leu Asp Phe Thr Val Leu Ser Gly Glu
    5650                5655                5660
Arg Arg Pro Asp Thr Gly Thr Thr Pro Leu Ala Asp Asp Gly Ser Glu
5665                5670                5675                5680
Ser Ile Thr Val Ile Leu Ser Gly Ile Pro Asp Gly Val Val Leu Glu
                5685                5690                5695
Asp Gly Asp Gly Thr Val Ile Asp Leu Asn Phe Val Gly Tyr Glu Thr
            5700                5705                5710
Gly Pro Gly Gly Ser Pro Asp Leu Ser Lys Pro Ile Tyr Glu Ala Asn
        5715                5720                5725
Ile Thr Glu Ala Gly Lys Thr Ser Gly Ile Arg Ile Arg Pro Val Asp
    5730                5735                5740
Ser Ser Thr Glu Asn Ile His Ile Gln Gly Lys Val Ile Val Thr Glu
5745                5750                5755                5760
Asn Asp Gly His Thr Leu Thr Phe Asp Gln Glu Ile Arg Val Leu Val
                5765                5770                5775
Ile Pro Arg Ile Asp Thr Ser Ala Thr Tyr Val Asn Thr Thr Asn Gly
            5780                5785                5790
Asp Glu Asp Thr Ala Ile Asn Ile Asp Trp His Pro Glu Gly Thr Asp
        5795                5800                5805
Tyr Ile Asp Asp Asp Glu His Phe Thr Lys Ile Thr Ile Asn Gly Ile
    5810                5815                5820
Pro Leu Gly Val Thr Ala Val Val Asn Gly Asp Val Thr Val Asp Asp
5825                5830                5835                5840
Ser Thr Pro Gly Thr Leu Ile Ile Thr Pro Lys Asp Ala Ser Gln Thr
                5845                5850                5855
Pro Glu Gln Phe Thr Gln Ile Ala Leu Ala Asn Asn Phe Ile Gln Met
            5860                5865                5870
Thr Pro Pro Ala Asp Ser Ser Ala Asp Phe Thr Leu Thr Thr Glu Leu
        5875                5880                5885
Lys Met Glu Glu Arg Asp His Glu Tyr Thr Ser Ser Gly Leu Glu Asp
    5890                5895                5900
Glu Asp Gly Gly Tyr Val Glu Ala Asp Pro Asp Ile Thr Gly Ile Ile
5905                5910                5915                5920
Asn Val Gln Val Arg Pro Val Val Glu Pro Gly Asp Ala Asp Asn Lys
                5925                5930                5935
Ile Val Val Ser Asn Glu Asp Gly Ser Gly Asp Leu Thr Thr Ile Thr
            5940                5945                5950
Ala Asp Ala Asn Gly Val Ile Lys Phe Thr Thr Asn Ser Asp Asn Gln
        5955                5960                5965
Thr Thr Asp Thr Asn Gly Asp Glu Ile Trp Asp Gly Glu Tyr Val Val
    5970                5975                5980
Arg Tyr Gln Glu Thr Asp Leu Ser Thr Val Glu Glu Gln Val Asp Glu
5985                5990                5995                6000
Val Ile Val Gln Leu Thr Asn Thr Asp Gly Ser Ala Leu Ser Asp Asp
                6005                6010                6015
Ile Leu Gly Gln Leu Leu Val Thr Gly Ala Ser Tyr Glu Gly Gly Gly
            6020                6025                6030
Arg Trp Val Val Thr Asn Glu Asp Ala Phe Ser Val Ser Ala Pro Asn
        6035                6040                6045
Gly Leu Asp Phe Thr Pro Ala Asn Asp Ala Asp Asp Val Ala Thr Asp
    6050                6055                6060
Phe Asn Asp Ile Lys Met Thr Ile Phe Thr Leu Val Ser Asp Pro Gly
6065                6070                6075                6080
Asp Ala Asn Asn Glu Thr Ser Ala Gln Val Gln Arg Thr Gly Glu Val
                6085                6090                6095
Thr Leu Ser Tyr Pro Glu Val Leu Thr Ala Pro Asp Lys Val Ala Ala
            6100                6105                6110
Asp Ile Ala Ile Val Pro Asp Ser Val Ile Asp Ala Val Glu Asp Thr
        6115                6120                6125
Gln Leu Asp Leu Gly Ala Ala Leu Asn Gly Ile Leu Ser Leu Thr Gly
    6130                6135                6140
Arg Asp Asp Ser Thr Asp Gln Val Thr Val Ile Ile Asp Gly Thr Leu
6145                6150                6155                6160
Val Ile Asp Ala Thr Thr Ser Phe Pro Ile Ser Leu Ser Gly Thr Ser
                6165                6170                6175
Asp Val Asp Phe Val Asn Gly Lys Tyr Val Tyr Glu Thr Thr Val Glu
            6180                6185                6190
Gln Gly Val Ala Val Asp Ser Ser Gly Leu Leu Leu Asn Leu Pro Pro
        6195                6200                6205
Asn Tyr Ser Gly Asp Phe Arg Leu Pro Met Thr Ile Val Thr Lys Asp
    6210                6215                6220
Leu Gln Ser Gly Asp Glu Lys Thr Leu Val Thr Glu Val Ile Ile Lys
6225                6230                6235                6240
Val Ala Pro Asp Ala Glu Thr Asp Pro Thr Ile Glu Val Asn Val Val
                6245                6250                6255
Gly Ser Leu Asp Asp Ala Phe Asn Pro Val Asp Thr Asp Gly Gln Ala
            6260                6265                6270
Gly Gln Asp Pro Val Gly Tyr Glu Asp Thr Tyr Ile Gln Leu Asp Phe
        6275                6280                6285
Asn Ser Thr Ile Ser Asp Gln Val Ser Gly Val Glu Gly Gly Gln Glu
    6290                6295                6300
Ala Phe Thr Ser Ile Thr Leu Thr Leu Asp Asp Pro Ser Ile Gly Ala
6305                6310                6315                6320
Phe Tyr Asp Asn Thr Gly Thr Ser Leu Gly Thr Ser Val Thr Phe Asn
                6325                6330                6335
Gln Ala Glu Ile Ala Ala Gly Ala Leu Asp Asn Val Leu Phe Arg Ala
            6340                6345                6350
Ile Glu Asn Tyr Pro Thr Gly Asn Asp Ile Asn Gln Val Gln Val Asn
        6355                6360                6365
Val Ser Gly Thr Val Thr Asp Thr Ala Thr Tyr Asn Asp Pro Ala Ser
    6370                6375                6380
Pro Ala Gly Thr Ala Thr Asp Ser Asp Thr Phe Ser Thr Ser Val Ser
6385                6390                6395                6400
Phe Glu Val Val Pro Val Val Asp Asp Val Ser Val Thr Gly Pro Gly
                6405                6410                6415
Ser Asp Pro Asp Val Ile Glu Ile Thr Gly Agn Glu Asp Gln Leu Ile
            6420                6425                6430
Ser Leu Ser Gly Thr Gly Pro Val Ser Ile Ala Leu Thr Asp Leu Asp
        6435                6440                6445
Gly Ser Glu Gln Phe Val Ser Ile Lys Phe Thr Asp Val Pro Asp Gly
    6450                6455                6460
Phe Gln Met Arg Ala Asp Ala Gly Ser Thr Tyr Thr Val Lys Asn Asn
6465                6470                6475                6480
Gly Asn Gly Glu Trp Ser Val Gln Leu Pro Gln Ala Ser Gly Leu Ser
                6485                6490                6495
Phe Asp Leu Ser Glu Ile Ser Ile Leu Pro Pro Lys Asn Phe Ser Gly
            6500                6505                6510
Thr Ala Glu Phe Gly Val Glu Val Phe Thr Gln Glu Ser Leu Leu Gly
        6515                6520                6525
Val Pro Thr Ala Ala Ala Asn Leu Pro Ser Phe Lys Leu His Val Val
    6530                6535                6540
Pro Val Gly Asp Asp Val Asp Thr Asn Pro Thr Asp Ser Val Thr Gly
6545                6550                6555                6560
Asn Glu Gly Gln Asn Ile Asp Ile Glu Ile Asn Ala Thr Ile Leu Asp
                6565                6570                6575
Lys Glu Leu Ser Ala Thr Gly Ser Gly Thr Tyr Thr Glu Asn Ala Pro
            6580                6585                6590
Glu Thr Leu Arg Val Glu Val Ala Gly Val Pro Gln Asp Ala Ser Ile
        6595                6600                6605
Phe Tyr Pro Asp Gly Thr Thr Leu Ala Ser Tyr Asp Pro Ala Thr Gln
    6610                6615                6620
Leu Trp Thr Leu Asp Val Pro Ala Gln Ser Leu Asp Lys Ile Val Phe
6625                6630                6635                6640
Asn Ser Gly Glu His Asn Ser Asp Thr Gly Asn Val Leu Gly Ile Asn
                6645                6650                6655
Gly Pro Leu Gln Ile Thr Val Arg Ser Val Asp Thr Asp Ala Asp Asn
            6660                6665                6670
Thr Glu Tyr Leu Gly Thr Pro Thr Ser Phe Asp Val Asp Leu Val Ile
        6675                6680                6685
Asp Pro Ile Asn Asp Gln Pro Ile Phe Val Asn Val Thr Asn Ile Glu
    6690                6695                6700
Thr Ser Glu Asp Ile Ser Val Ala Ile Asp Asn Phe Ser Ile Tyr Asp
6705                6710                6715                6720
Val Asp Ala Asn Phe Asp Asn Pro Asp Ala Pro Tyr Glu Leu Thr Leu
                6725                6730                6735
Lys Val Asp Gln Thr Leu Pro Gly Ala Gln Gly Val Phe Glu Phe Thr
            6740                6745                6750
Ser Ser Pro Asp Val Thr Phe Val Leu Gln Pro Asp Gly Ser Leu Val
        6755                6760                6765
Ile Thr Gly Lys Glu Ala Asp Ile Asn Thr Ala Leu Thr Asn Gly Ala
    6770                6775                6780
Val Thr Phe Lys Pro Asp Pro Asp Gln Asn Tyr Leu Asn Gln Thr Gly
6785                6790                6795                6800
Leu Val Thr Ile Asn Ala Thr Leu Asp Asp Gly Gly Asn Asn Gly Leu
                6805                6810                6815
Ile Asp Ala Val Asp Pro Asn Thr Ala Gln Thr Asn Gln Thr Thr Phe
            6820                6825                6830
Thr Ile Lys Val Thr Glu Val Asn Asp Ala Pro Val Ala Thr Asn Val
        6835                6840                6845
Asp Leu Gly Ser Ile Ala Glu Asp Ala Gln Ile Val Ile Val Glu Ser
    6850                6855                6860
Asp Leu Ile Ala Ala Ser Ser Asp Leu Glu Asn His Asn Leu Thr Val
6865                6870                6875                6880
Thr Gly Val Thr Leu Thr Gln Gly Gln Gly Gln Leu Thr Arg Tyr Glu
                6885                6890                6895
Asn Ala Gly Gly Ala Asp Asp Ala Ala Ile Thr Gly Pro Phe Trp Ile
            6900                6905                6910
Phe Ile Ala Asp Asn Asp Phe Asn Gly Asp Val Lys Phe Asn Tyr Ser
        6915                6920                6925
Ile Ile Asp Asp Gly Thr Thr Asn Gly Val Asp Asp Phe Lys Thr Asp
    6930                6935                6940
Ser Ala Glu Ile Ser Leu Val Val Thr Glu Val Asn Asp Gln Pro Val
6945                6950                6955                6960
Ala Ser Asn Ile Asp Leu Gly Thr Met Leu Glu Glu Gly Gln Leu Val
                6965                6970                6975
Ile Lys Glu Glu Asp Leu Ile Ser Ala Thr Thr Asp Pro Glu Asn Asp
            6980                6985                6990
Thr Ile Thr Val Asn Ser Leu Val Leu Asp Gln Gly Gln Gly Gln Leu
        6995                7000                7005
Gln Arg Phe Glu Asn Val Gly Gly Ala Asp Asp Ala Thr Ile Thr Gly
    7010                7015                7020
Pro Tyr Trp Val Phe Thr Ala Ala Asn Glu Tyr Asn Gly Asp Val Lys
7025                7030                7035                7040
Phe Thr Tyr Thr Val Glu Asp Asp Gly Thr Thr Asn Gly Ala Asp Asp
                7045                7050                7055
Phe Leu Thr Asp Thr Gly Glu Ile Ser Val Val Val Thr Glu Val Asn
            7060                7065                7070
Asp Gln Pro Val Ala Thr Asp Ile Asp Leu Gly Asn Ile Leu Glu Glu
        7075                7080                7085
Gly Gln Leu Ile Ile Lys Glu Glu Asp Leu Ile Ala Ala Thr Ser Asp
    7090                7095                7100
Pro Glu Asn Asp Thr Ile Thr Val Thr Asn Leu Val Leu Asp Glu Gly
7105                7110                7115                7120
Gln Gly Gln Leu Gln Arg Phe Glu Asn Val Gly Gly Ala Asp Asp Ala
                7125                7130                7135
Met Ile Thr Gly Pro Tyr Trp Ile Phe Thr Ala Ala Asp Glu Tyr Asn
            7140                7145                7150
Gly Asn Val Lys Phe Thr Tyr Thr Val Glu Asp Asp Gly Thr Thr Asn
        7155                7160                7165
Gly Ala Asn Asp Phe Leu Thr Asp Thr Ala Glu Ile Thr Ala Ile Val
    7170                7175                7180
Asp Gly Val Asn Asp Thr Pro Val Val Asn Gly Asp Ser Val Thr Thr
7185                7190                7195                7200
Ile Val Asp Glu Asp Ala Gly Gln Leu Leu Ser Gly Ile Asn Val Ser
                7205                7210                7215
Asp Pro Asp Tyr Val Asp Ala Phe Ser Asn Asp Leu Met Thr Val Thr
            7220                7225                7230
Leu Thr Val Asp Tyr Gly Thr Leu Asn Val Ser Leu Pro Ala Val Thr
        7235                7240                7245
Thr Val Met Val Asn Gly Asn Asn Thr Gly Ser Val Ile Leu Val Gly
    7250                7255                7260
Thr Leu Ser Asp Leu Asn Ala Leu Ile Asp Thr Pro Thr Ser Pro Asn
7265                7270                7275                7280
Gly Val Tyr Leu Asp Ala Ser Leu Ser Pro Thr Asn Ser Ile Gly Leu
                7285                7290                7295
Glu Val Ile Ala Lys Asp Ser Gly Asn Pro Ser Gly Ile Ala Ile Glu
            7300                7305                7310
Thr Ala Pro Val Val Tyr Asn Ile Ala Val Thr Pro Val Ala Asn Ala
        7315                7320                7325
Pro Thr Leu Ser Ile Asp Pro Ala Phe Asn Tyr Val Arg Asn Ile Thr
    7330                7335                7340
Thr Ser Ser Ser Val Val Ala Asn Ser Gly Val Ala Leu Val Gly Ile
7345                7350                7355                7360
Val Ala Ala Leu Thr Asp Ile Thr Glu Glu Leu Thr Leu Lys Ile Ser
                7365                7370                7375
Asp Val Pro Asp Gly Val Asp Val Thr Ser Asp Val Gly Thr Val Ser
            7380                7385                7390
Leu Val Gly Asp Thr Trp Ile Ala Thr Ala Asp Ala Ile Asp Ser Leu
        7395                7400                7405
Arg Leu Val Glu Gln Ser Ser Leu Gly Lys Pro Leu Thr Pro Gly Asn
    7410                7415                7420
Tyr Thr Leu Lys Val Glu Ala Leu Ser Glu Glu Thr Asp Asn Asn Asp
7425                7430                7435                7440
Ile Ala Ile Ser Gln Asn Ile Asp Leu Asn Leu Asn Ile Val Ala Asn
                7445                7450                7455
Pro Ile Asp Leu Asp Leu Ser Ser Glu Thr Asp Asp Val Gln Leu Leu
            7460                7465                7470
Ala Ser Asn Phe Asp Thr Asn Leu Thr Gly Gly Thr Gly Asn Asp Arg
        7475                7480                7485
Leu Val Gly Gly Ala Gly Asp Asp Thr Leu Val Gly Gly Asp Gly Asn
    7490                7495                7500
Asp Thr Leu Ile Gly Gly Gly Gly Ser Asp Ile Leu Thr Gly Gly Asn
7505                7510                7515                7520
Gly Met Asp Ser Phe Val Trp Leu Asn Ile Glu Asp Gly Val Glu Asp
                7525                7530                7535
Thr Ile Thr Asp Phe Ser Leu Ser Glu Gly Asp Gln Ile Asp Leu Arg
            7540                7545                7550
Glu Val Leu Pro Glu Leu Lys Asn Thr Ser Pro Asp Met Ser Ala Leu
        7555                7560                7565
Leu Gln Gln Ile Asp Ala Lys Val Glu Gly Asp Asp Ile Glu Leu Thr
    7570                7575                7580
Ile Lys Ser Asp Gly Leu Gly Thr Thr Glu Gln Val Ile Val Val Glu
7585                7590                7595                7600
Asp Leu Ala Pro Gln Leu Thr Leu Ser Gly Thr Met Pro Ser Asp Ile
                7605                7610                7615
Leu Asp Ala Leu Val Gln Gln Asn Val Ile Thr His Gly
            7620                7625
 
<210>5
<211>765
<212>DNA
<213>灿烂弧菌
 
<400>5
atgaaaaaaa catcactatt acttgcttcc attactctgg cactttctgg tgtagtacaa 60
gctgaccagc tagaagacat tcaaaaatca ggcacacttc gcgtcggcac cacaggcgac 120
tacaaacctt tttcttactt cgacggcaaa acctactctg gttatgacat tgacgtagcc 180
aaacatgttg cagagcagtt gggcgttgaa ttacagattg ttcgtaccac atggaaagat 240
ctactgaccg atctagacag cgataaatac gacatcgcga tgggcggtat cacgcgtaaa 300
atgcagcgtc agttaaacgc agaacaaact caaggttaca tgacctttgg caagtgtttc 360
ttagttgcga aaggcaaagc agaacaatac aacagcattg agaaagtgaa cctctcttct 420
gtgcgtgttg gcgtcaatat cggtgggact aatgagatgt ttgcggatgc taacttgcaa 480
gacgcgagct ttacgcgtta cgagaacaac ctagacgttc cgcaagccgt tgcggaaggt 540
aaagttgatg taatggtgac agaaactcct gaaggtctgt tctatcaagt gacggacgaa 600
cgtcttgaag cggcacgctg tgaaacaccg tttaccaaca gtcaattcgg ttacctgata 660
ccaaaaggtg aacaacgctt gttgaacaca gtgaacttca ttatggatga gatgaaattg 720
aaaggcgtcg aagaagagtt cctgatccac aactctctta agtaa                 765
 
<210>6
<211>254
<212>PRT
<213>灿烂弧菌
 
<400>6
Met Lys Lys Thr Ser Leu Leu Leu Ala Ser Ile Thr Leu Ala Leu Ser
 1               5                  10                  15
Gly Val Val Gln Ala Asp Gln Leu Glu Asp Ile Gln Lys Ser Gly Thr
            20                  25                  30
Leu Arg Val Gly Thr Thr Gly Asp Tyr Lys Pro Phe Ser Tyr Phe Asp
        35                  40                  45
Gly Lys Thr Tyr Ser Gly Tyr Asp Ile Asp Val Ala Lys His Val Ala
    50                  55                  60
Glu Gln Leu Gly Val Glu Leu Gln Ile Val Arg Thr Thr Trp Lys Asp
65                  70                  75                  80
Leu Leu Thr Asp Leu Asp Ser Asp Lys Tyr Asp Ile Ala Met Gly Gly
                85                  90                  95
Ile Thr Arg Lys Met Gln Arg Gln Leu Asn Ala Glu Gln Thr Gln Gly
            100                 105                 110
Tyr Met Thr Phe Gly Lys Cys Phe Leu Val Ala Lys Gly Lys Ala Glu
        115                 120                 125
Gln Tyr Asn Ser Ile Glu Lys Val Asn Leu Ser Ser Val Arg Val Gly
    130                 135                 140
Val Asn Ile Gly Gly Thr Asn Glu Met Phe Ala Asp Ala Asn Leu Gln
145                 150                 155                 160
Asp Ala Ser Phe Thr Arg Tyr Glu Asn Asn Leu Asp Val Pro Gln Ala
                165                 170                 175
Val Ala Glu Gly Lys Val Asp Val Met Val Thr Glu Thr Pro Glu Gly
            180                 185                 190
Leu Phe Tyr Gln Val Thr Asp Glu Arg Leu Glu Ala Ala Arg Cys Glu
        195                 200                 205
Thr Pro Phe Thr Asn Ser Gln Phe Gly Tyr Leu Ile Pro Lys Gly Glu
    210                 215                 220
Gln Arg Leu Leu Asn Thr Val Asn Phe Ile Met Asp Glu Met Lys Leu
225                 230                 235                 240
Lys Gly Val Glu Glu Glu Phe Leu Ile His Asn Ser Leu Lys
                245                 250
 
<210>7
<211>765
<212>DNA
<213>灿烂弧菌
 
<400>7
atgaaaaaaa catcactatt acttgcttcc attactctgg cactttctgg tgtagtacaa 60
gctgaccagc tagaagacat tcaaaaatca ggcacacttc gcgtcggcac cacaggcgac 120
tacaaacctt tttcttactt cgacggcaaa acctactctg gttatgacat tgacgtagcc 180
aaacatgttg cagagcagtt gggcgttgaa ttacagattg ttcgtaccac atggaaagat 240
ctactgaccg atctagacag cgataaatac gacatcgcga tgggcggtat cacgcgtaaa 300
atgcagcgtc agttaaacgc agaacaaact caaggttaca tgacctttgg caagtgtttc 360
ttagttgcga aaggcaaagc agaacaatac aacagcattg agaaagtgaa cctctcttct 420
gtgcgtgttg gcgtcaatat cggtgggact aatgagatgt ttgcggatgc taacttgcaa 480
gacgcgagct ttacgcgtta cgagaacaac ctagacgttc cgcaagccgt tgcggaaggt 540
aaagttgatg taatggtgac agaaactcct gaaggtctgt tctatcaagt gacggacgaa 600
cgtcttgaag cggcacgctg tgaaacaccg tttaccaaca gtcaattcgg ttacctgata 660
ccaaaaggtg aacaacgctt gttgaacaca gtgaacttca ttatggatga gatgaaattg 720
aaaggcgtcg aagaagagtt cctgatccac aactctctta agtaa                 765
 
<210>8
<211>588
<212>PRT
<213>灿烂弧菌
 
<400>8
Met Thr Ile Asp Thr Phe Val Val Leu Ala Tyr Phe Phe Phe Leu Ile
 1               5                  10                  15
Ala Ile Gly Trp Met Phe Arg Lys Phe Thr Thr Ser Thr Ser Asp Tyr
            20                  25                  30
Phe Arg Gly Gly Gly Lys Met Leu Trp Trp Met Val Gly Ala Thr Ala
        35                  40                  45
Phe Met Thr Gln Phe Ser Ala Trp Thr Phe Thr Gly Ala Ala Gly Arg
    50                  55                  60
Ala Phe Asn Asp Gly Phe Val Ile Val Ile Leu Phe Leu Ala Asn Ala
65                  70                  75                  80
Phe Gly Tyr Phe Met Asn Tyr Met Tyr Phe Ala Pro Lys Phe Arg Gln
                85                  90                  95
Leu Arg Val Val Thr Ala Ile Glu Ala Ile Arg Gln Arg Phe Gly Lys
            100                 105                 110
Thr Ser Glu Gln Phe Phe Thr Trp Ala Gly Met Pro Asp Ser Leu Ile
        115                 120                 125
Ser Ala Gly Ile Trp Leu Asn Gly Leu Ala Ile Phe Val Ala Ala Val
    130                 135                 140
Phe Asn Ile Pro Met Glu Ala Thr Ile Val Val Thr Gly Met Val Leu
145                 150                 155                 160
Val Leu Met Ala Val Thr Gly Gly Ser Trp Ala Val Val Ala Ser Asp
                165                 170                 175
Phe Met Gln Met Leu Val Ile Met Ala Val Thr Ile Thr Cys Ala Val
            180                 185                 190
Ala Ala Tyr Phe His Gly Gly Gly Leu Thr Asn Ile Val Ala Asn Phe
        195                 200                 205
Asp Gly Asp Phe Met Leu Gly Asn Asn Leu Asn Tyr Met Ser Ile Phe
    210                 215                 220
Val Leu Trp Val Val Phe Ile Phe Val Lys Gln Phe Gly Val Met Asn
225                 230                 235                 240
Asn Ser Ile Asn Ala Tyr Arg Tyr Leu Cys Ala Lys Asp Ser Glu Asn
                245                 250                 255
Ala Arg Lys Ala Ala Gly Leu Ala Cys Ile Leu Met Val Val Gly Pro
            260                 265                 270
Leu Ile Trp Phe Leu Pro Pro Trp Tyr Val Ser Ala Phe Met Pro Asp
        275                 280                 285
Phe Ala Leu Glu Tyr Ala Ser Met Gly Asp Lys Ala Gly Asp Ala Ala
    290                 295                 300
Tyr Leu Ala Phe Val Gln Asn Val Met Pro Ala Gly Met Val Gly Leu
305                 310                 315                 320
Leu Met Ser Ala Met Phe Ala Ala Thr Met Ser Ser Met Asp Ser Gly
                325                 330                 335
Leu Asn Arg Asn Ala Gly Ile Phe Val Met Asn Phe Tyr Ser Pro Ile
            340                 345                 350
Leu Arg Gln Asn Ala Thr Gln Lys Glu Leu Val Ile Val Ser Lys Leu
        355                 360                 365
Thr Thr Ile Met Met Gly Ile Ile Ile Ile Ala Ile Gly Leu Phe Ile
    370                 375                 380
Asn Ser Leu Arg His Leu Ser Leu Phe Asp Ile Val Met Asn Val Gly
385                 390                 395                 400
Ala Leu Ile Gly Phe Pro Met Leu Ile Pro Val Leu Leu Gly Met Trp
                405                 410                 415
Ile Arg Lys Thr Pro Asp Trp Ala Gly Trp Ser Thr Leu Ile Val Gly
            420                 425                 430
Gly Phe Val Ser Tyr Ile Phe Gly Ile Ser Leu Gln Ala Glu Asp Ile
        435                 440                 445
Glu His Leu Phe Gly Met Glu Thr Ala Leu Thr Gly Arg Glu Trp Ser
    450                 455                 460
Asp Leu Lys Val Gly Leu Ser Leu Ala Ala His Val Val Phe Thr Gly
465                 470                 475                 480
Gly Tyr Phe Ile Leu Thr Ser Arg Phe Tyr Lys Gly Leu Ser Pro Glu
                485                 490                 495
Arg Glu Lys Glu Val Asp Gln Leu Phe Thr Asn Trp Asn Thr Pro Leu
            500                 505                 510
Val Ala Glu Gly Glu Glu Gln Gln Asn Leu Asp Thr Lys Gln Arg Ser
        515                 520                 525
Met Leu Gly Lys Leu Ile Ser Thr Ala Gly Phe Gly Ile Leu Ala Met
    530                 535                 540
Ala Leu Ile Pro Asn Glu Pro Thr Gly Arg Leu Leu Phe Leu Leu Cys
545                 550                 555                 560
Gly Ser Met Val Leu Thr Val Gly Ile Leu Leu Val Asn Ala Ser Lys
                565                 570                 575
Ala Pro Ala Lys Met Asn Asn Glu Ser Val Ala Lys
            580                 585
 
<210>9
<211>627
<212>DNA
<213>灿烂弧菌
<400>9
atgacgacat taaatgaaca actagcaaac ctaaaagtaa ttcctgtaat cgcgatcaac  60
cgtgctgaag acgctatccc tctaggtaaa gcgttggttg aaaatggcat gccatgtgca  120
gaaattacac tacgtacaga atgtgcaatc gaagcgattc gcatcatgcg taaagaattc  180
ccagacatgc taatcggttc aggtactgta ctgactaacg agcaagttga cgcatctatc  240
gaagctggtg ttgatttcat cgtaagccca ggttttaacc cacgtactgt tcaatactgt  300
atcgataaag gtattgcaat cgtaccgggt gttaacaacc caagcctagt tgagcaagca  360
atggaaatgg gtcttcgcac gttgaagttc ttccctgctg agccttcagg cggtactggc  420
atgcttaaag cactaacagc agtttaccct gttaaattca tgcctactgg tggcgtaagc  480
ttgaagaatg ttgatgaata cctatcgatc ccttctgttc ttgcgtgtgg cggtacttgg  540
atggttccaa ctaaccttat cgatgaaggt aagtgggacg aactaggcaa gcttgttcgt  600
gacgcagttg atcacgttaa cgcttaa                                      627
 
<210>10
<211>208
<212>PRT
<213>灿烂弧菌
 
<400>10
Met Thr Thr Leu Asn Glu Gln Leu Ala Asn Leu Lys Val Ile Pro Val
 1               5                  10                  15
Ile Ala Ile Asn Arg Ala Glu Asp Ala Ile Pro Leu Gly Lys Ala Leu
            20                  25                  30
Val Glu Asn Gly Met Pro Cys Ala Glu Ile Thr Leu Arg Thr Glu Cys
        35                  40                  45
Ala Ile Glu Ala Ile Arg Ile Met Arg Lys Glu Phe Pro Asp Met Leu
    50                  55                  60
Ile Gly Ser Gly Thr Val Leu Thr Asn Glu Gln Val Asp Ala Ser Ile
65                  70                  75                  80
Glu Ala Gly Val Asp Phe Ile Val Ser Pro Gly Phe Asn Pro Arg Thr
                85                  90                  95
Val Gln Tyr Cys Ile Asp Lys Gly Ile Ala Ile Val Pro Gly Val Asn
            100                 105                 110
Asn Pro Ser Leu Val Glu Gln Ala Met Glu Met Gly Leu Arg Thr Leu
        115                 120                 125
Lys Phe Phe Pro Ala Glu Pro Ser Gly Gly Thr Gly Met Leu Lys Ala
    130                 135                 140
Leu Thr Ala Val Tyr Pro Val Lys Phe Met Pro Thr Gly Gly Val Ser
145                 150                 155                 160
Leu Lys Asn Val Asp Glu Tyr Leu Ser Ile Pro Ser Val Leu Ala Cys
                165                 170                 175
Gly Gly Thr Trp Met Val Pro Thr Asn Leu Ile Asp Glu Gly Lys Trp
            180                 185                 190
Asp Glu Leu Gly Lys Leu Val Arg Asp Ala Val Asp His Val Asn Ala
        195                 200                 205
 
<210>11
<211>933
<212>DNA
<213>灿烂弧菌
 
<400>11
atgaaatcat taaacatcgc ggtcattggc gagtgcatgg ttgagctaca aaagaaacaa  60
gacgggctta agcaaagttt tggtggcgat acgctgaata ctgcacttta cttgtcacgc  120
ttaacaaaag agcaagatat caacacgagc tacgtaactg cactaggcac tgacccattc  180
agtaccgaca tgttaaaaaa ttggcaagcg gaaggtatcg acacgagctt aattgctcag  240
ctggaccaca aacaaccagg gctttactac atcgagaccg atgaaactgg tgaacgcagt  300
ttccactact ggcgtagtga tgctgcagcg aagttcatgt ttgatcagga agacacgcct  360
gctcttcttg ataagctgtt ctcttttgac gcgatttact taagtggtat tacgctggca  420
atcttgacag aaaatggtcg cacgcagcta ttcaacttct tagacaaatt caaagctcaa  480
ggcggccaag tattcttcga caataactac cgacctaaac tttgggaaag ccaacaagaa  540
gcgatttctt ggtacttgaa aatgcttaag tacacagata cggctctgct gacgtttgat  600
gatgagcaag agctatacgg cgacgaaagc attgaacaat gtattacacg tacgtcagag  660
tctggtgtga aagagatcgt cattaaacgt ggcgcgaaag actgcttagt ggttgaaagc  720
caaagcgctc aatacgttgc acccaaccct gtagacaaca tcgttgatac gactgccgct  780
ggcgactcgt tcagtgcagg cttcttggcc aagcgcttga gcggcggtag tgctcgtgat  840
gctgcatttg caggtcatat tgtggcagga accgtgattc agcatccagg tgctatcatt  900
cctctagaag cgacgcctga tctgtctcta taa                               933
 
<210>12
<211>310
<212>PRT
<213>灿烂弧菌
 
<400>12
Met Lys Ser Leu Asn Ile Ala Val Ile Gly Glu Cys Met Val Glu Leu
 1               5                  10                  15
Gln Lys Lys Gln Asp Gly Leu Lys Gln Ser Phe Gly Gly Asp Thr Leu
            20                  25                  30
Asn Thr Ala Leu Tyr Leu Ser Arg Leu Thr Lys Glu Gln Asp Ile Asn
        35                  40                  45
Thr Ser Tyr Val Thr Ala Leu Gly Thr Asp Pro Phe Ser Thr Asp Met
    50                  55                  60
Leu Lys Asn Trp Gln Ala Glu Gly Ile Asp Thr Ser Leu Ile Ala Gln
65                  70                  75                  80
Leu Asp His Lys Gln Pro Gly Leu Tyr Tyr Ile Glu Thr Asp Glu Thr
                85                  90                  95
Gly Glu Arg Ser Phe His Tyr Trp Arg Ser Asp Ala Ala Ala Lys Phe
            100                 105                 110
Met Phe Asp Gln Glu Asp Thr Pro Ala Leu Leu Asp Lys Leu Phe Ser
        115                 120                 125
Phe Asp Ala Ile Tyr Leu Ser Gly Ile Thr Leu Ala Ile Leu Thr Glu
    130                 135                 140
Asn Gly Arg Thr Gln Leu Phe Asn Phe Leu Asp Lys Phe Lys Ala Gln
145                 150                 155                 160
Gly Gly Gln Val Phe Phe Asp Asn Asn Tyr Arg Pro Lys Leu Trp Glu
                165                 170                 175
Ser Gln Gln Glu Ala Ile Ser Trp Tyr Leu Lys Met Leu Lys Tyr Thr
            180                 185                 190
Asp Thr Ala Leu Leu Thr Phe Asp Asp Glu Gln Glu Leu Tyr Gly Asp
        195                 200                 205
Glu Ser Ile Glu Gln Cys Ile Thr Arg Thr Ser Glu Ser Gly Val Lys
    210                 215                 220
Glu Ile Val Ile Lys Arg Gly Ala Lys Asp Cys Leu Val Val Glu Ser
225                 230                 235                 240
Gln Ser Ala Gln Tyr Val Ala Pro Asn Pro Val Asp Asn Ile Val Asp
                245                 250                 255
Thr Thr Ala Ala Gly Asp Ser Phe Ser Ala Gly Phe Leu Ala Lys Arg
            260                 265                 270
Leu Ser Gly Gly Ser Ala Arg Asp Ala Ala Phe Ala Gly His Ile Val
        275                 280                 285
Ala Gly Thr Val Ile Gln His Pro Gly Ala Ile Ile Pro Leu Glu Ala
    290                 295                 300
Thr Pro Asp Leu Ser Leu
305                 310
 
<210>13
<211>336
<212>DNA
<213>灿烂弧菌
 
<400>13
atgaactctt tctttatcct agatgaaaat ccatgggaag aacttggtgg cggcattaag  60
cgtaaaatcg ttgcttacac tgacgatcta atggcagtac acctatgctt tgataagggc  120
gcgattggcc accctcatac tcacgaaatt cacgaccaaa tcggttatgt tgttcgtggt  180
agcttcgaag ctgaaatcga cggcgagaag aaagtgctta aagaaggcga tgcttacttc  240
gctcgtaaac acatgatgca cggtgcagtt gctctagaac aagacagcat ccttcttgat  300
atcttcaatc ctgcgcgtga agatttccta aaataa                            336
 
<210>14
<211>111
<212>PRT
<213>灿烂弧菌
 
<400>14
Met Asn Ser Phe Phe Ile Leu Asp Glu Asn Pro Trp Glu Glu Leu Gly
 1               5                  10                  15
Gly Gly Ile Lys Arg Lys Ile Val Ala Tyr Thr Asp Asp Leu Met Ala
            20                  25                  30
Val His Leu Cys Phe Asp Lys Gly Ala Ile Gly His Pro His Thr His
        35                  40                  45
Glu Ile His Asp Gln Ile Gly Tyr Val Val Arg Gly Ser Phe Glu Ala
    50                  55                  60
Glu Ile Asp Gly Glu Lys Lys Val Leu Lys Glu Gly Asp Ala Tyr Phe
65                  70                  75                  80
Ala Arg Lys His Met Met His Gly Ala Val Ala Leu Glu Gln Asp Ser
                85                  90                  95
Ile Leu Leu Asp Ile Phe Asn Pro Ala Arg Glu Asp Phe Leu Lys
            100                 105                 110
 
<210>15
<211>2208
<212>DNA
<213>灿烂弧菌
 
<400>15
atgacgacta aaccagtatt gttgactgaa gctgaaatcg aacagcttca tcttgaagtg 60
ggccgttcta gcttaatggg caaaaccatt gcagcgaacg cgaaagacct agaagcattc 120
atgcgtttac ctattgatgt tccaggtcac ggtgaagctg ggggttacga acataaccgc 180
cacaagcaaa attacacgta catgaaccta gctggtcgca tgttcttgat cactaaagag 240
caaaaatacg ctgactttgt tacagaatta ctagaagagt acgcagacaa atatctaacg 300
tttgattacc acgtacagaa aaacaccaac ccaacaggtc gtttgttcca ccaaatccta 360
aacgaacact gctggttaat gttctcaagc ttagcttatt cttgtgttgc ttcaacactg 420
acacaagatc agcgtgacaa tattgagtct cgcatttttg aacccatgct agaaatgttc 480
acggttaaat acgcacacga cttcgaccgt attcacaatc acggtatttg ggcagtagcc 540
gctgtgggta tctgtggtct tgctttaggc aaacgtgaat acctagaaat gtcagtgtac 600
ggcatcgacc gtaatgatac tggcggtttc ctagcgcaag tttctcagct atttgcacct 660
tctggctact acatggaagg tccttactac catcgttatg cgattcgccc aacgtgtgtg 720
ttcgctgaag tgattcaccg tcatatgcct gaagttgata tctacaacta caaaggcggc 780
gtgattggta acacagtaca agctatgctt gcgacagcgt acccgaacgg cgagttcccg 840
gctctgaatg atgcttctcg tactatgggt atcacagaca tgggtgttca ggttgcggtc 900
agtgtttaca gtaagcatta ctcttctgaa aacggtgtag accaaaacat tctgggtatg 960
gcgaagattc aagacgcagt atggatgcat ccatgtggtc ttgagctatc taaagcatac 1020
gaagccgcat ctgcagagaa agaaatcggc atgcctttct ggccaagtgt tgaattgaat 1080
gaaggccctc aaggtcacaa cggcgcgcaa ggctttatcc gtatgcagga taagaaaggc 1140
gacgtttctc aacttgtgat gaactacggc caacacggca tgggtcacgg caactttgat 1200
acgctgggta tttctttctt taaccgcggt caagaagtgc tacgtgaata cggcttctgt 1260
cgttgggtta acgttgagcc aaaattcggc ggccgttacc tagacgaaaa caaatcttac 1320
gctcgtcaaa cgattgctca caatgcagtt acgattgatg aaaaatgtca gaacaacttt 1380
gacgttgaac gtgcagactc agtacatggt ttacctcact tctttaaagt agaagacgat 1440
caaatcaacg gtatgagtgc atttgctaac gatcattacc aaggctttga catgcaacgc 1500
agcgtgttca tgctaaatct tgaagaatta gaatctccgt tattgttaga cctataccgc 1560
ttagattcta caaaaggcgg cgaaggcgag caccaatacg actattcaca ccaatatgcg 1620
ggtcagattg ttcgcactaa cttcgaatac caagcgaaca aagagctaaa cactctaggt 1680
gacgatttcg gttaccaaca tctatggaac gtcgcaagcg gtgaagtgaa gggcacagca 1740
attgtaagtt ggctacaaaa caacacctac tacacatggc taggtgcaac gtctaacgat 1800
aatgctgaag taatatttac tcgcactggc gctaacgacc caagtttcaa tctacgttca 1860
gagcctgcgt tcattctacg cagcaaaggc gaaacaacac tgtttgcttc tgttgttgaa 1920
acgcacggtt atttcaacga agaattcgag caatctgtca atgcacgtgg tgttgtgaaa 1980
gacatcaaag tcgtggctca caccaatgtc ggttcggtag ttgagatcac cacagagaaa 2040
tcaaacgtga cagtgatgat cagcaaccaa cttggcgcga ctgacagcac tgaacacaaa 2100
gtagaactga acggcaaagt atacagctgg aaaggcttct actcagtaga gacaacttta 2160
caagaaacga attcagaaga acttagcact gcagggcagg ggaaataa              2208
 
<210>16
<211>735
<212>PRT
<213>灿烂弧菌
 
<400>16
Met Thr Thr Lys Pro Val Leu Leu Thr Glu Ala Glu Ile Glu Gln Leu
 1               5                  10                  15
His Leu Glu Val Gly Arg Ser Ser Leu Met Gly Lys Thr Ile Ala Ala
            20                  25                  30
Asn Ala Lys Asp Leu Glu Ala Phe Met Arg Leu Pro Ile Asp Val Pro
        35                  40                  45
Gly His Gly Glu Ala Gly Gly Tyr Glu His Asn Arg His Lys Gln Asn
    50                  55                  60
Tyr Thr Tyr Met Asn Leu Ala Gly Arg Met Phe Leu Ile Thr Lys Glu
65                  70                  75                  80
Gln Lys Tyr Ala Asp Phe Val Thr Glu Leu Leu Glu Glu Tyr Ala Asp
                85                  90                  95
Lys Tyr Leu Thr Phe Asp Tyr His Val Gln Lys Asn Thr Asn Pro Thr
            100                 105                 110
Gly Arg Leu Phe His Gln Ile Leu Asn Glu His Cys Trp Leu Met Phe
        115                 120                 125
Ser Ser Leu Ala Tyr Ser Cys Val Ala Ser Thr Leu Thr Gln Asp Gln
    130                 135                 140
Arg Asp Asn Ile Glu Ser Arg Ile Phe Glu Pro Met Leu Glu Met Phe
145                 150                 155                 160
Thr Val Lys Tyr Ala His Asp Phe Asp Arg Ile His Asn His Gly Ile
                165                 170                 175
Trp Ala Val Ala Ala Val Gly Ile Cys Gly Leu Ala Leu Gly Lys Arg
            180                 185                 190
Glu Tyr Leu Glu Met Ser Val Tyr Gly Ile Asp Arg Asn Asp Thr Gly
        195                 200                 205
Gly Phe Leu Ala Gln Val Ser Gln Leu Phe Ala Pro Ser Gly Tyr Tyr
    210                 215                 220
Met Glu Gly Pro Tyr Tyr His Arg Tyr Ala Ile Arg Pro Thr Cys Val
225                 230                 235                 240
Phe Ala Glu Val Ile His Arg His Met Pro Glu Val Asp Ile Tyr Asn
                245                 250                 255
Tyr Lys Gly Gly Val Ile Gly Asn Thr Val Gln Ala Met Leu Ala Thr
            260                 265                 270
Ala Tyr Pro Asn Gly Glu Phe Pro Ala Leu Asn Asp Ala Ser Arg Thr
        275                 280                 285
Met Gly Ile Thr Asp Met Gly Val Gln Val Ala Val Ser Val Tyr Ser
    290                 295                 300
Lys His Tyr Ser Ser Glu Asn Gly Val Asp Gln Asn Ile Leu Gly Met
305                 310                 315                 320
Ala Lys Ile Gln Asp Ala Val Trp Met His Pro Cys Gly Leu Glu Leu
                325                 330                 335
Ser Lys Ala Tyr Glu Ala Ala Ser Ala Glu Lys Glu Ile Gly Met Pro
            340                 345                 350
Phe Trp Pro Ser Val Glu Leu Asn Glu Gly Pro Gln Gly His Asn Gly
        355                 360                 365
Ala Gln Gly Phe Ile Arg Met Gln Asp Lys Lys Gly Asp Val Ser Gln
    370                 375                 380
Leu Val Met Asn Tyr Gly Gln His Gly Met Gly His Gly Asn Phe Asp
385                 390                 395                 400
Thr Leu Gly Ile Ser Phe Phe Asn Arg Gly Gln Glu Val Leu Arg Glu
                405                 410                 415
Tyr Gly Phe Cys Arg Trp Val Asn Val Glu Pro Lys Phe Gly Gly Arg
            420                 425                 430
Tyr Leu Asp Glu Asn Lys Ser Tyr Ala Arg Gln Thr Ile Ala His Asn
        435                 440                 445
Ala Val Thr Ile Asp Glu Lys Cys Gln Asn Asn Phe Asp Val Glu Arg
    450                 455                 460
Ala Asp Ser Val His Gly Leu Pro His Phe Phe Lys Val Glu Asp Asp
465                 470                 475                 480
Gln Ile Asn Gly Met Ser Ala Phe Ala Asn Asp His Tyr Gln Gly Phe
                485                 490                 495
Asp Met Gln Arg Ser Val Phe Met Leu Asn Leu Glu Glu Leu Glu Ser
            500                 505                 510
Pro Leu Leu Leu Asp Leu Tyr Arg Leu Asp Ser Thr Lys Gly Gly Glu
        515                 520                 525
Gly Glu His Gln Tyr Asp Tyr Ser His Gln Tyr Ala Gly Gln Ile Val
    530                 535                 540
Arg Thr Asn Phe Glu Tyr Gln Ala Asn Lys Glu Leu Asn Thr Leu Gly
545                 550                 555                 560
Asp Asp Phe Gly Tyr Gln His Leu Trp Asn Val Ala Ser Gly Glu Val
                565                 570                 575
Lys Gly Thr Ala Ile Val Ser Trp Leu Gln Asn Asn Thr Tyr Tyr Thr
            580                 585                 590
Trp Leu Gly Ala Thr Ser Asn Asp Asn Ala Glu ValIle Phe Thr Arg
        595                 600                 605
Thr Gly Ala Asn Asp Pro Ser Phe Asn Leu Arg Ser Glu Pro Ala Phe
    610                 615                 620
Ile Leu Arg Ser Lys Gly Glu Thr Thr Leu Phe Ala Ser Val Val Glu
625                 630                 635                 640
Thr His Gly Tyr Phe Asn Glu Glu Phe Glu Gln Ser Val Asn Ala Arg
                645                 650                 655
Gly Val Val Lys Asp Ile Lys Val Val Ala His Thr Asn Val Gly Ser
            660                 665                 670
Val Val Glu Ile Thr Thr Glu Lys Ser Asn Val Thr Val Met Ile Ser
        675                 680                 685
Asn Gln Leu Gly Ala Thr Asp Ser Thr Glu His Lys Val Glu Leu Asn
    690                 695                 700
Gly Lys Val Tyr Ser Trp Lys Gly Phe Tyr Ser Val Glu Thr Thr Leu
705                 710                 715                 720
Gln Glu Thr Asn Ser Glu Glu Leu Ser Thr Ala Gly Gln Gly Lys
                725                 730                 735
 
<210>17
<211>2154
<212>DNA
<213>灿烂弧菌
 
<400>17
atgagctatc aaccactttt acttaacttt gatgaagcag ctgaacttcg taaagaactt 60
ggcaaggata gcctattagg taacgcactg actcgcgaca ttaaacaaac tgacgcttac 120
atggctgaag ttggcattga agtaccaggt cacggtgaag gcggcggtta cgagcacaac 180
cgtcataagc aaaactacat ccatatggat ctagcaggcc gtttgttcct tatcactgag 240
gaaacaaaat accgagatta catcgttgat atgctaacag cgtacgcgac ggtataccca 300
acacttgaaa gcaacgtaag ccgtgactct aaccctccgg gtaagctgtt ccaccaaacg 360
ttgaacgaga acatgtggat gctttacgct tcttgtgcgt acagctgcat ctaccacacg 420
atctctgaag agcaaaagcg tctgatcgaa gacgatcttc ttaagcaaat gatcgaaatg  480
ttcgttgtga cttacgcaca cgacttcgat atcgtacaca accacggctt atgggcagtg  540
gcagcagtag gtatctgtgg ttacgcaatc aacgatcaag agtctgtaga caaagcacta  600
tacggcctga aactagacaa agtcagcggc ggtttcttag cgcaactaga ccaactgttt  660
tcgccagacg gctactacat ggaaggtcct tactaccacc gtttctctct gcgtccaatc  720
tacctgttcg cagaagcgat tgaacgtcgt cagcctgaag ttggtatcta tgaattcaac  780
gattcagtga tcaagacaac gtcttactct gtattcaaaa cggcattccc agacggtaca  840
ttgcctgctc tgaacgattc atcgaagaca atctctatca acgatgaagg cgttatcatg  900
gcaacgtctg tgtgttacca ccgttacgag caaactgaaa ctctacttgg tatggctaac  960
caccagcaaa acgtttgggt tcatgcttca ggtaaaacac tgtctgacgc ggttgatgca  1020
gcagacgaca tcaaagcatt caactggggt agcctgtttg taaccgacgg ccctgaaggc  1080
gaaaaaggcg gcgtaagcat ccttcgtcac cgtgacgaac aagatgacga cacgatggcg  1140
ttgatctggt ttggtcaaca cggttctgat caccagtacc actctgctct agaccacggt  1200
cactacgatg gcctgcacct aagcgtattt aaccgtggcc acgaagtgct gcacgatttc  1260
ggcttcggtc gctgggtaaa cgttgagcct aagtttggcg gtcgttacat cccagagaac  1320
aagtcttact gtaagcagac ggttgctcac aacacagtaa cggttgatca gaaaacgcag  1380
aacaacttca acacagcatt ggctgagtct aagtttggtc agaagcactt cttcgtagca  1440
gacgaccagt ctctacaagg catgagcggc acaatttctg agtactacac tggcgtagac  1500
atgcaacgca gcgtgattct tgctgaactt cctgagttcg agaagccact tgtaatcgac  1560
gtataccgca tcgaagctga cgctgaacac cagtacgacc tacccgttca ccactctggt  1620
cagatcatcc gtactgactt cgattacaac atggaaaaaa cgcttaagcc gctaggtgaa  1680
gacaacggtt accagcactt atggaacgtg gcttcaggca aagtgaacga agaaggttct  1740
ctagtaagct ggctacatga cagcagctac tacagcctag taaccagcgc gaatgcgggc  1800
agcgaagtga tttttgctcg cactggtgct aacgatccag acttcaacct taagagtgag  1860
cctgcgttca tcttacgtca gtctggtcaa aaccacgtgt ttgcttctgt actagaaacg  1920
catggttact ttaacgagtc tatcgaagcc tctgtaggcg ctcgtggtct agttaaatca  1980
gtatctgttg tgggccataa cagtgtcggg actgttgttc gcattcagac tacttctggc  2040
aacacttacc actacggtat ctcaaaccaa gctgaagaca cgcagcaagc aactcacact  2100
gttgagttcg cgggtgagac atactcgtgg gaaggatcat ttgctcaact gtaa        2154
 
<210>18
<211>717
<212>PRT
<213>灿烂弧菌
 
<400>18
Met Ser Tyr Gln Pro Leu Leu Leu Asn Phe Asp Glu Ala Ala Glu Leu
 1               5                  10                  15
Arg Lys Glu Leu Gly Lys Asp Ser Leu Leu Gly Asn Ala Leu Thr Arg
            20                  25                  30
Asp Ile Lys Gln Thr Asp Ala Tyr Met Ala Glu Val Gly Ile Glu Val
        35                  40                  45
Pro Gly His Gly Glu Gly Gly Gly Tyr Glu His Asn Arg His Lys Gln
    50                  55                  60
Asn Tyr Ile His Met Asp Leu Ala Gly Arg Leu Phe Leu Ile Thr Glu
65                  70                  75                  80
Glu Thr Lys Tyr Arg Asp Tyr Ile Val Asp Met Leu Thr Ala Tyr Ala
                85                  90                  95
Thr Val Tyr Pro Thr Leu Glu Ser Asn Val Ser Arg Asp Ser Asn Pro
            100                 105                 110
Pro Gly Lys Leu Phe His Gln Thr Leu Asn Glu Asn Met Trp Met Leu
        115                 120                 125
Tyr Ala Ser Cys Ala Tyr Ser Cys Ile Tyr His Thr Ile Ser Glu Glu
    130                 135                 140
Gln Lys Arg Leu Ile Glu Asp Asp Leu Leu Lys Gln Met Ile Glu Met
145                 150                 155                 160
Phe Val Val Thr Tyr Ala His Asp Phe Asp Ile Val His Asn His Gly
                165                 170                 175
Leu Trp Ala Val Ala Ala Val Gly Ile Cys Gly Tyr Ala Ile Asn Asp
            180                 185                 190
Gln Glu Ser Val Asp Lys Ala Leu Tyr Gly Leu Lys Leu Asp Lys Val
        195                 200                 205
Ser Gly Gly Phe Leu Ala Gln Leu Asp Gln Leu Phe Ser Pro Asp Gly
    210                 215                 220
Tyr Tyr Met Glu Gly Pro Tyr Tyr His Arg Phe Ser Leu Arg Pro Ile
225                 230                 235                 240
Tyr Leu Phe Ala Glu Ala Ile Glu Arg Arg Gln Pro Glu Val Gly Ile
                245                 250                 255
Tyr Glu Phe Asn Asp Ser Val Ile Lys Thr Thr Ser Tyr Ser Val Phe
            260                 265                 270
Lys Thr Ala Phe Pro Asp Gly Thr Leu Pro Ala Leu Asn Asp Ser Ser
        275                 280                 285
Lys Thr Ile Ser Ile Asn Asp Glu Gly Val Ile Met Ala Thr Ser Val
    290                 295                 300
Cys Tyr His Arg Tyr Glu Gln Thr Glu Thr Leu Leu Gly Met Ala Asn
305                 310                 315                 320
His Gln Gln Asn Val Trp Val His Ala Ser Gly Lys Thr Leu Ser Asp
                325                 330                 335
Ala Val Asp Ala Ala Asp Asp Ile Lys Ala Phe Asn Trp Gly Ser Leu
            340                 345                 350
Phe Val Thr Asp Gly Pro Glu Gly Glu Lys Gly Gly Val Ser Ile Leu
        355                 360                 365
Arg His Arg Asp Glu Gln Asp Asp Asp Thr Met Ala Leu Ile Trp Phe
    370                 375                 380
Gly Gln His Gly Ser Asp His Gln Tyr His Ser Ala Leu Asp His Gly
385                 390                 395                 400
His Tyr Asp Gly Leu His Leu Ser Val Phe Asn Arg Gly His Glu Val
                405                 410                 415
Leu His Asp Phe Gly Phe Gly Arg Trp Val Asn Val Glu Pro Lys Phe
            420                 425                 430
Gly Gly Arg Tyr Ile Pro Glu Asn Lys Ser Tyr Cys Lys Gln Thr Val
        435                 440                 445
Ala His Asn Thr Val Thr Val Asp Gln Lys Thr Gln Asn Asn Phe Asn
    450                 455                 460
Thr Ala Leu Ala Glu Ser Lys Phe Gly Gln Lys His Phe Phe Val Ala
465                 470                 475                 480
Asp Asp Gln Ser Leu Gln Gly Met Ser Gly Thr Ile Ser Glu Tyr Tyr
                485                 490                 495
Thr Gly Val Asp Met Gln Arg Ser Val Ile Leu Ala Glu Leu Pro Glu
            500                 505                 510
Phe Glu Lys Pro Leu Val Ile Asp Val Tyr Arg Ile Glu Ala Asp Ala
        515                 520                 525
Glu His Gln Tyr Asp Leu Pro Val His His Ser Gly Gln Ile Ile Arg
    530                 535                 540
Thr Asp Phe Asp Tyr Asn Met Glu Lys Thr Leu Lys Pro Leu Gly Glu
545                 550                 555                 560
Asp Asn Gly Tyr Gln His Leu Trp Asn Val Ala Ser Gly Lys Val Asn
                565                 570                 575
Glu Glu Gly Ser Leu Val Ser Trp Leu His Asp Ser Ser Tyr Tyr Ser
            580                 585                 590
Leu Val Thr Ser Ala Asn Ala Gly Ser Glu Val Ile Phe Ala Arg Thr
        595                 600                 605
Gly Ala Asn Asp Pro Asp Phe Asn Leu Lys Ser Glu Pro Ala Phe Ile
    610                 615                 620
Leu Arg Gln Ser Gly Gln Asn His Val Phe Ala Ser Val Leu Glu Thr
625                 630                 635                 640
His Gly Tyr Phe Asn Glu Ser Ile Glu Ala Ser Val Gly Ala Arg Gly
                645                 650                 655
Leu Val Lys Ser Val Ser Val Val Gly His Asn Ser Val Gly Thr Val
            660                 665                 670
Val Arg Ile Gln Thr Thr Ser Gly Asn Thr Tyr His Tyr Gly Ile Ser
        675                 680                 685
Asn Gln Ala Glu Asp Thr Gln Gln Ala Thr His Thr Val Glu Phe Ala
    690                 695                 700
Gly Glu Thr Tyr Ser Trp Glu Gly Ser Phe Ala Gln Leu
705                 710                 715
 
<210>19
<211>825
<212>DNA
<213>灿烂弧菌
 
<400>19
atgaagtggt tattggcaat agttgcgatg tctggtgtcg cattggcggc agaaaataag 60
aatgttgagg tgagcagtga gcatttcgtc cgttatcaat accaagacaa aatcagctat 120
ggaaagctag acaatgacgc agtgttaccg gtcagcggcg atctctttgg cgaatattcg 180
gtagcaaaaa attcgatccc gttagagtcg gttgaggtgt tactaccgac aaaaccagag 240
aaagtcttcg ccgtcgggat gaacttcgct agccacttag cctcacctgc cgatgcacca 300
ccgccgatgt ttcttaaact tccttcttct ttgattctca cgggcgaagt gattcaagtg 360
ccaccaaaag caagaaatgt tcattttgaa ggcgagctgg tggttgtgat tggtagagag 420
ctcagtcaag ccagtgaaga agaagccgaa caagcgatct ttggcgtcac ggtgggcaac 480
gatattactg aaagaagttg gcaaggcgcc gatttacaat ggctccgagc gaaagcttcc 540
gatggttttg gcccggttgg caacacaatt gtgcgcggca ttgattacaa caatattgag 600
ttaaccactc gtgttaacgg taaagtggtt caacaagaaa atacttcgtt catgatccac 660
aagccaagaa aagtcgtgag ctatttgagc tattatttta ccctcaaacc gggcgatcta 720
attttcatgg gcacgccagg tagaacttat gctctgtccg acaaagatca agtgagtgtc 780
acgattgaag gggtagggac tgtggtaaat gaagtgcggt tctga                 825
 
<210>20
<211>274
<212>PRT
<213>灿烂弧菌
 
<400>20
Met Lys Trp Leu Leu Ala Ile Val Ala Met Ser Gly Val Ala Leu Ala
 1               5                  10                  15
Ala Glu Asn Lys Asn Val Glu Val Ser Ser Glu His Phe Val Arg Tyr
            20                  25                  30
Gln Tyr Gln Asp Lys Ile Ser Tyr Gly Lys Leu Asp Asn Asp Ala Val
        35                  40                  45
Leu Pro Val Ser Gly Asp Leu Phe Gly Glu Tyr Ser Val Ala Lys Asn
    50                  55                  60
Ser Ile Pro Leu Glu Ser Val Glu Val Leu Leu Pro Thr Lys Pro Glu
65                  70                  75                  80
Lys Val Phe Ala Val Gly Met Asn Phe Ala Ser His Leu Ala Ser Pro
                85                  90                  95
Ala Asp Ala Pro Pro Pro Met Phe Leu Lys Leu Pro Ser Ser Leu Ile
            100                 105                 110
Leu Thr Gly Glu Val Ile Gln Val Pro Pro Lys Ala Arg Asn Val His
        115                 120                 125
Phe Glu Gly Glu Leu Val Val Val Ile Gly Arg Glu Leu Ser Gln Ala
    130                 135                 140
Ser Glu Glu Glu Ala Glu Gln Ala Ile Phe Gly Val Thr Val Gly Asn
145                 150                 155                 160
Asp Ile Thr Glu Arg Ser Trp Gln Gly Ala Asp Leu Gln Trp Leu Arg
                165                 170                 175
Ala Lys Ala Ser Asp Gly Phe Gly Pro Val Gly Asn Thr Ile Val Arg
            180                 185                 190
Gly Ile Asp Tyr Asn Asn Ile Glu Leu Thr Thr Arg Val Asn Gly Lys
        195                 200                 205
Val Val Gln Gln Glu Asn Thr Ser Phe Met Ile His Lys Pro Arg Lys
    210                 215                 220
Val Val Ser Tyr Leu Ser Tyr Tyr Phe Thr Leu Lys Pro Gly Asp Leu
225                 230                 235                 240
Ile Phe Met Gly Thr Pro Gly Arg Thr Tyr Ala Leu Ser Asp Lys Asp
                245                 250                 255
Gln Val Ser Val Thr Ile Glu Gly Val Gly Thr Val Val Asn Glu Val
            260                 265                 270
Arg Phe
 
<210>21
<211>717
<212>DNA
<213>灿烂弧菌
 
<400>21
atggctagca cttttaattc aatttcgggc tcgaagcgta gcctgcacgt gcaagtagca  60
cgcgaaatcg ctcgaggaat tttgtctggt gatctgccgc aaggttctat tattcctggt  120
gaaatggcgt tgtgtgaaca gtttggtatc agccgaacgg cacttcgtga agcagttaaa  180
ctactgacct ctaaaggtct gttagagtct cgccctaaaa ttggtactcg cgtagtcgac  240
cgcgcatact ggaacttcct tgatcctcaa ctgattgaat ggatggacgg actaaccgac  300
gtagaccaat tctgttctca gtttttaggc cttcgccgtg cgatcgagcc tgaagcgtgt  360
gcactggcgg caaaatttgc gacagctgaa caacgtatcg agctttcaga gatcttccaa  420
aagatggtcg aagtggatga agctgaagtg tttgaccaag aacgttggac agacattgat  480
actcgtttcc atagcttgat cttcaatgcg accggtaacg acttctatct accgttcggt  540
aatattctga ctactatgtt cgttaacttc atagtgcatt cttctgaaga gggaagcaca  600
tgcatcaatg aacaccgcag aatctatgaa gctatcatgg ccggtgattg tgacaaggct  660
agaattgctt ctgctgttca cttgcaagat gccaaccacc gtttggcaac agcataa     717
 
<210>22
<211>238
<212>PRT
<213>灿烂弧菌
 
<400>22
Met Ala Ser Thr Phe Asn Ser Ile Ser Gly Ser Lys Arg Ser Leu His
 1               5                  10                  15
Val Gln Val Ala Arg Glu Ile Ala Arg Gly Ile Leu Ser Gly Asp Leu
            20                  25                  30
Pro Gln Gly Ser Ile Ile Pro Gly Glu Met Ala Leu Cys Glu Gln Phe
        35                  40                  45
Gly Ile Ser Arg Thr Ala Leu Arg Glu Ala Val Lys Leu Leu Thr Ser
    50                  55                  60
Lys Gly Leu Leu Glu Ser Arg Pro Lys Ile Gly Thr Arg Val Val Asp
65                  70                  75                  80
Arg Ala Tyr Trp Asn Phe Leu Asp Pro Gln Leu Ile Glu Trp Met Asp
                85                  90                  95
Gly Leu Thr Asp Val Asp Gln Phe Cys Ser Gln Phe Leu Gly Leu Arg
            100                 105                 110
Arg Ala Ile Glu Pro Glu Ala Cys Ala Leu Ala Ala Lys Phe Ala Thr
        115                 120                 125
Ala Glu Gln Arg Ile Glu Leu Ser Glu Ile Phe Gln Lys Met Val Glu
    130                 135                 140
Val Asp Glu Ala Glu Val Phe Asp Gln Glu Arg Trp Thr Asp Ile Asp
145                 150                 155                 160
Thr Arg Phe His Ser Leu Ile Phe Asn Ala Thr Gly Asn Asp Phe Tyr
                165                 170                 175
Leu Pro Phe Gly Asn Ile Leu Thr Thr Met Phe Val Asn Phe Ile Val
            180                 185                 190
His Ser Ser Glu Glu Gly Ser Thr Cys Ile Asn Glu His Arg Arg Ile
        195                 200                 205
Tyr Glu Ala Ile Met Ala Gly Asp Cys Asp Lys Ala Arg Ile Ala Ser
    210                 215                 220
Ala Val His Leu Gln Asp Ala Asn His Arg Leu Ala Thr Ala
225                 230                 235
<210>23
<211>1779
<212>DNA
<213>灿烂弧菌
 
<400>23
atggaactca acacgattat tgtcggcatt tatttcctat tcttgattgc gataggttgg  60
atgtttagaa catttacaag tactactagt gactacttcc gcgggggcgg taacatgttg  120
tggtggatgg ttggtgcaac cgcctttatg acccagttta gtgcatggac attcaccggt  180
gcagcaggta aagcgtataa cgatggtttc gctgtagcgg tcatcttcgt agccaacgca  240
tttggttact tcatgaacta cgcgtacttc gcgccgaaat tccgtcaact tcgcgttgtt  300
acggtaatcg aagcgattcg tatgcgtttt ggtgcgacca acgaacaagt attcacttgg  360
tcttcaatgc caaactcagt ggtatctgcg ggtgtgtggt taaacgcatt ggcaatcatc  420
gcttcgggta tcttcggttt cgacatgaac atgactatct gggtgactgg cctagtggta  480
ttggcaatgt cggtaacagg tggttcatgg gcggtaatcg catctgactt catgcagatg  540
gttatcatca tggcggtaac ggtaacttgt gcggttgtag cggttgttca aggtggcggt  600
gttggtgaga ttgttaacaa cttcccagta caagatggtg gttcgttcct ttggggcaac  660
aacatcaact acctaagcat ctttacgatt tgggcattct tcatcttcgt taagcagttc  720
tcaatcacga acaacatgct taactcttac cgttacctag cggctaaaga ctcaaagaac  780
gctaagaaag ctgcactgct tgcttgtgtg ttgatgttgt gtggtgtgtt tatttggttc  840
atgccttctt ggttcattgc aggccaaggt gttgatttat cagcggctta cccgaatgca  900
ggtaaaaaag cgggtgactt tgcttaccta tacttcgtac aagagtacat gccagcaggt  960
atggttggtc tattagttgc cgcgatgttt gcagcgacaa tgtcttcaat ggactcaggt  1020
ctaaaccgta actcaggtat ttttgttaag aacttctacg aaacaatcgt tcgtaaaggt  1080
caagcatcag agaaagagct agtaaccgta tctaaaatta cttcagcggt atttggtttc  1140
gctattatcc taatcgcaca gttcatcaac tcattaaaag gcttaagcct gtttgatacg  1200
atgatgtacg taggtgcgtt aatcggcttc cctatgacga ttcctgcatt ccttggtttc  1260
ttcatcaaga agactccgga ctgggctggt tggggaacgc tagttgttgg tggtatcgta  1320
tcttatgtgg ttggttttgt tatcaacgcg gagatggtag cagcggcgtt tggtcttgat  1380
actctaacag gacgtgaatg gtctgatgtt aaagttgcga ttggtctgat tgctcacatc  1440
acgctaaccg gtggcttctt cgtactatct acgatgttct acaagcctct atcaaaagaa  1500
cgtcaagcgg atgttgataa gttctttggc aacttagata ccccattagt agctgaatcg  1560
gcagagcaaa aagtgttgga taacaaacaa cgtcaaatgc ttggtaaact gattgcggta  1620
gcgggtgttg gtattatgct gatggctctt ctgactaacc caatgtgggg gcgcctagtc  1680
ttcatcttat gtggtgtgat agtgggtggt gtcggtattc tacttgtgaa agcggtcgat  1740
gacggcggca agcaagcgaa agcagtaacc gaaagctaa                         1779
 
<210>24
<211>592
<212>PRT
<213>灿烂弧菌
 
<400>24
Met Glu Leu Asn Thr Ile Ile Val Gly Ile Tyr Phe Leu Phe Leu Ile
 1               5                  10                  15
Ala Ile Gly Trp Met Phe Arg Thr Phe Thr Ser Thr Thr Ser Asp Tyr
            20                  25                  30
Phe Arg Gly Gly Gly Asn Met Leu Trp Trp Met Val Gly Ala Thr Ala
        35                  40                  45
Phe Met Thr Gln Phe Ser Ala Trp Thr Phe Thr Gly Ala Ala Gly Lys
    50                  55                  60
Ala Tyr Asn Asp Gly Phe Ala Val Ala Val Ile Phe Val Ala Asn Ala
65                  70                  75                  80
Phe Gly Tyr Phe Met Asn Tyr Ala Tyr Phe Ala Pro Lys Phe Arg Gln
                85                  90                  95
Leu Arg Val Val Thr Val Ile Glu Ala Ile Arg Met Arg Phe Gly Ala
            100                 105                 110
Thr Asn Glu Gln Val Phe Thr Trp Ser Ser Met Pro Asn Ser Val Val
        115                 120                 125
Ser Ala Gly Val Trp Leu Asn Ala Leu Ala Ile Ile Ala Ser Gly Ile
    130                 135                 140
Phe Gly Phe Asp Met Asn Met Thr Ile Trp Val Thr Gly Leu Val Val
145                 150                 155                 160
Leu Ala Met Ser Val Thr Gly Gly Ser Trp Ala Val Ile Ala Ser Asp
                165                 170                 175
Phe Met Gln Met Val Ile Ile Met Ala Val Thr Val Thr Cys Ala Val
            180                 185                 190
Val Ala Val Val Gln Gly Gly Gly Val Gly Glu Ile Val Asn Asn Phe
        195                 200                 205
Pro Val Gln Asp Gly Gly Ser Phe Leu Trp Gly Asn Asn Ile Asn Tyr
    210                 215                 220
Leu Ser Ile Phe Thr Ile Trp Ala Phe Phe Ile Phe Val Lys Gln Phe
225                 230                 235                 240
Ser Ile Thr Asn Asn Met Leu Asn Ser Tyr Arg Tyr Leu Ala Ala Lys
                245                 250                 255
Asp Ser Lys Asn Ala Lys Lys Ala Ala Leu Leu Ala Cys Val Leu Met
            260                 265                 270
Leu Cys Gly Val Phe Ile Trp Phe Met Pro Ser Trp Phe Ile Ala Gly
        275                 280                 285
Gln Gly Val Asp Leu Ser Ala Ala Tyr Pro Asn Ala Gly Lys Lys Ala
    290                 295                 300
Gly Asp Phe Ala Tyr Leu Tyr Phe Val Gln Glu Tyr Met Pro Ala Gly
305                 310                 315                 320
Met Val Gly Leu Leu Val Ala Ala Met Phe Ala Ala Thr Met Ser Ser
                325                 330                 335
Met Asp Ser Gly Leu Asn Arg Asn Ser Gly Ile Phe Val Lys Asn Phe
            340                 345                 350
Tyr Glu Thr Ile Val Arg Lys Gly Gln Ala Ser Glu Lys Glu Leu Val
        355                 360                 365
Thr Val Ser Lys Ile Thr Ser Ala Val Phe Gly Phe Ala Ile Ile Leu
    370                 375                 380
Ile Ala Gln Phe Ile Asn Ser Leu Lys Gly Leu Ser Leu Phe Asp Thr
385                 390                 395                 400
Met Met Tyr Val Gly Ala Leu Ile Gly Phe Pro Met Thr Ile Pro Ala
                405                 410                 415
Phe Leu Gly Phe Phe Ile Lys Lys Thr Pro Asp Trp Ala Gly Trp Gly
            420                 425                 430
Thr Leu Val Val Gly Gly Ile Val Ser Tyr Val Val Gly Phe Val Ile
        435                 440                 445
Asn Ala Glu Met Val Ala Ala Ala Phe Gly Leu Asp Thr Leu Thr Gly
    450                 455                 460
Arg Glu Trp Ser Asp Val Lys Val Ala Ile Gly Leu Ile Ala His Ile
465                 470                 475                 480
Thr Leu Thr Gly Gly Phe Phe Val Leu Ser Thr Met Phe Tyr Lys Pro
                485                 490                 495
Leu Ser Lys Glu Arg Gln Ala Asp Val Asp Lys Phe Phe Gly Asn Leu
            500                 505                 510
Asp Thr Pro Leu Val Ala Glu Ser Ala Glu Gln Lys Val Leu Asp Asn
        515                 520                 525
Lys Gln Arg Gln Met Leu Gly Lys Leu Ile Ala Val Ala Gly Val Gly
    530                 535                 540
Ile Met Leu Met Ala Leu Leu Thr Asn Pro Met Trp Gly Arg Leu Val
545                 550                 555                 560
Phe Ile Leu Cys Gly Val Ile Val Gly Gly Val Gly Ile Leu Leu Val
                565                 570                 575
Lys Ala Val Asp Asp Gly Gly Lys Gln Ala Lys Ala Val Thr Glu Ser
            580                 585                 590
 
<210>25
<211>2079
<212>DNA
<213>灿烂弧菌
 
<400>25
atgagcgacc aaaaatctct tgatgcaatc aggaagatga agctggaaaa cgatacttca  60
gcaggtaatc ttgtagacct actccctatc gaagttcaaa cacgtgactt cgacctatca  120
ttcctagaca ccttgagcga agcacgtccg cgtcttcttg ttcaagctga tcagctagaa  180
gaattcaaag caaaagtgaa agctgatcaa gctcactgta tgtttgatga tttctacaac  240
aactctaccg ttaagttcct tgagactgct cctttcgaag agcctcaagc gtacccagct  300
gagacggtag gtaaagcttc tctatggcgt ccttattggc gtcaaatgta cgttgattgc  360
caaatggcac tgaacgcgac acgtaaccta gcgattgctg gtgttgtaaa agaagacgaa  420
gcgctcattg cgaaagcaaa agcttggact ctaaaactgt ctacgtacga tccagaaggc  480
gtgacttctc gtggctataa cgatgaagcg gctttccgtg ttatcgctgc tatggcttgg  540
ggttacgatt ggctacacgg ctacttcacc gatgaagaac gccagcaagt tcaagatgct  600
ttgattgagc gtctagacga aatcatgcac cacctgaaag tgacggttga tctattgaac  660
aacccactaa atagccacgg tgttcgttct atctcttctg ctatcatccc aacgtgtatc  720
gcgctttacc acgatcaccc gaaagcaggc gagtacattg catacgcgct agaatactac  780
gcagtacatt acccaccatg gggcggtgta gacggcggtt gggctgaagg tcctgattac  840
tggaacacgc aaactgcatt cctaggcgaa gcattcgacc tattgaaagc atactgtggt  900
gtagacatgt ttaacaaaac attctacgaa aacacaggtg atttcccgct ttactgcatg  960
ccagttcact ctaagcgcgc gagcttctgt gaccagtctt caatcggcga tttcccaggt  1020
ttaaaactgg cttacaacat caagcactac gcaggtgtta accagaagcc tgagtacgtt  1080
tggtactata accagcttaa aggccgtgat actgaagcac acaccaaatt ctacaacttc  1140
ggttggtggg acttcggtta tgacgatctt cgttttaact tcctttggga tgcacctgaa  1200
gagaaagccc catcgaacga tccactgttg aaagtattcc caatcacggg ttgggctgca  1260
ttccacaaca agatgactga gcgtgataac catattcaca tggtattcaa atgttctccg  1320
tttggctcaa tcagccactc tcacggtgac caaaacgcat ttacgcttca cgcatttggt  1380
gaaacgctag cgtcagtaac aggttactat ggtggtttcg gtgtagacat gcacacgaaa  1440
tggcgtcgtc aaacgttctc taaaaacctg ccactatttg gcggtaaagg tcagtacggc  1500
gagaacaaga acacaggcta cgaaaaccac caagatcgct tttgtatcga agcgggcggc  1560
actatctctg acttcgacac tgaatctgat gtgaagatgg ttgaaggtga tgcaacggca  1620
tcttacaagt acttcgttcc tgaaatcgaa tcttacaagc gtaaagtctg gttcgttcaa  1680
ggtaaagtct tcgtaatgca agacaaggca acgctttctg aagagaaaga catgacttgg  1740
ctaatgcaca caactttcgc aaacgaagtg gcagacaagt ctttcactat ccgtggcgaa  1800
gttgcgcacc tagacgtaaa cttcatcaac gagtctgctg ataacatcac gtcagttaag  1860
aacgttgaag gctttggcga agttgaccca tacgagttca aagatcttga gatccaccgt  1920
cacgtggaag tggaattcaa gccatcgaaa gagcacaaca tcctgacgct tcttgttcct  1980
aataagaatg aaggcgagca agttgaagtg tttcacaagc ttgaaggcaa cacgctactg  2040
ctaaatgttg acggcgaaac ggtttcaatc gaactgtaa                         2079
 
<210>26
<211>692
<212>PRT
<213>灿烂弧菌
 
<400>26
Met Ser Asp Gln Lys Ser Leu Asp Ala Ile Arg Lys Met Lys Leu Glu
 1               5                  10                  15
Asn Asp Thr Ser Ala Gly Asn Leu Val Asp Leu Leu Pro Ile Glu Val
            20                  25                  30
Gln Thr Arg Asp Phe Asp Leu Ser Phe Leu Asp Thr Leu Ser Glu Ala
        35                  40                  45
Arg Pro Arg Leu Leu Val Gln Ala Asp Gln Leu Glu Glu Phe Lys Ala
    50                  55                  60
Lys Val Lys Ala Asp Gln Ala His Cys Met Phe Asp Asp Phe Tyr Asn
65                  70                  75                  80
Asn Ser Thr Val Lys Phe Leu Glu Thr Ala Pro Phe Glu Glu Pro Gln
                85                  90                  95
Ala Tyr Pro Ala Glu Thr Val Gly Lys Ala Ser Leu Trp Arg Pro Tyr
            100                 105                 110
Trp Arg Gln Met Tyr Val Asp Cys Gln Met Ala Leu Asn Ala Thr Arg
        115                 120                 125
Asn Leu Ala Ile Ala Gly Val Val Lys Glu Asp Glu Ala Leu Ile Ala
    130                 135                 140
Lys Ala Lys Ala Trp Thr Leu Lys Leu Ser Thr Tyr Asp Pro Glu Gly
145                 150                 155                 160
Val Thr Ser Arg Gly Tyr Asn Asp Glu Ala Ala Phe Arg Val Ile Ala
                165                 170                 175
Ala Met Ala Trp Gly Tyr Asp Trp Leu His Gly Tyr Phe Thr Asp Glu
            180                 185                 190
Glu Arg Gln Gln Val Gln Asp Ala Leu Ile Glu Arg Leu Asp Glu Ile
        195                 200                 205
Met His His Leu Lys Val Thr Val Asp Leu Leu Asn Asn Pro Leu Asn
    210                 215                 220
Ser His Gly Val Arg Ser Ile Ser Ser Ala Ile Ile Pro Thr Cys Ile
225                 230                 235                 240
Ala Leu Tyr His Asp His Pro Lys Ala Gly Glu Tyr Ile Ala Tyr Ala
                245                 250                 255
Leu Glu Tyr Tyr Ala Val His Tyr Pro Pro Trp Gly Gly Val Asp Gly
            260                 265                 270
Gly Trp Ala Glu Gly Pro Asp Tyr Trp Asn Thr Gln Thr Ala Phe Leu
        275                 280                 285
Gly Glu Ala Phe Asp Leu Leu Lys Ala Tyr Cys Gly Val Asp Met Phe
    290                 295                 300
Asn Lys Thr Phe Tyr Glu Asn Thr Gly Asp Phe Pro Leu Tyr Cys Met
305                 310                 315                 320
Pro Val His Ser Lys Arg Ala Ser Phe Cys Asp Gln Ser Ser Ile Gly
                325                 330                 335
Asp Phe Pro Gly Leu Lys Leu Ala Tyr Asn Ile Lys His Tyr Ala Gly
            340                 345                 350
Val Asn Gln Lys Pro Glu Tyr Val Trp Tyr Tyr Asn Gln Leu Lys Gly
        355                 360                 365
Arg Asp Thr Glu Ala His Thr Lys Phe Tyr Asn Phe Gly Trp Trp Asp
    370                 375                 380
Phe Gly Tyr Asp Asp Leu Arg Phe Asn Phe Leu Trp Asp Ala Pro Glu
385                 390                 395                 400
Glu Lys Ala Pro Ser Asn Asp Pro Leu Leu Lys Val Phe Pro Ile Thr
                405                 410                 415
Gly Trp Ala Ala Phe His Asn Lys Met Thr Glu Arg Asp Asn His Ile
            420                 425                 430
His Met Val Phe Lys Cys Ser Pro Phe Gly Ser Ile Ser His Ser His
        435                 440                 445
Gly Asp Gln Asn Ala Phe Thr Leu His Ala Phe Gly Glu Thr Leu Ala
    450                 455                 460
Ser Val Thr Gly Tyr Tyr Gly Gly Phe Gly Val Asp Met His Thr Lys
465                 470                 475                 480
Trp Arg Arg Gln Thr Phe Ser Lys Asn Leu Pro Leu Phe Gly Gly Lys
                485                 490                 495
Gly Gln Tyr Gly Glu Asn Lys Asn Thr Gly Tyr Glu Asn His Gln Asp
            500                 505                 510
Arg Phe Cys Ile Glu Ala Gly Gly Thr Ile Ser Asp Phe Asp Thr Glu
        515                 520                 525
Ser Asp Val Lys Met Val Glu Gly Asp Ala Thr Ala Ser Tyr Lys Tyr
    530                 535                 540
Phe Val Pro Glu Ile Glu Ser Tyr Lys Arg Lys Val Trp Phe Val Gln
545                 550                 555                 560
Gly Lys Val Phe Val Met Gln Asp Lys Ala Thr Leu Ser Glu Glu Lys
                565                 570                 575
Asp Met Thr Trp Leu Met His Thr Thr Phe Ala Asn Glu Val Ala Asp
            580                 585                 590
Lys Ser Phe Thr Ile Arg Gly Glu Val Ala His Leu Asp Val Asn Phe
        595                 600                 605
Ile Asn Glu Ser Ala Asp Asn Ile Thr Ser Val Lys Asn Val Glu Gly
    610                 615                 620
Phe Gly Glu Val Asp Pro Tyr Glu Phe Lys Asp Leu Glu Ile His Arg
625                 630                 635                 640
His Val Glu Val Glu Phe Lys Pro Ser Lys Glu His Asn Ile Leu Thr
                645                 650                 655
Leu Leu Val Pro Asn Lys Asn Glu Gly Glu Gln Val Glu Val Phe His
            660                 665                 670
Lys Leu Glu Gly Asn Thr Leu Leu Leu Asn Val Asp Gly Glu Thr Val
        675                 680                 685
Ser Ile Glu Leu
    690
 
<210>27
<211>882
<212>DNA
<213>灿烂弧菌
 
<400>27
atgactaaac ctgtaatcgg tttcattggc ctaggtctta tgggcggcaa catggttgaa  60
aacctacaaa agcgcggcta ccacgtaaac gtaatggatc taagcgctga agctgttgct  120
cgcgtaacag atcgcggcaa cgcaactgca ttcacttctg ctaaagaact agctgctgca  180
agtgacatcg ttcagttttg tctgacaact tctgctgttg ttgaaaaaat cgtttacggc  240
gaagacggcg ttctagcggg catcaaagaa ggcgcagtac tagtagactt cggtacttct  300
atccctgctt ctactaagaa aatcggcgca gctcttgctg aaaaaggcgc gggcatgatc  360
gacgcacctc taggtcgtac tcctgcacac gctaaagatg gtcttctgaa catcatggct  420
gctggcgaca tggaaacttt caacaaagtt aaacctgttc ttgaagagca aggcgaaaac  480
gtattccacc taggggctct aggttctggt cacgtgacta agcttgtaaa caacttcatg  540
ggtatgacga ctgttgcgac tatgtctcaa gctttcgctg ttgctcaacg cgctggtgtt  600
gatggccaac aactgtttga catcatgtct gcaggtccat ctaactctcc gttcatgcaa  660
ttctgtaagt tctacgcggt agacggcgaa gagaagctag gtttctctgt tgctaacgca  720
aacaaagacc ttggttactt ccttgcactt tgtgaagagc taggtactga gtctctaatc  780
gctcaaggta ctgcaacaag cctacaagct gctgttgatg caggcatggg taacaacgac  840
gtaccagtaa tcttcgacta cttcgctaaa ctagagaagt aa                     882
 
<210>28
<211>293
<212>PRT
<213>灿烂弧菌
 
<400>28
Met Thr Lys Pro Val Ile Gly Phe Ile Gly Leu Gly Leu Met Gly Gly
 1               5                  10                  15
Asn Met Val Glu Asn Leu Gln Lys Arg Gly Tyr His Val Asn Val Met
            20                  25                  30
Asp Leu Ser Ala Glu Ala Val Ala Arg Val Thr Asp Arg Gly Asn Ala
        35                  40                  45
Thr Ala Phe Thr Ser Ala Lys Glu Leu Ala Ala Ala Ser Asp Ile Val
    50                  55                  60
Gln Phe Cys Leu Thr Thr Ser Ala Val Val Glu Lys Ile Val Tyr Gly
65                  70                  75                  80
Glu Asp Gly Val Leu Ala Gly Ile Lys Glu Gly Ala Val Leu Val Asp
                85                  90                  95
Phe Gly Thr Ser Ile Pro Ala Ser Thr Lys Lys Ile Gly Ala Ala Leu
            100                 105                 110
Ala Glu Lys Gly Ala Gly Met Ile Asp Ala Pro Leu Gly Arg Thr Pro
        115                 120                 125
Ala His Ala Lys Asp Gly Leu Leu Asn Ile Met Ala Ala Gly Asp Met
    130                 135                 140
Glu Thr Phe Asn Lys Val Lys Pro Val Leu Glu Glu Gln Gly Glu Asn
145                 150                 155                 160
Val Phe His Leu Gly Ala Leu Gly Ser Gly His Val Thr Lys Leu Val
                165                 170                 175
Asn Asn Phe Met Gly Met Thr Thr Val Ala Thr Met Ser Gln Ala Phe
            180                 185                 190
Ala Val Ala Gln Arg Ala Gly Val Asp Gly Gln Gln Leu Phe Asp Ile
        195                 200                 205
Met Ser Ala Gly Pro Ser Asn Ser Pro Phe Met Gln Phe Cys Lys Phe
    210                 215                 220
Tyr Ala Val Asp Gly Glu Glu Lys Leu Gly Phe Ser Val Ala Asn Ala
225                 230                 235                 240
Asn Lys Asp Leu Gly Tyr Phe Leu Ala Leu Cys Glu Glu Leu Gly Thr
                245                 250                 255
Glu Ser Leu Ile Ala Gln Gly Thr Ala Thr Ser Leu Gln Ala Ala Val
            260                 265                 270
Asp Ala Gly Met Gly Asn Asn Asp Val Pro Val Ile Phe Asp Tyr Phe
        275                 280                 285
Ala Lys Leu Glu Lys
    290
 
<210>29
<211>1872
<212>DNA
<213>灿烂弧菌
 
<400>29
atggtagcgg tcgtcagttc tagtgctttg gcatttacga actggtttac gcttaacttg  60
gccactgaac aggtaaacca aacgatttat aacgagattg atcactcgct tacgatagaa  120
atcaatcaaa tagaaagtac cgttcagcgc accatcgata ccgttaactc tgttgcacaa  180
gagttcatga aatcccctta ccaagtgccg aatgaagcac tcatgcatta tgccgctaag  240
cttggtggca ttgacaagat tgtggtgggt tttgacgacg gccgttctta tacctctcgc  300
ccttcagagt ctttccctaa cggtgttgga ataaaagaaa aatacaatcc aaccactcga  360
ccttggtatc aacaagcgaa attgaaatca ggcttatctt ttagtggtct gtttttcact  420
aagagtactc aagtgcctat gatcggtgtg acctactcat accaagatcg tgtcatcatg  480
gccgatatac gctttgacga tttggaaacg cagcttgaac agctggacag catctacgaa  540
gccaaaggca ttatcatcga cgaaaagggg atggtggtcg cttcaacaat cgaaaacgtg  600
cttccgcaaa ccaatatatc ttctgcagac actcaaatga aactcaacag tgccattgaa  660
cagcctgatc aattcattga gggtgtgatt gatggtaacc agagaatctt gatggccaag  720
aaagtggata ttggcagcca gaaagagtgg ttcatgatct ccagtattga ccctgaactc  780
gcgctcaatc agctgaatgg cgtgatgtcg agtgcgcgca tccttatcgt cgcttgtgta  840
cttggctcgg tgatattgat gattttactt ctgaatcgtt tctaccgccc aatcgtgtca  900
ctgcgcaaaa tcgtccacga tctatcacaa ggtaacggag acctcactca aaggcttgct  960
gagaagggga atgatgactt agggcatatc gccaaagaca tcaacttgtt cattatcggc  1020
ttacaagaga tggttaagga tgtgaaatac aagaactcgg atctcgatac caaggtactg  1080
agtattcgcg aaggttgtaa agaaaccagc gatgtactga aagttcatac tgatgaaacg  1140
gttcaagtgg tctctgcgat taacggcttg tctgaagcat caaacgaagt agagaagagt  1200
tctcagtcgg cggcagaagc agcaagagag gccgctgtgt tcagtgatga gacgaaacag  1260
attaacacgg tgacggaaac ctatatcagt gatcttgaga agcaagtctg caccacttct  1320
gatgacattc gctcaatggc caatgaaacg cagagcatcc agtctatcgt gtctgtgatt  1380
ggcggaattg cggaacaaac taatttgctg gcattgaatg cgtcaattga agcggcgagg  1440
gcgggtgaac atggtcgagg tttcgcggtg gttgctgatg aagtccgtgc gctagccaac  1500
cgaacgcaaa tcagtacctc tgaaattgat gaagcgttat ctggcttgca gtctaaatca  1560
gatggtttgg ttaaatctat tgagttgacc aaaagtaact gtgaactgac tcgcgctcaa  1620
gttgttcaag ctgtaaacat gttggcgaag ctaaccgagc agatggaaac agtaagtcgt  1680
tttaataatg acatttcggg ttcgtctgtt gagcaaaacg cccttattca gagcattgct  1740
aagaacatgc ataagattga aagctttgtt gaggagctta ataaactaag ccaagatcag  1800
ttaactgaat cagcagaaat caaaacactt aacggtagcg ttagtgaatt gatgagcagc  1860
tttaaggttt aa                                                      1872
 
<210>30
<211>623
<212>PRT
<213>灿烂弧菌
 
<400>30
Met Val Ala Val Val Ser Ser Ser Ala Leu Ala Phe Thr Asn Trp Phe
 1               5                  10                  15
Thr Leu Asn Leu Ala Thr Glu Gln Val Asn Gln Thr Ile Tyr Asn Glu
            20                  25                  30
Ile Asp His Ser Leu Thr Ile Glu Ile Asn Gln Ile Glu Ser Thr Val
        35                  40                  45
Gln Arg Thr Ile Asp Thr Val Asn Ser Val Ala Gln Glu Phe Met Lys
    50                  55                  60
Ser Pro Tyr Gln Val Pro Asn Glu Ala Leu Met His Tyr Ala Ala Lys
65                  70                  75                  80
Leu Gly Gly Ile Asp Lys Ile Val Val Gly Phe Asp Asp Gly Arg Ser
                85                  90                  95
Tyr Thr Ser Arg Pro Ser Glu Ser Phe Pro Asn Gly Val Gly Ile Lys
            100                  105                  110
Glu Lys Tyr Asn Pro Thr Thr Arg Pro Trp Tyr Gln Gln Ala Lys Leu
        115                  120                  125
Lys Ser Gly Leu Ser Phe Ser Gly Leu Phe Phe Thr Lys Ser Thr Gln
    130                  135                  140
Val Pro Met Ile Gly Val Thr Tyr Ser Tyr Gln Asp Arg Val Ile Met
145                 150                 155                 160
Ala Asp Ile Arg Phe Asp Asp Leu Glu Thr Gln Leu Glu Gln Leu Asp
                165                 170                 175
Ser Ile Tyr Glu Ala Lys Gly Ile Ile Ile Asp Glu Lys Gly Met Val
            180                 185                 190
Val Ala Ser Thr Ile Glu Asn Val Leu Pro Gln Thr Asn Ile Ser Ser
        195                 200                 205
Ala Asp Thr Gln Met Lys Leu Asn Ser Ala Ile Glu Gln Pro Asp Gln
    210                 215                 220
Phe Ile Glu Gly Val Ile Asp Gly Asn Gln Arg Ile Leu Met Ala Lys
225                 230                 235                 240
Lys Val Asp Ile Gly Ser Gln Lys Glu Trp Phe Met Ile Ser Ser Ile
                245                 250                 255
Asp Pro Glu Leu Ala Leu Asn Gln Leu Asn Gly Val Met Ser Ser Ala
            260                 265                 270
Arg Ile Leu Ile Val Ala Cys Val Leu Gly Ser Val Ile Leu Met Ile
        275                 280                 285
Leu Leu Leu Asn Arg Phe Tyr Arg Pro Ile Val Ser Leu Arg Lys Ile
    290                 295                 300
Val His Asp Leu Ser Gln Gly Asn Gly Asp Leu Thr Gln Arg Leu Ala
305                 310                 315                 320
Glu Lys Gly Asn Asp Asp Leu Gly His Ile Ala Lys Asp Ile Asn Leu
                325                 330                 335
Phe Ile Ile Gly Leu Gln Glu Met Val Lys Asp Val Lys Tyr Lys Asn
            340                 345                 350
Ser Asp Leu Asp Thr Lys Val Leu Ser Ile Arg Glu Gly Cys Lys Glu
        355                 360                 365
Thr Ser Asp Val Leu Lys Val His Thr Asp Glu Thr Val Gln Val Val
    370                 375                 380
Ser Ala Ile Asn Gly Leu Ser Glu Ala Ser Asn Glu Val Glu Lys Ser
385                 390                 395                 400
Ser Gln Ser Ala Ala Glu Ala Ala Arg Glu Ala Ala Val Phe Ser Asp
                405                 410                 415
Glu Thr Lys Gln Ile Asn Thr Val Thr Glu Thr Tyr Ile Ser Asp Leu
            420                 425                 430
Glu Lys Gln Val Cys Thr Thr Ser Asp Asp Ile Arg Ser Met Ala Asn
        435                 440                 445
Glu Thr Gln Ser Ile Gln Ser Ile Val Ser Val Ile Gly Gly Ile Ala
    450                 455                 460
Glu Gln Thr Asn Leu Leu Ala Leu Asn Ala Ser Ile Glu Ala Ala Arg
465                 470                 475                 480
Ala Gly Glu His Gly Arg Gly Phe Ala Val Val Ala Asp Glu Val Arg
                485                 490                 495
Ala Leu Ala Asn Arg Thr Gln Ile Ser Thr Ser Glu Ile Asp Glu Ala
            500                 505                 510
Leu Ser Gly Leu Gln Ser Lys Ser Asp Gly Leu Val Lys Ser Ile Glu
        515                 520                 525
Leu Thr Lys Ser Asn Cys Glu Leu Thr Arg Ala Gln Val Val Gln Ala
    530                 535                 540
Val Asn Met Leu Ala Lys Leu Thr Glu Gln Met Glu Thr Val Ser Arg
545                 550                 555                 560
Phe Asn Asn Asp Ile Ser Gly Ser Ser Val Glu Gln Asn Ala Leu Ile
                565                 570                 575
Gln Ser Ile Ala Lys Asn Met His Lys Ile Glu Ser Phe Val Glu Glu
            580                 585                 590
Leu Asn Lys Leu Ser Gln Asp Gln Leu Thr Glu Ser Ala Glu Ile Lys
        595                 600                 605
Thr Leu Asn Gly Ser Val Ser Glu Leu Met Ser Ser Phe Lys Val
    610                 615                 620
 
<210>31
<211>1743
<212>DNA
<213>灿烂弧菌
 
<400>31
gtgaataagc caatctttgt cgtcgtactc gcttcgctta cgtatggctg cggtggaagc 60
agctccagtg actctagtga cccttctgat accaataact caggagcatc ttatggtgtt 120
gttgctccct atgatattgc caagtatcaa aacatccttt ccagctcaga tcttcaggtg 180
tctgatccta atggagagga gggcaataaa acctctgaag tcaaagatgg taacttcgat 240
ggttatgtca gtgattattt ttatgctgac gaagagacgg aaaatctgat cttcaaaatg 300
gcgaactaca agatgcgctc tgaagttcgt gaaggagaaa acttcgatat caatgaagca 360
ggcgtaagac gcagtctaca tgcggaaata agcctacctg atattgagca tgtaatggcg 420
agttctcccg cagatcacga tgaagtgacc gtgctacaga tccacaataa aggtacagac 480
gagagtggca cgggttatat ccctcatccg ctattgcgtg tggtttggga gcaagaacga 540
gatggcctca caggtcacta ctgggcagtc atgaaaaata atgccattga ctgtagcagt 600
gccgctgact cttcggattg ttatgccact tcatataatc gctacgattt gggagaggcg 660
gatctcgata acttcaccaa gtttgatctt tctgtttatg aaaataccct ttcgatcaaa 720
gtgaacgatg aagttaaagt cgacgaagac atcacctact ggcagcatct actgagttac 780
tttaaagcgg gtatctacaa tcaatttgaa aatggtgaag ccacggctca ctttcaggca 840
ctgcgataca ccaccacaca ggtcaacggc tcaaacgatt gggatattaa tgattggaag 900
ttgacgattc ctgcgagtaa agacacttgg tatggaagtg ggggtgacag tgcggctgaa 960
ctagaacctg agcgctgcga atcgagcaaa gaccttctcg ccaacgacag tgatgtctac 1020
gacagcgata ttggtctttc ttatttcaat accgatgaag ggagagtgca ctttagagcg 1080
gatatgggat atggcacctc taccgaaaat tctagctata ttcgctctga gctcagggag 1140
ttgtatcaaa gcagtgttca accggattgt agcaccagcg atgaagatac aagttggtat 1200
ttggacgaca ctagaacgaa cgctaccagt cacgagttaa ccgcaagctt acgaattgaa 1260
gactacccga acattaataa ccaagacccg aaagtggtgc ttgggcaaat acacggttgg 1320
aagatcaatc aagcattggt gaagttgtta tgggaaggcg agagtaagcc agtaagagtg 1380
atactgaact ctgattttga gcgcaacaac caagactgta accattgtga cccgttcagt 1440
gtcgagttag gtacttattc ggcaagtgaa gagtggcgat atacgattcg agccaatcaa 1500
gacggtatct acttagcgac tcatgattta gatggaacta atacggtttc tcatttaatc 1560
ccttggggac aagattacac agataaagat ggggacacgg tctcgttgac gtcagattgg 1620
acatcgacag acatcgcttt ctatttcaaa gcgggcatct acccacaatt taagcctgat 1680
agcgactatg cgggtgaagt gtttgatgtg agctttagtt ctctaagagc agagcataac 1740
tga                                                               1743
 
<210>32
<211>580
<212>PRT
<213>灿烂弧菌
 
<400>32
Met Asn Lys Pro Ile Phe Val Val Val Leu Ala Ser Leu Thr Tyr Gly
 1               5                  10                  15
Cys Gly Gly Ser Ser Ser Ser Asp Ser Ser Asp Pro Ser Asp Thr Asn
            20                  25                  30
Asn Ser Gly Ala Ser Tyr Gly Val Val Ala Pro Tyr Asp Ile Ala Lys
        35                  40                  45
Tyr Gln Asn Ile Leu Ser Ser Ser Asp Leu Gln Val Ser Asp Pro Asn
    50                  55                  60
Gly Glu Glu Gly Asn Lys Thr Ser Glu Val Lys Asp Gly Asn Phe Asp
65                  70                  75                  80
Gly Tyr Val Ser Asp Tyr Phe Tyr Ala Asp Glu Glu Thr Glu Asn Leu
                85                  90                  95
Ile Phe Lys Met Ala Asn Tyr Lys Met Arg Ser Glu Val Arg Glu Gly
            100                 105                 110
Glu Asn Phe Asp Ile Asn Glu Ala Gly Val Arg Arg Ser Leu His Ala
        115                 120                 125
Glu Ile Ser Leu Pro Asp Ile Glu His Val Met Ala Ser Ser Pro Ala
    130                 135                 140
Asp His Asp Glu Val Thr Val Leu Gln Ile His Asn Lys Gly Thr Asp
145                 150                 155                 160
Glu Ser Gly Thr Gly Tyr Ile Pro His Pro Leu Leu Arg Val Val Trp
                165                 170                 175
Glu Gln Glu Arg Asp Gly Leu Thr Gly His Tyr Trp Ala Val Met Lys
            180                 185                 190
Asn Asn Ala Ile Asp Cys Ser Ser Ala Ala Asp Ser Ser Asp Cys Tyr
        195                 200                 205
Ala Thr Ser Tyr Asn Arg Tyr Asp Leu Gly Glu Ala Asp Leu Asp Asn
    210                 215                 220
Phe Thr Lys Phe Asp Leu Ser Val Tyr Glu Asn Thr Leu Ser Ile Lys
225                 230                 235                 240
Val Asn Asp Glu Val Lys Val Asp Glu Asp Ile Thr Tyr Trp Gln His
                245                 250                 255
Leu Leu Ser Tyr Phe Lys Ala Gly Ile Tyr Asn Gln Phe Glu Asn Gly
            260                 265                 270
Glu Ala Thr Ala His Phe Gln Ala Leu Arg Tyr Thr Thr Thr Gln Val
        275                 280                 285
Asn Gly Ser Asn Asp Trp Asp Ile Asn Asp Trp Lys Leu Thr Ile Pro
    290                 295                 300
Ala Ser Lys Asp Thr Trp Tyr Gly Ser Gly Gly Asp Ser Ala Ala Glu
305                 310                 315                 320
Leu Glu Pro Glu Arg Cys Glu Ser Ser Lys Asp Leu Leu Ala Asn Asp
                325                 330                 335
Ser Asp Val Tyr Asp Ser Asp Ile Gly Leu Ser Tyr Phe Asn Thr Asp
            340                 345                 350
Glu Gly Arg Val His Phe Arg Ala Asp Met Gly Tyr Gly Thr Ser Thr
        355                 360                 365
Glu Asn Ser Ser Tyr Ile Arg Ser Glu Leu Arg Glu Leu Tyr Gln Ser
    370                 375                 380
Ser Val Gln Pro Asp Cys Ser Thr Ser Asp Glu Asp Thr Ser Trp Tyr
385                 390                 395                 400
Leu Asp Asp Thr Arg Thr Asn Ala Thr Ser His Glu Leu Thr Ala Ser
                405                 410                 415
Leu Arg Ile Glu Asp Tyr Pro Asn Ile Asn Asn Gln Asp Pro Lys Val
            420                 425                 430
Val Leu Gly Gln Ile His Gly Trp Lys Ile Asn Gln Ala Leu Val Lys
        435                 440                 445
Leu Leu Trp Glu Gly Glu Ser Lys Pro Val Arg Val Ile Leu Asn Ser
    450                 455                 460
Asp Phe Glu Arg Asn Asn Gln Asp Cys Asn His Cys Asp Pro Phe Ser
465                 470                 475                 480
Val Glu Leu Gly Thr Tyr Ser Ala Ser Glu Glu Trp Arg Tyr Thr Ile
                485                 490                 495
Arg Ala Asn Gln Asp Gly Ile Tyr Leu Ala Thr His Asp Leu Asp Gly
            500                 505                 510
Thr Asn Thr Val Ser His Leu Ile Pro Trp Gly Gln Asp Tyr Thr Asp
        515                 520                 525
Lys Asp Gly Asp Thr Val Ser Leu Thr Ser Asp Trp Thr Ser Thr Asp
    530                 535                 540
Ile Ala Phe Tyr Phe Lys Ala Gly Ile Tyr Pro Gln Phe Lys Pro Asp
545                 550                 555                 560
Ser Asp Tyr Ala Gly Glu Val Phe Asp Val Ser Phe Ser Ser Leu Arg
                565                 570                 575
Ala Glu His Asn
            580
 
<210>33
<211>1569
<212>DNA
<213>灿烂弧菌
 
<400>33
atgaaacaaa ttactctaaa aactttactc gcttcttcta ttctacttgc ggttggttgt  60
gcgagcacga gcacgcctac tgctgatttt ccaaataaca aagaaactgg tgaagcgctt  120
ctgacgccag ttgctgtttc cgctagtagc catgatggta acggacctga tcgtctcgtt  180
gaccaagacc taactacacg ttggtcatct gcgggtgacg gcgagtgggc aacgctagac  240
tatggttcag tacaggagtt tgacgcggtt caggcatctt tcagtaaagg taatcagcgc  300
caatctaaat ttgatatcca agtgagtgtt gatggcgaaa gctggacaac ggtactagaa  360
aaccaactaa gctcaggtaa agcgatcggc ctagagcgtt tccaatttga gccagtagtg  420
caagcacgct acgtaagata cgttggtcac ggtaacacca aaaacggttg gaacagtgtg  480
actggattag cggcggttaa ctgtagcatt aacgcatgtc ctgctagcca tatcatcact  540
tcagacgtgg ttgcagcaga agccgtgatt attgctgaaa tgaaagcggc agaaaaagca  600
cgtaaagatg cgcgcaaaga tctacgctct ggtaacttcg gtgtagcagc ggtttaccct  660
tgtgagacga ccgttgaatg tgacactcgc agtgcacttc cagttccgac aggcctgcca  720
gcgacaccag ttgcaggtaa ctcgccaagc gaaaactttg acatgacgca ttggtaccta  780
tctcaaccat ttgaccatga caaaaatggc aaacctgatg atgtgtctga gtggaacctt  840
gcaaacggtt accaacaccc tgaaatcttc tacacagctg atgacggcgg cctagtattc  900
aaagcttacg tgaaaggtgt acgtacctct aaaaacacta agtacgcgcg tacagagctt  960
cgtgaaatga tgcgtcgtgg tgatcagtct attagcacta aaggtgttaa taagaataac  1020
tgggtattct caagcgctcc tgaatctgac ttagagtcgg cagcgggtat tgacggcgtt  1080
ctagaagcga cgttgaaaat cgaccatgca acaacgacgg gtaatgcgaa tgaagtaggt  1140
cgctttatca ttggtcagat tcacgatcaa aacgatgaac caattcgttt gtactaccgt  1200
aaactgccaa accaagaaac gggtgcggtt tacttcgcac atgaaagcca agacgcaact  1260
aaagaggact tctaccctct agtgggcgac atgacggctg aagtgggtga cgatggtatc  1320
gcgcttggcg aagtgttcag ctaccgtatt gacgttaaag gcaacacgat gactgtaacg  1380
ctaatacgtg aaggcaaaga cgatgttgta caagtggttg atatgagcaa cagcggctac  1440
gacgcaggcg gcaagtacat gtacttcaaa gccggtgttt acaaccaaaa catcagcggc  1500
gacctagacg attactcaca agcgactttc tatcagctag atgtatcgca cgatcaatac  1560
aaaaagtaa                                                          1569
 
<210>34
<211>522
<212>PRT
<213>灿烂弧菌
 
<400>34
Met Lys Gln Ile Thr Leu Lys Thr Leu Leu Ala Ser Ser Ile Leu Leu
 1               5                  10                  15
Ala Val Gly Cys Ala Ser Thr Ser Thr Pro Thr Ala Asp Phe Pro Asn
            20                  25                  30
Asn Lys Glu Thr Gly Glu Ala Leu Leu Thr Pro Val Ala Val Ser Ala
        35                  40                  45
Ser Ser His Asp Gly Asn Gly Pro Asp Arg Leu Val Asp Gln Asp Leu
    50                  55                  60
Thr Thr Arg Trp Ser Ser Ala Gly Asp Gly Glu Trp Ala Thr Leu Asp
65                  70                  75                  80
Tyr Gly Ser Val Gln Glu Phe Asp Ala Val Gln Ala Ser Phe Ser Lys
                85                  90                  95
Gly Asn Gln Arg Gln Ser Lys Phe Asp Ile Gln Val Ser Val Asp Gly
            100                 105                 110
Glu Ser Trp Thr Thr Val Leu Glu Asn Gln Leu Ser Ser Gly Lys Ala
        115                 120                 125
Ile Gly Leu Glu Arg Phe Gln Phe Glu Pro Val Val Gln Ala Arg Tyr
    130                 135                 140
Val Arg Tyr Val Gly His Gly Asn Thr Lys Asn Gly Trp Asn Ser Val
145                 150                 155                 160
Thr Gly Leu Ala Ala Val Asn Cys Ser Ile Asn Ala Cys Pro Ala Ser
                165                 170                 175
His Ile Ile Thr Ser Asp Val Val Ala Ala Glu Ala Val Ile Ile Ala
            180                 185                 190
Glu Met Lys Ala Ala Glu Lys Ala Arg Lys Asp Ala Arg Lys Asp Leu
        195                 200                 205
Arg Ser Gly Asn Phe Gly Val Ala Ala Val Tyr Pro Cys Glu Thr Thr
    210                 215                 220
Val Glu Cys Asp Thr Arg Ser Ala Leu Pro Val Pro Thr Gly Leu Pro
225                 230                 235                 240
Ala Thr Pro Val Ala Gly Asn Ser Pro Ser Glu Asn Phe Asp Met Thr
                245                 250                 255
His Trp Tyr Leu Ser Gln Pro Phe Asp His Asp Lys Asn Gly Lys Pro
            260                 265                 270
Asp Asp Val Ser Glu Trp Asn Leu Ala Asn Gly Tyr Gln His Pro Glu
        275                 280                 285
Ile Phe Tyr Thr Ala Asp Asp Gly Gly Leu Val Phe Lys Ala Tyr Val
    290                 295                 300
Lys Gly Val Arg Thr Ser Lys Asn Thr Lys Tyr Ala Arg Thr Glu Leu
305                 310                 315                 320
Arg Glu Met Met Arg Arg Gly Asp Gln Ser Ile Ser Thr Lys Gly Val
                325                 330                 335
Asn Lys Asn Asn Trp Val Phe Ser Ser Ala Pro Glu Ser Asp Leu Glu
            340                 345                 350
Ser Ala Ala Gly Ile Asp Gly Val Leu Glu Ala Thr Leu Lys Ile Asp
        355                 360                 365
His Ala Thr Thr Thr Gly Asn Ala Asn Glu Val Gly Arg Phe Ile Ile
    370                 375                 380
Gly Gln Ile His Asp Gln Asn Asp Glu Pro Ile Arg Leu Tyr Tyr Arg
385                 390                 395                 400
Lys Leu Pro Asn Gln Glu Thr Gly Ala Val Tyr Phe Ala His Glu Ser
                405                 410                 415
Gln Asp Ala Thr Lys Glu Asp Phe Tyr Pro Leu Val Gly Asp Met Thr
            420                 425                 430
Ala Glu Val Gly Asp Asp Gly Ile Ala Leu Gly Glu Val Phe Ser Tyr
        435                 440                 445
Arg Ile Asp Val Lys Gly Asn Thr Met Thr Val Thr Leu Ile Arg Glu
    450                 455                 460
Gly Lys Asp Asp Val Val Gln Val Val Asp Met Ser Asn Ser Gly Tyr
465                 470                 475                 480
Asp Ala Gly Gly Lys Tyr Met Tyr Phe Lys Ala Gly Val Tyr Asn Gln
                485                 490                 495
Asn Ile Ser Gly Asp Leu Asp Asp Tyr Ser Gln Ala Thr Phe Tyr Gln
            500                 505                 510
Leu Asp Val Ser His Asp Gln Tyr Lys Lys
        515                 520
 
<210>35
<211>1230
<212>DNA
<213>灿烂弧菌
 
<400>35
atgcaaattt ctaaagtcgc tacagctgtc gctctttcga caggtttatt atttggttgt  60
aacagtgatg gtttacctat tccaacagat ccaggcggaa cagaccctgt tgaacctgtt  120
gaagtttact ctatagaaaa cgtctattgg gatctgacag gtggtgctgt tgctgcacag  180
tcactcagcg gaacttcacc atatcgcttt gataataatg aggaaggtac tcgtgctcta  240
agcatttaca gtggagacgt agctaatggc ttcacttttg agagttcaat atatactgct  300
gaagaagaag gtgttgtttc ctttgaaggt aaggactgta cttacacagt gactgagcaa  360
cagctagata tgacctgtga aaaagatgac gtagaaacag cttactcagc aacagagatt  420
acagatgaat ctgttataac tgcattagaa aatgccgatg atggaaaacc taaatcagtc  480
gatgatgtga acgctgcgat tgcatcagca gaagatggcg cgattattga tttatcatct  540
gaaggtacgt ttgataccgg tgttattgag ctaaataaag ctgtcacaat tgatggtgct  600
ggtttagcaa ccattaccgg agatgcttgt attgatgtca ctgcacccgg tgcaggtatc  660
aaaaacatga cttttgctaa cgacaatttg gccgggtgtt ttggtaggga gtcagctggt  720
acttcagata atgaaactgg tgcgatcgtt attggtaaaa ttggtaaaga ttcagatcct  780
gtagcacttg aaaacctaaa gttcgatgca aacggcatta ccgaagatga tctaggtact  840
aaaaaagcaa gttggttatt ctctcgaggt tactttacat tagacaatag cgaatttgtc  900
ggtttaagtg gcagtttcca aaataatgca attcgtatta actgtagtag tgacaacggg  960
cgatttggtt cacaaatcac aaataataca ttcactatta actctggtgg tagtgatgtg  1020
ggcggaatta aagttggtga ttctagcagt gccgtcataa agaatagtga tgataacctt  1080
ggctgtaatg tcactattga aagcaatacg ttcaatggtt acaaaaccct actttcagct  1140
gacaacggta aagatataag aaatacagcc atctacgcac aaccatctgc agtgaacact  1200
gcggcaggta aagaaaatat cttgaactaa                                   1230
 
<210>36
<211>409
<212>PRT
<213>灿烂弧菌
 
<400>36
Met Gln Ile Ser Lys Val Ala Thr Ala Val Ala Leu Ser Thr Gly Leu
 1               5                  10                  15
Leu Phe Gly Cys Asn Ser Asp Gly Leu Pro Ile Pro Thr Asp Pro Gly
            20                  25                  30
Gly Thr Asp Pro Val Glu Pro Val Glu Val Tyr Ser Ile Glu Asn Val
        35                  40                  45
Tyr Trp Asp Leu Thr Gly Gly Ala Val Ala Ala Gln Ser Leu Ser Gly
    50                  55                  60
Thr Ser Pro Tyr Arg Phe Asp Asn Asn Glu Glu Gly Thr Arg Ala Leu
65                  70                  75                  80
Ser Ile Tyr Ser Gly Asp Val Ala Asn Gly Phe Thr Phe Glu Ser Ser
                85                  90                  95
Ile Tyr Thr Ala Glu Glu Glu Gly Val Val Ser Phe Glu Gly Lys Asp
            100                 105                 110
Cys Thr Tyr Thr Val Thr Glu Gln Gln Leu Asp Met Thr Cys Glu Lys
        115                 120                 125
Asp Asp Val Glu Thr Ala Tyr Ser Ala Thr Glu Ile Thr Asp Glu Ser
    130                 135                 140
Val Ile Thr Ala Leu Glu Asn Ala Asp Asp Gly Lys Pro Lys Ser Val
145                 150                 155                 160
Asp Asp Val Asn Ala Ala Ile Ala Ser Ala Glu Asp Gly Ala Ile Ile
                165                 170                 175
Asp Leu Ser Ser Glu Gly Thr Phe Asp Thr Gly Val Ile Glu Leu Asn
            180                 185                 190
Lys Ala Val Thr Ile Asp Gly Ala Gly Leu Ala Thr Ile Thr Gly Asp
        195                 200                 205
Ala Cys Ile Asp Val Thr Ala Pro Gly Ala Gly Ile Lys Asn Met Thr
    210                 215                 220
Phe Ala Asn Asp Asn Leu Ala Gly Cys Phe Gly Arg Glu Ser Ala Gly
225                 230                 235                 240
Thr Ser Asp Asn Glu Thr Gly Ala Ile Val Ile Gly Lys Ile Gly Lys
                245                 250                 255
Asp Ser Asp Pro Val Ala Leu Glu Asn Leu Lys Phe Asp Ala Asn Gly
            260                 265                 270
Ile Thr Glu Asp Asp Leu Gly Thr Lys Lys Ala Ser Trp Leu Phe Ser
        275                 280                 285
Arg Gly Tyr Phe Thr Leu Asp Asn Ser Glu Phe Val Gly Leu Ser Gly
    290                 295                 300
Ser Phe Gln Asn Asn Ala Ile Arg Ile Asn Cys Ser Ser Asp Asn Gly
305                 310                 315                 320
Arg Phe Gly Ser Gln Ile Thr Asn Asn Thr Phe Thr Ile Asn Ser Gly
                325                 330                 335
Gly Ser Asp Val Gly Gly Ile Lys Val Gly Asp Ser Ser Ser Ala Val
            340                 345                 350
Ile Lys Asn Ser Asp Asp Asn Leu Gly Cys Asn Val Thr Ile Glu Ser
        355                 360                 365
Asn Thr Phe Asn Gly Tyr Lys Thr Leu Leu Ser Ala Asp Asn Gly Lys
    370                 375                 380
Asp Ile Arg Asn Thr Ala Ile Tyr Ala Gln Pro Ser Ala Val Asn Thr
385                 390                 395                 400
Ala Ala Gly Lys Glu Asn Ile Leu Asn
                405
 
<210>37
<211>861
<212>DNA
<213>灿烂弧菌
 
<400>37
atgaattctg ttacaaaaat tgctgcagct gttgcatgta ctcttttagc gggcacagct  60
gctggtgcat ctcttgatta tcgttacgag tatcgtgctg cgacggatta tacaaagact  120
aatggtgata cggctcacgt agacgctcgc catcaacacc gagttaagct aggtgaaagc  180
tttaagctgt cagacaagtg gaagcactct actggtctag aacttaagtt ccacggtgat  240
gactcttact atgatgaaga ttcaggttct gttaaatcag caaacagcca gagtttttac  300
gatggcaatt ggtacatcta tggtatggag atcgataaca ctgcgacata caaaatagac  360
aataattggt atctacaaat gggtatgcct attgcttggg attgggatga gcctaatgct  420
aacgatggcg actggaagat gaaaaaggtt acgtttaaac ctcagttccg cgttggctat  480
aaagcagata tgggtttaac aactgctatt cgttaccgtc atgaatatgc tgacttccgt  540
aaccacacac aatttggcga caaagattct gaaactggcg agcgtttaga atcagctcaa  600
aagtctaaag ttacactgac gggctcttac aaaattgaat ctctacctaa gcttggcctt  660
tcttacgaag caaactatgt aaaatctttg gataacgtac ttctttataa tagtgatgac  720
tgggaatggg atgctggctt aaaggtaaac tacaagttcg gttcttggaa accttttgct  780
gaaatctggt cttctgatat cagttcatct tcaaaagatc gtgaagctaa ataccgtgtt  840
ggtattgctt actcattcta a                                            861
 
<210>38
<211>286
<212>PRT
<213>灿烂弧菌
 
<400>38
Met Asn Ser Val Thr Lys Ile Ala Ala Ala Val Ala Cys Thr Leu Leu
 1               5                  10                  15
Ala Gly Thr Ala Ala Gly Ala Ser Leu Asp Tyr Arg Tyr Glu Tyr Arg
            20                  25                  30
Ala Ala Thr Asp Tyr Thr Lys Thr Asn Gly Asp Thr Ala His Val Asp
        35                  40                  45
Ala Arg His Gln His Arg Val Lys Leu Gly Glu Ser Phe Lys Leu Ser
    50                  55                  60
Asp Lys Trp Lys His Ser Thr Gly Leu Glu Leu Lys Phe His Gly Asp
65                  70                  75                  80
Asp Ser Tyr Tyr Asp Glu Asp Ser Gly Ser Val Lys Ser Ala Asn Ser
                85                 90                 95
Gln Ser Phe Tyr Asp Gly Asn Trp Tyr Ile Tyr Gly Met Glu Ile Asp
            100                 105                 110
Asn Thr Ala Thr Tyr Lys Ile Asp Asn Asn Trp Tyr Leu Gln Met Gly
        115                 120                 125
Met Pro Ile Ala Trp Asp Trp Asp Glu Pro Asn Ala Asn Asp Gly Asp
    130                 135                 140
Trp Lys Met Lys Lys Val Thr Phe Lys Pro Gln Phe Arg Val Gly Tyr
145                 150                 155                 160
Lys Ala Asp Met Gly Leu Thr Thr Ala Ile Arg Tyr Arg His Glu Tyr
                165                 170                 175
Ala Asp Phe Arg Asn His Thr Gln Phe Gly Asp Lys Asp Ser Glu Thr
            180                 185                 190
Gly Glu Arg Leu Glu Ser Ala Gln Lys Ser Lys Val Thr Leu Thr Gly
        195                 200                 205
Ser Tyr Lys Ile Glu Ser Leu Pro Lys Leu Gly Leu Ser Tyr Glu Ala
    210                 215                 220
Asn Tyr Val Lys Ser Leu Asp Asn Val Leu Leu Tyr Asn Ser Asp Asp
225                 230                 235                 240
Trp Glu Trp Asp Ala Gly Leu Lys Val Asn Tyr Lys Phe Gly Ser Trp
                245                 250                 255
Lys Pro Phe Ala Glu Ile Trp Ser Ser Asp Ile Ser Ser Ser Ser Lys
            260                 265                 270
Asp Arg Glu Ala Lys Tyr Arg Val Gly Ile Ala Tyr Ser Phe
        275                 280                 285
 
<210>39
<211>1038
<212>DNA
<213>灿烂弧菌
 
<400>39
atgtttaaga aaaacatatt agcagtggcg ttattagcga ctgtgccaat ggttactttc  60
gcaaataacg gtgtttctta ccccgtacct gccgataaat tcgatatgca taattggaaa  120
ataaccatac cttcagatat taatgaagat ggtcgcgttg atgaaataga aggggtcgct  180
atgatgagct actcacatag tgatttcttc catcttgata aagacggcaa ccttgtattt  240
gaagtgcaga accaagcgat tacgacgaaa aactcgaaga atgcgcgttc tgagttacgc  300
cagatgccaa gaggcgcaga tttctctatc gatacggctg ataaaggaaa ccagtgggca  360
ctgtcgagtc acccagcggc tagtgaatac agtgctgtgg gcggaacatt agaagcgaca  420
ttaaaagtga atcacgtctc agttaacgct aagttcccag aaaaataccc agctcattct  480
gttgtggttg gtcagattca tgctaaaaaa cacaacgagc taatcaaagc tggaaccggt  540
tatgggcatg gtaatgaacc actaaagatc ttctataaga agtttcctga ccaagaaatg  600
ggttcagtat tctggaacta tgaacgtaac ctagagaaaa aagatcctaa ccgtgccgat  660
atcgcttatc cagtgtgggg taacacgtgg gaaaaccctg cagagccggg tgaagccggt  720
attgctcttg gtgaagagtt tagctacaaa gtggaagtga aaggcaccat gatgtaccta  780
acgtttgaaa ccgagcgtca cgataccgtt aagtatgaaa tcgacctgag taagggcatc  840
gatgaacttg actcaccaac gggctatgct gaagatgatt tttactacaa agcgggcgca  900
tacggccaat gtagcgtgag cgattctcac cctgtatggg ggcctggttg tggcggtact  960
ggcgatttcg ctgtcgataa aaagaatggc gattacaaca gtgtgacttt ctctgcgctt  1020
aagttaaacg gtaaatag                                                1038
 
<210>40
<211>345
<212>PRT
<213>灿烂弧菌
 
<400>40
Met Phe Lys Lys Asn Ile Leu Ala Val Ala Leu Leu Ala Thr Val Pro
 1               5                  10                  15
Met Val Thr Phe Ala Asn Asn Gly Val Ser Tyr Pro Val Pro Ala Asp
            20                  25                  30
Lys Phe Asp Met His Asn Trp Lys Ile Thr Ile Pro Ser Asp Ile Asn
        35                  40                  45
Glu Asp Gly Arg Val Asp Glu Ile Glu Gly Val Ala Met Met Ser Tyr
    50                  55                  60
Ser His Ser Asp Phe Phe His Leu Asp Lys Asp Gly Asn Leu Val Phe
65                  70                  75                  80
Glu Val Gln Asn Gln Ala Ile Thr Thr Lys Asn Ser Lys Asn Ala Arg
                85                  90                  95
Ser Glu Leu Arg Gln Met Pro Arg Gly Ala Asp Phe Ser Ile Asp Thr
            100                 105                 110
Ala Asp Lys Gly Asn Gln Trp Ala Leu Ser Ser His Pro Ala Ala Ser
        115                 120                 125
Glu Tyr Ser Ala Val  Gly Gly Thr Leu Glu Ala Thr Leu Lys Val Asn
    130                 135                 140
His Val Ser Val Asn Ala Lys Phe Pro Glu Lys Tyr Pro Ala His Ser
145                 150                 155                 160
Val Val Val Gly Gln Ile His Ala Lys Lys His Asn Glu Leu Ile Lys
                165                 170                 175
Ala Gly Thr Gly Tyr Gly His Gly Asn Glu Pro Leu Lys Ile Phe Tyr
            180                 185                 190
Lys Lys Phe Pro Asp Gln Glu Met Gly Ser Val Phe Trp Asn Tyr Glu
        195                 200                 205
Arg Asn Leu Glu Lys Lys Asp Pro Asn Arg Ala Asp Ile Ala Tyr Pro
    210                 215                 220
Val Trp Gly Asn Thr Trp Glu Asn Pro Ala Glu Pro Gly Glu Ala Gly
225                 230                 235                 240
Ile Ala Leu Gly Glu Glu Phe Ser Tyr Lys Val Glu Val Lys Gly Thr
                245                 250                 255
Met Met Tyr Leu Thr Phe Glu Thr Glu Arg His Asp Thr Val Lys Tyr
            260                 265                 270
Glu Ile Asp Leu Ser Lys Gly Ile Asp Glu Leu Asp Ser Pro Thr Gly
        275                 280                 285
Tyr Ala Glu Asp Asp Phe Tyr Tyr Lys Ala Gly Ala Tyr Gly Gln Cys
    290                 295                 300
Ser Val Ser Asp Ser His Pro Val Trp Gly Pro Gly Cys Gly Gly Thr
305                 310                 315                 320
Gly Asp Phe Ala Val Asp Lys Lys Asn Gly Asp Tyr Asn Ser Val Thr
                325                 330                 335
Phe Ser Ala Leu Lys Leu Asn Gly Lys
            340                 345
 
<210>41
<211>897
<212>DNA
<213>灿烂弧菌
 
<400>41
atggataact ctccggtgct gagccgattt ttagagaatg gatttttact ccagcagaaa  60
ctgagccttg ttctttgttg tgtgttgatc gcagcttctg catggatttt aggacagctt  120
gcatggttta ttgaacctgc tgagcaaacc gtcgtgccat ggacagcaac ggcttcctcg  180
tcttcaacgc ctcaatcgac tcttgatatc tcttctttgc agcagagcaa catgtttggt  240
gcttataacc caaccacgcc tgctgtggtt gagcagcaag ttatccaaga tgcgccaaag  300
acgcgactga acctcgtttt agtgggtgca gtagccagtt ctaatccaaa gctgagcttg  360
gctgtgattg ccaatcgcgg cacacaagca acctacggca ttaatgaaga gatcgaaggt  420
acgcgagcta agttaaaagc ggtattagtc gatcgcgtga ttattgataa ctcaggtcga  480
gacgaaacct tgatgcttga aggcattgag tacaagcgtt tgtctgtatc agcacctgcg  540
ccacctcgta cctcttcttc tgtgcgtggc aacaacccag cttctgcaga agagaagcta  600
gatgaaatta aagcgaagat aatgaaagat ccgcaacaaa tcttccaata tgttcgactg  660
tctcaggtga aacgcgacga taaagtgatt ggttatcgtg tgagccctgg caaagattca  720
gaacttttta actctgttgg gctccaaaac ggagatattg ccactcagtt aaatggacaa  780
gacctgacag accctgctgc tatgggcaac atattccgtt ctatctcaga gctgacagag  840
ctaaacctcg tcgtcgagag agatggtcaa caacatgaag tgtttattga attttag    897
 
<210>42
<211>298
<212>PRT
<213>灿烂弧菌
 
<400>42
Met Asp Asn Ser Pro Val Leu Ser Arg Phe Leu Glu Asn Gly Phe Leu
 1               5                  10                  15
Leu Gln Gln Lys Leu Ser Leu Val Leu Cys Cys Val Leu Ile Ala Ala
            20                  25                  30
Ser Ala Trp Ile Leu Gly Gln Leu Ala Trp Phe Ile Glu Pro Ala Glu
        35                  40                  45
Gln Thr Val Val Pro Trp Thr Ala Thr Ala Ser Ser Ser Ser Thr Pro
    50                  55                  60
Gln Ser Thr Leu Asp Ile Ser Ser Leu Gln Gln Ser Asn Met Phe Gly
65                  70                  75                  80
Ala Tyr Asn Pro Thr Thr Pro Ala Val Val Glu Gln Gln Val Ile Gln
                85                  90                  95
Asp Ala Pro Lys Thr Arg Leu Asn Leu Val Leu Val Gly Ala Val Ala
            100                 105                 110
Ser Ser Asn Pro Lys Leu Ser Leu Ala Val Ile Ala Asn Arg Gly Thr
        115                 120                 125
Gln Ala Thr Tyr Gly Ile Asn Glu Glu Ile Glu Gly Thr Arg Ala Lys
    130                 135                 140
Leu Lys Ala Val Leu Val Asp Arg Val Ile Ile Asp Asn Ser Gly Arg
145                 150                 155                 160
Asp Glu Thr Leu Met Leu Glu Gly Ile Glu Tyr Lys Arg Leu Ser Val
                165                 170                 175
Ser Ala Pro Ala Pro Pro Arg Thr Ser Ser Ser Val Arg Gly Asn Asn
            180                 1851                 90
Pro Ala Ser Ala Glu Glu Lys Leu Asp Glu Ile Lys Ala Lys Ile Met
        195                 200                 205
Lys Asp Pro Gln Gln Ile Phe Gln Tyr Val Arg Leu Ser Gln Val Lys
    210                 215                 220
Arg Asp Asp Lys Val Ile Gly Tyr Arg Val Ser Pro Gly Lys Asp Ser
225                 230                 235                 240
Glu Leu Phe Asn Ser Val Gly Leu Gln Asn Gly Asp Ile Ala Thr Gln
                245                 250                 255
Leu Asn Gly Gln Asp Leu Thr Asp Pro Ala Ala Met Gly Asn Ile Phe
            260                 265                 270
Arg Ser Ile Ser Glu Leu Thr Glu Leu Asn Leu Val Val Glu Arg Asp
        275                 280                 285
Gly Gln Gln His Glu Val Phe Ile Glu Phe
    290                 295
 
<210>43
<211>2025
<212>DNA
<213>灿烂弧菌
 
<400>43
gtgaagcatt ggtttaagaa aagtgcatgg ttattggcag gaagcttaat ctgcacaccc 60
gcagccatcg cgagtgattt tagtgccagc tttaaaggca ctgatattca agagtttatt 120
aatattgttg gtcgtaacct agagaagacg atcatcgttg acccttcggt gcgcggaaaa 180
atcgatgtac gcagctacga cgtactcaat gaagagcaat actacagctt cttcctaaac 240
gtattggaag tgtatggcta cgcggttgtc gaaatggact cgggtgttct taagatcatc 300
aaggccaaag attcgaaaac atcggcaatt ccagtcgttg gagacagtga cacgatcaaa 360
ggcgacaatg tggtgacacg tgttgtgacg gttcgtaatg tctcggtgcg tgaactttct 420
cctctgcttc gtcaactaaa cgacaatgca ggcgcgggta acgttgtgca ctacgaccca 480
gccaacatca tccttattac aggccgagcg gcggtagtaa accgtttagc tgaaatcatc  540
aagcgtgttg accaagcggg tgataaagag attgaagtcg ttgagctaaa gaatgcttct  600
gcggcagaaa tggtacgtat cgttgatgcg ttaagcaaaa ccactgatgc gaaaaacaca  660
cctgcatttc tacaacctaa attagttgcc gatgaacgta ccaatgcgat tcttatctca  720
ggcgacccta aagtacgtag ccgtttaaga aggctgattg aacagcttga tgttgaaatg  780
gcaaccaagg gcaataacca agttatttac cttaaatatg caaaagccga agatctagtt  840
gatgtgctga aaggcgtgtc ggacaaccta caatcagaga agcagacatc aaccaaagga  900
agttcatcgc agcgtaacca agtgatgatc tcagctcaca gtgacaccaa ctctttagtg  960
attaccgcac agccggacat catgaatgcg cttcaagatg tgatcgcaca gctggatatt  1020
cgtcgtgctc aagtattgat tgaagcactg attgtcgaaa tggccgaagg tgacggcgtt  1080
aaccttggtg tgcagtgggg taaccttgaa acgggtgcca tgattcagta cagcaacact  1140
ggcgcttcca ttggcggtgt gatggttggt ttagaagaag cgaaagacag cgaaacgaca  1200
accgctgttt atgattcaga cggtaaattc ttacgtaatg aaaccacgac ggaagaaggt  1260
gactattcaa cattagcttc cgcactttct ggtgttaatg gtgcggcaat gagtgtggta  1320
atgggtgact ggaccgcctt gatcagtgca gtagcgaccg attcaaattc aaatatccta  1380
tcttctccaa gtatcaccgt gatggataac ggcgaagcgt cattcattgt gggtgaagag  1440
gtgcctgttc taaccggttc tacagcaggc tcaagtaacg acaacccatt ccaaacagtt  1500
gaacgtaaag aagtgggtat caagcttaaa gtggtgccgc aaatcaatga aggtgattcg  1560
gttcaactgc aaatagaaca agaagtatcg aacgtattag gcgccaatgg tgcggttgat  1620
gtgcgttttg ctaagcgaca gctaaataca tcagtgattg ttcaagacgg tcaaatgctg  1680
gtgttgggtg gcttgattga cgagcgagca ttggaaagtg aatctaaggt gccgttcttg  1740
ggagatattc ctgtgcttgg acacttgttc aaatcaacca gtactcaggt tgagaaaaag  1800
aacctaatgg tcttcatcaa accaaccatt attcgtgatg gtatgacagc cgatggtatc  1860
acgcagcgta aatacaactt catccgtgct gagcagttgt acaaggctga gcaaggactg  1920
aagttaatgg cagacgataa catcccagta ttgcctaaat ttggtgccga catgaatcac  1980
ccggctgaaa ttcaagcctt catcgatcaa atggaacaag aataa                  2025
 
<210>44
<211>674
<212>PRT
<213>灿烂弧菌
 
<400>44
Met Lys His Trp Phe Lys Lys Ser Ala Trp Leu Leu Ala Gly Ser Leu
 1               5                  10                  15
Ile Cys Thr Pro Ala Ala Ile Ala Ser Asp Phe Ser Ala Ser Phe Lys
            20                  25                  30
Gly Thr Asp Ile Gln Glu Phe Ile Asn Ile Val Gly Arg Asn Leu Glu
        35                  40                  45
Lys Thr Ile Ile Val Asp Pro Ser Val Arg Gly Lys Ile Asp Val Arg
    50                  55                  60
Ser Tyr Asp Val Leu Asn Glu Glu Gln Tyr Tyr Ser Phe Phe Leu Asn
65                  70                  75                  80
Val Leu Glu Val Tyr Gly Tyr Ala Val Val Glu Met Asp Ser Gly Val
                85                  90                  95
Leu Lys Ile Ile Lys Ala Lys Asp Ser Lys Thr Ser Ala Ile Pro Val
            100                 105                 110
Val Gly Asp Ser Asp Thr Ile Lys Gly Asp Asn Val Val Thr Arg Val
        115                 120                 125
Val Thr Val Arg Asn Val Ser Val Arg Glu Leu Ser Pro Leu Leu Arg
    130                 135                 140
Gln Leu Asn Asp Asn Ala Gly Ala Gly Asn Val Val His Tyr Asp Pro
145                 150                 155                 160
Ala Asn Ile Ile Leu Ile Thr Gly Arg Ala Ala Val Val Asn Arg Leu
                165                 170                 175
Ala Glu Ile Ile Lys Arg Val Asp Gln Ala Gly Asp Lys Glu Ile Glu
            180                 185                 190
Val Val Glu Leu Lys Asn Ala Ser Ala Ala Glu Met Val Arg Ile Val
        195                 200                 205
Asp Ala Leu Ser Lys Thr Thr Asp Ala Lys Asn Thr Pro Ala Phe Leu
    210                 215                 220
Gln Pro Lys Leu Val Ala Asp Glu Arg Thr Asn Ala Ile Leu Ile Ser
225                 230                 235                 240
Gly Asp Pro Lys Val Arg Ser Arg Leu Arg Arg Leu Ile Glu Gln Leu
                245                 250                 255
Asp Val Glu Met Ala Thr Lys Gly Asn Asn Gln Val Ile Tyr Leu Lys
            260                 265                 270
Tyr Ala Lys Ala Glu Asp Leu Val Asp Val Leu Lys Gly Val Ser Asp
        275                 280                 285
Asn Leu Gln Ser Glu Lys Gln Thr Ser Thr Lys Gly Ser Ser Ser Gln
    290                 295                 300
Arg Asn Gln Val Met Ile Ser Ala His Ser Asp Thr Asn Ser Leu Val
305                 310                 315                 320
Ile Thr Ala Gln Pro Asp Ile Met Asn Ala Leu Gln Asp Val Ile Ala
                325                 330                 335
Gln Leu Asp Ile Arg Arg Ala Gln Val Leu Ile Glu Ala Leu Ile Val
            340                 345                 350
Glu Met Ala Glu Gly Asp Gly Val Asn Leu Gly Val Gln Trp Gly Asn
        355                 360                 365
Leu Glu Thr Gly Ala Met Ile Gln Tyr Ser Asn Thr Gly Ala Ser Ile
    370                 375                 380
Gly Gly Val Met Val Gly Leu Glu Glu Ala Lys Asp Ser Glu Thr Thr
385                 390                 395                 400
Thr Ala Val Tyr Asp Ser Asp Gly Lys Phe Leu Arg Asn Glu Thr Thr
                405                 410                 415
Thr Glu Glu Gly Asp Tyr Ser Thr Leu Ala Ser Ala Leu Ser Gly Val
            420                 425                 430
Asn Gly Ala Ala Met Ser Val Val Met Gly Asp Trp Thr Ala Leu Ile
        435                 440                 445
Ser Ala Val Ala Thr Asp Ser Asn Ser Asn Ile Leu Ser Ser Pro Ser
    450                 455                 460
Ile Thr Val Met Asp Asn Gly Glu Ala Ser Phe Ile Val Gly Glu Glu
465                 470                 475                 480
Val Pro Val Leu Thr Gly Ser Thr Ala Gly Ser Ser Asn Asp Asn Pro
                485                 490                 495
Phe Gln Thr Val Glu Arg Lys Glu Val Gly Ile Lys Leu Lys Val Val
            500                 505                 510
Pro Gln Ile Asn Glu Gly Asp Ser Val Gln Leu Gln Ile Glu Gln Glu
        515                 520                 525
Val Ser Asn Val Leu Gly Ala Asn Gly Ala Val Asp Val Arg Phe Ala
    530                 535                 540
Lys Arg Gln Leu Asn Thr Ser Val Ile Val Gln Asp Gly Gln Met Leu
545                 550                 555                 560
Val Leu Gly Gly Leu Ile Asp Glu Arg Ala Leu Glu Ser Glu Ser Lys
                565                 570                 575
Val Pro Phe Leu Gly Asp Ile Pro Val Leu Gly His Leu Phe Lys Ser
            580                 585                 590
Thr Ser Thr Gln Val Glu Lys Lys Asn Leu Met Val Phe Ile Lys Pro
        595                 600                 605
Thr Ile Ile Arg Asp Gly Met Thr Ala Asp Gly Ile Thr Gln Arg Lys
    610                 615                 620
Tyr Asn Phe Ile Arg Ala Glu Gln Leu Tyr Lys Ala Glu Gln Gly Leu
625                 630                 635                 640
Lys Leu Met Ala Asp Asp Asn Ile Pro Val Leu Pro Lys Phe Gly Ala
                645                 650                 655
Asp Met Asn His Pro Ala Glu Ile Gln Ala Phe Ile Asp Gln Met Glu
            660                 665                 670
Gln Glu
 
<210>45
<211>1503
<212>DNA
<213>灿烂弧菌
 
<400>45
atggctgaat tggtaggggc ggcacgtact tatcagcgct tgccgtttag ctttgcgaat  60
cgctacaaga tggtgttgga ataccaacat ccagagcgcg caccgatact ttattatgtt  120
gagccactga aatcggcggc gatcattgaa gtgagtcgtg ttgtgaaaaa tggtttcacg  180
ccacaagcga ttactctcga tgagtttgat aaaaaactaa ccgatgctta tcagcgtgac  240
tcgtcagaag ctcgtcagct catggaagac attggtgctg atagtgatga tttcttctca  300
ctagcggaag aactgcctca agacgaagac ttacttgaat cagaagatga tgcaccaatc  360
atcaagttaa tcaatgcgat gctgggtgag gcgatcaaag agggtgcttc ggatatacac  420
atcgaaacct ttgaaaagtc actttgtatc cgtttccgag ttgatggtgt gctgcgtgat  480
gttctagcgc caagccgtaa actggctccg ctattggttt cacgtgtcaa ggttatggct  540
aaactggata ttgcggaaaa acgcgtgcca caagatggtc gtatttctct gcgtattggt  600
ggccgagcgg ttgatgttcg tgtttcaacc atgccttctt cgcatggtga gcgtgtggta  660
atgcgtctgt tggacaaaaa tgccactcgt ctagacttgc acagtttagg tatgacagcc  720
gaaaaccatg aaaacttccg taagctgatt cagcgcccac atggcattat cttggtgacc  780
ggcccgacag gttcaggtaa atcgacgacc ttgtacgcag gtctgcaaga actcaacagc  840
aatgaacgaa acattttaac cgttgaagac ccaatcgaat tcgatatcga tggcattggt  900
caaacacaag tgaaccctaa ggttgatatg acctttgcgc gtggtttacg tgccattctt  960
cgtcaagatc ctgatgttgt tatgattggt gagatccgtg acttggagac cgcagagatt  1020
gctgtccagg cctctttgac aggtcactta gttatgtcga ctctgcatac caatactgcc  1080
gtcggtgcga ttacacgtct acgtgatatg ggcattgaac ctttcttgat ctcttcttcg  1140
ctgctgggtg ttttggctca gcgcttggtt cgtactttat gtaacgaatg taaagaacct  1200
tatgaagccg ataaagagca gaagaaactg tttgggttga agaagaaaga aagcttgacg  1260
ctttaccatg ccaaaggttg tgaagagtgt ggccataagg gttatcgagg tcgtacgggt  1320
attcatgagc tgttgatgat tgatgattca gtacaagagc tgattcacag tgaagcgggt  1380
gagcaggcga ttgataaagc aattcgtggc acaacaccaa gtattcgaga tgatggcttg  1440
agcaaagttc tgaaaggggt aacgtcccta gaagaagtga tgcgcgtgac caaggaagtc  1500
tag                                                                1503
 
<210>46
<211>500
<212>PRT
<213>灿烂弧菌
 
<400>46
Met Ala Glu Leu Val Gly Ala Ala Arg Thr Tyr Gln Arg Leu Pro Phe
 1               5                  10                  15
Ser Phe Ala Asn Arg Tyr Lys Met Val Leu Glu Tyr Gln His Pro Glu
            20                  25                  30
Arg Ala Pro Ile Leu Tyr Tyr Val Glu Pro Leu Lys Ser Ala Ala Ile
        35                  40                  45
Ile Glu Val Ser Arg Val Val Lys Asn Gly Phe Thr Pro Gln Ala Ile
    50                  55                  60
Thr Leu Asp Glu Phe Asp Lys Lys Leu Thr Asp Ala Tyr Gln Arg Asp
65                  70                  75                  80
Ser Ser Glu Ala Arg Gln Leu Met Glu Asp Ile Gly Ala Asp Ser Asp
                85                  90                  95
Asp Phe Phe Ser Leu Ala Glu Glu Leu Pro Gln Asp Glu Asp Leu Leu
            100                 105                 110
Glu Ser Glu Asp Asp Ala Pro Ile Ile Lys Leu Ile Asn Ala Met Leu
        115                 120                 125
Gly Glu Ala Ile Lys Glu Gly Ala Ser Asp Ile His Ile Glu Thr Phe
    130                 135                 140
Glu Lys Ser Leu Cys Ile Arg Phe Arg Val Asp Gly Val Leu Arg Asp
145                 150                 155                 160
Val Leu Ala Pro Ser Arg Lys Leu Ala Pro Leu Leu Val Ser Arg Val
                165                 170                 175
Lys Val Met Ala Lys Leu Asp Ile Ala Glu Lys Arg Val Pro Gln Asp
            180                 185                 190
Gly Arg Ile Ser Leu Arg Ile Gly Gly Arg Ala Val Asp Val Arg Val
        195                 200                 205
Ser Thr Met Pro Ser Ser His Gly Glu Arg Val Val Met Arg Leu Leu
    210                 215                 220
Asp Lys Asn Ala Thr Arg Leu Asp Leu His Ser Leu Gly Met Thr Ala
225                 230                 235                 240
Glu Asn His Glu Asn Phe Arg Lys Leu Ile Gln Arg Pro His Gly Ile
                245                 250                 255
Ile Leu Val Thr Gly Pro Thr Gly Ser Gly Lys Ser Thr Thr Leu Tyr
            260                 265                 270
Ala Gly Leu Gln Glu Leu Asn Ser Asn Glu Arg Asn Ile Leu Thr Val
        275                 280                 285
Glu Asp Pro Ile Glu Phe Asp Ile Asp Gly Ile Gly Gln Thr Gln Val
    290                 295                 300
Asn Pro Lys Val Asp Met Thr Phe Ala Arg Gly Leu Arg Ala Ile Leu
305                 310                 315                 320
Arg Gln Asp Pro Asp Val Val Met Ile Gly Glu Ile Arg Asp Leu Glu
                325v330                 335
Thr Ala Glu Ile Ala Val Gln Ala Ser Leu Thr Gly His Leu Val Met
            340                 345                 350
Ser Thr Leu His Thr Asn Thr Ala Val Gly Ala Ile Thr Arg Leu Arg
        355                 360                 365
Asp Met Gly Ile Glu Pro Phe Leu Ile Ser Ser Ser Leu Leu Gly Val
    370                 375                 380
Leu Ala Gln Arg Leu Val Arg Thr Leu Cys Asn Glu Cys Lys Glu Pro
385                 390                 395                 400
Tyr Glu Ala Asp Lys Glu Gln Lys Lys Leu Phe Gly Leu Lys Lys Lys
                405                 410                 415
Glu Ser Leu Thr Leu Tyr His Ala Lys Gly Cys Glu Glu Cys Gly His
            420                 425                 430
Lys Gly Tyr Arg Gly Arg Thr Gly Ile His Glu Leu Leu Met Ile Asp
        435                 440                 445
Asp Ser Val Gln Glu Leu Ile His Ser Glu Ala Gly Glu Gln Ala Ile
    450                 455                 460
Asp Lys Ala Ile Arg Gly Thr Thr Pro Ser Ile Arg Asp Asp Gly Leu
465                 470                 475                 480
Ser Lys Val Leu Lys Gly Val Thr Ser Leu Glu Glu Val Met Arg Val
                485                 490                 495
Thr Lys Glu Val
            500
 
<210>47
<211>1221
<212>DNA
<213>灿烂弧菌
 
<400>47
atggcggcat ttgaatacaa agcactggat gccaaaggca aaagtaaaaa aggctcaatt  60
gaagcagata atgctcgtca ggctcgccaa agaataaaag agcttggctt gatgccggtt  120
gagatgaccg aggctaaagc aaaaacagca aaaggtgctc agccatcgac cagctttaaa  180
cgcggcatca gtacgcctga tcttgcgctt attactcgtc aaatatccac gctcgttcaa  240
tctggtatgc cgctagaaga gtgtttgaaa gccgttgccg aacagtctga gaaacctcgt  300
attcgcacca tgctactcgc ggtgagatct aaggtgactg aaggttattc gttagcagac  360
agcttgtctg attatcccca tatcttcgat gagctattca gagccatggt tgctgctggt  420
gagaagtcag ggcatctaga tgcggtattg gaacgattgg ctgactacgc agaaaaccgt  480
cagaagatgc gttctaagtt gctgcaagcg atgatctacc ccatcgtgct ggtggtgttt  540
gcggtgacga ttgtgtcgtt cctactggca acggtagtgc cgaagatcgt tgagcctatt  600
atccaaatgg gacaagagct ccctcagtcg acacaatttt tattagcatc gagtgaattt  660
atccagaatt ggggcatcca attactggtg ttgaccattg gtgtgattgt gttggttaag  720
actgcgctga aaaagccggg cgttcgcatg agctgggatc gcaaattatt gagcatcccg  780
ctgataggca agatagcgaa agggatcaac acctctcgtt ttgcacgaac actttctatc  840
tgtacctcta gtgcgattcc tatccttgaa gggatgaagg tcgcggtaga tgtgatgtcg  900
aatcatcacg tgaaacaaca agtattacag gcatcagata gcgttagaga aggggcaagc  960
ctgcgtaaag cgcttgatca aaccaaactc tttcccccga tgatgctgca tatgatcgcc  1020
agtggtgagc agagtggcca attggaacag atgctgacaa gagcggcaga taatcaggat  1080
caaagctttg aatcgaccgt taatatcgcg ttaggcattt ttaccccagc gcttattgcg  1140
ttgatggctg gcttagtgct gtttatcgtg atggcgacgc tgatgccaat gcttgaaatg  1200
aacaatttaa tgagtggtta a                                            1221
 
<210>48
<211>406
<212>PRT
<213>灿烂弧菌
 
<400>48
Met Ala Ala Phe Glu Tyr Lys Ala Leu Asp Ala Lys Gly Lys Ser Lys
 1               5                  10                  15
Lys Gly Ser Ile Glu Ala Asp Asn Ala Arg Gln Ala Arg Gln Arg Ile
            20                  25                  30
Lys Glu Leu Gly Leu Met Pro Val Glu Met Thr Glu Ala Lys Ala Lys
        35                  40                  45
Thr Ala Lys Gly Ala Gln Pro Ser Thr Ser Phe Lys Arg Gly Ile Ser
    50                  55                  60
Thr Pro Asp Leu Ala Leu Ile Thr Arg Gln Ile Ser Thr Leu Val Gln
65                  70                  75                  80
Ser Gly Met Pro Leu Glu Glu Cys Leu Lys Ala Val Ala Glu Gln Ser
                85                  90                  95
Glu Lys Pro Arg Ile Arg Thr Met Leu Leu Ala Val Arg Ser Lys Val
            100                 105                 110
Thr Glu Gly Tyr Ser Leu Ala Asp Ser Leu Ser Asp Tyr Pro His Ile
        115                 120                 125
Phe Asp Glu Leu Phe Arg Ala Met Val Ala Ala Gly Glu Lys Ser Gly
    130                 135                 140
His Leu Asp Ala Val Leu Glu Arg Leu Ala Asp Tyr Ala Glu Asn Arg
145                 150                 155                 160
Gln Lys Met Arg Ser Lys Leu Leu Gln Ala Met Ile Tyr Pro Ile Val
                165                 170                 175
Leu Val Val Phe Ala Val Thr Ile Val Ser Phe Leu Leu Ala Thr Val
            180                 185                 190
Val Pro Lys Ile Val Glu Pro Ile Ile Gln Met Gly Gln Glu Leu Pro
        195                 200                 205
Gln Ser Thr Gln Phe Leu Leu Ala Ser Ser Glu Phe Ile Gln Asn Trp
    210                 215                 220
Gly Ile Gln Leu Leu Val Leu Thr Ile Gly Val Ile Val Leu Val Lys
225                 230                 235                 240
Thr Ala Leu Lys Lys Pro Gly Val Arg Met Ser Trp Asp Arg Lys Leu
                245                 250                 255
Leu Ser Ile Pro Leu Ile Gly Lys Ile Ala Lys Gly Ile Asn Thr Ser
            260                 265                 270
Arg Phe Ala Arg Thr Leu Ser Ile Cys Thr Ser Ser Ala Ile Pro Ile
        275                 280                 285
Leu Glu Gly Met Lys Val Ala Val Asp Val Met Ser Asn His His Val
    290                 295                 300
Lys Gln Gln Val Leu Gln Ala Ser Asp Ser Val Arg Glu Gly Ala Ser
305                 310                 315                 320
Leu Arg Lys Ala Leu Asp Gln Thr Lys Leu Phe Pro Pro Met Met Leu
                325                 330                 335
His Met Ile Ala Ser Gly Glu Gln Ser Gly Gln Leu Glu Gln Met Leu
            340                 345                 350
Thr Arg Ala Ala Asp Asn Gln Asp Gln Ser Phe Glu Ser Thr Val Asn
        355                 360                 365
Ile Ala Leu Gly Ile Phe Thr Pro Ala Leu Ile Ala Leu Met Ala Gly
    370                 375                 380
Leu Val Leu Phe Ile Val Met Ala Thr Leu Met Pro Met Leu Glu Met
385                 390                 395                 400
Asn Asn Leu Met Ser Gly
                405
 
<210>49
<211>444
<212>DNA
<213>灿烂弧菌
 
<400>49
atgaaaaata aaatgaaaaa acaatcaggc tttaccctat tagaagtcat ggttgttgtc  60
gttatccttg gtgttctagc aagttttgtt gtacctaacc tgttgggcaa caaagagaag  120
gcggatcaac aaaaagccat cactgatatt gtggcgctag agaacgcgct cgacatgtac  180
aaactggata acagcgttta cccaacaacg gatcaaggcc tggacgggtt ggtgacaaag  240
ccaagcagtc cagagcctcg taactaccga gacggcggtt acatcaagcg tctacctaac  300
gacccatggg gcaatgagta ccaataccta agtcctggtg ataacggcac aattgatatc  360
ttcactcttg gcgcagatgg tcaagaaggt ggtgaaggta ttgctgcaga tatcggcaac  420
tggaacatgc aggacttcca ataa                                         444
 
<210>50
<211>146
<212>PRT
<213>灿烂弧菌
 
<400>50
Lys Asn Lys Met Lys Lys Gln Ser Gly Phe Thr Leu Leu Glu Val Met
 1               5                  10                  15
Val Val Val Val Ile Leu Gly Val Leu Ala Ser Phe Val Val Pro Asn
            20                  25                  30
Leu Leu Gly Asn Lys Glu Lys Ala Asp Gln Gln Lys Ala Ile Thr Asp
        35                  40                  45
Ile Val Ala Leu Glu Asn Ala Leu Asp Met Tyr Lys Leu Asp Asn Ser
    50                  55                  60
Val Tyr Pro Thr Thr Asp Gln Gly Leu Asp Gly Leu Val Thr Lys Pro
65                  70                  75                  80
Ser Ser Pro Glu Pro Arg Asn Tyr Arg Asp Gly Gly Tyr Ile Lys Arg
                85                  90                  95
Leu Pro Asn Asp Pro Trp Gly Asn Glu Tyr Gln Tyr Leu Ser Pro Gly
            100                 105                 110
Asp Asn Gly Thr Ile Asp Ile Phe Thr Leu Gly Ala Asp Gly Gln Glu
        115                 120                 125
Gly Gly Glu Gly Ile Ala Ala Asp Ile Gly Asn Trp Asn Met Gln Asp
    130                 135                 140
Phe Gln
145
 
<210>51
<211>594
<212>DNA
<213>灿烂弧菌
 
<400>51
gtgaaaacta agcaaacaca gccaggtttc accttgattg agattctttt ggtgttggta  60
ttactgtcag tatcggcggt cgcggtgatc tcgaccatcc ctaccaatag caaagatgtt  120
gctaaaaaat acgctcaaag cttttatcag cgaattcagc tactcaatga agaggctatt  180
ttgagtggct tagattttgg tgttcgtgtt gatgaaaaaa aatcgactta cgttctgatg  240
actttgaagt ctgatggctg gcaagaaacg gagttcgaaa agatcccttc ttcaactgaa  300
ttaccggaag aactggcact gtcgctgaca ttaggtggtg gcgcgtggga agacgatgat  360
cggttgttca atccaggaag cttatttgat gaagatatgt ttgctgatct tgaagaggaa  420
aagaagccga aaccaccaca gatctacatc ttgtcgagtg ctgaaatgac gccatttgta  480
ctgtcgtttt acccaaatac cggtgacaca atacaagatg tttggcgcat tcgagtattg  540
gataatggtg tgattcgatt actcgagccg ggagaagaag atgaagaaga ataa    594
 
<210>52
<211>197
<212>PRT
<213>灿烂弧菌
 
<400>52
Met Lys Thr Lys Gln Thr Gln Pro Gly Phe Thr Leu Ile Glu Ile Leu
 1               5                  10                  15
Leu Val Leu Val Leu Leu Ser Val Ser Ala Val Ala Val Ile Ser Thr
            20                  25                  30
Ile Pro Thr Asn Ser Lys Asp Val Ala Lys Lys Tyr Ala Gln Ser Phe
        35                  40                  45
Tyr Gln Arg Ile Gln Leu Leu Asn Glu Glu Ala Ile Leu Ser Gly Leu
    50                  55                  60
Asp Phe Gly Val Arg Val Asp Glu Lys Lys Ser Thr Tyr Val Leu Met
65                  70                  75                  80
Thr Leu Lys Ser Asp Gly Trp Gln Glu Thr Glu Phe Glu Lys Ile Pro
                85                  90                  95
Ser Ser Thr Glu Leu Pro Glu Glu Leu Ala Leu Ser Leu Thr Leu Gly
            100                 105                 110
Gly Gly Ala Trp Glu Asp Asp Asp Arg Leu Phe Asn Pro Gly Ser Leu
        115                 120                 125
Phe Asp Glu Asp Met Phe Ala Asp Leu Glu Glu Glu Lys Lys Pro Lys
    130                 135                 140
Pro Pro Gln Ile Tyr Ile Leu Ser Ser Ala Glu Met Thr Pro Phe Val
145                 150                 155                 160
Leu Ser Phe Tyr Pro Asn Thr Gly Asp Thr Ile Gln Asp Val Trp Arg
                165                 170                 175
Ile Arg Val Leu Asp Asn Gly Val Ile Arg Leu Leu Glu Pro Gly Glu
            180                 185                 190
Glu Asp Glu Glu Glu
        195
 
<210>53
<211>396
<212>DNA
<213>灿烂弧菌
 
<400>53
atgaagaaga ataaccgttc tccttatcgt tctcgcggta tgcctcttgg ttctcgagga  60
atgactctgc ttgaagtatt ggttgcgctg gctatcttcg ctacggcggc gatcagtgtg  120
attcgtgctg tcacccagca catcaatacg ctcagttatc tcgaagaaaa aaccttcgcg  180
gcgatggtcg ttgataatca aatggcccta gtcatgctac atcctgagat gcttaaaaaa  240
gcgcagggca cgcaagagtt agcgggaaga gaatggttct ggaaggtgac tcccatcgat  300
accagcgata atttattaaa ggcgtttgat gtgagtgcgg caaccagtaa gaaagcgtct  360
ccagtcgtta cggtgcgcag ttatgtggtt aattaa                            396
 
<210>54
<211>131
<212>PRT
<213>灿烂弧菌
 
<400>54
Met Lys Lys Asn Asn Arg Ser Pro Tyr Arg Ser Arg Gly Met Pro Leu
 1               5                  10                  15
Gly Ser Arg Gly Met Thr Leu Leu Glu Val Leu Val Ala Leu Ala Ile
            20                  25                  30
Phe Ala Thr Ala Ala Ile Ser Val Ile Arg Ala Val Thr Gln His Ile
        35                  40                  45
Asn Thr Leu Ser Tyr Leu Glu Glu Lys Thr Phe Ala Ala Met Val Val
    50                  55                  60
Asp Asn Gln Met Ala Leu Val Met Leu His Pro Glu Met Leu Lys Lys
65                  70                  75                  80
Ala Gln Gly Thr Gln Glu Leu Ala Gly Arg Glu Trp Phe Trp Lys Val
                85                  90                  95
Thr Pro Ile Asp Thr Ser Asp Asn Leu Leu Lys Ala Phe Asp Val Ser
            100                 105                 110
Ala Ala Thr Ser Lys Lys Ala Ser Pro Val Val Thr Val Arg Ser Tyr
        115                 120                 125
Val Val Asn
    130
 
<210>55
<211>804
<212>DNA
<213>灿烂弧菌
 
<400>55
atgtggttaa ttaagagaat gtggtcaatt aagagcatgt tattaattaa gaacagctcg  60
ctaactaaga gcgtgtcgct aactaagagc atgtcggaaa ataagcgtac gccgcgtaaa  120
caaggtctac cttcaaaagg gagaggcttt accttaattg aagtcttggt ctcgattgct  180
atctttgcca cgctaagtat ggcggcttat caggtggtta atcaggtgca gcgaagcaac  240
gagatctcta ttgagcgcag tgctcgtttg aaccaactgc aacgcagttt agtcatttta  300
gataatgatt ttcgccagat ggcggtgcga aaatttcgta ccaacggtga agaagcatca  360
tctaagctga tcttaatgaa agagtattta ttggactccg acagtgtagg catcatgttt  420
actcgtctag gttggcacaa cccacaacag cagtttcctc gcggtgaagt cacgaaggtt  480
ggctaccgta ttaaagaaga aacacttgag cgtgtatggt ggcgttatcc cgatacacct  540
tcaggccaag aaggtgtgat tacccctctg cttgatgatg ttgaaagctt ggaattcgag  600
ttttatgacg gaagccgctg ggggaaagag tggcaaaccg ataaatcact gccgaaagcg  660
gtgaggctta agctgacact gaaagactat ggtgagatag agcgtgttta tctcactccc  720
ggtggcaccc tagatcaggc cgatgattct tcaaacagtg actcttcagg cagtagtgag  780
gggaataatg actcatcgaa ctaa                                         804
 
<210>56
<211>267
<212>PRT
<213>灿烂弧菌
 
<400>56
Met Trp Leu Ile Lys Arg Met Trp Ser Ile Lys Ser Met Leu Leu Ile
 1               5                  10                   15
Lys Asn Ser Ser Leu Thr Lys Ser Val Ser Leu Thr Lys Ser Met Ser
            20                  25                  30
Glu Asn Lys Arg Thr Pro Arg Lys Gln Gly Leu Pro Ser Lys Gly Arg
        35                  40                  45
Gly Phe Thr Leu Ile Glu Val Leu Val Ser Ile Ala Ile Phe Ala Thr
    50                  55                  60
Leu Ser Met Ala Ala Tyr Gln Val Val Asn Gln Val Gln Arg Ser Asn
65                  70                  75                  80
Glu Ile Ser Ile Glu Arg Ser Ala Arg Leu Asn Gln Leu Gln Arg Ser
                85                  90                  95
Leu Val Ile Leu Asp Asn Asp Phe Arg Gln Met Ala Val Arg Lys Phe
            100                 105                 110
Arg Thr Asn Gly Glu Glu Ala Ser Ser Lys Leu Ile Leu Met Lys Glu
        115                 120                 125
Tyr Leu Leu Asp Ser Asp Ser Val Gly Ile Met Phe Thr Arg Leu Gly
    130                 135                 140
Trp His Asn Pro Gln Gln Gln Phe Pro Arg Gly Glu Val Thr Lys Val
145                 150                 155                 160
Gly Tyr Arg Ile Lys Glu Glu Thr Leu Glu Arg Val Trp Trp Arg Tyr
                165                 170                 175
Pro Asp Thr Pro Ser Gly Gln Glu Gly Val Ile Thr Pro Leu Leu Asp
            180                 185                 190
Asp Val Glu Ser Leu Glu Phe Glu Phe Tyr Asp Gly Ser Arg Trp Gly
        195                 200                 205
Lys Glu Trp Gln Thr Asp Lys Ser Leu Pro Lys Ala Val Arg Leu Lys
    210                 215                 220
Leu Thr Leu Lys Asp Tyr Gly Glu Ile Glu Arg Val Tyr Leu Thr Pro
225                 230                 235                 240
Gly Gly Thr Leu Asp Gln Ala Asp Asp Ser Ser Asn Ser Asp Ser Ser
                245                 250                 255
Gly Ser Ser Glu Gly Asn Asn Asp Ser Ser Asn
            260                 265
 
<210>57
<211>1050
<212>DNA
<213>灿烂弧菌
 
<400>57
atgactcatc gaactaataa gcgtttagcg acaaggtcag ccttgggacg taaacaacgt 60
ggtgtcgcgc tgatcattat tttgatgcta ttggcgatca tggcaaccat tgctggcagc 120
atgtccgagc gtttgtttac gcaattcaag cgcgttggta accaactgaa ttaccaacag 180
gcttactggt acagcattgg tgtggaagcg cttgtgcaaa acggtattag gcaaagttac 240
aaagacagtg ataccgtgaa cctaagccaa ccatgggcgt tagaagagca ggtataccca 300
ttggattatg gccaagttaa gggccgcatt gttgatgctc aggcatgttt taatcttaat 360
gccttagccg gagtggcgac cacttcaagt aaccagactc cttatttaat cacggtttgg 420
caaaccttat tggaaaacca agacgttgag ccttatcagg ctgaggttat cgcaaattca 480
acgtgggaat ttgttgatgc ggatacacga accacctctt cgtctggtgt agaagacagc 540
acgtatgaag cgatgaagcc ctcttatttg gcggcgaatg gcttaatggc cgatgaatcc 600
gagctacgag cggtttatca agtcactggt gaagtgatga ataaggttcg cccctttgtt 660
tgcgctctgc caaccgatga tttccgcttg aatgtgaata ctctcacgga aaaacaagca 720
ccgttattgg aagcgatgtt tgcgccaggc ttaagtgaat cggatgccaa acagctgata 780
gataaacgcc catttgatgg ctgggatacg gtagatgctt tcatggctga acctgccatt 840
gttggtgtaa gtgccgaagt cagcaagaaa gcgaaagcat atttaactgt agatagcgcc 900
tattttgagc tagatgcaga ggtattagtt gagcagtcac gtgtacgtat acggacgctt 960
ttctatagta gtaatcgaga aacagtgacg gtagtacgcc gtcgttttgg aggaatcagt 1020
gagcgagttt ctgaccgttc gactgagtag                                  1050
 
<210>58
<211>349
<212>PRT
<213>灿烂弧菌
 
<400>58
Met Thr His Arg Thr Asn Lys Arg Leu Ala Thr Arg Ser Ala Leu Gly
 1               5                  10                  15
Arg Lys Gln Arg Gly Val Ala Leu Ile Ile Ile Leu Met Leu Leu Ala
            20                  25                  30
Ile Met Ala Thr Ile Ala Gly Ser Met Ser Glu Arg Leu Phe Thr Gln
        35                  40                  45
Phe Lys Arg Val Gly Asn Gln Leu Asn Tyr Gln Gln Ala Tyr Trp Tyr
    50                  55                  60
Ser Ile Gly Val Glu Ala Leu Val Gln Asn Gly Ile Arg Gln Ser Tyr
65                  70                  75                  80
Lys Asp Ser Asp Thr Val Asn Leu Ser Gln Pro Trp Ala Leu Glu Glu
                85                  90                  95
Gln Val Tyr Pro Leu Asp Tyr Gly Gln Val Lys Gly Arg Ile Val Asp
            100                 105                 110
Ala Gln Ala Cys Phe Asn Leu Asn Ala Leu Ala Gly Val Ala Thr Thr
        115                 120                 125
Ser Ser Asn Gln Thr Pro Tyr Leu Ile Thr Val Trp Gln Thr Leu Leu
    130                 135                 140
Glu Asn Gln Asp Val Glu Pro Tyr Gln Ala Glu Val Ile Ala Asn Ser
145                 150                 155                 160
Thr Trp Glu Phe Val Asp Ala Asp Thr Arg Thr Thr Ser Ser Ser Gly
                165                 170                 175
Val Glu Asp Ser Thr Tyr Glu Ala Met Lys Pro Ser Tyr Leu Ala Ala
            180                 185                 190
Asn Gly Leu Met Ala Asp Glu Ser Glu Leu Arg Ala Val Tyr Gln Val
        195                 200                 205
Thr Gly Glu Val Met Asn Lys Val Arg Pro Phe Val Cys Ala Leu Pro
    210                 215                 220
Thr Asp Asp Phe Arg Leu Asn Val Asn Thr Leu Thr Glu Lys Gln Ala
225                 230                 235                 240
Pro Leu Leu Glu Ala Met Phe Ala Pro Gly Leu Ser Glu Ser Asp Ala
                245                 250                 255
Lys Gln Leu Ile Asp Lys Arg Pro Phe Asp Gly Trp Asp Thr Val Asp
            260                 265                 270
Ala Phe Met Ala Glu Pro Ala Ile Val Gly Val Ser Ala Glu Val Ser
        275                 280                 285
Lys Lys Ala Lys Ala Tyr Leu Thr Val Asp Ser Ala Tyr Phe Glu Leu
    290                 295                 300
Asp Ala Glu Val Leu Val Glu Gln Ser Arg Val Arg Ile Arg Thr Leu
305                 310                 315                 320
Phe Tyr Ser Ser Asn Arg Glu Thr Val Thr Val Val Arg Arg Arg Phe
                325                 330                 335
Gly Gly Ile Ser Glu Arg Val Ser Asp Arg Ser Thr Glu
            340                 345
 
<210>59
<211>1248
<212>DNA
<213>灿烂弧菌
 
<400>59
gtgagcgagt ttctgaccgt tcgactgagt agcgaaccac aaagccctgt gcagtggtta 60
gtttggtcga caagccaaca agaagtgata gcaagcggtg aactgtctag ctgggaacag 120
cttgacgagt taacgcctta cgctgaaaag cgcagctgta tcgctttatt gccgggaagt 180
gaatgcttaa ttaagcgtgt tgagatcccg aaaggtgctg ctcgccagtt tgattctatg 240
ctgccgttct tattagaaga cgaagtcgca caagatatcg aagacttaca cctgactatt 300
ttagataaag atgccactca cgctaccgtg tgtggtgtgg atcgtgaatg gctaaaacaa 360
gctttagacc tgtttcgcga agccaatata atcttccgta aggtgctacc agatacacta 420
gccgtgcctt ttgaagaaca aggcatcagt gcgttgcaga tagatcagca ttggttattg 480
cgccaaggtc actctcaacg tcaaggtcac tatcaagccg tatcgatcag tgaagcatgg 540
ttaccgatgt ttttgcaaag tgattgggtt gtcgctggtg aggaagagca agcgacgact 600
atcttcagct ataccgcgat gccgagcgac gacgttcaac agcaaagcgg cctcgagtgg 660
caagcaaagc ctgcggaatt ggtgatgtct ttattgagtc agcaagcgat cacaagcggc 720
gtaaatttac tgactggcac ctttaaaacc aaatcttcat tcagtaaata ttggcgtgtt 780
tggcagaaag tggcgattgc tgcttgtttg ctggtggccg tgattgtgac tcagcaagtg 840
ttgaaggttc agcaatacga agcgcaagca caagcctacc gcatggagag tgagcgtatc 900
tttagagctg tgctgcctgg caaacaacgc attccgaccg tgagttacct caagcgtcag 960
atgaatgatg aagctaagaa atacggtggt tcaggcgaag gtgattcttt acttggttgg 1020
ttagctttgc tgcctgaaac cttagggcaa gtgaagacga tcgaagttga aagcattcgc 1080
tacgatggca accgttctga ggttcgactg caggctaaaa gttctgactt ccaacacttt 1140
gagaccgcaa gggtgaagct cgaagagaag tttgtcgttg agcaagggcc attgaaccgt 1200
aatggcgatg ccgtatttgg cagttttact cttaaacccc atcaataa              1248
 
<210>60
<211>415
<212>PRT
<213>灿烂弧菌
<400>60
Met Ser Glu Phe Leu Thr Val Arg Leu Ser Ser Glu Pro Gln Ser Pro
 1               5                  10                  15
Val Gln Trp Leu Val Trp Ser Thr Ser Gln Gln Glu Val Ile Ala Ser
            20                  25                  30
Gly Glu Leu Ser Ser Trp Glu Gln Leu Asp Glu Leu Thr Pro Tyr Ala
        35                  40                  45
Glu Lys Arg Ser Cys Ile Ala Leu Leu Pro Gly Ser Glu Cys Leu Ile
    50                  55                  60
Lys Arg Val Glu Ile Pro Lys Gly Ala Ala Arg Gln Phe Asp Ser Met
65                  70                  75                  80
Leu Pro Phe Leu Leu Glu Asp Glu Val Ala Gln Asp Ile Glu Asp Leu
                85                  90                  95
His Leu Thr Ile Leu Asp Lys Asp Ala Thr His Ala Thr Val Cys Gly
            100                 105                 110
Val Asp Arg Glu Trp Leu Lys Gln Ala Leu Asp Leu Phe Arg Glu Ala
        115                 120                 125
Asn Ile Ile Phe Arg Lys Val Leu Pro Asp Thr Leu Ala Val Pro Phe
    130                 135                 140
Glu Glu Gln Gly Ile Ser Ala Leu Gln Ile Asp Gln His Trp Leu Leu
145                 150                 155                 160
Arg Gln Gly His Ser Gln Arg Gln Gly His Tyr Gln Ala Val Ser Ile
                165                 170                 175
Ser Glu Ala Trp Leu Pro Met Phe Leu Gln Ser Asp Trp Val Val Ala
            180                 185                 190
Gly Glu Glu Glu Gln Ala Thr Thr Ile Phe Ser Tyr Thr Ala Met Pro
        195                 200                 205
Ser Asp Asp Val Gln Gln Gln Ser Gly Leu Glu Trp Gln Ala Lys Pro
    210                 215                 220
Ala Glu Leu Val Met Ser Leu Leu Ser Gln Gln Ala Ile Thr Ser Gly
225                 230                 235                 240
Val Asn Leu Leu Thr Gly Thr Phe Lys Thr Lys Ser Ser Phe Ser Lys
                245                 250                 255
Tyr Trp Arg Val Trp Gln Lys Val Ala Ile Ala Ala Cys Leu Leu Val
            260                 265                 270
Ala Val Ile Val Thr Gln Gln Val Leu Lys Val Gln Gln Tyr Glu Ala
        275                 280                 285
Gln Ala Gln Ala Tyr Arg Met Glu Ser Glu Arg Ile Phe Arg Ala Val
    290                 295                 300
Leu Pro Gly Lys Gln Arg Ile Pro Thr Val Ser Tyr Leu Lys Arg Gln
305                 310                 315                 320
Met Asn Asp Glu Ala Lys Lys Tyr Gly Gly Ser Gly Glu Gly Asp Ser
                325                 330                 335
Leu Leu Gly Trp Leu Ala Leu Leu Pro Glu Thr Leu Gly Gln Val Lys
            340                 345                 350
Thr Ile Glu Val Glu Ser Ile Arg Tyr Asp Gly Asn Arg Ser Glu Val
        355                 360                 365
Arg Leu Gln Ala Lys Ser Ser Asp Phe Gln His Phe Glu Thr Ala Arg
    370                 375                 380
Val Lys Leu Glu Glu Lys Phe Val Val Glu Gln Gly Pro Leu Asn Arg
385                 390                 395                 400
Asn Gly Asp Ala Val Phe Gly Ser Phe Thr Leu Lys Pro His Gln
                405                 410                 415
 
<210>61
<211>489
<212>DNA
<213>灿烂弧菌
 
<400>61
atgagaaata tgattgaacc actccaagcg tggtgggctt caataagtca gcgggaacaa  60
cgattagtca ttggttgttc tattttattg atactgggcg ttgtctattg gggattaata  120
caaccactta gccaacgagc cgagcttgca caaagccgca ttcaaagtga gaagcaactt  180
ctggcttggg taacggacaa agcgaatcaa gtggttgaac tacgaggcag tggtggcatc  240
agtgccagtc agcctttgaa ccaatctgtg cctgcttcta tgcgccgttt taacatcgag  300
ctgatacgcg tgcaaccacg cggtgagatg ctgcaagttt ggattaagcc tgtgccattt  360
aataagttcg ttgactggct gacatacctg aaagaaaagc agggtgttga ggttgagttt  420
atggatattg atcgctctga tagccctggg gttattgaga tcaaccgact acagtttaaa  480
cgaggttaa                                                          489
 
<210>62
<211>162
<212>PRT
<213>灿烂弧菌
 
<400>62
Met Arg Asn Met Ile Glu Pro Leu Gln Ala Trp Trp Ala Ser Ile Ser
 1               5                  10                  15
Gln Arg Glu Gln Arg Leu Val Ile Gly Cys Ser Ile Leu Leu Ile Leu
            20                  25                  30
Gly Val Val Tyr Trp Gly Leu Ile Gln Pro Leu Ser Gln Arg Ala Glu
        35                  40                  45
Leu Ala Gln Ser Arg Ile Gln Ser Glu Lys Gln Leu Leu Ala Trp Val
    50                  55                  60
Thr Asp Lys Ala Asn Gln Val Val Glu Leu Arg Gly Ser Gly Gly Ile
65                  70                  75                  80
Ser Ala Ser Gln Pro Leu Asn Gln Ser Val Pro Ala Ser Met Arg Arg
                85                  90                  95
Phe Asn Ile Glu Leu Ile Arg Val Gln Pro Arg Gly Glu Met Leu Gln
            100                 105                 110
Val Trp Ile Lys Pro Val Pro Phe Asn Lys Phe Val Asp Trp Leu Thr
        115                 120                 125
Tyr Leu Lys Glu Lys Gln Gly Val Glu Val Glu Phe Met Asp Ile Asp
    130                 135                 140
Arg Ser Asp Ser Pro Gly Val Ile Glu Ile Asn Arg Leu Gln Phe Lys
145                 150                 155                 160
Arg Gly
 
<210>63
<211>780
<212>DNA
<213>灿烂弧菌
 
<400>63
gtgaaacgcg gtttatcttt caaatacggc ctgttattca gcgtcatttt tatcgttttt  60
ttctcggtaa gcttgttgct gcatttgcct gccgcttttg ctctcaagca tgcacccgtc  120
gtgcgtggtt taagcattga aggcgttgag ggcaccgttt ggcaaggtcg cgctaacaat  180
atcgcgtggc agcgtgtcaa ttacggctca gtgcagtggg acttccagtt ctctaaacta  240
ttccaagcca aagcagaact tgcggttcgc tttggccgca acagcgacat gaacttatca  300
ggtaaaggac gtgtcggata tagcatgagt ggtgcttacg cggaaaactt agtggcatca  360
atgccagcca gcaacgtgat gaaatatgcg ccagctatcc cagtgcctgt gtctattgca  420
gggcaagttg aactgacgat caaacatgcg gttcatgctc aaccttggtg tcaatcaggt  480
gaaggtacgc ttgcttggtc tggtgcagca gtcgactcgc cagtgggttc gttagacctt  540
ggccctgtga ttgcggacat aacgtgtgaa gacagcacaa ttgcagccaa aggcactcag  600
aagagcgatc aggtagacag cgagttctca gcgagcgtaa cacctaacca acgctacacc  660
tcggcagcat ggtttaagcc aggcgctgaa ttcccgccag caatgcagag tcagcttaag  720
tggttgggca atcctgatag ccaaggtaaa taccaattta cttatcaagg ccgcttttag  780
 
<210>64
<211>259
<212>PRT
<213>灿烂弧菌
 
<400>64
Met Lys Arg Gly Leu Ser Phe Lys Tyr Gly Leu Leu Phe Ser Val Ile
 1               5                  10                  15
Phe Ile Val Phe Phe Ser Val Ser Leu Leu Leu His Leu Pro Ala Ala
            20                  25                  30
Phe Ala Leu Lys His Ala Pro Val Val Arg Gly Leu Ser Ile Glu Gly
        35                  40                  45
Val Glu Gly Thr Val Trp Gln Gly Arg Ala Asn Asn Ile Ala Trp Gln
    50                  55                  60
Arg Val Asn Tyr Gly Ser Val Gln Trp Asp Phe Gln Phe Ser Lys Leu
65                  70                  75                  80
Phe Gln Ala Lys Ala Glu Leu Ala Val Arg Phe Gly Arg Asn Ser Asp
                85                  90                  95
Met Asn Leu Ser Gly Lys Gly Arg Val Gly Tyr Ser Met Ser Gly Ala
            100                 105                 110
Tyr Ala Glu Asn Leu Val Ala Ser Met Pro Ala Ser Asn Val Met Lys
        115                 120                 125
Tyr Ala Pro Ala Ile Pro Val Pro Val Ser Ile Ala Gly Gln Val Glu
    130                 135                 140
Leu Thr Ile Lys His Ala Val His Ala Gln Pro Trp Cys Gln Ser Gly
145                 150                 155                 160
Glu Gly Thr Leu Ala Trp Ser Gly Ala Ala Val Asp Ser Pro Val Gly
                165                 170                 175
Ser Leu Asp Leu Gly Pro Val Ile Ala Asp Ile Thr Cys Glu Asp Ser
            180                 185                 190
Thr Ile Ala Ala Lys Gly Thr Gln Lys Ser Asp Gln Val Asp Ser Glu
        195                 200                 205
Phe Ser Ala Ser Val Thr Pro Asn Gln Arg Tyr Thr Ser Ala Ala Trp
    210                 215                 220
Phe Lys Pro Gly Ala Glu Phe Pro Pro Ala Met Gln Ser Gln Leu Lys
225                 230                 235                 240
Trp Leu Gly Asn Pro Asp Ser Gln Gly Lys Tyr Gln Phe Thr Tyr Gln
                245                 250                 255
Gly Arg Phe
 
<210>65
<211>10967
<212>DNA
<213>胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043
 
<400>65
aagttgcagg atatgacgaa agcgtggccg acgactatac cggccacgct ttgaggaatt  60
acaggaaatc agctcgctta ggcgagaaag catcgatcag tacgctaccg tcttccagcg  120
aaaccacgcc gtgcatctcg tgtttcaccg ccagataggc gtcgcccgtt ttcagggtgc  180
gtttttcacc ttcgatcacg acttcaaagc tgccagcggc aacataagca atctggtcgt  240
gaatctcatg gaagtgcggc gtaccaatcg cacctttatc aaagtgcacg taaaccatca  300
tcagctcatc gctccatgtc atgattttac gtttaatgcc accgcccagc tcttcccatg  360
gcgtttcatc atcaataaag tatcttctca tcatctctct cctctaacgc tctttttgcc  420
cataccttct attgcgtcaa caaaccgtgt acgacaacga atgcatggct atggattgcg  480
acattttagc cacatcagta ccagaagaaa cataaaataa gcaaaaccat gacggccctc  540
aagaaataaa taaaacatta tttcattttt attgaattcg catctcatcc aaactatcat  600
cccgcataac aagaaagaac cgggcatgtt gaggaacagg tgacgttgtc actgccacgc  660
aacatcatct gtttcgcccg gcgctttcgc caggaacgat tcctcttctt ggaacggcgc  720
ctgatttttg tttttctctg aaagagaggc taagaaatgc aagttcgtca aagcattcac  780
agcgatcacg cgaagcagct agatacagca ggcctgcgtc gtgaattcct gatcgaacag  840
attttttctg ccgatgccta cactatgacc tatagccaca tcgaccgaat catcgtcggt  900
ggcatcatgc ccgtacacag cgccgtaacg attggcggtg aagtgggtaa acaactcggc 960
gttagctatt tccttgagcg tcgcgaactc ggagccatca acattggcgg cgcgggtacc 1020
gttactgtcg atggcgagcg ctatgacgtg ggtaatgaag aagcaattta tgttggcatg 1080
ggcgtgaaag acgtgcagtt taccagcact gatgccacta acccggccaa gttctactac 1140
aacagcgcgc ctgcacatac gacatatcct acccgcaaga ttacccaagc tgacgcttca 1200
ccacaaaccg tgggagaaga tgcaagctgt aatcgtcgca caattaacaa atacattgtt 1260
cccgatgtat tgccaacctg ccagctcacc atgggattaa ccaagttagc tgaaggcagc 1320
ctgtggaaca ccatgccttg tcatacgcat gagcgccgga tggaagtcta tttctatttt 1380
gatatggatg aggaaacggc cgttttccac atgatggggc aaccgcagga aacccgtcac 1440
atagttatta aaaacgagca ggcggtgatt tcaccgagct ggtcgattca ttccggtgtt 1500
ggcaccagac gctacacctt tatctggggc atggttggcg agaatcaagt tttcggtgac 1560
atggatcacg tcaaggttag cgagttacgt taatcgcttt caaccggaat taccggtgtt 1620
ccctacagta acagctaacg actaagtatt gtcgcttata gagagattat tgatatgatt 1680
ttaaattctt ttgatttgca aggtaaagtt gctcttatca cgggttgtga tacgggttta 1740
ggtcagggta tggctatcgg tctggcacaa gctggctgtg atatcgttgg cgtcaacatc 1800
gttgaaccaa aagataccat cgaaaaagtt accgcactgg gacgccgttt cctcagcctg 1860
accgctgaca tgagcaacgt agcgggtcat gccgagctgg tagagaaagc cgttgctgaa 1920
tttggtcacg ttgacattct ggtcaacaac gccggtatca tccgtcgtga agatgctatc 1980
gagttcagcg agaaaaactg ggacgacgtc atgaatctga acattaagag cgttttcttt 2040
atgtctcagg ctgttgcacg ccagtttatc aaacaaggta aaggcggcaa gatcatcaac 2100
atcgcctcta tgctgtcctt ccaaggcggt atccgcgtgc cttcttacac tgcgtcaaaa 2160
agcgccgtta tgggtgtaac ccgtctgctg gctaacgagt gggcaaaaca cggcatcaac 2220
gttaacgcca ttgctccagg gtacatggca accaacaata ctcagcaact gcgcgccgat 2280
gaagaccgca gcaaagagat tctggaccgt atcccggctg gccgttgggg tttaccacag 2340
gatctgatgg gcccatccgt cttcctggca tccagcgcat ctgattacat caatggctac 2400
acgattgccg ttgatggtgg ctggctggct cgctaagtgt aatttttctt agcggcattt 2460
cgctaatcca cgataaaaag cacaatttag gttgtgcttt ttatttattt ttcaagttgt 2520
tatttcgttt tttataattc tcttttctgc ctaaatcctt tcttaaaaaa aaatcaaaac 2580
aacgttccga ctttgatcac actttcgata ttgcgtgcat gacgacaagg ttaatagcgc 2640
aatataatca atcaaaacag tgtttctatt tataaggaac tgttcacgca gttccataag 2700
aaggtactcc atgagtattt ttgaaaactt atacaccagc aggaaatcgc agctcgacga 2760
atgggttgct gcacttgata gccacatatc ctgcgttcag gaaaaaggcc gcagccaaag 2820
ccaaccgacg ctattactgg ccgatggttt tgatgtggaa aattatgcgc ctgcggtatg 2880
gcaatttccg gatgggcaca gcgcgcctat ttctaatttt gccagccagc agaattggct 2940
aagaacgctg tgcgccatga gcgtcgttac gggtaatgat agttaccaac agcacgctat 3000
cgcacaaagc gaatatttcc tggatcattt cgttgatgat aatagcggcc tgttctactg 3060
gggcggccat cgctttatta atctggatac gctggaaggc gaagggccag aatccaaagc 3120
tcaggtgcat gaattaaagc accacctgcc ctattacgcg ctgttacatc gtgttaacgc 3180
ggaaaagacg ctgaacttct ttcaggggtt ctggaacgca cacgttgaag attggaattc 3240
actggatctg ggtcgtcatg gcgattacag caaaaaacgc gatcctgatg ttttcctgca 3300
taaccgtcat gatgtcgtcg atccggcaca gtggcccgtt ctgccattaa cgaaaggcct 3360
gacgtttgtt aatgccggca cggatctgat ttacgccgca ttcaaatatg cagaatatac 3420
gggcgatagc catgccgcgg catggggtaa acacctttat cgccaatacg ttctggctcg 3480
caacccagaa accggtatgc cggtgtatca attcagttca ccacagcagc gccagccagt 3540
gccggaagac gataaccaga cgcagtcctg gtttggcgat cgcgctcaac gccagtttgg 3600
cccagagttc ggtgaaatcg cacgtgaagc caatgtgctg ttccgcgata tgcgtccact 3660
gctgattgat aacccgctgg caatgctgga tatcctccgc acacagcctg atgcagaaat 3720
gctgaattgg gtaatctctg gattaaaaaa ttattaccag tacgcctacg atgtcaccag 3780
caatacgttg cgcccgatgt ggaacaacgg gcaggacatg acaggctacc gttttaaacg 3840
cgatggctat tacggcaaag cgggaacgga attaaaaccg ttcgcattag aaggtgatta 3900
tttattacct ctggttcgtg cttatcgtct gagcggtgat gaagacctgt acgcactggt 3960
taacaccatg ctgacacggc tgaataaaga agatattcag cacatcgcca gtccgctact 4020
tttgttgacc gttatcgaac tggccgatca caagcaatca gaatcctggg cacattacgc 4080
cgcacaactg gcgggcgtta tgtttgaaca acatttccat cgtggtttgt ttgttcgctc 4140
tgcacagcat cgttatgttc gtctggatga tacctatccg ctggctttac tgactttcgt 4200
tgccgcctgt cgcaacaaat taaacgatat cccgccgtat ctgacacaag gtggatatgt 4260
tcacggcgat tttcacgtta acggggaaaa tagaattgtt tatgacgtgg aattaattta 4320
tccagagtta ttaacagctt aattttatgt tttttttaat gattcacaat taatcaatag 4380
gtaagcatta tgaatgaaaa cagaatgctg gggttagcct atatctcccc ctatattata 4440
gggctgatag tttttaccgc tttccccttt atttcgtcat ttatcctcag ttttactgag 4500
tatgatttga tgagtccgcc tgagtttacg ggtcttgaga actatcaccg tatgttcatg 4560
gaggatgatc ttttttggaa atcaatgggc gtcacctttg cctatgtatt tctgaccatt 4620
ccattgaaat taatcttcgc actgttaatt gcgtttgtac ttaatttcaa attacgtggt 4680
atcggtttct tccgtactgc ttactatgtg ccttctattc tgggcagcag cgtggccatt 4740
gccgttctgt ggcgtgccct attcgccatc gatggcttgc tgaacagctt cctcggcgta 4800
tttggctttg atgccatcaa ctggctgggc gaaccttcgc tggcactgat gtcggtaacc 4860
ctgctgcgcg tatggcagtt tggttccgcc atggttatct tccttgctgc attgcagaac 4920
gtcccgcaat cacagtatga agcagccatg atcgacggtg catccaaatg gcaaatgttc 4980
ctgaaagtaa cggttccact gattacgccg gttattttct ttaactttat catgcagacc 5040
actcaggcat tccaggagtt tacggcacct tacgtcatca ctggcggcgg tccaacgcac 5100
tacacctatc tgttctcgct ctatatctat gataccgcgt tcaagtattt cgatatgggc 5160
tatggtgctg cgctggcatg ggttctgttc ctggttgttg cggtatttgc ggcaatctcc 5220
tttaagtcgt cgaaatactg ggtgttctac tccgctgata aaggaggaaa aaatggctga 5280
catgcattca aacctgacta cagcacaaga aattgctgct gcagaagtac gccgcacgct 5340
gcgtaaagag aaactcagtg cctccatccg ttacgtgata ctgctgttcg ttggcttact 5400
gatgctttac ccactagcgt ggatgttctc agcgtcgttc aaaccgaacc aagagatctt 5460
cacgacactg ggcctgtggc cggaacacgc cacatgggac ggtttcgtta acggttggaa 5520
aaccggtacg gaatacaatt tcggtcacta catgatcaat acgctcaagt tcgtgattcc 5580
gaaagtgcta ctgaccatta tctcttccac cattgtcgct tacggctttg cccgtttcga 5640
gattccatgg aagggcttct ggttcgggac gctgatcacc accatgctgt taccaagcac 5700
cgtgttgctg attccgcagt acatcatgtt ccgtgaaatg ggcatgctga acagctatct 5760
gccactgtac ttgccgatgg cgtttgcaac acaagggttc tttgtgttca tgctgatcca 5820
gttcctgcgt ggtgtaccac gtgatatgga agaagccgcc cagatcgatg gctgtaactc 5880
cttccaggtt ctgtggtatg tggtcgtgcc gattttgaaa ccagccatca tctctgttgc 5940
gctgttccag ttcatgtggt caatgaacga cttcatcggt ccgctgattt atgtctatag 6000
cgtggataaa tatccgattg cgctggcgct gaaaatgtct atcgacgtta ctgaaggcgc 6060
tccgtggaat gaaatcctgg caatgtccag catctccatt ctgccatcca ttattgtttt 6120
cttcctggca cagcgttact tcgtacaagg cgtgaccagc agcggaatta aaggttaata 6180
gaggatttat catggctgaa gttattttca ataaactgga aaaagtatac accaacggct 6240
tcaaagcggt tcacggcatc gacctgacca ttaaagacgg tgagttcatg gttatcgtcg 6300
gcccgtcagg ctgtgcgaaa tcaacgacgc tgcgtatgtt agcgggtctg gaaaccatca 6360
gcggcggtga agttcgcatc ggcgagcgcg ttgttaacaa tctggcaccg aaagagcgtg 6420
ggattgcaat ggtgttccag aactatgcgc tctaccctca tatgacggta aaagagaacc 6480
tggcgtttgg tctgaagctg agcaaaatgc ctaaagatca aattgaagcg caagtaacgg 6540
aagcagccaa aattctggag ctggaagacc tgatggatcg tctgccacgc cagctatctg 6600
gtggtcaggc gcagcgtgtg gccgtaggcc gtgccatcgt taaaaagccg gatgttttcc 6660
tgtttgatga accgttatct aacctggatg ccaaactgcg tgcttccatg cgtatccgta 6720
tttctgacct gcataagcag ttgaagaaaa gcggtaaagc ggcaacgacg gtatatgtta 6780
cccacgacca gactgaagcc atgaccatgg gcgaccgtat ctgcgttatg aagctgggtc 6840
acatcatgca ggtcgatacg ccggataacc tgtaccattt ccctgtcaac atgttcgttg 6900
ctggcttcat tggctcacca gaaatgaaca ttaagccgtg caaactggtc gagaaagacg 6960
gtcagattgg cgttgttgtg ggtaataacg cgctggtatt aaatactgaa aaacaagata 7020
aagtgcgcag ctacgtagga caagacgtat tcttcggcgt tcgcccagac tatgtttcct 7080
tgtcagatac gccatttgaa ggcagccact cacagggtga actggttcgc gtagaaaaca 7140
tgggtcacga attctttatg tacattaaag tcgatggctt tgaattaacc agccgcattc 7200
cttatgacga aggtcggctg attatcgaga agggactgca tcgtccggta tatttccagt 7260
tcgacatgga aaaatgccat atttttgatg caaaaacaga aaaaaatatc tctctttaac 7320
aggagtagta accgatgaaa aaagcgatcc tacacacgtt aatagcttca tctttggcat 7380
tagttgcaat gccatctctg gcagccgatc aggttgagtt gagaatgtcc tggtggggcg 7440
gcaacagccg tcaccaacag acgctcaagg cgattgaaga gttccataag cagcacccag 7500
acatcaccgt gaaagcggaa tacaccggat gggatggtca cctgtctcgt ctgacaacac 7560
agattgccgg taacactgag ccagatgtga tgcagactaa ctggaactgg ctgccgattt 7620
tctccaaaaa cggcgatggt ttttatgatc tgaacaaagt gaaagattct ctggatctga 7680
cccagttcga agcaaaagaa ctgcaaaaca ccacggttaa cggcaagctg aacggtattc 7740
ctatttctgt taccgctcgc gtgttctatt tcaacaacga aagctgggca aaagcgggac 7800
tggaataccc gaaaacgtgg gacgaactgc tgaacgccgg taaagtgttc aaagagaagc 7860
tgggcgacca atactaccct atcgtgttgg aacaccagga ttctctggca ctgctgaact 7920
cttacatggt tcaaaaatac aacattcctg ctattgatgt gaaaagtcag aaattcgcct 7980
ataccgatgc acaatgggtt gaattctttg gcatgtataa gaaactgatc gacagccatg 8040
tcatgcctga tgcgaaatac tatgcctctt tcggtaagag caacatgtat gagatgaagc 8100
catggatcaa tggcgagtgg tctggtactt acatgtggaa ctccactatc actaagtact 8160
ctgacaactt gcaaccacca gcaaaactgg cgttaggtaa ctacccaatg ctgcctggtg 8220
caaaagatgc tggcttgttc ttcaaacctg cacaaatgct gtctatcggt aagtcaacca 8280
agcatcctaa agagtctgct cagttgatca acttcctgct gaacagcaaa gaaggtgctc 8340
aggctttggg tctggaacgt ggtgtaccgt tgagtaaagc ggctgtggct cagctgaccg 8400
ctgatggcat catcaaagat gatgctccag cagttgccgg gttgaagctg gcgctgtctc 8460
tgccgcatga agttgctgtt tctccttatt tcgacgaccc acaaatcgtt tctctgtttg 8520
gtgataccat ccaatctatc gattatggtc agaaatctgt ggaagacgca gcgaaatact 8580
tccagcgtca atctgagcgt gttctgaaac gcgcaatgaa ataatgtagc actcgattta 8640
ccctgtaatt catccctgcc gcaccgacgg cagggatttt tcatttaaat taaaacatcc 8700
tctatattca attcgatctc cctcacaatt tgaaacccta ttttactttt tgttactcaa 8760
aacgatctcg atcacagaac gtaatttaat aataaataga atagaacttg tcccaaaaaa 8820
cataatgcgc ctttcgaatt aaagtattaa gcacagtcct aaccaatggg gaatataaca 8880
atgaaattta aattattagc tctggctgtt acatcattaa ttagtgtgaa tgcaatggct 8940
gtaactatcg attaccgtca tgaaatgaaa gatacaccga aaaatgatca ccgcgatcgt 9000
ttgtcaatgt cacaccgttt tgccaatggc tttggtttat ccgttgaagc aaaatggcgt 9060
caatccagtg ctgacagcac accgaataaa ccatttaatg aaaccgtcag caacggtact 9120
gaagttgtcg ccagctatgt ttacaacttc aacaaaactt tttctctgga gccaggtttc 9180
tctttagatt caagctctac ctctaacaac tatcgccctt atctgcgcgg taaagtgaat 9240
atcactgacg atctttctac ctctttacgt tatcgtcctt actacaaacg taacagcggt 9300
gatgttccaa atgcatcaaa aaacaaccaa gagaatggtt ataacctaac cgccgttctc 9360
agctataaat tcctgaaaga tttccaagtt gattacgaac tggactacaa aaaagcaaat 9420
aaagccggtg cgtatcaata cgacaatgaa acatacaatt tcgaccatga tgtaaaattg 9480
tcttataaaa tggataaaaa ctggaagcct tatatggctg taggtaatgt tgcagattcc 9540
ggcaccaacg atcatcgtca aactcgttac cgtgttggtg tgcaatacag cttctaataa 9600
cggccttgtt atttaaataa gcgttattag gtagcagaag ggatgttatt gttaatcgat 9660
ttactcagat ctacttttat cattaacatc cctttattat ggtgtccgtt gtaggttaag 9720
caggttagtt acgtttcttt gttgtacatg atttagttat atgcgtttta gctgctgtaa 9780
ttgctgtgtc tgatttaccc tcttcgtgta tgaatgttat ttctttatta aaatttgcgg 9840
ttcagggtag tcattttttc tccgatgtga tggctaccct attttttacc accgcccaac 9900
gattcccccc tcattccctt tgtcaggtga tctatcatga ttgttcgttc tctgcttgtc 9960
ggggccatta tgatgtctgt aaatggatta agttacgcac aacctgtttt ctctgtctgg 10020
ccacacggtg aagcaccggg tgcctcttct tcaacggcac agccgcaagt ggtcgaacgg 10080
agtaaagatc cttctcttcc cgatcgagcc gcaacgggta ttcgcagccc tgaaattacc 10140
gtttatccgg cagagaaacc caatggcatg gcattactca ttacgccggg cggttcttat 10200
cagcgcgtcg tgctagataa agaaggcagc gatctagccc ctttctttaa tcaacaaggc 10260
tacacccttt tcgtgatgac ctatcgtatg cccggtgaag gccataaaga aggcgctgac 10320
gctccgctag ccgatgccca acgagccatc agaacactga gagccaacgc cgaaaagtgg 10380
cacattaacc cgcagcgcat cggtattatg gggttctccg ccggtggtca cgttgccgcc 10440
agccttggaa cccgattcgc acagtccgtt taccccgcga tggacgccgt tgataacgta 10500
agcgcacgcc ctgacttcat ggtgttgatg taccccgtaa tttctatgca ggcagatatt 10560
gcgcacgccg gttcacgtaa acagttaatc ggcgagcaac cgatggaagt acaagcggta 10620
cgttattctc ctgagaaaca ggttactgat cagactcccc ccacgttttt ggtgcatgcg 10680
gttgacgatc cgtcagtgtc ggttgataac agcctggtga tgtttagcgc gctgcgggca 10740
aagcagattc cggtcgaaat gcatctcttt gagaaaggta aacacggctt cggtctccgc 10800
ggcaccaagg ggcttcctgc cgctgcctgg cctcaactgc tggacaactg gctacgcgct 10860
ttacctgcaa gcaacgaatt gccgaaagcc gcgccataag gtatagcaaa catcgtaacc 10920
gaaataaatc gttacgccgt caccgcttcc gcagacaggg ataatct               10967
 
<210>66
<211>2582
<212>DNA
<213>胡萝卜软腐欧文氏菌马铃薯黑胫亚种SCRI1043
 
<400>66
ccaacggcgg gtgcgacata aacataagcg aatcgaagcg ctgcgctccg gtgagtatct 60
gaagtaattt acgatagttt ctttccaaag gcccattcgg gcctttgtta tttcagcgtt 120
tattgattca tcaaacctgc gctttctctg ctcgaatgtt ttcactagat ctgaaacagg 180
tggtgaaaac atgaagaatg ttttataaaa taaaaccacg atcacggaaa aatgaaacat 240
tgtttctata ataccgatat gacaggcgtc tcgcgtgaga tttgtggcct gatttttgaa 300
caaccggtgt cggggtgacc gattcgtcgg acgttcagta atgtcaggtt atcgaagcgt 360
atgcgtgtgt ggcgtcaaat tcttcatgat aagttctaag gatttacgga tggccaaagg 420
taataagatc cccctaacgt ttcataccta ccaggatgca gcaaccggca ccgaagttgt 480
gcgtttaacc ccgcccgatg ttatctgcca ccggaattat ttctaccaga agtgtttctt 540
caatgacggt agcaagctgc tgtttggcgc tgcatttgat ggcccatgga actactatct 600
gctggattta aaagagcaga acgccacaca gttgacggaa ggcaaaggcg acaatacttt 660
tggtggtttc ctgtctccga atgacgatgc gctatattac gttaaaaata cccgtaattt 720
gatgcgtgtc gatctgacta cgctggaaga gaaaacgatt tatcaggtgc ctgacgattg 780
ggtcggctac ggtacttggg ttgccaactc cgattgcacc aaaatggtcg gtattgagat 840
caagaaagaa gactggaagc cactgaccga ttggaaaaaa ttccaggagt tctacttcac 900
taatccttgc tgtcgtctga ttcgcgtcga tttggtaacg ggcgaagcgg agactatcct 960
tcaggaaaac cagtggctgg gtcacccaat ctaccgtcca ggtgatgaca acacggttgc 1020
tttctgtcac gaaggcccgc atgacctggt tgatgctcgt atgtggttca tcaacgaaga 1080
tggcaccaac atgcgcaaag tgaaagagca tgcagaaggc gaaagctgca cccacgaatt 1140
ttgggtgccg gatggctccg cgatgattta tgtctcttat cttaaagacg ataccaaccg 1200
ttatattcgc agcatcgatc ccgttacgct ggaagatcgc caactgcgtg taatgccgcc 1260
gtgttctcac ctgatgagta actatgatgg cacactgttg gtcggtgatg gttccgatgc 1320
accggtcgac gtgcaggatg atggtggcta caaaattgag aacgatccgt tcctgtatgt 1380
tttcaacctg aaaactggca aagaacatcg tattgcgcag cacaatacat cctgggaagt 1440
gttggaaggg gaccgtcagg tcactcaccc gcacccgtct ttcacgccgg ataataaaca 1500
agttctgttt acttctgacg tagatggaaa acctgcgttg tatctggcga aggttcctga 1560
ttcagtctgg aactaataat actaataaat ccgcgtcacg tttcatggcg cggattattt 1620
taaaatattt acttacatat tattttatta agtctctgac gcggttattt ctcaaactta 1680
acttgattat cgttgttgct ccattgccat aatcaaagcg ttccctttat actaaaacca 1740
ttgttctatt ttttttaaaa caaaaaaacc tgagtagggt aaccacaaaa atggctagtg 1800
cagatttaga taaacaaccc gattccgtgt cgtccgtttt aaaggttttt ggtattttgc 1860
aggcattagg tgaagagaga gaaattggta ttaccgagct ttctcagcga gtcatgatgt 1920
ctaagagtac cgtttaccgt ttcttgcaga cgatgaaatc cctgggctat gtcgcgcagg 1980
aaggtgaatc agagaagtat tcgctaacgc tcaagttgtt tgaacttggt gcaaaagcat 2040
tgcagaacgt agacttaatc cgcagtgcgg atatacagat gcgcgagttg tctgtgctga 2100
cgcgggaaac gattcacctt ggcgcgttgg atgaagacgg catcgtttat atccacaaga 2160
ttgattctat gtataacctg cgtatgtatt cgcgcatcgg tcgccgtaat ccactacaca 2220
gtaccgcaat tggtaaagtg ttgctggctt ggcgcgatcg cggtgaagtg gaagaggttc 2280
tgtcgactgt cgaattcacg cgtagtacgc cacacacatt gtgtactgct gaagatcttc 2340
tcaatcaact ggatgtcgtg cgtgagcaag gctacgggga agataaagaa gagcaggaag 2400
aagggctgcg ttgtatcgct gtgccagtat tcgatcgttt tggtgtggtg attgccggcc 2460
tcagtatttc cttcccaacg attcgttttt cagaagaaaa caaacacgaa tatgtggcca 2520
tgctgcacac cgcagctaga aatatctctg agcaaatggg ctaccacaat ttccctttct 2580
ga                                                                2582
 
<210>67
<211>2331
<212>DNA
<213>根癌农杆菌
 
<400>67
atgcgtccct ctgccccggc catctccaga cagacacttc tcgatgaacc ccgcccgggc 60
tcattgacca ttggctacga gccgagcgaa gaagcacaac cgacggagaa ccctccgcgc 120
ttttcatggc tacccgatat tgacgacggc gcgcgttacg tgctgcgcat ttcgaccgat 180
cccggtttta cagacaaaaa aacgctcgtc ttcgaggatc tcgcctggaa tttcttcacc 240
ccggatgaag cactgccgga cggccattat cactggtgtt atgcgctatg ggatcagaaa 300
tccgcaacag cgcattccaa ctggagcacc gtacgcagtt tcgagatcag tgaagcactg 360
ccgaaaacgc cgctgcccgg caggtctgcc cgccatgctg ccgcgcaaac cagccaccct 420
cggctgtggc tcaactccga gcaattgagt gccttcgccg atgccgttgc gaaggacccc 480
aaccattgtg gctgggccga gttttacgaa aaatcggtcg agccgtggct cgagcggccg 540
gtcatgccgg aaccgcagcc ctatcccaac aacacgcgtg tcgccacgct ctggcggcag 600
atgtatatag actgccagga agtgatctat gcgatccggc acctggccat tgccggccgc 660
gtgctcggac gcgacgacct tctcgatgca tcccgcaaat ggctgctggc cgtcgccgcc 720
tgggacacga aaggtgcgac ctcacgcgcc tataatgacg aggcggggtt ccgcgtcgtc 780
gtcgcactcg cctggggtta tgactggctg tacgaccatc tgagcgaaga cgaacgcagg 840
accgtgcgat ccgttcttct cgaacggacg cgggaagttg ccgatcatgt catcgcacac 900
gcccgcattc acgtctttcc ctatgacagc catgcggtgc gctcgctttc ggctgtattg 960
acgccggcct gcatcgcact tcagggagaa agcgacgagg ctggcgaatg gctcgactat 1020
accgtcgaat tccttgccac gctctattct ccctgggcgg gaaccgatgg tggttgggcg 1080
gaaggtccgc attactggat gaccggcatg gcctatctca tcgaggccgc caatctgatc 1140
cgctcctata ttggttatga cctctatcaa cggccgtttt tccagaatac cggtcgcttc 1200
ccgctttaca ccaaggcgcc gggaacccgc cgcgccaact tcggcgacga ctccaccctt 1260
ggcgaccttc ccggcctgaa gctgggatac aacgtccggc aattcgccgg cgtcaccggc 1320
aatggccatt accagtggta tttcgatcac atcaaggccg atgcgacagg cacggaaatg 1380
gccttttaca attacggctg gtgggacctc aacttcgacg atctcgtcta tcgccacgat 1440
tacccgcagg tggaagccgt gtctcccgcc gacctgccgg cactcgccgt tttcgatgat 1500
attggttggg cgaccatcca aaaagacatg gaagacccgg accggcacct gcagttcgtc 1560
ttcaaatcca gcccttacgg ttcgctcagc cacagtcacg gcgaccagaa tgcctttgtg 1620
ctttatgccc atggcgagga tctggcgatc cagtccggtt attacgtggc gttcaattcg 1680
cagatgcatc tgaattggcg gcgtcagaca cggtcgaaaa atgccgtgct gatcggcggc 1740
aaaggccaat atgcggaaaa ggacaaggcg cttgcacgcc gcgccgccgg ccgcatcgtc 1800
tcggtggagg aacagcccgg ccatgttcgt atcgtcggcg atgcaaccgc cgcctaccag 1860
gttgcgaacc cgctggttca aaaggtgctg cgcgaaaccc acttcgttaa tgacagctat 1920
ttcgtgattg tcgacgaagt cgaatgttcg gaaccccagg aactgcaatg gctttgccat 1980
acactcggag cgccgcagac cggcaggtca agcttccgct acaatggccg gaaagccggt 2040
ttctacggac agttcgttta ctcttcgggc ggcacgccgc aaatcagcgc cgtggagggt 2100
tttcccgata tcgacccgaa agaattcgaa gggctcgaca tacaccacca tgtctgcgcc 2160
acggttccgg ccgccacccg gcatcgcctt gtcacccttc tggtgcctta cagcctgaag 2220
gagccgaagc gcattttcag cttcatcgat gatcagggtt tttccaccga catctacttc 2280
agtgatgtcg atgacgagcg tttcaagctc tcccttccca agcagttcta a          2331
 
<210>68
<211>776
<212>PRT
<213>根癌农杆菌
 
<400>68
Met Arg Pro Ser Ala Pro Ala Ile Ser Arg Gln Thr Leu Leu Asp Glu
 1               5                  10                  15
Pro Arg Pro Gly Ser Leu Thr Ile Gly Tyr Glu Pro Ser Glu Glu Ala
            20                  25                  30
Gln Pro Thr Glu Asn Pro Pro Arg Phe Ser Trp Leu Pro Asp Ile Asp
        35                  40                  45
Asp Gly Ala Arg Tyr Val Leu Arg Ile Ser Thr Asp Pro Gly Phe Thr
    50                  55                  60
Asp Lys Lys Thr Leu Val Phe Glu Asp Leu Ala Trp Asn Phe Phe Thr
65                  70                  75                  80
Pro Asp Glu Ala Leu Pro Asp Gly His Tyr His Trp Cys Tyr Ala Leu
                85                  90                  95
Trp Asp Gln Lys Ser Ala Thr Ala His Ser Asn Trp Ser Thr Val Arg
            100                 105                 110
Ser Phe Glu Ile Ser Glu Ala Leu Pro Lys Thr Pro Leu Pro Gly Arg
        115                 120                 125
Ser Ala Arg His Ala Ala Ala Gln Thr Ser His Pro Arg Leu Trp Leu
    130                 135                 140
Asn Ser Glu Gln Leu Ser Ala Phe Ala Asp Ala Val Ala Lys Asp Pro
145                 150                 155                 160
Asn His Cys Gly Trp Ala Glu Phe Tyr Glu Lys Ser Val Glu Pro Trp
                165                 170                 175
Leu Glu Arg Pro Val Met Pro Glu Pro Gln Pro Tyr Pro Asn Asn Thr
            180                 185                 190
Arg Val Ala Thr Leu Trp Arg Gln Met Tyr Ile Asp Cys Gln Glu Val
        195                 200                 205
Ile Tyr Ala Ile Arg His Leu Ala Ile Ala Gly Arg Val Leu Gly Arg
    210                 215                 220
Asp Asp Leu Leu Asp Ala Ser Arg Lys Trp Leu Leu Ala Val Ala Ala
225                 230                 235                 240
Trp Asp Thr Lys Gly Ala Thr Ser Arg Ala Tyr Asn Asp Glu Ala Gly
                245                 250                 255
Phe Arg Val Val Val Ala Leu Ala Trp Gly Tyr Asp Trp Leu Tyr Asp
            260                 265                 270
His Leu Ser Glu Asp Glu Arg Arg Thr Val Arg Ser Val Leu Leu Glu
        275                 280                 285
Arg Thr Arg Glu Val Ala Asp His Val Ile Ala His Ala Arg Ile His
    290                 295                 300
Val Phe Pro Tyr Asp Ser His Ala Val Arg Ser Leu Ser Ala Val Leu
305                 310                 315                 320
Thr Pro Ala Cys Ile Ala Leu Gln Gly Glu Ser Asp Glu Ala Gly Glu
                325                 330                 335
Trp Leu Asp Tyr Thr Val Glu Phe Leu Ala Thr Leu Tyr Ser Pro Trp
            340                 345                 350
Ala Gly Thr Asp Gly Gly Trp Ala Glu Gly Pro His Tyr Trp Met Thr
        355                 360                 365
Gly Met Ala Tyr Leu Ile Glu Ala Ala Asn Leu Ile Arg Ser Tyr Ile
    370                 375                 380
Gly Tyr Asp Leu Tyr Gln Arg Pro Phe Phe Gln Asn Thr Gly Arg Phe
385                 390                 395                 400
Pro Leu Tyr Thr Lys Ala Pro Gly Thr Arg Arg Ala Asn Phe Gly Asp
                405                 410                 415
Asp Ser Thr Leu Gly Asp Leu Pro Gly Leu Lys Leu Gly Tyr Asn Val
            420                 425                 430
Arg Gln Phe Ala Gly Val Thr Gly Asn Gly His Tyr Gln Trp Tyr Phe
        435                 440                 445
Asp His Ile Lys Ala Asp Ala Thr Gly Thr Glu Met Ala Phe Tyr Asn
    450                 455                 460
Tyr Gly Trp Trp Asp Leu Asn Phe Asp Asp Leu Val Tyr Arg His Asp
465                 470                 475                 480
Tyr Pro Gln Val Glu Ala Val Ser Pro Ala Asp Leu Pro Ala Leu Ala
                485                 490                 495
Val Phe Asp Asp Ile Gly Trp Ala Thr Ile Gln Lys Asp Met Glu Asp
            500                 505                 510
Pro Asp Arg His Leu Gln Phe Val Phe Lys Ser Ser Pro Tyr Gly Ser
        515                 520                 525
Leu Ser His Ser His Gly Asp Gln Asn Ala Phe Val Leu Tyr Ala His
    530                 535                 540
Gly Glu Asp Leu Ala Ile Gln Ser Gly Tyr Tyr Val Ala Phe Asn Ser
545                 550                 555                 560
Gln Met His Leu Asn Trp Arg Arg Gln Thr Arg Ser Lys Asn Ala Val
                565                 570                 575
Leu Ile Gly Gly Lys Gly Gln Tyr Ala Glu Lys Asp Lys Ala Leu Ala
            580                 585                 590
Arg Arg Ala Ala Gly Arg Ile Val Ser Val Glu Glu Gln Pro Gly His
        595                 600                 605
Val Arg Ile Val Gly Asp Ala Thr Ala Ala Tyr Gln Val Ala Asn Pro
    610                 615                 620
Leu Val Gln Lys Val Leu Arg Glu Thr His Phe Val Asn Asp Ser Tyr
625                 630                 635                 640
Phe Val Ile Val Asp Glu Val Glu Cys Ser Glu Pro Gln Glu Leu Gln
                645                 650                 655
Trp Leu Cys His Thr Leu Gly Ala Pro Gln Thr Gly Arg Ser Ser Phe
            660                 665                 670
Arg Tyr Asn Gly Arg Lys Ala Gly Phe Tyr Gly Gln Phe Val Tyr Ser
        675                 680                 685
Ser Gly Gly Thr Pro Gln Ile Ser Ala Val Glu Gly Phe Pro Asp Ile
    690                 695                 700
Asp Pro Lys Glu Phe Glu Gly Leu Asp Ile His His His Val Cys Ala
705                 710                 715                 720
Thr Val Pro Ala Ala Thr Arg His Arg Leu Val Thr Leu Leu Val Pro
                725                 730                 735
Tyr Ser Leu Lys Glu Pro Lys Arg Ile Phe Ser Phe Ile Asp Asp Gln
            740                 745                 750
Gly Phe Ser Thr Asp Ile Tyr Phe Ser Asp Val Asp Asp Glu Arg Phe
        755                 760                 765
Lys Leu Ser Leu Pro Lys Gln Phe
    770                 775
<210>69
<211>1068
<212>DNA
<213>根癌农杆菌C58
 
<400>69
atgttcacaa cgtccgccta tgcctgcgat gacggctctt cgccgatgaa gctcgcgacc  60
atcaggcgcc gcgatcccgg tccgcgcgat gtcgaaatcg agatagaatt ctgtggcgtc  120
tgccactcgg acatccatac ggcccgcagc gaatggccgg gctccctcta cccttgcgtc  180
cccggccacg aaatcgtcgg ccgtgtcggt cgggtgggcg cgcaagtcac ccggttcaag  240
acgggtgacc gcgtcggtgt cggctgtatc gtcgatagct gccgcgaatg cgcaagctgc  300
gccgaagggc tggagcaata ttgcgaaaac ggcatgaccg gcacctataa ctcccctgac  360
aaggcgatgg gcggcggcgc gcatacgctt ggcggctatt ccgcccatgt ggtggtggat  420
gaccgctatg tgctcaatat tcccgaaggg ctcgatccgg cggcagcagc accgctactc  480
tgcgctggta tcaccaccta ctcgccgctg cgccactgga atgccggccc cggcaaacgc  540
gtcggcgtcg tcggtctggg cggcctcggc catatggccg tcaagctcgc caatgccatg  600
ggtgcgactg tcgtgatgat caccacctcg cccggcaagg cggaggatgc caaaaaactc  660
ggcgcacacg aggtgatcat ctcccgcgat gcggagcaga tgaagaaggc tacctcgagc  720
ctcgatctca tcatcgatgc tgtcgccgcc gaccacgaca tcgacgccta tctggcgctg  780
ctgaaacgcg atggcgcgct ggtgcaggtg ggcgcgccgg aaaagccact ttcggtgatg  840
gccttcagcc tcatccccgg ccgcaagacc tttgccggct cgatgatcgg cggtattccc  900
gagactcagg aaatgctgga tttctgcgcc gaaaaaggca tcgccggcga aatcgagatg  960
atcgatatcg atcagatcaa tgacgcttat gaacgcatga taaaaagcga tgtgcgttat  1020
cgtttcgtca ttgatatgaa gagcctgccg cgccagaagg ccgcctga               1068
 
<210>70
<211>355
<212>PRT
<213>根癌农杆菌C58
 
<400>70
Met Phe Thr Thr Ser Ala Tyr Ala Cys Asp Asp Gly Ser Ser Pro Met
 1               5                  10                  15
Lys Leu Ala Thr Ile Arg Arg Arg Asp Pro Gly Pro Arg Asp Val Glu
            20                  25                  30
Ile Glu Ile Glu Phe Cys Gly Val Cys His Ser Asp Ile His Thr Ala
        35                  40                  45
Arg Ser Glu Trp Pro Gly Ser Leu Tyr Pro Cys Val Pro Gly His Glu
    50                  55                  60
Ile Val Gly Arg Val Gly Arg Val Gly Ala Gln Val Thr Arg Phe Lys
65                  70                  75                  80
Thr Gly Asp Arg Val Gly Val Gly Cys Ile Val Asp Ser Cys Arg Glu
                85                  90                  95
Cys Ala Ser Cys Ala Glu Gly Leu Glu Gln Tyr Cys Glu Asn Gly Met
            100                 105                 110
Thr Gly Thr Tyr Asn Ser Pro Asp Lys Ala Met Gly Gly Gly Ala His
        115                 120                 125
Thr Leu Gly Gly Tyr Ser Ala His Val Val Val Asp Asp Arg Tyr Val
    130                 135                 140
Leu Asn Ile Pro Glu Gly Leu Asp Pro Ala Ala Ala Ala Pro Leu Leu
145                 150                 155                 160
Cys Ala Gly Ile Thr Thr Tyr Ser Pro Leu Arg His Trp Asn Ala Gly
                165                 170                 175
Pro Gly Lys Arg Val Gly Val Val Gly Leu Gly Gly Leu Gly His Met
            180                 185                 190
Ala Val Lys Leu Ala Asn Ala Met Gly Ala Thr Val Val Met Ile Thr
        195                 200                 205
Thr Ser Pro Gly Lys Ala Glu Asp Ala Lys Lys Leu Gly Ala His Glu
    210                 215                 220
Val Ile Ile Ser Arg Asp Ala Glu Gln Met Lys Lys Ala Thr Ser Ser
225                 230                 235                 240
Leu Asp Leu Ile Ile Asp Ala Val Ala Ala Asp His Asp Ile Asp Ala
                245                 250                 255
Tyr Leu Ala Leu Leu Lys Arg Asp Gly Ala Leu Val Gln Val Gly Ala
            260                 265                 270
Pro Glu Lys Pro Leu Ser Val Met Ala Phe Ser Leu Ile Pro Gly Arg
        275                 280                 285
Lys Thr Phe Ala Gly Ser Met Ile Gly Gly Ile Pro Glu Thr Gln Glu
    290                 295                 300
Met Leu Asp Phe Cys Ala Glu Lys Gly Ile Ala Gly Glu Ile Glu Met
305                 310                 315                 320
Ile Asp Ile Asp Gln Ile Asn Asp Ala Tyr Glu Arg Met Ile Lys Ser
                325                 330                 335
Asp Val Arg Tyr Arg Phe Val Ile Asp Met Lys Ser Leu Pro Arg Gln
            340                 345                 350
Lys Ala Ala
        355
 
<210>71
<211>1047
<212>DNA
<213>根癌农杆菌C58
 
<400>71
atggctattg caagaggtta tgctgcgacc gacgcgtcga agccgcttac cccgttcacc  60
ttcgaacgcc gcgagccgaa tgatgacgac gtcgtcatcg atatcaaata tgccggcatc  120
tgccactcgg acatccacac cgtccgcaac gaatggcaca atgccgttta cccgatcgtt  180
ccgggccacg aaatcgccgg tgtcgtgcgg gccgttggtt ccaaggtcac gcggttcaag  240
gtcggcgacc atgtcggcgt cggctgcttt gtcgattcct gcgttggctg cgccacccgc  300
gatgtcgaca atgagcagta tatgccgggt ctcgtgcaga cctacaattc cgttgaacgg  360
gacggcaaga gcgcgaccca gggcggttat tccgaccata tcgtggtcag ggaagactac  420
gtcctgtcca tcccggacaa cctgccgctc gatgcctccg cgccgcttct ctgcgccggc  480
atcacgctct attcgccgct gcagcactgg aatgcaggcc ccggcaagaa agtggctatc  540
gtcggcatgg gtggccttgg ccacatgggc gtgaagatcg gctcggccat gggcgctgat  600
atcaccgttc tctcgcagac gctgtcgaag aaggaagacg gcctcaagct cggcgcgaag  660
gaatattacg ccaccagcga cgcctcgacc tttgagaaac tcgccggcac cttcgacctg  720
atcctgtgca cagtctcggc cgaaatcgac tggaacgcct acctcaacct gctcaaggtc  780
aacggcacga tggttctgct cggcgtgccg gaacatgcga tcccggtgca cgcattctcg  840
gtcattcccg cccgccgttc gctcgccggt tcgatgatcg gctcgatcaa ggaaacccag  900
gaaatgctgg atttctgcgg caagcacgac atcgtttcgg aaatcgaaac gatcggcatc  960
aaggacgtca acgaagccta tgagcgcgtg ctgaagagcg acgtgcgtta ccgcttcgtc  1020
atcgacatgg cctcgctcga cgcttga                                      1047
 
<210>72
<211>348
<212>PRT
<213>根癌农杆菌C58
 
<400>72
Met Ala Ile Ala Arg Gly Tyr Ala Ala Thr Asp Ala Ser Lys Pro Leu
 1               5                  10                  15
Thr Pro Phe Thr Phe Glu Arg Arg Glu Pro Asn Asp Asp Asp Val Val
            20                  25                  30
Ile Asp Ile Lys Tyr Ala Gly Ile Cys His Ser Asp Ile His Thr Val
        35                  40                  45
Arg Asn Glu Trp His Asn Ala Val Tyr Pro Ile Val Pro Gly His Glu
    50                  55                  60
Ile Ala Gly Val Val Arg Ala Val Gly Ser Lys Val Thr Arg Phe Lys
65                  70                  75                  80
Val Gly Asp His Val Gly Val Gly Cys Phe Val Asp Ser Cys Val Gly
                85                  90                  95
Cys Ala Thr Arg Asp Val Asp Asn Glu Gln Tyr Met Pro Gly Leu Val
            100                 105                 110
Gln Thr Tyr Asn Ser Val Glu Arg Asp Gly Lys Ser Ala Thr Gln Gly
        115                 120                 125
Gly Tyr Ser Asp His Ile Val Val Arg Glu Asp Tyr Val Leu Ser Ile
    130                 135                 140
Pro Asp Asn Leu Pro Leu Asp Ala Ser Ala Pro Leu Leu Cys Ala Gly
145                 150                 155                 160
Ile Thr Leu Tyr Ser Pro Leu Gln His Trp Asn Ala Gly Pro Gly Lys
                165                 170                 175
Lys Val Ala Ile Val Gly Met Gly Gly Leu Gly His Met Gly Val Lys
            180                 185                 190
Ile Gly Ser Ala Met Gly Ala Asp Ile Thr Val Leu Ser Gln Thr Leu
        195                 200                 205
Ser Lys Lys Glu Asp Gly Leu Lys Leu Gly Ala Lys Glu Tyr Tyr Ala
    210                 215                 220
Thr Ser Asp Ala Ser Thr Phe Glu Lys Leu Ala Gly Thr Phe Asp Leu
225                 230                 235                 240
Ile Leu Cys Thr Val Ser Ala Glu Ile Asp Trp Asn Ala Tyr Leu Asn
                245                 250                 255
Leu Leu Lys Val Asn Gly Thr Met Val Leu Leu Gly Val Pro Glu His
            260                 265                 270
Ala Ile Pro Val His Ala Phe Ser Val Ile Pro Ala Arg Arg Ser Leu
        275                 280                 285
Ala Gly Ser Met Ile Gly Ser Ile Lys Glu Thr Gln Glu Met Leu Asp
    290                 295                 300
Phe Cys Gly Lys His Asp Ile Val Ser Glu Ile Glu Thr Ile Gly Ile
305                 310                 315                 320
Lys Asp Val Asn Glu Ala Tyr Glu Arg Val Leu Lys Ser Asp Val Arg
                325                 330                 335
Tyr Arg Phe Val Ile Asp Met Ala Ser Leu Asp Ala
            340                 345
 
<210>73
<211>1029
<212>DNA
<213>根癌农杆菌C58
 
<400>73
atgactaaaa caatgaaggc ggcggttgtc cgcgcatttg gaaaaccgct gaccatcgag 60
gaagtggcaa taccggatcc cggccccggt gaaattctca tcaactacaa ggcgacgggc 120
gtttgccaca ccgacctgca cgccgcaacg ggggattggc cggtcaagcc caacccgccc 180
ttcattcccg gacatgaagg tgcaggttac gtcgccaaga tcggcgctgg cgtcaccggc 240
atcaaggagg gcgaccgcgc cggcacgccc tggctctaca ccgcctgcgg atgctgcatt 300
ccctgccgta ccggctggga aaccctgtgc ccgagccaga agaactcagg ttattccgtc 360
aacggcagct ttgccgaata tggccttgcc gatccgaaat tcgtcggccg cctgcctgac 420
aatctcgatt tcggcccagc cgcacccgtg ctctgcgccg gcgttacagt ctataagggc 480
ctgaaggaaa ccgaagtcag gcccggtgaa tgggtggtca tttcaggcat tggcgggctt 540
ggccacatgg ccgtgcaata tgcgaaagcc atgggcatgc atgtggttgc cgccgatatt 600
ttcgacgaca agctggcgct tgccaaaaag ctcggagccg acgtcgtcgt caacggccgc 660
gcgcctgacg cggtggagca agtgcaaaag gcaaccggcg gcgtccatgg cgcgctggtg 720
acggcggttt caccgaaggc catggagcag gcttatggct tcctgcgctc caagggcacg 780
atggcgcttg tcggtctgcc gccgggcttc atctccattc cggtgttcga cacggtgctg 840
aagcgcatca cggtgcgtgg ctccatcgtc ggcacgcggc aggatctgga ggaggcgttg 900
accttcgccg gtgaaggcaa ggtggccgcc cacttctcgt gggacaagct cgaaaacatc 960
aatgatatct tccatcgcat ggaagagggc aagatcgacg gccgtatcgt cgtggatctc 1020
gccgcctga                                                         1029
 
<210>74
<211>342
<212>PRT
<213>根癌农杆菌C58
 
<400>74
Met Thr Lys Thr Met Lys Ala Ala Val Val Arg Ala Phe Gly Lys Pro
 1               5                  10                  15
Leu Thr Ile Glu Glu Val Ala Ile Pro Asp Pro Gly Pro Gly Glu Ile
            20                  25                  30
Leu Ile Asn Tyr Lys Ala Thr Gly Val Cys His Thr Asp Leu His Ala
        35                  40                  45
Ala Thr Gly Asp Trp Pro Val Lys Pro Asn Pro Pro Phe Ile Pro Gly
    50                  55                  60
His Glu Gly Ala Gly Tyr Val Ala Lys Ile Gly Ala Gly Val Thr Gly
65                  70                  75                  80
Ile Lys Glu Gly Asp Arg Ala Gly Thr Pro Trp Leu Tyr Thr Ala Cys
                85                  90                  95
Gly Cys Cys Ile Pro Cys Arg Thr Gly Trp Glu Thr Leu Cys Pro Ser
            100                 105                 110
Gln Lys Asn Ser Gly Tyr Ser Val Asn Gly Ser Phe Ala Glu Tyr Gly
        115                 120                 125
Leu Ala Asp Pro Lys Phe Val Gly Arg Leu Pro Asp Asn Leu Asp Phe
    130                 135                 140
Gly Pro Ala Ala Pro Val Leu Cys Ala Gly Val Thr Val Tyr Lys Gly
145                 150                 155                 160
Leu Lys Glu Thr Glu Val Arg Pro Gly Glu Trp Val Val Ile Ser Gly
                165                 170                 175
Ile Gly Gly Leu Gly His Met Ala Val Gln Tyr Ala Lys Ala Met Gly
            180                 185                 190
Met His Val Val Ala Ala Asp Ile Phe Asp Asp Lys Leu Ala Leu Ala
        195                 200                 205
Lys Lys Leu Gly Ala Asp Val Val Val Asn Gly Arg Ala Pro Asp Ala
    210                 215                 220
Val Glu Gln Val Gln Lys Ala Thr Gly Gly Val His Gly Ala Leu Val
225                 230                 235                 240
Thr Ala Val Ser Pro Lys Ala Met Glu Gln Ala Tyr Gly Phe Leu Arg
                245                 250                 255
Ser Lys Gly Thr Met Ala Leu Val Gly Leu Pro Pro Gly Phe Ile Ser
            260                 265                 270
Ile Pro Val Phe Asp Thr Val Leu Lys Arg Ile Thr Val Arg Gly Ser
        275                 280                 285
Ile Val Gly Thr Arg Gln Asp Leu Glu Glu Ala Leu Thr Phe Ala Gly
    290                 295                 300
Glu Gly Lys Val Ala Ala His Phe Ser Trp Asp Lys Leu Glu Asn Ile
305                 310                 315                 320
Asn Asp Ile Phe His Arg Met Glu Glu Gly Lys Ile Asp Gly Arg Ile
                325                 330                 335
Val Val Asp Leu Ala Ala
            340
 
<210>75
<211>1008
<212>DNA
<213>根癌农杆菌C58
 
<400>75
atgaccgggg cgaaccagcc ttgggaggtt caagaggttc ccgttccgaa ggcagagcca 60
ggacttgtcc ttgttaaaat ccacgcctcc ggcatgtgct acacggacgt gtgggcgacg 120
cagggtgccg gtggcgacat ctatccgcag acccccggcc atgaggttgt cggcgagatc 180
atcgaggtcg gcgcgggcgt tcatacgcgc aaggtgggag accgggtcgg caccacctgg 240
gtgcagtcct cttgtggacg atgctcctac tgccgccaga accgtccgtt gaccggccag 300
acagccatga actgcgattc acccaggaca acggggttcg cgacgcaagg cgggcacgca 360
gagtacatcg cgatctctgc tgaaggcaca gtgttattac ccgacgggct cgactacacg 420
gatgccgcac ccatgatgtg cgcaggctac acgacctgga gcggcttgcg cgacgccgag 480
cccaaacctg gtgacagaat tgcggtactt ggcatcggcg ggctggggca cgtcgccgtg 540
cagttctcca aagccttggg gtttgagacc atcgcgatca cgcattcacc cgacaagcac 600
aagttggcca ccgatcttgg tgcagacatc gtcgtcgccg atggcaaaga gttattggag 660
gccggcggtg cggacgttct tctggttacg accaacgact tcgacaccgc cgaaaaagcg 720
atggcgggcg taaggcctga cgggcgcatc gttctttgcg cgctcgactt cagcaagccg 780
ttctcgatcc cgtccgacgg caagccgttc cacatgatgc gccaacgcgt ggttgggtcc 840
acgcatggcg gacagcacta tctcgccgaa atcctcgatc tcgccgccaa gggcaaggtc 900
aagccgattg tcgagacctt cgccctcgag caggcaaccg aggcatatga gcggctatcc 960
accgggaaga tgcgcttccg gggcgtgttc cttccgcacg gcgcttga              1008
 
<210>76
<211>335
<212>PRT
<213>根癌农杆菌C58
 
<400>76
Met Thr Gly Ala Asn Gln Pro Trp Glu Val Gln Glu Val Pro Val Pro
 1               5                  10                  15
Lys Ala Glu Pro Gly Leu Val Leu Val Lys Ile His Ala Ser Gly Met
            20                  25                  30
Cys Tyr Thr Asp Val Trp Ala Thr Gln Gly Ala Gly Gly Asp Ile Tyr
        35                  40                  45
Pro Gln Thr Pro Gly His Glu Val Val Gly Glu Ile Ile Glu Val Gly
    50                  55                  60
Ala Gly Val His Thr Arg Lys Val Gly Asp Arg Val Gly Thr Thr Trp
65                  70                  75                  80
Val Gln Ser Ser Cys Gly Arg Cys Ser Tyr Cys Arg Gln Asn Arg Pro
                85                  90                  95
Leu Thr Gly Gln Thr Ala Met Asn Cys Asp Ser Pro Arg Thr Thr Gly
            100                 105                 110
Phe Ala Thr Gln Gly Gly His Ala Glu Tyr Ile Ala Ile Ser Ala Glu
        115                 120                 125
Gly Thr Val Leu Leu Pro Asp Gly Leu Asp Tyr Thr Asp Ala Ala Pro
    130                 135                 140
Met Met Cys Ala Gly Tyr Thr Thr Trp Ser Gly Leu Arg Asp Ala Glu
145                 150                 155                 160
Pro Lys Pro Gly Asp Arg Ile Ala Val Leu Gly Ile Gly Gly Leu Gly
                165                 170                 175
His Val Ala Val Gln Phe Ser Lys Ala Leu Gly Phe Glu Thr Ile Ala
            180                 185                 190
Ile Thr His Ser Pro Asp Lys His Lys Leu Ala Thr Asp Leu Gly Ala
        195                 200                 205
Asp Ile Val Val Ala Asp Gly Lys Glu Leu Leu Glu Ala Gly Gly Ala
    210                 215                 220
Asp Val Leu Leu Val Thr Thr Asn Asp Phe Asp Thr Ala Glu Lys Ala
225                 230                 235                 240
Met Ala Gly Val Arg Pro Asp Gly Arg Ile Val Leu Cys Ala Leu Asp
                245                 250                 255
Phe Ser Lys Pro Phe Ser Ile Pro Ser Asp Gly Lys Pro Phe His Met
            260                 265                 270
Met Arg Gln Arg Val Val Gly Ser Thr His Gly Gly Gln His Tyr Leu
        275                 280                 285
Ala Glu Ile Leu Asp Leu Ala Ala Lys Gly Lys Val Lys Pro Ile Val
    290                 295                 300
Glu Thr Phe Ala Leu Glu Gln Ala Thr Glu Ala Tyr Glu Arg Leu Ser
305                 310                 315                 320
Thr Gly Lys Met Arg Phe Arg Gly Val Phe Leu Pro His Gly Ala
                325                 330                 335
 
<210>77
<211>1017
<212>DNA
<213>根癌农杆菌C58
 
<400>77
atgaccatgc atgccattca attcgtcgag aagggacgcg ccgtgctggc ggaactcccc  60
gtcgccgatc tgccgccggg ccatgcgctc gtgcgggtca aggcttcggg gctttgccat  120
accgatatcg acgtgctgca tgcgcgttat ggcgacggtg cgttccccgt cattccgggg  180
catgaatatg ctggcgaagt cgcagccgtg gcttccgatg tgacagtctt caaggctggc  240
gaccgggttg tcgtcgatcc caatctgccc tgtggcacct gcgccagctg caggaaaggg  300
ctgaccaacc tttgcagcac attgaaagct tacggcgttt cccacaatgg cggctttgcg  360
gagttcagtg tggtgcgtgc cgatcacctg cacggtatcg gttcgatgcc ctatcacgtc  420
gcggcgctgg ctgagccgct tgcctgtgtt gtcaatggca tgcagagtgc gggtattggc  480
gagagtggcg tggtgccgga gaatgcgctt gttttcggtg ctgggcccat cggcctgctg  540
cttgccctgt cgctgaaatc acgcggcatt gcgacggtga cgatggccga tatcaatgaa  600
agcaggctgg cctttgccca ggacctcggg cttcagacgg cggtatccgg ctcggaagcg  660
ctctcgcggc agcggaagga gttcgatttc gtggccgatg cgacgggtat tgccccggtc  720
gccgaggcga tgatcccgct ggttgcggat ggcggcacgg cgctattctt cggcgtctgc  780
gcgccggatg cccgtatttc ggtggcaccg tttgaaatct tccggcgcca gctgaaactt  840
gtcggctcgc attcgctgaa ccgcaacata ccgcaggcgc ttgccattct ggagacggat  900
ggcgaggtca tggcgcggct cgtttcgcac cgcttgccgc tttcggagat gctgccgttc  960
tttacgaaaa aaccgtctga tccggcgacg atgaaagtgc aatttgcagc cgaatga     1017
 
<210>78
<211>338
<212>PRT
<213>根癌农杆菌C58
 
<400>78
Met Thr Met His Ala Ile Gln Phe Val Glu Lys Gly Arg Ala Val Leu
 1               5                  10                  15
Ala Glu Leu Pro Val Ala Asp Leu Pro Pro Gly His Ala Leu Val Arg
            20                  25                  30
Val Lys Ala Ser Gly Leu Cys His Thr Asp Ile Asp Val Leu His Ala
        35                  40                  45
Arg Tyr Gly Asp Gly Ala Phe Pro Val Ile Pro Gly His Glu Tyr Ala
    50                  55                  60
Gly Glu Val Ala Ala Val Ala Ser Asp Val Thr Val Phe Lys Ala Gly
65                  70                  75                  80
Asp Arg Val Val Val Asp Pro Asn Leu Pro Cys Gly Thr Cys Ala Ser
                85                  90                  95
Cys Arg Lys Gly Leu Thr Asn Leu Cys Ser Thr Leu Lys Ala Tyr Gly
            100                 105                 110
Val Ser His Asn Gly Gly Phe Ala Glu Phe Ser Val Val Arg Ala Asp
        115                 120                 125
His Leu His Gly Ile Gly Ser Met Pro Tyr His Val Ala Ala Leu Ala
    130                 135                 140
Glu Pro Leu Ala Cys Val Val Asn Gly Met Gln Ser Ala Gly Ile Gly
145                 150                 155                 160
Glu Ser Gly Val Val Pro Glu Asn Ala Leu Val Phe Gly Ala Gly Pro
                165                 170                 175
Ile Gly Leu Leu Leu Ala Leu Ser Leu Lys Ser Arg Gly Ile Ala Thr
            180                 185                 190
Val Thr Met Ala Asp Ile Asn Glu Ser Arg Leu Ala Phe Ala Gln Asp
        195                 200                 205
Leu Gly Leu Gln Thr Ala Val Ser Gly Ser Glu Ala Leu Ser Arg Gln
    210                 215                 220
Arg Lys Glu Phe Asp Phe Val Ala Asp Ala Thr Gly Ile Ala Pro Val
225                 230                 235                 240
Ala Glu Ala Met Ile Pro Leu Val Ala Asp Gly Gly Thr Ala Leu Phe
                245                 250                 255
Phe Gly Val Cys Ala Pro Asp Ala Arg Ile Ser Val Ala Pro Phe Glu
            260                 265                 270
Ile Phe Arg Arg Gln Leu Lys Leu Val Gly Ser His Ser Leu Asn Arg
        275                 280                 285
Asn Ile Pro Gln Ala Leu Ala Ile Leu Glu Thr Asp Gly Glu Val Met
    290                 295                 300
Ala Arg Leu Val Ser His Arg Leu Pro Leu Ser Glu Met Leu Pro Phe
305                 310                 315                 320
Phe Thr Lys Lys Pro Ser Asp Pro Ala Thr Met Lys Val Gln Phe Ala
                325                 330                 335
Ala Glu
 
<210>79
<211>1044
<212>DNA
<213>根癌农杆菌C58
 
<400>79
atgcgcgcgc tttattacga acgattcggc gagacccctg tagtcgcgtc cctgcctgat 60
ccggcaccga gcgatggcgg cgtggtgatt gcggtgaagg caaccggcct ctgccgcagc 120
gactggcatg gctggatggg acatgacacg gatatccgtc tgccgcatgt gcccggccac 180
gagttcgccg gcgtcatctc cgcagtcggc agaaacgtca cccgcttcaa gacgggtgat 240
cgcgttaccg tgcctttcgt ctccggctgc ggccattgcc atgagtgccg ctccggcaat 300
cagcaggtct gcgaaacgca gttccagccc ggcttcaccc attggggttc cttcgccgaa 360
tatgtcgcca tcgactatgc cgatcagaac ctcgtgcacc tgccggaatc gatgagttac 420
gccaccgccg ccggcctcgg ttgccgtttc gccacctcct tccgggcggt gacggatcag 480
ggacgcctga agggcggcga atggctggct gtccatggct gcggcggtgt cggtctctcc 540
gccatcatga tcggcgccgg cctcggcgca caggtcgtcg ccatcgatat tgccgaagac 600
aagctcgaac tcgcccggca actgggtgca accgcaacca tcaacagccg ctccgttgcc 660
gatgtcgccg aagcggtgcg cgacatcacc ggtggcggcg cgcatgtgtc ggtggatgcg 720
cttggccatc cgcagacctg ctgcaattcc atcagcaacc tgcgccggcg cggacgccat 780
gtgcaggtgg ggctgatgct ggcagaccat gccatgccgg ccattcccat ggcccgggtg 840
atcgctcatg agctggagat ctatggcagc cacggcatgc aggcatggcg ttacgaggac 900
atgctggcca tgatcgaaag cggcaggctt gcgccggaaa agctgattgg ccgccatatc 960
tcgctgaccg aagcggccgt cgccctgccc ggaatggata ggttccagga gagcggcatc 1020
agcatcatcg accggttcga atag                                        1044
 
<210>80
<211>357
<212>PRT
<213>根癌农杆菌C58
 
<400>80
Met Asn Leu Arg Thr Asn Asp Glu Ala Met Met Arg Ala Leu Tyr Tyr
 1               5                  10                  15
Glu Arg Phe Gly Glu Thr Pro Val Val Ala Ser Leu Pro Asp Pro Ala
            20                  25                  30
Pro Ser Asp Gly Gly Val Val Ile Ala Val Lys Ala Thr Gly Leu Cys
        35                  40                  45
Arg Ser Asp Trp His Gly Trp Met Gly His Asp Thr Asp Ile Arg Leu
    50                  55                  60
Pro His Val Pro Gly His Glu Phe Ala Gly Val Ile Ser Ala Val Gly
65                  70                  75                  80
Arg Asn Val Thr Arg Phe Lys Thr Gly Asp Arg Val Thr Val Pro Phe
                85                  90                  95
Val Ser Gly Cys Gly His Cys His Glu Cys Arg Ser Gly Asn Gln Gln
            100                 105                 110
Val Cys Glu Thr Gln Phe Gln Pro Gly Phe Thr His Trp Gly Ser Phe
        115                 120                 125
Ala Glu Tyr Val Ala Ile Asp Tyr Ala Asp Gln Asn Leu Val His Leu
    130                 135                 140
Pro Glu Ser Met Ser Tyr Ala Thr Ala Ala Gly Leu Gly Cys Arg Phe
145                 150                 155                 160
Ala Thr Ser Phe Arg Ala Val Thr Asp Gln Gly Arg Leu Lys Gly Gly
                165                 170                 175
Glu Trp Leu Ala Val His Gly Cys Gly Gly Val Gly Leu Ser Ala Ile
            180                 185                 190
Met Ile Gly Ala Gly Leu Gly Ala Gln Val Val Ala Ile Asp Ile Ala
        195                 200                 205
Glu Asp Lys Leu Glu Leu Ala Arg Gln Leu Gly Ala Thr Ala Thr Ile
    210                 215                 220
Asn Ser Arg Ser Val Ala Asp Val Ala Glu Ala Val Arg Asp Ile Thr
225                 230                 235                 240
Gly Gly Gly Ala His Val Ser Val Asp Ala Leu Gly His Pro Gln Thr
                245                 250                 255
Cys Cys Asn Ser Ile Ser Asn Leu Arg Arg Arg Gly Arg His Val Gln
            260                 265                 270
Val Gly Leu Met Leu Ala Asp His Ala Met Pro Ala Ile Pro Met Ala
        275                 280                 285
Arg Val Ile Ala His Glu Leu Glu Ile Tyr Gly Ser His Gly Met Gln
    290                 295                 300
Ala Trp Arg Tyr Glu Asp Met Leu Ala Met Ile Glu Ser Gly Arg Leu
305                 310                 315                 320
Ala Pro Glu Lys Leu Ile Gly Arg His Ile Ser Leu Thr Glu Ala Ala
                325                 330                 335
Val Ala Leu Pro Gly Met Asp Arg Phe Gln Glu Ser Gly Ile Ser Ile
            340                 345                 350
Ile Asp Arg Phe Glu
        355
 
<210>81
<211>1011
<212>DNA
<213>根癌农杆菌C58
 
<400>81
atgctggcga ttttctgtga cactcccggt caattaaccg ccaaggatct gccgaacccc 60
gtgcgcggcg aaggtgaagt cctggtacgt attcgccgga ttggcgtttg cggcacggat 120
ctgcacatct ttaccggcaa ccagccctat ctttcctatc cgcggatcat gggtcacgaa 180
ctttccggca cggttgagga ggcacccgct ggcagccacc tttccgctgg cgatgtggtg 240
accataattc cctatatgtc ctgcgggaaa tgcaatgcct gcctgaaggg taagagcaat 300
tgctgccgca atatcggtgt gcttggcgtt catcgcgatg gcggcatggt ggaatatctg 360
agcgtgccgc agcaattcgt gctgaaggcg gaggggctga gcctcgacca ggcagccatg 420
acggaatttc tggcgatcgg tgcccatgcg gtgcgtcgcg gtgccgtcga aaaagggcaa 480
aaggtcctga tcgtcggtgc cggcccgatc ggcatggcgg ttgctgtctt tgcggttctc 540
gatggcacgg aagtgacgat gatcgacggt cgcaccgacc ggctggattt ctgcaaggac 600
cacctcggtg tcgctcatac agtcgccctc ggcgacggtg acaaagatcg tctgtccgac 660
attaccggtg gcaatttctt cgatgcggtg tttgatgcga ccggcaatcc gaaagccatg 720
gagcgcggtt tctccttcgt cggtcacggc ggctcctatg ttctggtgtc catcgtcgcc 780
agcgatatca gcttcaacga cccggaattt cacaagcgtg agacgacgct gctcggcagc 840
cgcaacgcga cggctgatga tttcgagcgg gtgcttcgcg ccttgcgcga agggaaagtg 900
ccggaggcac taatcaccca tcgcatgaca cttgccgatg ttccctcgaa gttcgccggc 960
ctgaccgatc cgaaagccgg agtcatcaag ggcatggtgg aggtcgcatg a          1011
 
<210>82
<211>336
<212>PRT
<213>根癌农杆菌C58
 
<400>82
Met Leu Ala Ile Phe Cys Asp Thr Pro Gly Gln Leu Thr Ala Lys Asp
 1               5                  10                  15
Leu Pro Asn Pro Val Arg Gly Glu Gly Glu Val Leu Val Arg Ile Arg
            20                  25                  30
Arg Ile Gly Val Cys Gly Thr Asp Leu His Ile Phe Thr Gly Asn Gln
        35                  40                  45
Pro Tyr Leu Ser Tyr Pro Arg Ile Met Gly His Glu Leu Ser Gly Thr
    50                  55                  60
Val Glu Glu Ala Pro Ala Gly Ser His Leu Ser Ala Gly Asp Val Val
65                  70                  75                  80
Thr Ile Ile Pro Tyr Met Ser Cys Gly Lys Cys Asn Ala Cys Leu Lys
                85                  90                  95
Gly Lys Ser Asn Cys Cys Arg Asn Ile Gly Val Leu Gly Val His Arg
            100                 105                 110
Asp Gly Gly Met Val Glu Tyr Leu Ser Val Pro Gln Gln Phe Val Leu
        115                 120                 125
Lys Ala Glu Gly Leu Ser Leu Asp Gln Ala Ala Met Thr Glu Phe Leu
    130                 135                 140
Ala Ile Gly Ala His Ala Val Arg Arg Gly Ala Val Glu Lys Gly Gln
145                 150                 155                 160
Lys Val Leu Ile Val Gly Ala Gly Pro Ile Gly Met Ala Val Ala Val
                165                 170                 175
Phe Ala Val Leu Asp Gly Thr Glu Val Thr Met Ile Asp Gly Arg Thr
            180                 185                 190
Asp Arg Leu Asp Phe Cys Lys Asp His Leu Gly Val Ala His Thr Val
        195                 200                 205
Ala Leu Gly Asp Gly Asp Lys Asp Arg Leu Ser Asp Ile Thr Gly Gly
    210                 215                 220
Asn Phe Phe Asp Ala Val Phe Asp Ala Thr Gly Asn Pro Lys Ala Met
225                 230                 235                 240
Glu Arg Gly Phe Ser Phe Val Gly His Gly Gly Ser Tyr Val Leu Val
                245                 250                 255
Ser Ile Val Ala Ser Asp Ile Ser Phe Asn Asp Pro Glu Phe His Lys
            260                 265                 270
Arg Glu Thr Thr Leu Leu Gly Ser Arg Asn Ala Thr Ala Asp Asp Phe
        275                 280                 285
Glu Arg Val Leu Arg Ala Leu Arg Glu Gly Lys Val Pro Glu Ala Leu
    290                 295                 300
Ile Thr His Arg Met Thr Leu Ala Asp Val Pro Ser Lys Phe Ala Gly
305                 310                 315                 320
Leu Thr Asp Pro Lys Ala Gly Val Ile Lys Gly Met Val Glu Val Ala
                325                 330                 335
 
<210>83
<211>1005
<212>DNA
<213>根癌农杆菌C58
 
<400>83
gtgaaagcct tcgtcgtcga caagtacaag aagaagggcc cgctgcgtct ggccgacatg 60
cccaatccgg tcatcggcgc caatgatgtg ctggttcgca tccatgccac tgccatcaat 120
cttctcgact ccaaggtgcg cgacggggaa ttcaagctgt tcctgcccta tcgtcctccc 180
ttcattctcg gtcatgatct ggccggaacg gtcatccgcg tcggcgcgaa tgtacggcag 240
ttcaagacag gcgacgaggt tttcgctcgc ccgcgtgatc accgggtcgg aaccttcgca 300
gaaatgattg cggtcgatgc cgcagacctt gcgctgaagc caacgagcct gtccatggag 360
caggcagcgt cgatcccgct cgtcggactg actgcctggc aggcgcttat cgaggttggc 420
aaggtcaagt ccggccagaa ggttttcatc caggccggtt ccggcggtgt cggcaccttc 480
gccatccagc ttgccaagca tctcggcgct accgtggcca cgaccaccag cgccgcgaat 540
gccgaactgg tcaaaagcct cggcgcagat gtggtgatcg actacaagac gcaggacttc 600
gaacaggtgc tgtccggcta cgatctcgtc ctgaacagcc aggatgccaa gacgctggaa 660
aagtcgttga acgtgctgag accgggcgga aagctcattt cgatctccgg tccgccggat 720
gttgcctttg ccagatcgtt gaaactgaat ccgctcctgc gttttgtcgt cagaatgctg 780
agccgtggtg tcctgaaaaa ggcaagcaga cgcggtgtcg attactcttt cctgttcatg 840
cgcgccgaag gtcagcaatt gcatgagatc gccgaactga tcgatgccgg caccatccgt 900
ccggtcgtcg acaaggtgtt tcaatttgcg cagacgcccg acgccctggc ctatgtcgag 960
accggacggg caaggggcaa ggttgtggtt acatacgcat cctag                 1005
 
<210>84
<211>359
<212>PRT
<213>根癌农杆菌C58
 
<400>84
Met Pro Ser Leu Cys Arg Lys Pro Trp Leu Ser Ser Leu Pro Asp Leu
 1               5                  10                  15
Ile Asn Val Ser His Trp Arg Lys Pro Val Lys Ala Phe Val Val Asp
            20                  25                  30
Lys Tyr Lys Lys Lys Gly Pro Leu Arg Leu Ala Asp Met Pro Asn Pro
        35                  40                  45
Val Ile Gly Ala Asn Asp Val Leu Val Arg Ile His Ala Thr Ala Ile
    50                  55                  60
Asn Leu Leu Asp Ser Lys Val Arg Asp Gly Glu Phe Lys Leu Phe Leu
65                  70                  75                  80
Pro Tyr Arg Pro Pro Phe Ile Leu Gly His Asp Leu Ala Gly Thr Val
                85                  90                  95
Ile Arg Val Gly Ala Asn Val Arg Gln Phe Lys Thr Gly Asp Glu Val
            100                 105                 110
Phe Ala Arg Pro Arg Asp His Arg Val Gly Thr Phe Ala Glu Met Ile
        115                 120                 125
Ala Val Asp Ala Ala Asp Leu Ala Leu Lys Pro Thr Ser Leu Ser Met
    130                 135                 140
Glu Gln Ala Ala Ser Ile Pro Leu Val Gly Leu Thr Ala Trp Gln Ala
145                 150                 155                 160
Leu Ile Glu Val Gly Lys Val Lys Ser Gly Gln Lys Val Phe Ile Gln
                165                 170                 175
Ala Gly Ser Gly Gly Val Gly Thr Phe Ala Ile Gln Leu Ala Lys His
            180                 185                 190
Leu Gly Ala Thr Val Ala Thr Thr Thr Ser Ala Ala Asn Ala Glu Leu
        195                 200                 205
Val Lys Ser Leu Gly Ala Asp Val Val Ile Asp Tyr Lys Thr Gln Asp
    210                 215                 220
Phe Glu Gln Val Leu Ser Gly Tyr Asp Leu Val Leu Asn Ser Gln Asp
225                 230                 235                 240
Ala Lys Thr Leu Glu Lys Ser Leu Asn Val Leu Arg Pro Gly Gly Lys
                245                 250                 255
Leu Ile Ser Ile Ser Gly Pro Pro Asp Val Ala Phe Ala Arg Ser Leu
            260                 265                 270
Lys Leu Asn Pro Leu Leu Arg Phe Val Val Arg Met Leu Ser Arg Gly
        275                 280                 285
Val Leu Lys Lys Ala Ser Arg Arg Gly Val Asp Tyr Ser Phe Leu Phe
    290                 295                 300
Met Arg Ala Glu Gly Gln Gln Leu His Glu Ile Ala Glu Leu Ile Asp
305                 310                 315                 320
Ala Gly Thr Ile Arg Pro Val Val Asp Lys Val Phe Gln Phe Ala Gln
                325                 330                 335
Thr Pro Asp Ala Leu Ala Tyr Val Glu Thr Gly Arg Ala Arg Gly Lys
            340                 345                 350
Val Val Val Thr Tyr Ala Ser
        355
 
<210>85
<211>1032
<212>DNA
<213>根癌农杆菌C58
<400>85
atgaaagcga ttgtcgccca cggggcaaag gatgtgcgca tcgaagaccg gccggaggaa  60
aagccgggtc cgggcgaggt gcggctccgt ctggcgaggg gcgggatctg cggcagtgat  120
ctgcattatt acaatcatgg cggtttcggc gccgtgcggc ttcgtgaacc catggtgctg  180
ggccatgagg tttccgccgt catcgaggaa ctgggcgaag gcgttgaggg gctgaagatc  240
ggcggtctgg tggcggtttc gccgtcgcgc ccatgccgaa cctgccgctt ctgccaggag  300
ggtctgcaca atcagtgcct caacatgcgg ttttatggca gcgccatgcc tttcccgcat  360
attcagggcg cgttccggga aattctggtg gcggacgccc tgcaatgcgt gccggccgat  420
ggtctcagcg ccggggaagc cgccatggcg gaaccgctgg cggtgacgct gcatgccaca  480
cgccgggccg gcgatttgct gggaaaacgt gtgctcgtca cgggttgcgg ccccatcggc  540
attctctcca ttctggctgc gcgccgggcg ggtgctgctg aaatcgtcgc caccgacctt  600
tccgatttca cgctcggcaa ggcgcgtgaa gcgggggcgg accgtgtcat caacagcaag  660
gatgagcccg atgcgctcgc cgcttatggt gcaaacaagg gaaccttcga cattctctat  720
gaatgctcgg gtgcggccgt ggcgcttgcc ggcggcatta cggcactgcg gccgcgcggc  780
atcatcgtcc agctcgggct cggcggcgat atgagcctgc cgatgatggc gatcacagcc  840
aaggaactcg acctgcgtgg ttcctttcgc ttccacgagg aattcgccac cggcgtcgag  900
ctgatgcgca agggcctgat cgacgtcaaa cccttcatca cccagaccgt cgatcttgcc  960
gacgccatct cggccttcga attcgcctcg gatcgcagcc gcgccatgaa ggtgcagatc  1020
gccttttcct aa                                                      1032
 
<210>86
<211>343
<212>PRT
<213>根癌农杆菌C58
 
<400>86
Met Lys Ala Ile Val Ala His Gly Ala Lys Asp Val Arg Ile Glu Asp
 1               5                  10                  15
Arg Pro Glu Glu Lys Pro Gly Pro Gly Glu Val Arg Leu Arg Leu Ala
            20                  25                  30
Arg Gly Gly Ile Cys Gly Ser Asp Leu His Tyr Tyr Asn His Gly Gly
        35                  40                  45
Phe Gly Ala Val Arg Leu Arg Glu Pro Met Val Leu Gly His Glu Val
    50                  55                  60
Ser Ala Val Ile Glu Glu Leu Gly Glu Gly Val Glu Gly Leu Lys Ile
65                  70                  75                  80
Gly Gly Leu Val Ala Val Ser Pro Ser Arg Pro Cys Arg Thr Cys Arg
                85                  90                  95
Phe Cys Gln Glu Gly Leu His Asn Gln Cys Leu Asn Met Arg Phe Tyr
            100                 105                 110
Gly Ser Ala Met Pro Phe Pro His Ile Gln Gly Ala Phe Arg Glu Ile
        115                 120                 125
Leu Val Ala Asp Ala Leu Gln Cys Val Pro Ala Asp Gly Leu Ser Ala
    130                 135                 140
Gly Glu Ala Ala Met Ala Glu Pro Leu Ala Val Thr Leu His Ala Thr
145                 150                 155                 160
Arg Arg Ala Gly Asp Leu Leu Gly Lys Arg Val Leu Val Thr Gly Cys
                165                 170                 175
Gly Pro Ile Gly Ile Leu Ser Ile Leu Ala Ala Arg Arg Ala Gly Ala
            180                 185                 190
Ala Glu Ile Val Ala Thr Asp Leu Ser Asp Phe Thr Leu Gly Lys Ala
        195                 200                 205
Arg Glu Ala Gly Ala Asp Arg Val Ile Asn Ser Lys Asp Glu Pro Asp
    210                 215                 220
Ala Leu Ala Ala Tyr Gly Ala Asn Lys Gly Thr Phe Asp Ile Leu Tyr
225                 230                 235                 240
Glu Cys Ser Gly Ala Ala Val Ala Leu Ala Gly Gly Ile Thr Ala Leu
                245                 250                 255
Arg Pro Arg Gly Ile Ile Val Gln Leu Gly Leu Gly Gly Asp Met Ser
            260                 265                 270
Leu Pro Met Met Ala Ile Thr Ala Lys Glu Leu Asp Leu Arg Gly Ser
        275                 280                 285
Phe Arg Phe His Glu Glu Phe Ala Thr Gly Val Glu Leu Met Arg Lys
    290                 295                 300
Gly Leu Ile Asp Val Lys Pro Phe Ile Thr Gln Thr Val Asp Leu Ala
305                 310                 315                 320
Asp Ala Ile Ser Ala Phe Glu Phe Ala Ser Asp Arg Ser Arg Ala Met
                325                 330                 335
Lys Val Gln Ile Ala Phe Ser
            340
 
<210>87
<211>939
<212>DNA
<213>根癌农杆菌C58
 
<400>87
atgccgatgg cgctcgggca cgaagcggcg ggcgtcgtcg aggcattggg cgaaggcgtg 60
cgcgatcttg agcccggcga tcatgtggtc atggtcttca tgcccagttg cggacattgc 120
ctgccctgtg cggaaggcag gcccgctctg tgcgagccgg gcgccgccgc caatgcagca 180
ggcaggctgt tgggtggcgc cacccgcctg aactatcatg gcgaggtcgt ccatcatcac 240
cttggtgtgt cggcctttgc cgaatatgcc gtggtgtcgc gcaattcgct ggtcaagatc 300
gaccgcgatc ttccatttgt cgaggcggca ctcttcggct gcgcggttct caccggcgtc 360
ggcgccgtcg tgaatacggc aagggtcagg accggctcga ctgcggtcgt catcggactt 420
ggcggtgtgg gccttgccgc ggttctcgga gcccgggcgg ccggtgccag caagatcgtc 480
gccgtcgacc tttcgcagga aaagcttgca ctcgccagcg aactgggcgc gaccgccatc 540
gtgaacggac gcgatgagga tgccgtcgag caggtccgcg agctcacttc cggcggtgcc 600
gattatgcct tcgagatggc agggtctatt cgcgccctcg aaaacgcctt caggatgacc 660
aaacgtggcg gcaccaccgt taccgccggt ctgccaccgc cgggtgcggc cctgccgctc 720
aacgtcgtgc agctcgtcgg cgaggagcgg acactcaagg gcagctatat cggcacctgt 780
gtgcctctcc gggatattcc gcgcttcatc gccctttatc gcgacggccg gttgccggtg 840
aaccgccttc tgagcggaag gctgaagcta gaagacatca atgaagggtt cgaccgcctg 900
cacgacggaa gcgccgttcg gcaagtcatc gaattctga                        939
 
<210>88
<211>312
<212>PRT
<213>根癌农杆菌C58
 
<400>88
Met Pro Met Ala Leu Gly His Glu Ala Ala Gly Val Val Glu Ala Leu
 1               5                  10                  15
Gly Glu Gly Val Arg Asp Leu Glu Pro Gly Asp His Val Val Met Val
            20                  25                  30
Phe Met Pro Ser Cys Gly His Cys Leu Pro Cys Ala Glu Gly Arg Pro
        35                  40                  45
Ala Leu Cys Glu Pro Gly Ala Ala Ala Asn Ala Ala Gly Arg Leu Leu
    50                  55                  60
Gly Gly Ala Thr Arg Leu Asn Tyr His Gly Glu Val Val His His His
65                  70                  75                  80
Leu Gly Val Ser Ala Phe Ala Glu Tyr Ala Val Val Ser Arg Asn Ser
                85                  90                  95
Leu Val Lys Ile Asp Arg Asp Leu Pro Phe Val Glu Ala Ala Leu Phe
            100                 105                 110
Gly Cys Ala Val Leu Thr Gly Val Gly Ala Val Val Asn Thr Ala Arg
        115                 120                 125
Val Arg Thr Gly Ser Thr Ala Val Val Ile Gly Leu Gly Gly Val Gly
    130                 135                 140
Leu Ala Ala Val Leu Gly Ala Arg Ala Ala Gly Ala Ser Lys Ile Val
145                 150                 155                 160
Ala Val Asp Leu Ser Gln Glu Lys Leu Ala Leu Ala Ser Glu Leu Gly
                165                 170                 175
Ala Thr Ala Ile Val Asn Gly Arg Asp Glu Asp Ala Val Glu Gln Val
            180                 185                 190
Arg Glu Leu Thr Ser Gly Gly Ala Asp Tyr Ala Phe Glu Met Ala Gly
        195                 200                 205
Ser Ile Arg Ala Leu Glu Asn Ala Phe Arg Met Thr Lys Arg Gly Gly
    210                 215                 220
Thr Thr Val Thr Ala Gly Leu Pro Pro Pro Gly Ala Ala Leu Pro Leu
225                 230                 235                 240
Asn Val Val Gln Leu Val Gly Glu Glu Arg Thr Leu Lys Gly Ser Tyr
                245                 250                 255
Ile Gly Thr Cys Val Pro Leu Arg Asp Ile Pro Arg Phe Ile Ala Leu
            260                 265                 270
Tyr Arg Asp Gly Arg Leu Pro Val Asn Arg Leu Leu Ser Gly Arg Leu
        275                 280                 285
Lys Leu Glu Asp Ile Asn Glu Gly Phe Asp Arg Leu His Asp Gly Ser
    290                 295                 300
Ala Val Arg Gln Val Ile Glu Phe
305                 310
 
<210>89
<211>1035
<212>DNA
<213>根癌农杆菌C58
 
<400>89
atgaaacatt ctcaggacaa accacgcctg ctgattgcga tgcgtagcga gcttccagaa 60
ggcttcttcg gtccgcgcga atgggcaagg ctgaatgccg tagcggacat tattccgggc 120
tttccccata cggatttcga cacggcgaac ggtgccgagg ctctcgccga agcggatatt 180
ctgctcgctg cctggggtac gccatccctg acacgcgaac gactttcacg cgcgccgcgg 240
ctgaaaatgc tggcctatgc ggcatcatcg gtgcggatgg ttgcgcccgc agaattctgg 300
gagacgtcgg atattctggt cacgacagca gcttccgcca tggccgtgcc ggttgccgaa 360
ttcacctatg cggcaatcat catgtgcggc aaggatgtgt ttcgattgcg ggatgaacat 420
agaacagagc gcggcaccgg cgtttttggc agcaggcgcg gcagaagcct gccctatctt 480
ggcaatcatg cccgcaaggt tggcattgtc ggcgcctcgc gcatcgggcg gctggtgatg 540
gagatgctgg cgcgcggcac attcgagatt gccgtttacg atccctttct gtcggcggaa 600
gaggccgcat cccttggcgc gaagaaagcc gaactggacg agcttctcgc atggtccgat 660
gtggtctcgc tgcacgcgcc gatcctgccg gaaacgcacc atatgatcgg cgcccgcgaa 720
ctggcgctga tggcggacca tgccatcttc atcaacacgg cgcggggctg gctggtcgac 780
cacgatgcat tgctgactga agcgatttcc ggacggctgc gcattctgat tgacacgccc 840
gaacccgagc ccctgcccac ggacagcccg ttttacgatc tgcccaatgt cgttctaacc 900
ccccatatag ccggggcgct gggcaatgaa ttgcgcgcac tttccgatct ggccattacc  960
gaaattgaac gtttcgtggc gggacttgcg cccctccacc cggtccacaa gcaggatatg 1020
gaacgtatgg catga                                                  1035
 
<210>90
<211>331
<212>PRT
<213>根癌农杆菌C58
 
<400>90
Met Arg Ser Glu Leu Pro Glu Gly Phe Phe Gly Pro Arg Glu Trp Ala
 1               5                  10                  15
Arg Leu Asn Ala Val Ala Asp Ile Ile Pro Gly Phe Pro His Thr Asp
            20                  25                  30
Phe Asp Thr Ala Asn Gly Ala Glu Ala Leu Ala Glu Ala Asp Ile Leu
        35                  40                  45
Leu Ala Ala Trp Gly Thr Pro Ser Leu Thr Arg Glu Arg Leu Ser Arg
    50                  55                  60
Ala Pro Arg Leu Lys Met Leu Ala Tyr Ala Ala Ser Ser Val Arg Met
65                  70                  75                  80
Val Ala Pro Ala Glu Phe Trp Glu Thr Ser Asp Ile Leu Val Thr Thr
                85                 90                 95
Ala Ala Ser Ala Met Ala Val Pro Val Ala Glu Phe Thr Tyr Ala Ala
            100                 105                 110
Ile Ile Met Cys Gly Lys Asp Val Phe Arg Leu Arg Asp Glu His Arg
        115                 120                 125
Thr Glu Arg Gly Thr Gly Val Phe Gly Ser Arg Arg Gly Arg Ser Leu
    130                 135                 140
Pro Tyr Leu Gly Asn His Ala Arg Lys Val Gly Ile Val Gly Ala Ser
145                 150                 155                 160
Arg Ile Gly Arg Leu Val Met Glu Met Leu Ala Arg Gly Thr Phe Glu
                165                 170                 175
Ile Ala Val Tyr Asp Pro Phe Leu Ser Ala Glu Glu Ala Ala Ser Leu
            180                 185                 190
Gly Ala Lys Lys Ala Glu Leu Asp Glu Leu Leu Ala Trp Ser Asp Val
        195                 200                 205
Val Ser Leu His Ala Pro Ile Leu Pro Glu Thr His His Met Ile Gly
    210                 215                 220
Ala Arg Glu Leu Ala Leu Met Ala Asp His Ala Ile Phe Ile Asn Thr
225                 230                 235                 240
Ala Arg Gly Trp Leu Val Asp His Asp Ala Leu Leu Thr Glu Ala Ile
                245                 250                 255
Ser Gly Arg Leu Arg Ile Leu Ile Asp Thr Pro Glu Pro Glu Pro Leu
            260                 265                 270
Pro Thr Asp Ser Pro Phe Tyr Asp Leu Pro Asn Val Val Leu Thr Pro
        275                 280                 285
His Ile Ala Gly Ala Leu Gly Asn Glu Leu Arg Ala Leu Ser Asp Leu
    290                 295                 300
Ala Ile Thr Glu Ile Glu Arg Phe Val Ala Gly Leu Ala Pro Leu His
305                 310                 315                 320
Pro Val His Lys Gln Asp Met Glu Arg Met Ala
                325                 330
 
<210>91
<211>750
<212>DNA
<213>根癌农杆菌C58
 
<400>91
atgcagcgtt ttaccaacag aaccatcgtt gtcgccgggg ccggccggga tatcggccgg 60
gcatgcgcca tccgtttcgc acaggaaggc gccaatgtcg ttcttaccta taatggcgcg 120
gcagagggcg cggccacagc cgttgccgaa atcgaaaagc ttggtcgttc ggctctggcg 180
atcaaggcgg atctcacaaa cgccgccgaa gtcgaggctg ccatatctgc ggctgcggac 240
aagtttgggg agatccacgg cctcgtccat gttgccggcg gcctgatcgc ccgcaagaca 300
atcgcagaaa tggatgaagc cttctggcat caggtcctcg acgtcaatct gacatcgctg 360
ttcctgacgg ccaagaccgc attgccgaag atggccaagg gcggcgcgat cgtcactttc 420
tcgtcgcagg ccggccgtga tggcggcggc ccgggcgctc ttgcctatgc cacttccaag 480
ggtgccgtga tgaccttcac ccgcggactt gccaaagaag tcggccccaa aatccgcgtc 540
aacgccgttt gccccggtat gatctccacc accttccacg ataccttcac caagccggag 600
gtgcgcgaac gggtggccgg cgcgacgtcg ctcaagcgcg aagggtcgag cgaagacgtc 660
gccggtctgg tggccttcct cgcgtctgac gatgccgctt atgtcaccgg cgcctgctac 720
gacatcaatg gcggcgtcct gttttcctga                                  750
<210>92
<211>249
<212>PRT
<213>根癌农杆菌C58
 
<400>92
Met Gln Arg Phe Thr Asn Arg Thr Ile Val Val Ala Gly Ala Gly Arg
 1               5                  10                  15
Asp Ile Gly Arg Ala Cys Ala Ile Arg Phe Ala Gln Glu Gly Ala Asn
            20                  25                  30
Val Val Leu Thr Tyr Asn Gly Ala Ala Glu Gly Ala Ala Thr Ala Val
        35                  40                  45
Ala Glu Ile Glu Lys Leu Gly Arg Ser Ala Leu Ala Ile Lys Ala Asp
    50                  55                  60
Leu Thr Asn Ala Ala Glu Val Glu Ala Ala Ile Ser Ala Ala Ala Asp
65                  70                  75                  80
Lys Phe Gly Glu Ile His Gly Leu Val His Val Ala Gly Gly Leu Ile
                85                  90                  95
Ala Arg Lys Thr Ile Ala Glu Met Asp Glu Ala Phe Trp His Gln Val
            100                 105                 110
Leu Asp Val Asn Leu Thr Ser Leu Phe Leu Thr Ala Lys Thr Ala Leu
        115                 120                 125
Pro Lys Met Ala Lys Gly Gly Ala Ile Val Thr Phe Ser Ser Gln Ala
    130                 135                 140
Gly Arg Asp Gly Gly Gly Pro Gly Ala Leu Ala Tyr Ala Thr Ser Lys
145                 150                 155                 160
Gly Ala Val Met Thr Phe Thr Arg Gly Leu Ala Lys Glu Val Gly Pro
                165                 170                 175
Lys Ile Arg Val Asn Ala Val Cys Pro Gly Met Ile Ser Thr Thr Phe
            180                 185                 190
His Asp Thr Phe Thr Lys Pro Glu Val Arg Glu Arg Val Ala Gly Ala
        195                 200                 205
Thr Ser Leu Lys Arg Glu Gly Ser Ser Glu Asp Val Ala Gly Leu Val
    210                 215                 220
Ala Phe Leu Ala Ser Asp Asp Ala Ala Tyr Val Thr Gly Ala Cys Tyr
225                 230                 235                 240
Asp Ile Asn Gly Gly Val Leu Phe Ser
                245
 
<210>93
<211>930
<212>DNA
<213>大肠杆菌DH10B
 
<400>93
atgtccaaaa agattgccgt gattggcgaa tgcatgattg agctttccga gaaaggcgcg  60
gacgttaagc gcggtttcgg cggcgatacc ctgaacactt ccgtctatat cgcccgtcag  120
gtcgatcctg cggcattaac cgttcattac gtaacggcgc tgggaacgga cagttttagc  180
cagcagatgc tggacgcctg gcacggcgag aacgttgata cttccctgac ccaacggatg  240
gaaaaccgtc tgccgggcct ttactacatt gaaaccgaca gcaccggcga gcgtacgttc  300
tactactggc ggaacgaagc cgccgccaaa ttctggctgg agagtgagca gtctgcggcg  360
atttgcgaag agctggcgaa tttcgattat ctctacctga gcgggattag cctggcgatc  420
ttaagcccga ccagccgcga aaagctgctt tccctgctgc gcgaatgccg cgccaacggc  480
ggaaaagtga ttttcgacaa taactatcgt ccgcgcctgt gggccagcaa agaagagaca  540
cagcaggtgt accaacaaat gctggaatgc acggatatcg ccttcctgac gctggacgac  600
gaagacgcgc tgtggggtca acagccggtg gaagacgtca ttgcgcgcac ccataacgcg  660
ggcgtgaaag aagtggtggt gaaacgcggg gcggattctt gcctggtgtc cattgctggc  720
gaagggttag tggatgttcc ggcggtgaaa ctgccgaaag aaaaagtgat cgataccacc  780
gcagctggcg actctttcag tgccggttat ctggcggtac gtctgacagg cggcagcgcg  840
gaagacgcgg cgaaacgtgg gcacctgacc gcaagtaccg ttattcagta tcgcggcgcg  900
attatcccgc gtgaggcgat gccagcgtaa                                   930
 
<210>94
<211>309
<212>PRT
<213>大肠杆菌DH10B
 
<400>94
Met Ser Lys Lys Ile Ala Val Ile Gly Glu Cys Met Ile Glu Leu Ser
 1               5                  10                  15
Glu Lys Gly Ala Asp Val Lys Arg Gly Phe Gly Gly Asp Thr Leu Asn
            20                  25                  30
Thr Ser Val Tyr Ile Ala Arg Gln Val Asp Pro Ala Ala Leu Thr Val
        35                  40                  45
His Tyr Val Thr Ala Leu Gly Thr Asp Ser Phe Ser Gln Gln Met Leu
    50                  55                  60
Asp Ala Trp His Gly Glu Asn Val Asp Thr Ser Leu Thr Gln Arg Met
65                  70                  75                  80
Glu Asn Arg Leu Pro Gly Leu Tyr Tyr Ile Glu Thr Asp Ser Thr Gly
                85                  90                  95
Glu Arg Thr Phe Tyr Tyr Trp Arg Asn Glu Ala Ala Ala Lys Phe Trp
            100                 105                 110
Leu Glu Ser Glu Gln Ser Ala Ala Ile Cys Glu Glu Leu Ala Asn Phe
        115                 120                 125
Asp Tyr Leu Tyr Leu Ser Gly Ile Ser Leu Ala Ile Leu Ser Pro Thr
    130                 135                 140
Ser Arg Glu Lys Leu Leu Ser Leu Leu Arg Glu Cys Arg Ala Asn Gly
145                 150                 155                 160
Gly Lys Val Ile Phe Asp Asn Asn Tyr Arg Pro Arg Leu Trp Ala Ser
                165                 170                 175
Lys Glu Glu Thr Gln Gln Val Tyr Gln Gln Met Leu Glu Cys Thr Asp
            180                 185                 190
Ile Ala Phe Leu Thr Leu Asp Asp Glu Asp Ala Leu Trp Gly Gln Gln
        195                 200                 205
Pro Val Glu Asp Val Ile Ala Arg Thr His Asn Ala Gly Val Lys Glu
    210                 215                 220
Val Val Val Lys Arg Gly Ala Asp Ser Cys Leu Val Ser Ile Ala Gly
225                 230                 235                 240
Glu Gly Leu Val Asp Val Pro Ala Val Lys Leu Pro Lys Glu Lys Val
                245                 250                 255
Ile Asp Thr Thr Ala Ala Gly Asp Ser Phe Ser Ala Gly Tyr Leu Ala
            260                 265                 270
Val Arg Leu Thr Gly Gly Ser Ala Glu Asp Ala Ala Lys Arg Gly His
        275                 280                 285
Leu Thr Ala Ser Thr Val Ile Gln Tyr Arg Gly Ala Ile Ile Pro Arg
    290                 295                 300
Glu Ala Met Pro Ala
305
 
<210>95
<211>642
<212>DNA
<213>大肠杆菌DH10B
 
<400>95
atgaaaaact ggaaaacaag tgcagaatca atcctgacca ccggcccggt tgtaccggtt 60
atcgtggtaa aaaaactgga acacgcggtg ccgatggcaa aagcgttggt tgctggtggg 120
gtgcgcgttc tggaagtgac tctgcgtacc gagtgtgcag ttgacgctat ccgtgctatc 180
gccaaagaag tgcctgaagc gattgtgggt gccggtacgg tgctgaatcc acagcagctg 240
gcagaagtca ctgaagcggg tgcacagttc gcaattagcc cgggtctgac cgagccgctg 300
ctgaaagctg ctaccgaagg gactattcct ctgattccgg ggatcagcac tgtttccgaa 360
ctgatgctgg gtatggacta cggtttgaaa gagttcaaat tcttcccggc tgaagctaac 420
ggcggcgtga aagccctgca ggcgatcgcg ggtccgttct cccaggtccg tttctgcccg 480
acgggtggta tttctccggc taactaccgt gactacctgg cgctgaaaag cgtgctgtgc 540
atcggtggtt cctggctggt tccggcagat gcgctggaag cgggcgatta cgaccgcatt 600
actaagctgg cgcgtgaagc tgtagaaggc gctaagctgt aa                    642
 
<210>96
<211>213
<212>PRT
<213>大肠杆菌DH10B
<400>96
Met Lys Asn Trp Lys Thr Ser Ala Glu Ser Ile Leu Thr Thr Gly Pro
 1               5                  10                  15
Val Val Pro Val Ile Val Val Lys Lys Leu Glu His Ala Val Pro Met
            20                  25                  30
Ala Lys Ala Leu Val Ala Gly Gly Val Arg Val Leu Glu Val Thr Leu
        35                  40                  45
Arg Thr Glu Cys Ala Val Asp Ala Ile Arg Ala Ile Ala Lys Glu Val
    50                  55                  60
Pro Glu Ala Ile Val Gly Ala Gly Thr Val Leu Asn Pro Gln Gln Leu
65                  70                  75                  80
Ala Glu Val Thr Glu Ala Gly Ala Gln Phe Ala Ile Ser Pro Gly Leu
                85                  90                  95
Thr Glu Pro Leu Leu Lys Ala Ala Thr Glu Gly Thr Ile Pro Leu Ile
            100                 105                 110
Pro Gly Ile Ser Thr Val Ser Glu Leu Met Leu Gly Met Asp Tyr Gly
        115                 120                 125
Leu Lys Glu Phe Lys Phe Phe Pro Ala Glu Ala Asn Gly Gly Val Lys
    130                 135                 140
Ala Leu Gln Ala Ile Ala Gly Pro Phe Ser Gln Val Arg Phe Cys Pro
145                 150                 155                 160
Thr Gly Gly Ile Ser Pro Ala Asn Tyr Arg Asp Tyr Leu Ala Leu Lys
                165                 170                 175
Ser Val Leu Cys Ile Gly Gly Ser Trp Leu Val Pro Ala Asp Ala Leu
            180                 185                 190
Glu Ala Gly Asp Tyr Asp Arg Ile Thr Lys Leu Ala Arg Glu Ala Val
        195                 200                 205
Glu Gly Ala Lys Leu
     210
 
<210>97
<211>780
<212>DNA
<213>短乳杆菌ATCC 367
 
<400>97
atggcatcaa atggaaaagt agcaatggtt accggtggcg gacaaggaat tggtgaagcc 60
atctcgaaac ggttagctaa cgacggcttt gctgtggcaa ttgctgattt gaacttggac 120
aatgccaaca aggtcgtttc tgatattgaa gctgctggtg gcaaggccat tgcggtcaag 180
accgatgtct ctgatcgtga tagcgtgttt gctgcggtta atgaagcggc cgacaagctg 240
ggcggctttg acgttatcgt taataacgcc ggccttggcc caaccacgcc aattgacacc 300
atcacccaag aacagtttga tacggtttat cacgttaacg tgggtggggt tctttggggc 360
attcaagcag cccatgcgaa gttcaaggaa ttgggtcatg gtgggaagat catttccgcg 420
acgtctcaag ccggggttgt tggtaacccg aacttagctc tgtacagtgg aactaagttt 480
gccattcgtg gtgtgaccca agttgcggcg cgtgacttag ccgctgaagg tatcacggtc 540
aatgcttatg cacccgggat tgttaagaca ccaatgatgt ttgacatcgc tcacaaggtt 600
ggtcaaaatg ctggtaaaga cgacgaatgg gggatgcaaa ccttctcaaa ggacatcgct 660
ttatgtcgat tgtcagaacc agaagatgtg gctaacgggg tggctttctt agccggtccc 720
gattctaact acattacggg tcaaacactt gaagttgatg gtgggatgca gttccactaa 780
 
<210>98
<211>259
<212>PRT
<213>短乳杆菌ATCC 367
 
<400>98
Met Ala Ser Asn Gly Lys Val Ala Met Val Thr Gly Gly Gly Gln Gly
 1               5                  10                  15
Ile Gly Glu Ala Ile Ser Lys Arg Leu Ala Asn Asp Gly Phe Ala Val
            20                  25                  30
Ala Ile Ala Asp Leu Asn Leu Asp Asn Ala Asn Lys Val Val Ser Asp
        35                  40                  45
Ile Glu Ala Ala Gly Gly Lys Ala Ile Ala Val Lys Thr Asp Val Ser
    50                  55                  60
Asp Arg Asp Ser Val Phe Ala Ala Val Asn Glu Ala Ala Asp Lys Leu
65                  70                  75                  80
Gly Gly Phe Asp Val Ile Val Asn Asn Ala Gly Leu Gly Pro Thr Thr
                85                  90                  95
Pro Ile Asp Thr Ile Thr Gln Glu Gln Phe Asp Thr Val Tyr His Val
            100                 105                 110
Asn Val Gly Gly Val Leu Trp Gly Ile Gln Ala Ala His Ala Lys Phe
        115                 120                 125
Lys Glu Leu Gly His Gly Gly Lys Ile Ile Ser Ala Thr Ser Gln Ala
    130                 135                 140
Gly Val Val Gly Asn Pro Asn Leu Ala Leu Tyr Ser Gly Thr Lys Phe
145                 150                 155                 160
Ala Ile Arg Gly Val Thr Gln Val Ala Ala Arg Asp Leu Ala Ala Glu
                165                 170                 175
Gly Ile Thr Val Asn Ala Tyr Ala Pro Gly Ile Val Lys Thr Pro Met
            180                 185                 190
Met Phe Asp Ile Ala His Lys Val Gly Gln Asn Ala Gly Lys Asp Asp
        195                 200                 205
Glu Trp Gly Met Gln Thr Phe Ser Lys Asp Ile Ala Leu Cys Arg Leu
    210                 215                 220
Ser Glu Pro Glu Asp Val Ala Asn Gly Val Ala Phe Leu Ala Gly Pro
225                 230                 235                 240
Asp Ser Asn Tyr Ile Thr Gly Gln Thr Leu Glu Val Asp Gly Gly Met
                245                 250                 255
Gln Phe His
 
<210>99
<211>1089
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>99
atgaatgacc tgagccacac ccacatgcgc gcggccgtct ggcatggccg ccacgatatt 60
cgtgtcgaac aggtaccttt gccggccgac cctgcgccgg gctgggtgca gatcaaggtg 120
gactggtgcg gcatctgcgg ctccgacctg cacgaatatg ttgccggccc ggtgttcatc 180
ccggtagagg ccccgcaccc gctgaccggc attcagggcc agtgcatcct cggccacgaa 240
ttctgcggcc acatcgccaa gcttggcgaa ggcgtggaag gctatgccgt aggcgacccg 300
gtggcggcag acgcgtgcca gcattgtggt acctgctatt actgcaccca tggcctgtac 360
aacatctgcg aacgcctggc gttcaccggc ctgatgaaca acggtgcctt cgccgagctg 420
gtcaacgtgc ccgccaacct gctctaccgg ctgccgcagg gcttccctgc cgaagccggg 480
gcactgatcg agccgctggc ggtgggtatg cacgcggtga aaaaggccgg cagcctgctt 540
gggcaaaccg ttgtagtggt tggggccggc accatcggcc tgtgcaccat catgtgcgcc 600
aaggctgcag gtgcggcaca ggtcatcgcc cttgagatgt cctctgcgcg caaagccaag 660
gccaaggaag cgggcgccaa cgtggtgctg gaccccagcc agtgcgatgc cctggcggaa 720
atccgcgcac tgactgctgg gctgggcgcc gatgtgagtt ttgagtgcat cggcaacaaa 780
catacggcca agctggccat cgacaccatc cgcaaagcag gcaagtgcgt gctggtgggt 840
attttcgaag agcccagcga gttcaacttc ttcgagctgg tgtccaccga gaagcaagtg 900
ctgggggcgt tggcgtacaa cggcgagttt gctgacgtga ttgccttcat tgctgatggt 960
cggctggata ttcgcccgct ggtaaccggc cggatcggat tggagcagat tgtcgagctg 1020
ggcttcgagg aactggtgaa caacaaagag gagaacgtga agatcatcgt ttcaccaggt 1080
gtgcgctga                                                         1089
 
<210>100
<211>362
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>100
Met Asn Asp Leu Ser His Thr His Met Arg Ala Ala Val Trp His Gly
 1               5                  10                  15
Arg His Asp Ile Arg Val Glu Gln Val Pro Leu Pro Ala Asp Pro Ala
            20                  25                  30
Pro Gly Trp Val Gln Ile Lys Val Asp Trp Cys Gly Ile Cys Gly Ser
        35                  40                  45
Asp Leu His Glu Tyr Val Ala Gly Pro Val Phe Ile Pro Val Glu Ala
    50                  55                  60
Pro His Pro Leu Thr Gly Ile Gln Gly Gln Cys Ile Leu Gly His Glu
65                  70                  75                  80
Phe Cys Gly His Ile Ala Lys Leu Gly Glu Gly Val Glu Gly Tyr Ala
                85                  90                  95
Val Gly Asp Pro Val Ala Ala Asp Ala Cys Gln His Cys Gly Thr Cys
            100                 105                 110
Tyr Tyr Cys Thr His Gly Leu Tyr Asn Ile Cys Glu Arg Leu Ala Phe
        115                 120                 125
Thr Gly Leu Met Asn Asn Gly Ala Phe Ala Glu Leu Val Asn Val Pro
    130                 135                 140
Ala Asn Leu Leu Tyr Arg Leu Pro Gln Gly Phe Pro Ala Glu Ala Gly
145                 150                 155                 160
Ala Leu Ile Glu Pro Leu Ala Val Gly Met His Ala Val Lys Lys Ala
                165                 170                 175
Gly Ser Leu Leu Gly Gln Thr Val Val Val Val Gly Ala Gly Thr Ile
            180                 185                 190
Gly Leu Cys Thr Ile Met Cys Ala Lys Ala Ala Gly Ala Ala Gln Val
        195                 200                 205
Ile Ala Leu Glu Met Ser Ser Ala Arg Lys Ala Lys Ala Lys Glu Ala
    210                 215                 220
Gly Ala Asn Val Val Leu Asp Pro Ser Gln Cys Asp Ala Leu Ala Glu
225                 230                 235                 240
Ile Arg Ala Leu Thr Ala Gly Leu Gly Ala Asp Val Ser Phe Glu Cys
                245                 250                 255
Ile Gly Asn Lys His Thr Ala Lys Leu Ala Ile Asp Thr Ile Arg Lys
            260                 265                 270
Ala Gly Lys Cys Val Leu Val Gly Ile Phe Glu Glu Pro Ser Glu Phe
        275                 280                 285
Asn Phe Phe Glu Leu Val Ser Thr Glu Lys Gln Val Leu Gly Ala Leu
    290                 295                 300
Ala Tyr Asn Gly Glu Phe Ala Asp Val Ile Ala Phe Ile Ala Asp Gly
305                 310                 315                 320
Arg Leu Asp Ile Arg Pro Leu Val Thr Gly Arg Ile Gly Leu Glu Gln
                325                 330                 335
Ile Val Glu Leu Gly Phe Glu Glu Leu Val Asn Asn Lys Glu Glu Asn
            340                 345                 350
Val Lys Ile Ile Val Ser Pro Gly Val Arg
        355                 360
 
<210>101
<211>771
<212>DNA
<213>肺炎克雷伯氏菌MGH78578
 
<400>101
atgaaaaaag tcgcacttgt taccggcgcc ggccagggga ttggtaaagc tatcgccctt 60
cgtctggtga aggatggatt tgccgtggcc attgccgatt ataacgacgc caccgccaaa 120
gcggtcgcct cggaaatcaa ccaggccggc ggacacgccg tggcggtgaa agtggatgtc 180
tccgaccgcg atcaggtatt tgccgccgtt gaacaggcgc gcaaaacgct gggcggcttc 240
gacgtcatcg tcaataacgc cggtgtggca ccgtctacgc cgatcgagtc cattaccccg 300
gagattgtcg acaaagtcta caacatcaac gtcaaagggg tgatctgggg tattcaggcg 360
gcggtcgagg cctttaagaa agaggggcac ggcgggaaaa tcatcaacgc ctgttcccag 420
gccggccacg tcggcaaccc ggagctggcg gtgtatagct ccagtaaatt cgcggtacgc 480
ggcttaaccc agaccgccgc tcgcgacctc gcgccgctgg gcatcacggt caacggctac 540
tgcccgggga ttgtcaaaac gccaatgtgg gccgaaattg accgccaggt gtccgaagcc 600
gccggtaaac cgctgggcta cggtaccgcc gagttcgcca aacgcatcac tctcggtcgt 660
ctgtccgagc cggaagatgt cgccgcctgc gtctcctatc ttgccagccc ggattctgat 720
tacatgaccg gtcagtcgtt gctgatcgac ggcgggatgg tatttaacta a          771
 
<210>102
<211>256
<212>PRT
<213>肺炎克雷伯氏菌MGH78578
 
<400>102
Met Lys Lys Val Ala Leu Val Thr Gly Ala Gly Gln Gly Ile Gly Lys
 1               5                  10                  15
Ala Ile Ala Leu Arg Leu Val Lys Asp Gly Phe Ala Val Ala Ile Ala
            20                  25                  30
Asp Tyr Asn Asp Ala Thr Ala Lys Ala Val Ala Ser Glu Ile Asn Gln
        35                  40                  45
Ala Gly Gly His Ala Val Ala Val Lys Val Asp Val Ser Asp Arg Asp
    50                  55                  60
Gln Val Phe Ala Ala Val Glu Gln Ala Arg Lys Thr Leu Gly Gly Phe
65                  70                  75                  80
Asp Val Ile Val Asn Asn Ala Gly Val Ala Pro Ser Thr Pro Ile Glu
                85                  90                  95
Ser Ile Thr Pro Glu Ile Val Asp Lys Val Tyr Asn Ile Asn Val Lys
            100                 105                 110
Gly Val Ile Trp Gly Ile Gln Ala Ala Val Glu Ala Phe Lys Lys Glu
        115                 120                 125
Gly His Gly Gly Lys Ile Ile Asn Ala Cys Ser Gln Ala Gly His Val
    130                 135                 140
Gly Asn Pro Glu Leu Ala Val Tyr Ser Ser Ser Lys Phe Ala Val Arg
145                 150                 155                 160
Gly Leu Thr Gln Thr Ala Ala Arg Asp Leu Ala Pro Leu Gly Ile Thr
                165                 170                 175
Val Asn Gly Tyr Cys Pro Gly Ile Val Lys Thr Pro Met Trp Ala Glu
            180                 185                 190
Ile Asp Arg Gln Val Ser Glu Ala Ala Gly Lys Pro Leu Gly Tyr Gly
        195                 200                 205
Thr Ala Glu Phe Ala Lys Arg Ile Thr Leu Gly Arg Leu Ser Glu Pro
    210                 215                 220
Glu Asp Val Ala Ala Cys Val Ser Tyr Leu Ala Ser Pro Asp Ser Asp
225                 230                 235                 240
Tyr Met Thr Gly Gln Ser Leu Leu Ile Asp Gly Gly Met Val Phe Asn
                245                 250                 255
 
<210>103
<211>1665
<212>DNA
<213>肺炎克雷伯氏菌MGH78578
 
<400>103
atgagatcga aaagatttga agcactggcg aaacgccctg tgaatcagga tggtttcgtt 60
aaggagtgga ttgaagaggg ctttatcgcg atggaaagcc ctaacgatcc caaaccttct 120
atccgcatcg tcaacggcgc ggtgaccgaa ctcgacgata aaccggttga gcagttcgac 180
ctgattgacc actttatcgc gcgctacggc attaatctcg cccgggccga agaagtgatg 240
gccatggatt cggttaagct cgccaacatg ctctgcgacc cgaacgttaa acgcagcgac 300
atcgtgccgc tcactaccgc gatgaccccg gcgaaaatcg tggaagtggt gtcgcatatg 360
aacgtggtcg agatgatgat ggcgatgcaa aaaatgcgcg cccgccgcac gccgtcccag 420
caggcgcatg tcactaatat caaagataat ccggtacaga ttgccgccga cgccgctgaa 480
ggcgcatggc gcggctttga cgagcaggag accaccgtcg ccgtggcgcg ctacgcgccg 540
ttcaacgcca tcgccctgct ggtcggttca caggttggcc gccccggcgt cctcacccag 600
tgttcgctgg aagaagccac cgagctgaaa ctgggcatgc tgggccacac ctgctatgcc 660
gaaaccattt cggtatacgg tacggaaccg gtgtttaccg atggcgatga caccccgtgg 720
tcgaaaggct tcctcgcctc ctcctacgcc tcgcgcggcc tgaaaatgcg ctttacctcc 780
ggttccggct cggaggtgca gatgggctat gccgaaggca aatcgatgct ttatctcgaa 840
gcgcgctgca tctacatcac caaagccgcc ggggtgcaag gcctgcagaa tggctccgtc 900
agctgtatcg gcgtgccgtc cgccgtgccg tccgggatcc gcgccgtact ggcggaaaac 960
ctgatctgct cagcgctgga tctggagtgc gcctccagca acgatcaaac ctttacccac 1020
tcggatatgc ggcgtaccgc gcgtctgctg atgcagttcc tgccaggtac cgactttatc 1080
tcctccggtt actcggcggt gccgaactac gacaacatgt tcgccggttc caacgaagat 1140
gccgaagact tcgatgacta caacgtgatc cagcgcgacc tgaaggtcga tggcggcctg 1200
cggccggtgc gtgaagagga cgtgatcgcc attcgcaaca aagccgcccg cgcgctgcag 1260
gcggtatttg ccggcatggg tttgccgcct attacggatg aagaagtaga agccgccacc 1320
tacgcccacg gttcaaaaga tatgcctgag cgcaatatcg tcgaggacat caagtttgct 1380
caggagatca tcaacaagaa ccgcaacggc ctggaggtgg tgaaagccct ggcgaaaggc 1440
ggcttccccg atgtcgccca ggacatgctc aatattcaga aagccaagct caccggcgac 1500
tacctgcata cctccgccat cattgttggc gagggccagg tgctctcggc cgtgaatgac 1560
gtgaacgatt atgccggtcc ggcaacaggc taccgcctgc aaggcgagcg ctgggaagag 1620
attaaaaata tcccgggcgc gctcgatccc aatgaacttg gctaa                 1665
 
<210>104
<211>554
<212>PRT
<213>肺炎克雷伯氏菌MGH78578
 
<400>104
Met Arg Ser Lys Arg Phe Glu Ala Leu Ala Lys Arg Pro Val Asn Gln
 1               5                  10                  15
Asp Gly Phe Val Lys Glu Trp Ile Glu Glu Gly Phe Ile Ala Met Glu
            20                  25                  30
Ser Pro Asn Asp Pro Lys Pro Ser Ile Arg Ile Val Asn Gly Ala Val
        35                  40                  45
Thr Glu Leu Asp Asp Lys Pro Val Glu Gln Phe Asp Leu Ile Asp His
    50                  55                  60
Phe Ile Ala Arg Tyr Gly Ile Asn Leu Ala Arg Ala Glu Glu Val Met
65                  70                  75                  80
Ala Met Asp Ser Val Lys Leu Ala Asn Met Leu Cys Asp Pro Asn Val
                85                  90                  95
Lys Arg Ser Asp Ile Val Pro Leu Thr Thr Ala Met Thr Pro Ala Lys
            100                 105                 110
Ile Val Glu Val Val Ser His Met Asn Val Val Glu Met Met Met Ala
        115                 120                 125
Met Gln Lys Met Arg Ala Arg Arg Thr Pro Ser Gln Gln Ala His Val
    130                 135                 140
Thr Asn Ile Lys Asp Asn Pro Val Gln Ile Ala Ala Asp Ala Ala Glu
145                 150                 155                 160
Gly Ala Trp Arg Gly Phe Asp Glu Gln Glu Thr Thr Val Ala Val Ala
                165                 170                 175
Arg Tyr Ala Pro Phe Asn Ala Ile Ala Leu Leu Val Gly Ser Gln Val
            180                 185                 190
Gly Arg Pro Gly Val Leu Thr Gln Cys Ser Leu Glu Glu Ala Thr Glu
        195                 200                 205
Leu Lys Leu Gly Met Leu Gly His Thr Cys Tyr Ala Glu Thr Ile Ser
    210                 215                 220
Val Tyr Gly Thr Glu Pro Val Phe Thr Asp Gly Asp Asp Thr Pro Trp
225                 230                 235                 240
Ser Lys Gly Phe Leu Ala Ser Ser Tyr Ala Ser Arg Gly Leu Lys Met
                245                 250                 255
Arg Phe Thr Ser Gly Ser Gly Ser Glu Val Gln Met Gly Tyr Ala Glu
            260                 265                 270
Gly Lys Ser Met Leu Tyr Leu Glu Ala Arg Cys Ile Tyr Ile Thr Lys
        275                 280                 285
Ala Ala Gly Val Gln Gly Leu Gln Asn Gly Ser Val Ser Cys Ile Gly
    290                 295                 300
Val Pro Ser Ala Val Pro Ser Gly Ile Arg Ala Val Leu Ala Glu Asn
305                 310                 315                 320
Leu Ile Cys Ser Ala Leu Asp Leu Glu Cys Ala Ser Ser Asn Asp Gln
                325                 330                 335
Thr Phe Thr His Ser Asp Met Arg Arg Thr Ala Arg Leu Leu Met Gln
            340                 345                 350
Phe Leu Pro Gly Thr Asp Phe Ile Ser Ser Gly Tyr Ser Ala Val Pro
        355                 360                 365
Asn Tyr Asp Asn Met Phe Ala Gly Ser Asn Glu Asp Ala Glu Asp Phe
    370                 375                 380
Asp Asp Tyr Asn Val Ile Gln Arg Asp Leu Lys Val Asp Gly Gly Leu
385                 390                 395                 400
Arg Pro Val Arg Glu Glu Asp Val Ile Ala Ile Arg Asn Lys Ala Ala
                405                 410                 415
Arg Ala Leu Gln Ala Val Phe Ala Gly Met Gly Leu Pro Pro Ile Thr
            420                 425                 430
Asp Glu Glu Val Glu Ala Ala Thr Tyr Ala His Gly Ser Lys Asp Met
        435                 440                 445
Pro Glu Arg Asn Ile Val Glu Asp Ile Lys Phe Ala Gln Glu Ile Ile
    450                 455                 460
Asn Lys Asn Arg Asn Gly Leu Glu Val Val Lys Ala Leu Ala Lys Gly
465                 470                 475                 480
Gly Phe Pro Asp Val Ala Gln Asp Met Leu Asn Ile Gln Lys Ala Lys
                485                 490                 495
Leu Thr Gly Asp Tyr Leu His Thr Ser Ala Ile Ile Val Gly Glu Gly
            500                 505                 510
Gln Val Leu Ser Ala Val Asn Asp Val Asn Asp Tyr Ala Gly Pro Ala
        515                 520                 525
Thr Gly Tyr Arg Leu Gln Gly Glu Arg Trp Glu Glu Ile Lys Asn Ile
    530                 535                 540
Pro Gly Ala Leu Asp Pro Asn Glu Leu Gly
545                 550
 
<210>105
<211>690
<212>DNA
<213>肺炎克雷伯氏菌MGH78578
 
<400>105
atggaaatta acgaaacgct gctgcgccag attatcgaag aggtgctgtc ggagatgaaa 60
tcaggcgcag ataagccggt ctcctttagc gcgcctgcgg cttctgtcgc ctctgccgcg 120
ccggtcgccg ttgcgcctgt gtccggcgac agcttcctga cggaaatcgg cgaagccaaa 180
cccggcacgc agcaggatga agtcattatt gccgtcgggc cagcgtttgg tctggcgcaa 240
accgccaata tcgtcggcat tccgcataaa aatattctgc gcgaagtgat cgccggcatt 300
gaggaagaag gcatcaaagc ccgggtgatc cgctgcttta agtcttctga cgtcgccttc 360
gtggcagtgg aaggcaaccg cctgagcggc tccggcatct cgatcggtat tcagtcgaaa 420
ggcaccaccg tcatccacca gcgcggcctg ccgccgcttt ccaatctgga actcttcccg 480
caggcgccgc tgctgacgct ggaaacctac cgtcagattg gcaaaaacgc cgcgcgctac 540
gccaaacgcg agtcgccgca gccggtgccg acgcttaacg atcagatggc tcgtcccaaa 600
taccaggcga agtcggccat tttgcacatt aaagagacca aatacgtggt gacgggcaaa 660
aacccgcagg aactgcgcgt ggcgctttaa                                  690
 
<210>106
<211>229
<212>PRT
<213>肺炎克雷伯氏菌MGH78578
<400>106
Met Glu Ile Asn Glu Thr Leu Leu Arg Gln Ile Ile Glu Glu Val Leu
 1               5                  10                  15
Ser Glu Met Lys Ser Gly Ala Asp Lys Pro Val Ser Phe Ser Ala Pro
            20                  25                  30
Ala Ala Ser Val Ala Ser Ala Ala Pro Val Ala Val Ala Pro Val Ser
        35                  40                  45
Gly Asp Ser Phe Leu Thr Glu Ile Gly Glu Ala Lys Pro Gly Thr Gln
    50                  55                  60
Gln Asp Glu Val Ile Ile Ala Val Gly Pro Ala Phe Gly Leu Ala Gln
65                  70                  75                  80
Thr Ala Asn Ile Val Gly Ile Pro His Lys Asn Ile Leu Arg Glu Val
                85                  90                  95
Ile Ala Gly Ile Glu Glu Glu Gly Ile Lys Ala Arg Val Ile Arg Cys
            100                 105                 110
Phe Lys Ser Ser Asp Val Ala Phe Val Ala Val Glu Gly Asn Arg Leu
        115                 120                 125
Ser Gly Ser Gly Ile Ser Ile Gly Ile Gln Ser Lys Gly Thr Thr Val
    130                 135                 140
Ile His Gln Arg Gly Leu Pro Pro Leu Ser Asn Leu Glu Leu Phe Pro
145                 150                 155                 160
Gln Ala Pro Leu Leu Thr Leu Glu Thr Tyr Arg Gln Ile Gly Lys Asn
                165                 170                 175
Ala Ala Arg Tyr Ala Lys Arg Glu Ser Pro Gln Pro Val Pro Thr Leu
            180                 185                 190
Asn Asp Gln Met Ala Arg Pro Lys Tyr Gln Ala Lys Ser Ala Ile Leu
        195                 200                 205
His Ile Lys Glu Thr Lys Tyr Val Val Thr Gly Lys Asn Pro Gln Glu
    210                 215                 220
Leu Arg Val Ala Leu
225
 
<210>107
<211>525
<212>DNA
<213>肺炎克雷伯氏菌MGH78578
 
<400>107
atgaataccg acgcaattga atccatggta cgcgacgtgc tgagccggat gaacagccta 60
caggacggga taacgcccgc gccagccgcg ccgacaaacg acaccgttcg ccagccaaaa 120
gttagcgact acccgttagc gacccgccat ccggagtggg tcaaaaccgc taccaataaa 180
acgctcgatg acctgacgct ggagaacgta ttaagcgatc gcgttacggc gcaggacatg 240
cgcatcactc cggaaacgct gcgtatgcag gcggcgatcg cccaggatgc cggacgcgat 300
cggctggcga tgaactttga gcgggccgca gagctcaccg cggttcccga cgaccgaatc 360
cttgagatct acaacgccct gcgcccatac cgttccaccc aggcggagct actggcgatc 420
gctgatgacc tcgagcatcg ctaccaggca cgactctgtg ccgcctttgt tcgggaagcg 480
gccgggctgtacatcgagcg taagaagctg aaaggcgacg attaa                  525
 
<210>108
<211>174
<212>PRT
<213>肺炎克雷伯氏菌MGH78578
 
<400>108
Met Asn Thr Asp Ala Ile Glu Ser Met Val Arg Asp Val Leu Ser Arg
 1               5                  10                  15
Met Asn Ser Leu Gln Asp Gly Ile Thr Pro Ala Pro Ala Ala Pro Thr
            20                  25                  30
Asn Asp Thr Val Arg Gln Pro Lys Val Ser Asp Tyr Pro Leu Ala Thr
        35                  40                  45
Arg His Pro Glu Trp Val Lys Thr Ala Thr Asn Lys Thr Leu Asp Asp
    50                 55                 60
Leu Thr Leu Glu Asn Val Leu Ser Asp Arg Val Thr Ala Gln Asp Met
65                  70                  75                  80
Arg Ile Thr Pro Glu Thr Leu Arg Met Gln Ala Ala Ile Ala Gln Asp
                85                  90                  95
Ala Gly Arg Asp Arg Leu Ala Met Asn Phe Glu Arg Ala Ala Glu Leu
            100                 105                 110
Thr Ala Val Pro Asp Asp Arg Ile Leu Glu Ile Tyr Asn Ala Leu Arg
        115                 120                 125
Pro Tyr Arg Ser Thr Gln Ala Glu Leu Leu Ala Ile Ala Asp Asp Leu
    130                 135                 140
Glu His Arg Tyr Gln Ala Arg Leu Cys Ala Ala Phe Val Arg Glu Ala
145                 150                 155                 160
Ala Gly Leu Tyr Ile Glu Arg Lys Lys Leu Lys Gly Asp Asp
                165                 170
 
<210>109
<211>789
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>109
atgacagtca attatgattt ttccggaaaa gtcgtgctgg ttaccggcgc tggctctggt  60
attggccgtg ccactgcgct tgccttcgcg cagtcgggcg catccgttgc ggtcgcagac  120
atctcgactg accacggttt gaaaaccgta gagttggtca aagccgaagg aggcgaggcg  180
accttcttcc atgtcgatgt aggctctgaa cccagcgtcc agtcgatgct ggctggtgtc  240
gtggcgcatt acggcggcct ggacattgcg cacaacaacg ccggcattga ggccaatatc  300
gtgccgctgg ccgagctgga ctccgacaac tggcgtcgtg tcatcgatgt gaacctttcc  360
tcggtgttct attgcctgaa aggtgaaatc cctctgatgc tgaaaagggg cggcggcgcc  420
attgtgaata ccgcatcggc ctccgggctg attggcggct atcgcctttc cgggtatacc  480
gccacgaagc acggcgtagt ggggctgact aaggctgctg ctatcgatta tgcaaaccag  540
aatatccgga ttaatgccgt gtgccctggt ccagttgact ccccattcct ggctgacatg  600
ccgcaaccca tgcgcgatcg acttctcttt ggcactccaa ttggacgatt ggccaccgca  660
gaggagatcg cgcgttcggt tctgtggctg tgttctgacg atgcaaaata cgtggtgggc  720
cattcgatgt cagtcgacgg tggcgtggca gtgactgcgg ttggtactcg aatggatgat  780
ctcttttaa                                                          789
 
<210>110
<211>262
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>110
Met Thr Val Asn Tyr Asp Phe Ser Gly Lys Val Val Leu Val Thr Gly
 1               5                  10                  15
Ala Gly Ser Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala Gln Ser
            20                  25                  30
Gly Ala Ser Val Ala Val Ala Asp Ile Ser Thr Asp His Gly Leu Lys
        35                  40                  45
Thr Val Glu Leu Val Lys Ala Glu Gly Gly Glu Ala Thr Phe Phe His
    50                  55                  60
Val Asp Val Gly Ser Glu Pro Ser Val Gln Ser Met Leu Ala Gly Val
65                  70                  75                  80
Val Ala His Tyr Gly Gly Leu Asp Ile Ala His Asn Asn Ala Gly Ile
                85                  90                  95
Glu Ala Asn Ile Val Pro Leu Ala Glu Leu Asp Ser Asp Asn Trp Arg
            100                 105                 110
Arg Val Ile Asp Val Asn Leu Ser Ser Val Phe Tyr Cys Leu Lys Gly
        115                 120                 125
Glu Ile Pro Leu Met Leu Lys Arg Gly Gly Gly Ala Ile Val Asn Thr
    130                 135                 140
Ala Ser Ala Ser Gly Leu Ile Gly Gly Tyr Arg Leu Ser Gly Tyr Thr
145                 150                 155                 160
Ala Thr Lys His Gly Val Val Gly Leu Thr Lys Ala Ala Ala Ile Asp
                165                 170                 175
Tyr Ala Asn Gln Asn Ile Arg Ile Asn Ala Val Cys Pro Gly Pro Val
            180                 185                 190
Asp Ser Pro Phe Leu Ala Asp Met Pro Gln Pro Met Arg Asp Arg Leu
        195                 200                 205
Leu Phe Gly Thr Pro Ile Gly Arg Leu Ala Thr Ala Glu Glu Ile Ala
    210                 215                 220
Arg Ser Val Leu Trp Leu Cys Ser Asp Asp Ala Lys Tyr Val Val Gly
225                 230                 235                 240
His Ser Met Ser Val Asp Gly Gly Val Ala Val Thr Ala Val Gly Thr
                245                 250                 255
Arg Met Asp Asp Leu Phe
            260
 
<210>111
<211>762
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>111
atgagcatga ccttttctgg ccaggtagcc ctggtgaccg gcgcgggtgc cggcatcggc 60
cgggcaaccg ccctggcgtt cgcccacgag ggcatgaaag tggtggtggc ggacctcgac 120
ccggtcggcg gcgaggccac cgtggcgcag atccacgcgg caggcggcga agcgctgttc 180
attgcctgcg acgtgacccg cgacgccgag gtgcgccagt tgcatgagcg cctgatggcc 240
gcctacggcc ggctggacta cgccttcaac aacgccggga tcgagatcga gcaacaccgc 300
ctggccgaag gcagcgaagc ggagttcgat gccatcatgg gcgtgaacgt gaagggcgtg 360
tggttgtgca tgaagtatca gttgcccttg ttgctggccc aaggcggtgg ggccatcgtc 420
aataccgcgt cggtggcggg gctaggggcg gcgccaaaga tgagcatcta cagcgccagc 480
aagcatgcgg tcatcggtct gaccaagtcg gcggccatcg agtacgccaa gaagggcatc 540
cgcgtgaacg ccgtgtgccc ggccgtgatc gacaccgaca tgttccgccg cgcttaccag 600
gccgacccgc gcaaggccga gttcgccgca gccatgcacc cggtagggcg cattggcaag 660
gtcgaggaaa tcgccagcgc cgtgctgtat ctgtgcagtg acggcgcggc gtttaccacc 720
gggcattgcc tgacggtgga tggtggggct acggcgatct ga                    762
 
<210>112
<211>253
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>112
Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Gly
 1               5                  10                  15
Ala Gly Ile Gly Arg Ala Thr Ala Leu Ala Phe Ala His Glu Gly Met
            20                  25                  30
Lys Val Val Val Ala Asp Leu Asp Pro Val Gly Gly Glu Ala Thr Val
        35                  40                  45
Ala Gln Ile His Ala Ala Gly Gly Glu Ala Leu Phe Ile Ala Cys Asp
    50                  55                  60
Val Thr Arg Asp Ala Glu Val Arg Gln Leu His Glu Arg Leu Met Ala
65                  70                  75                  80
Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile
                85                  90                  95
Glu Gln His Arg Leu Ala Glu Gly Ser Glu Ala Glu Phe Asp Ala Ile
            100                 105                 110
Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu
        115                 120                 125
Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser
    130                 135                 140
Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ser Ala Ser
145                 150                 155                 160
Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala
                165                 170                 175
Lys Lys Gly Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr
            180                 185                 190
Asp Met Phe Arg Arg Ala Tyr Gln Ala Asp Pro Arg Lys Ala Glu Phe
        195                 200                 205
Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile
    210                 215                 220
Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr
225                 230                 235                 240
Gly His Cys Leu Thr Val Asp Gly Gly Ala Thr Ala Ile
                245                 250
 
<210>113
<211>810
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>113
atgtcttttc aaaacaaaat cgttgtgctc acaggcgcag cttctggcat cggcaaagcg 60
acagcacagc tgctagtgga gcagggcgcc catgtggttg ccatggatct taaaagcgac 120
ttgcttcaac aagcattcgg cagtgaggag cacgttctgt gcatccctac cgacgtcagc 180
gatagcgaag ccgtgcgagc cgccttccag gcagtggacg cgaaatttgg ccgtgtcgac 240
gtgattatta acgccgcggg catcaacgca cctacgcgag aagccaacca gaaaatggtt 300
gatgccaacg tcgctgccct cgatgccatg aagagcgggc gggcgcccac tttcgacttc 360
ctggccgata cctcggatca ggatttccgg cgcgtaatgg aagtcaattt gttcagccag 420
ttttactgca ttcgagaggg tgttccgctg atgcgccgag cgggtggcgg cagcatcgtc 480
aacatctcca gcgtggcagc gctcctgggc gtggcaatgc cactttacta ccccgcctcc 540
aaggcggcgg tgctgggcct cacccgtgca gcggcagctg agttggcacc ttacaacatt 600
cgtgtgaatg ccatcgctcc aggctctgtc gacacaccat tgatgcatga gcaaccaccg 660
gaagtcgttc agttcctggt cagcatgcaa cccatcaagc ggctggccca acccgaggag 720
cttgcccaaa gcatcctgtt ccttgccggt gagcattcgt ccttcatcac cggacagacg 780
ctttctccca acggcgggat gcacatgtaa                                  810
 
<210>114
<211>269
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>114
Met Ser Phe Gln Asn Lys Ile Val Val Leu Thr Gly Ala Ala Ser Gly
 1               5                  10                  15
Ile Gly Lys Ala Thr Ala Gln Leu Leu Val Glu Gln Gly Ala His Val
            20                  25                  30
Val Ala Met Asp Leu Lys Ser Asp Leu Leu Gln Gln Ala Phe Gly Ser
        35                  40                  45
Glu Glu His Val Leu Cys Ile Pro Thr Asp Val Ser Asp Ser Glu Ala
    50                  55                  60
Val Arg Ala Ala Phe Gln Ala Val Asp Ala Lys Phe Gly Arg Val Asp
65                  70                  75                  80
Val Ile Ile Asn Ala Ala Gly Ile Asn Ala Pro Thr Arg Glu Ala Asn
                85                  90                  95
Gln Lys Met Val Asp Ala Asn Val Ala Ala Leu Asp Ala Met Lys Ser
            100                 105                 110
Gly Arg Ala Pro Thr Phe Asp Phe Leu Ala Asp Thr Ser Asp Gln Asp
        115                 120                 125
Phe Arg Arg Val Met Glu Val Asn Leu Phe Ser Gln Phe Tyr Cys Ile
    130                 135                 140
Arg Glu Gly Val Pro Leu Met Arg Arg Ala Gly Gly Gly Ser Ile Val
145                 150                 155                 160
Asn Ile Ser Ser Val Ala Ala Leu Leu Gly Val Ala Met Pro Leu Tyr
                165                 170                 175
Tyr Pro Ala Ser Lys Ala Ala Val Leu Gly Leu Thr Arg Ala Ala Ala
            180                 185                 190
Ala Glu Leu Ala Pro Tyr Asn Ile Arg Val Asn Ala Ile Ala Pro Gly
        195                 200                 205
Ser Val Asp Thr Pro Leu Met His Glu Gln Pro Pro Glu Val Val Gln
    210                 215                 220
Phe Leu Val Ser Met Gln Pro Ile Lys Arg Leu Ala Gln Pro Glu Glu
225                 230                 235                 240
Leu Ala Gln Ser Ile Leu Phe Leu Ala Gly Glu His Ser Ser Phe Ile
                245                 250                 255
Thr Gly Gln Thr Leu Ser Pro Asn Gly Gly Met His Met
            260                 265
 
<210>115
<211>771
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>115
atgacccttg aaggcaaaac tgcactcgtc accggttcca ccagcggcat tggcctgggc 60
atcgcccagg tattggcccg ggctggcgcc aacatcgtgc tcaacggctt tggtgacccg 120
ggccccgcca tggcggaaat tgcccggcac ggggtgaagg ttgtgcacca cccggccgac 180
ctgtcggatg tggtccagat cgaggctttg ttcaacctgg ccgaacgcga gttcggcggc 240
gtcgacatcc tggtcaacaa cgccggtatc cagcatgtgg caccggttga gcagttcccg 300
ccagaaagct gggacaagat catcgccctg aacctgtcgg ccgtattcca tggcacgcgc 360
ctggcgctgc cgggcatgcg cacgcgcaac tgggggcgca tcatcaatat cgcttcggtg 420
catggcctgg tcggctcgat tggcaaggca gcctacgtgg cagccaagca tggcgtgatc 480
ggcctgacca aggtggtcgg cctggaaacc gccaccagtc atgtcacctg caatgccata 540
tgcccgggct gggtgctgac accgctggtg caaaagcaga tcgacgatcg tgcggccaag 600
ggtggcgatc ggctgcaagc gcagcacgat ctgctggcag aaaagcaacc gtcgctggct 660
ttcgtcaccc ccgaacacct cggtgagctg gtactctttc tgtgcagcga ggccggtagc 720
caggttcgcg gcgccgcctg gaacgtcgat ggtggctggt tggcccagtg a          771
 
<210>116
<211>256
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>116
Met Thr Leu Glu Gly Lys Thr Ala Leu Val Thr Gly Ser Thr Ser Gly
 1               5                  10                  15
Ile Gly Leu Gly Ile Ala Gln Val Leu Ala Arg Ala Gly Ala Asn Ile
            20                  25                  30
Val Leu Asn Gly Phe Gly Asp Pro Gly Pro Ala Met Ala Glu Ile Ala
        35                  40                  45
Arg His Gly Val Lys Val Val His His Pro Ala Asp Leu Ser Asp Val
    50                  55                  60
Val Gln Ile Glu Ala Leu Phe Asn Leu Ala Glu Arg Glu Phe Gly Gly
65                  70                  75                  80
Val Asp Ile Leu Val Asn Asn Ala Gly Ile Gln His Val Ala Pro Val
                85                  90                  95
Glu Gln Phe Pro Pro Glu Ser Trp Asp Lys Ile Ile Ala Leu Asn Leu
            100                 105                 110
Ser Ala Val Phe His Gly Thr Arg Leu Ala Leu Pro Gly Met Arg Thr
        115                 120                 125
Arg Asn Trp Gly Arg Ile Ile Asn Ile Ala Ser Val His Gly Leu Val
    130                 135                 140
Gly Ser Ile Gly Lys Ala Ala Tyr Val Ala Ala Lys His Gly Val Ile
145                 150                 155                 160
Gly Leu Thr Lys Val Val Gly Leu Glu Thr Ala Thr Ser His Val Thr
                165                 170                 175
Cys Asn Ala Ile Cys Pro Gly Trp Val Leu Thr Pro Leu Val Gln Lys
            180                 185                 190
Gln Ile Asp Asp Arg Ala Ala Lys Gly Gly Asp Arg Leu Gln Ala Gln
        195                 200                 205
His Asp Leu Leu Ala Glu Lys Gln Pro Ser Leu Ala Phe Val Thr Pro
    210                 215                 220
Glu His Leu Gly Glu Leu Val Leu Phe Leu Cys Ser Glu Ala Gly Ser
225                 230                 235                 240
Gln Val Arg Gly Ala Ala Trp Asn Val Asp Gly Gly Trp Leu Ala Gln
                245                 250                 255
 
<210>117
<211>750
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>117
atgtccaagc aacttacact cgaaggcaaa gtggccctgg ttcagggcgg ttcccgaggc  60
attggcgcag ctatcgtaag gcgcctggcc cgcgaaggcg cgcaagtggc cttcacctat  120
gtcagctctg ccggcccggc tgaagaactg gctcgggaaa ttaccgagaa cggcggcaaa  180
gccttggccc tgcgggctga cagcgctgat gccgcggccg tgcagctggc ggttgatgac  240
accgagaaag ccttgggccg gctggatatc ctggtcaaca acgccggtgt gctggcagtg  300
gccccagtga cagagttcga cctggccgac ttcgatcata tgctggccgt gaacgtacgc  360
agcgtgttcg tcgccagcca ggccgcggca cgctatatgg gccagggcgg tcgtatcatc  420
aacattggca gcaccaacgc cgagcgcatg ccgtttgccg gtggtgcacc gtacgccatg  480
agcaagtcgg cactggttgg tctgacccgc ggcatggcac gcgacctcgg gccgcagggc  540
attaccgtga acaacgtgca gcccggcccg gtggacaccg acatgaaccc ggccagtggc  600
gagtttgccg agagcctgat tccgctgatg gccattgggc gatatggcga gccggaggag  660
attgccagct tcgtggctta cctggcaggg cctgaagccg ggtatatcac cggggccagc  720
ctgactgtag atggtgggtt tgcagcctga                                   750
 
<210>118
<211>249
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>118
Met Ser Lys Gln Leu Thr Leu Glu Gly Lys Val Ala Leu Val Gln Gly
 1               5                  10                  15
Gly Ser Arg Gly Ile Gly Ala Ala Ile Val Arg Arg Leu Ala Arg Glu
            20                  25                  30
Gly Ala Gln Val Ala Phe Thr Tyr Val Ser Ser Ala Gly Pro Ala Glu
        35                  40                  45
Glu Leu Ala Arg Glu Ile Thr Glu Asn Gly Gly Lys Ala Leu Ala Leu
    50                  55                  60
Arg Ala Asp Ser Ala Asp Ala Ala Ala Val Gln Leu Ala Val Asp Asp
65                  70                  75                  80
Thr Glu Lys Ala Leu Gly Arg Leu Asp Ile Leu Val Asn Asn Ala Gly
                85                  90                  95
Val Leu Ala Val Ala Pro Val Thr Glu Phe Asp Leu Ala Asp Phe Asp
            100                 105                 110
His Met Leu Ala Val Asn Val Arg Ser Val Phe Val Ala Ser Gln Ala
        115                 120                 125
Ala Ala Arg Tyr Met Gly Gln Gly Gly Arg Ile Ile Asn Ile Gly Ser
    130                 135                 140
Thr Asn Ala Glu Arg Met Pro Phe Ala Gly Gly Ala Pro Tyr Ala Met
145                 150                 155                 160
Ser Lys Ser Ala Leu Val Gly Leu Thr Arg Gly Met Ala Arg Asp Leu
                165                 170                 175
Gly Pro Gln Gly Ile Thr Val Asn Asn Val Gln Pro Gly Pro Val Asp
            180                 185                 190
Thr Asp Met Asn Pro Ala Ser Gly Glu Phe Ala Glu Ser Leu Ile Pro
        195                 200                 205
Leu Met Ala Ile Gly Arg Tyr Gly Glu Pro Glu Glu Ile Ala Ser Phe
    210                 215                 220
Val Ala Tyr Leu Ala Gly Pro Glu Ala Gly Tyr Ile Thr Gly Ala Ser
225                 230                 235                 240
Leu Thr Val Asp Gly Gly Phe Ala Ala
                245
 
<210>119
<211>858
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>119
atgagcgact accctacccc tccattccca tcccaaccgc aaagcgttcc cggttcccag  60
cgcaagatgg atccgtatcc ggactgcggt gagcagagct acaccggcaa caatcgcctc  120
gcaggcaaga tcgccttgat aaccggtgct gacagcggca tcgggcgtgc ggtggcgatt  180
gcctatgccc gagaaggcgc tgacgttgcc attgcctatc tgaatgaaca cgacgatgcg  240
caggaaaccg cgcgctgggt caaagcggct ggccgccagt gcctgctgct gcccggcgac  300
ctggcacaga aacagcactg ccacgacatc gtcgacaaga ccgtggcgca gtttggtcgc  360
atcgatatcc tggtcaacaa cgccgcgttc cagatggccc atgaaagcct ggacgacatt  420
gatgacgatg aatgggtgaa gaccttcgat accaacatca ccgccatttt ccgcatttgc  480
cagcgcgctt tgccctcgat gccaaagggc ggttcgatca tcaacaccag ttcggtcaac  540
tctgacgacc cgtcacccag cctgttggcc tatgccgcga ccaaaggggc tattgccaat  600
ttcactgcag gccttgcgca actgctgggc aagcagggca ttcgcgtcaa cagcgtcgca  660
cccggcccga tctggacccc gctgatcccg gccaccatgc ctgatgaggc ggtgagaaac  720
ttcggttccg gttacccgat gggacggccg ggtcaacctg tggaggtggc gccaatctat  780
gtcttgctgg ggtccgatga agccagctac atctcgggtt cgcgttacgc cgtgacggga  840
ggcaaaccta ttctgtga                                                858
 
<210>120
<211>285
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>120
Met Ser Asp Tyr Pro Thr Pro Pro Phe Pro Ser Gln Pro Gln Ser Val
 1               5                  10                  15
Pro Gly Ser Gln Arg Lys Met Asp Pro Tyr Pro Asp Cys Gly Glu Gln
            20                  25                  30
Ser Tyr Thr Gly Asn Asn Arg Leu Ala Gly Lys Ile Ala Leu Ile Thr
        35                  40                  45
Gly Ala Asp Ser Gly Ile Gly Arg Ala Val Ala Ile Ala Tyr Ala Arg
    50                  55                  60
Glu Gly Ala Asp Val Ala Ile Ala Tyr Leu Asn Glu His Asp Asp Ala
65                  70                  75                  80
Gln Glu Thr Ala Arg Trp Val Lys Ala Ala Gly Arg Gln Cys Leu Leu
                85                  90                  95
Leu Pro Gly Asp Leu Ala Gln Lys Gln His Cys His Asp Ile Val Asp
            100                 105                 110
Lys Thr Val Ala Gln Phe Gly Arg Ile Asp Ile Leu Val Asn Asn Ala
        115                 120                 125
Ala Phe Gln Met Ala His Glu Ser Leu Asp Asp Ile Asp Asp Asp Glu
    130                 135                 140
Trp Val Lys Thr Phe Asp Thr Asn Ile Thr Ala Ile Phe Arg Ile Cys
145                 150                 155                 160
Gln Arg Ala Leu Pro Ser Met Pro Lys Gly Gly Ser Ile Ile Asn Thr
                165                 170                 175
Ser Ser Val Asn Ser Asp Asp Pro Ser Pro Ser Leu Leu Ala Tyr Ala
            180                 185                 190
Ala Thr Lys Gly Ala Ile Ala Asn Phe Thr Ala Gly Leu Ala Gln Leu
        195                 200                 205
Leu Gly Lys Gln Gly Ile Arg Val Asn Ser Val Ala Pro Gly Pro Ile
    210                 215                 220
Trp Thr Pro Leu Ile Pro Ala Thr Met Pro Asp Glu Ala Val Arg Asn
225                 230                 235                 240
Phe Gly Ser Gly Tyr Pro Met Gly Arg Pro Gly Gln Pro Val Glu Val
                245                 250                 255
Ala Pro Ile Tyr Val Leu Leu Gly Ser Asp Glu Ala Ser Tyr Ile Ser
            260                 265                 270
Gly Ser Arg Tyr Ala Val Thr Gly Gly Lys Pro Ile Leu
        275                 280                 285
 
<210>121
<211>774
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>121
atgatcgaaa tcagcggcag caccccgggc cacaatggcc gggtagcctt ggtcacgggc 60
gccgcccgcg gcatcggtct gggcattgcc gcatggctga tctgcgaagg ctggcaagtg 120
gtgctgagtg atctggaccg ccagcgtggt accaaagtgg ccaaggcgtt gggcgacaac 180
gcctggttca tcaccatgga cgttgccgac gaggcccagg tcagtgccgg cgtgtccgaa 240
gtgctcgggc agttcggccg gctggacgcg ctggtgtgca atgcggccat tgccaacccg 300
cacaaccaga cgctggaaag cctgagcctg gcacaatgga accgggtgct gggggtcaac 360
ctcagcggcc ccatgctgct ggccaagcat tgtgcgccgt acctgcgtgc gcacaatggg 420
gcgatcgtca acctgacctc tacccgtgct cggcagtccg aacccgacac cgaggcttac 480
gcggcaagca agggcggcct ggtggctttg acccatgccc tggccatgag cctgggcccg 540
gagattcgcg tcaatgcggt gagcccgggc tggatcgatg cccgtgatcc gtcgcagcgc 600
cgtgccgagc cgttgagcga agctgaccat gcccagcatc caacgggcag ggtagggacc 660
gtggaagatg tcgcggccat ggttgcctgg ttgctgtcac gccaggcggc atttgtcacc 720
ggccaggagt ttgtggtcga tggcggcatg acccgcaaga tgatctatac ctga       774
 
<210>122
<211>257
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>122
Met Ile Glu Ile Ser Gly Ser Thr Pro Gly His Asn Gly Arg Val Ala
 1               5                  10                  15
Leu Val Thr Gly Ala Ala Arg Gly Ile Gly Leu Gly Ile Ala Ala Trp
            20                  25                  30
Leu Ile Cys Glu Gly Trp Gln Val Val Leu Ser Asp Leu Asp Arg Gln
        35                  40                  45
Arg Gly Thr Lys Val Ala Lys Ala Leu Gly Asp Asn Ala Trp Phe Ile
    50                  55                  60
Thr Met Asp Val Ala Asp Glu Ala Gln Val Ser Ala Gly Val Ser Glu
65                  70                  75                  80
Val Leu Gly Gln Phe Gly Arg Leu Asp Ala Leu Val Cys Asn Ala Ala
                85                  90                  95
Ile Ala Asn Pro His Asn Gln Thr Leu Glu Ser Leu Ser Leu Ala Gln
            100                 105                 110
Trp Asn Arg Val Leu Gly Val Asn Leu Ser Gly Pro Met Leu Leu Ala
        115                 120                 125
Lys His Cys Ala Pro Tyr Leu Arg Ala His Asn Gly Ala Ile Val Asn
    130                 135                 140
Leu Thr Ser Thr Arg Ala Arg Gln Ser Glu Pro Asp Thr Glu Ala Tyr
145                 150                 155                 160
Ala Ala Ser Lys Gly Gly Leu Val Ala Leu Thr His Ala Leu Ala Met
                165                 170                 175
Ser Leu Gly Pro Glu Ile Arg Val Asn Ala Val Ser Pro Gly Trp Ile
            180                 185                 190
Asp Ala Arg Asp Pro Ser Gln Arg Arg Ala Glu Pro Leu Ser Glu Ala
        195                 200                 205
Asp His Ala Gln His Pro Thr Gly Arg Val Gly Thr Val Glu Asp Val
    210                 215                 220
Ala Ala Met Val Ala Trp Leu Leu Ser Arg Gln Ala Ala Phe Val Thr
225                 230                 235                 240
Gly Gln Glu Phe Val Val Asp Gly Gly Met Thr Arg Lys Met Ile Tyr
                245                 250                 255
Thr
 
<210>123
<211>741
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>123
atgagcctgc aaggtaaagt tgcactggtt accggcgcca gccgtggcat tggccaggcc 60
atcgccctcg agctgggccg ccagggcgcg accgtgatcg gtaccgccac gtcggcgtcc 120
ggtgccgagc gcatcgctgc caccctgaaa gaacacggca ttaccggcac tggcatggag 180
ctgaacgtga ccagcgccga atcggttgaa gccgtactgg ccgccattgg cgagcagttc 240
ggcgcgccgg ccatcttggt caacaatgcc ggtatcaccc gcgacaacct catgctgcgc 300
atgaaagacg acgagtggtt tgatgtcatc gacaccaacc tgaacagcct ctaccgtctg 360
tccaagggcg tgctgcgtgg catgaccaag gcgcgttggg gtcgtatcat cagcatcggc 420
tcggtcgttg gtgccatggg taacgcaggt caggccaact acgcggctgc caaggccggt 480
ctggaaggtt tcagccgcgc cctggcgcgt gaagtgggtt cgcgtggtat caccgtcaac 540
tcggtgaccc caggcttcat cgataccgac atgacccgcg agctgccaga agctcagcgc 600
gaagccctgc agacccagat tccgctgggc cgcctgggcc aggctgacga aattgccaag 660
gtggtttcgt tcctggcatc cgacggcgcc gcctacgtga ccggcgctac cgtgccggtc 720
aacggcggga tgtacatgta a                                           741
 
<210>124
<211>246
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>124
Met Ser Leu Gln Gly Lys Val Ala Leu Val Thr Gly Ala Ser Arg Gly
 1               5                  10                  15
Ile Gly Gln Ala Ile Ala Leu Glu Leu Gly Arg Gln Gly Ala Thr Val
            20                  25                  30
Ile Gly Thr Ala Thr Ser Ala Ser Gly Ala Glu Arg Ile Ala Ala Thr
        35                  40                  45
Leu Lys Glu His Gly Ile Thr Gly Thr Gly Met Glu Leu Asu Val Thr
    50                  55                  60
Ser Ala Glu Ser Val Glu Ala Val Leu Ala Ala Ile Gly Glu Gln Phe
65                  70                  75                  80
Gly Ala Pro Ala Ile Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Asn
                85                  90                  95
Leu Met Leu Arg Met Lys Asp Asp Glu Trp Phe Asp Val Ile Asp Thr
            100                 105                 110
Asn Leu Asn Ser Leu Tyr Arg Leu Ser Lys Gly Val Leu Arg Gly Met
        115                 120                 125
Thr Lys Ala Arg Trp Gly Arg Ile Ile Ser Ile Gly Ser Val Val Gly
    130                 135                 140
Ala Met Gly Asn Ala Gly Gln Ala Asn Tyr Ala Ala Ala Lys Ala Gly
145                 150                 155                 160
Leu Glu Gly Phe Ser Arg Ala Leu Ala Arg Glu Val Gly Ser Arg Gly
                165                 170                 175
Ile Thr Val Asn Ser Val Thr Pro Gly Phe Ile Asp Thr Asp Met Thr
            180                 185                 190
Arg Glu Leu Pro Glu Ala Gln Arg Glu Ala Leu Gln Thr Gln Ile Pro
        195                 200                 205
Leu Gly Arg Leu Gly Gln Ala Asp Glu Ile Ala Lys Val Val Ser Phe
    210                 215                 220
Leu Ala Ser Asp Gly Ala Ala Tyr Val Thr Gly Ala Thr Val Pro Val
225                 230                 235                 240
Asn Gly Gly Met Tyr Met
                245
 
<210>125
<211>738
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>125
atgactcaga aaatagctgt cgtgaccggc ggcagtcgcg gcattggcaa gtccatcgtg 60
ctggccctgg ccggcgcggg ttatcaggtt gccttcagtt atgtccgtga cgaggcgtca 120
gccgctgcct tgcaggcgca ggtcgaaggg ctcggccggg actgcctggc cgtgcagtgt 180
gatgtcaagg aagcgccgag cattcaggcg ttttttgaac gggtcgagca acgtttcgag 240
cgtatcgact tgttggtcaa caacgccggt attacccgtg acggtttgct cgccacgcaa 300
tcgttgaacg acatcaccga ggtcatccag accaacctgg tcggcacgtt gttgtgctgt 360
cagcaggtgc tgccctgcat gatgcgccaa cgcagcgggt gcatcgtcaa cctcagttcg 420
gtggccgcgc aaaagcccgg caagggccag agcaactacg ccgccgccaa aggcggtgta 480
gaagcattga cacgcgcact ggcggtggag ttggcgccgc gcaacatccg ggtcaacgcg 540
gtggcgcccg gcatcgtcag caccgacatg agccaagccc tggtcggcgc ccatgagcag 600
gaaatccagt cgcggctgtt gatcaaacgg ttcgcccggc ctgaagaaat tgccgacgcg 660
gtgctgtatc tggccgagcg cggcctgtac atcacgggcg aagtcctgtc cgtcaacggc 720
ggattgaaaa tgccatga                                               738
 
<210>126
<211>245
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>126
Met Thr Gln Lys Ile Ala Val Val Thr Gly Gly Ser Arg Gly Ile Gly
 1               5                  10                  15
Lys Ser Ile Val Leu Ala Leu Ala Gly Ala Gly Tyr Gln Val Ala Phe
            20                  25                  30
Ser Tyr Val Arg Asp Glu Ala Ser Ala Ala Ala Leu Gln Ala Gln Val
        35                  40                  45
Glu Gly Leu Gly Arg Asp Cys Leu Ala Val Gln Cys Asp Val Lys Glu
    50                  55                  60
Ala Pro Ser Ile Gln Ala Phe Phe Glu Arg Val Glu Gln Arg Phe Glu
65                  70                  75                  80
Arg Ile Asp Leu Leu Val Asn Asn Ala Gly Ile Thr Arg Asp Gly Leu
                85                  90                  95
Leu Ala Thr Gln Ser Leu Asn Asp Ile Thr Glu Val Ile Gln Thr Asn
            100                 105                 110
Leu Val Gly Thr Leu Leu Cys Cys Gln Gln Val Leu Pro Cys Met Met
        115                 120                 125
Arg Gln Arg Ser Gly Cys Ile Val Asn Leu Ser Ser Val Ala Ala Gln
    130                 135                 140
Lys Pro Gly Lys Gly Gln Ser Asn Tyr Ala Ala Ala Lys Gly Gly Val
145                 150                 155                 160
Glu Ala Leu Thr Arg Ala Leu Ala Val Glu Leu Ala Pro Arg Asn Ile
                165                 170                 175
Arg Val Asn Ala Val Ala Pro Gly Ile Val Ser Thr Asp Met Ser Gln
            180                 185                 190
Ala Leu Val Gly Ala His Glu Gln Glu Ile Gln Ser Arg Leu Leu Ile
        195                 200                 205
Lys Arg Phe Ala Arg Pro Glu Glu Ile Ala Asp Ala Val Leu Tyr Leu
    210                 215                 220
Ala Glu Arg Gly Leu Tyr Ile Thr Gly Glu Val Leu Ser Val Asn Gly
225                 230                 235                 240
Gly Leu Lys Met Pro
                245
 
<210>127
<211>768
<212>DNA
<213>恶臭假单胞菌KT2440
 
<400>127
atgtccaaga cccacctgtt cgacctcgac ggcaagattg cctttgtttc cggcgccagc 60
cgtggcatcg gcgaggccat cgcccacttg ctcgcgcagc aaggggccca tgtgatcgtt 120
tccagccgca agcttgacgg gtgccagcag gtggccgacg ccatcattgc cgccggcggc 180
aaggccacgg ctgtggcctg ccacattggt gagctggaac agattcagca ggtgttcgcc 240
ggcattcgcg aacagttcgg gcgactggac gtgctggtca acaatgcagc caccaacccg 300
caattctgca atgtgctgga caccgaccca ggggcgttcc agaagaccgt ggacgtgaac 360
atccgtggtt acttcttcat gtcggtggag gctggcaagc tgatgcgcga gaacggcggc 420
ggcagcatca tcaacgtggc gtcgatcaac ggtgtttcac ccgggctgtt ccaaggcatc 480
tactcggtga ccaaggcggc ggtcatcaac atgaccaagg tgttcgccaa agagtgtgca 540
cccttcggta ttcgctgcaa cgcgctactg ccggggctga ccgataccaa gttcgcttcg 600
gcattggtga agaacgaagc catcctcaac gccgccttgc agcagatccc cctcaaacgc 660
gtggccgacc ccaaggaaat ggcgggtgcg gtgctgtacc tggccagcga tgcctccagc 720
tacaccaccg gcaccacgct caatgtcgac ggtggcttcc tgtcctga              768
 
<210>128
<211>255
<212>PRT
<213>恶臭假单胞菌KT2440
 
<400>128
Met Ser Lys Thr His Leu Phe Asp Leu Asp Gly Lys Ile Ala Phe Val
 1               5                  10                  15
Ser Gly Ala Ser Arg Gly Ile Gly Glu Ala Ile Ala His Leu Leu Ala
            20                  25                  30
Gln Gln Gly Ala His Val Ile Val Ser Ser Arg Lys Leu Asp Gly Cys
        35                  40                  45
Gln Gln Val Ala Asp Ala Ile Ile Ala Ala Gly Gly Lys Ala Thr Ala
    50                  55                  60
Val Ala Cys His Ile Gly Glu Leu Glu Gln Ile Gln Gln Val Phe Ala
65                  70                  75                  80
Gly Ile Arg Glu Gln Phe Gly Arg Leu Asp Val Leu Val Asn Asn Ala
                85                  90                  95
Ala Thr Asn Pro Gln Phe Cys Asn Val Leu Asp Thr Asp Pro Gly Ala
            100                 105                 110
Phe Gln Lys Thr Val Asp Val Asn Ile Arg Gly Tyr Phe Phe Met Ser
        115                 120                 125
Val Glu Ala Gly Lys Leu Met Arg Glu Asn Gly Gly Gly Ser Ile Ile
    130                 135                 140
Asn Val Ala Ser Ile Asn Gly Val Ser Pro Gly Leu Phe Gln Gly Ile
145                 150                 155                 160
Tyr Ser Val Thr Lys Ala Ala Val Ile Asn Met Thr Lys Val Phe Ala
                165                 170                 175
Lys Glu Cys Ala Pro Phe Gly Ile Arg Cys Asn Ala Leu Leu Pro Gly
            180                 185                 190
Leu Thr Asp Thr Lys Phe Ala Ser Ala Leu Val Lys Asn Glu Ala Ile
        195                 200                 205
Leu Asn Ala Ala Leu Gln Gln Ile Pro Leu Lys Arg Val Ala Asp Pro
    210                 215                 220
Lys Glu Met Ala Gly Ala Val Leu Tyr Leu Ala Ser Asp Ala Ser Ser
225                 230                 235                 240
Tyr Thr Thr Gly Thr Thr Leu Asn Val Asp Gly Gly Phe Leu Ser
                245                 250                 255
 
<210>129
<211>762
<212>DNA
<213>荧光假单孢菌Pf-5
 
<400>129
atgagcatga cgttttccgg ccaggtggcc ctagtgaccg gcgcagccaa tggtatcggc 60
cgcgccaccg cccaggcatt tgccgcacaa ggcttgaagg tggtggtggc ggacctggac 120
acggcggggg gcgagggcac cgtggcgctg atccgcgagg ccggtggcga ggcattgttc 180
gtgccgtgca acgttaccct ggaggcggat gtgcaaagcc tcatggcccg caccatcgaa 240
gcctatgggc gcctggatta cgccttcaac aatgccggta tcgagatcga aaagggccgc 300
cttgcggagg gctccatgga tgagttcgac gccatcatgg gggtcaacgt caaaggggtc 360
tggctgtgca tgaagtacca gttgccgctg ctgctggccc agggcggtgg ggcgatcgtc 420
aacaccgcct cggtggcggg cctgggcgcg gcgccgaaga tgagcatcta tgcggcctcc 480
aagcatgcgg tgatcggcct gaccaagtcg gcggccatcg aatatgcgaa gaagaaaatc 540
cgcgtgaacg cggtatgccc ggcggtgatc gacaccgaca tgttccgccg tgcctacgag 600
gcggacccga agaaggccga gttcgccgcg gccatgcacc cggtggggcg catcggcaag 660
gtcgaggaga tcgccagtgc ggtgctctac ctgtgcagcg atggcgcggc ctttaccacc 720
ggccatgcac tggcggtcga cggcggggcc accgcgatct ga                    762
 
<210>130
<211>253
<212>PRT
<213>荧光假单孢菌Pf-5
 
<400>130
Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala
 1               5                  10                  15
Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu
            20                  25                  30
Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val
        35                  40                  45
Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn
    50                  55                  60
Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu
65                  70                  75                  80
Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile
                85                  90                  95
Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile
            100                 105                 110
Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu
        115                 120                 125
Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser
    130                 135                 140
Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser
145                 150                 155                 160
Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala
                165                 170                 175
Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr
            180                 185                 190
Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe
        195                 200                 205
Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile
    210                 215                 220
Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr
225                 230                 235                 240
Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile
                245                 250
 
<210>131
<211>735
<212>DNA
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>131
atgaaacttg ccagtaaaac cgccattgtc accggcgccg cacgcggtat cggctttggc  60
attgcccagg tgcttgcgcg ggaaggcgcg cgagtgatta tcgccgatcg tgatgcacac  120
ggcgaagccg ccgccgcttc cctgcgcgaa tcgggcgcac aggcgctgtt tatcagctgc  180
aatatcgctg aaaaaacgca ggtcgaagcc ctgtattccc aggccgaaga ggcgtttggc  240
ccggtagaca ttctggtgaa taacgccgga atcaaccgcg acgccatgct gcacaaatta  300
acggaagcgg actgggacac ggttatcgac gttaacctga aaggcacttt cctctgtatg  360
cagcaggccg ctatccgcat gcgcgagcgc ggtgcgggcc gcattatcaa tatcgcttcc  420
gccagttggc ttggcaacgt cgggcaaacc aactattcgg cgtcaaaagc cggcgtggtg  480
ggaatgacca aaaccgcctg ccgcgaactg gcgaaaaaag gtgtcacggt gaatgccatc  540
tgcccgggct ttatcgatac cgacatgacg cgcggcgtac cggaaaacgt ctggcaaatc  600
atggtcagca aaattcccgc gggttacgcc ggcgaggcga aagacgtcgg cgagtgtgtg  660
gcgtttctgg cgtccgatgg cgcgcgctat atcaatggtg aagtgattaa cgtcggcggc  720
ggcatggtgc tgtaa                                                   735
 
<210>132
<211>253
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>132
Met Ser Met Thr Phe Ser Gly Gln Val Ala Leu Val Thr Gly Ala Ala
 1               5                  10                  15
Asn Gly Ile Gly Arg Ala Thr Ala Gln Ala Phe Ala Ala Gln Gly Leu
            20                  25                  30
Lys Val Val Val Ala Asp Leu Asp Thr Ala Gly Gly Glu Gly Thr Val
        35                  40                  45
Ala Leu Ile Arg Glu Ala Gly Gly Glu Ala Leu Phe Val Pro Cys Asn
    50                  55                  60
Val Thr Leu Glu Ala Asp Val Gln Ser Leu Met Ala Arg Thr Ile Glu
65                  70                  75                  80
Ala Tyr Gly Arg Leu Asp Tyr Ala Phe Asn Asn Ala Gly Ile Glu Ile
                85                  90                  95
Glu Lys Gly Arg Leu Ala Glu Gly Ser Met Asp Glu Phe Asp Ala Ile
            100                 105                 110
Met Gly Val Asn Val Lys Gly Val Trp Leu Cys Met Lys Tyr Gln Leu
        115                 120                 125
Pro Leu Leu Leu Ala Gln Gly Gly Gly Ala Ile Val Asn Thr Ala Ser
    130                 135                 140
Val Ala Gly Leu Gly Ala Ala Pro Lys Met Ser Ile Tyr Ala Ala Ser
145                 150                 155                 160
Lys His Ala Val Ile Gly Leu Thr Lys Ser Ala Ala Ile Glu Tyr Ala
                165                 170                 175
Lys Lys Lys Ile Arg Val Asn Ala Val Cys Pro Ala Val Ile Asp Thr
            180                 185                 190
Asp Met Phe Arg Arg Ala Tyr Glu Ala Asp Pro Lys Lys Ala Glu Phe
        195                 200                 205
Ala Ala Ala Met His Pro Val Gly Arg Ile Gly Lys Val Glu Glu Ile
    210                 215                 220
Ala Ser Ala Val Leu Tyr Leu Cys Ser Asp Gly Ala Ala Phe Thr Thr
225                 230                 235                 240
Gly His Ala Leu Ala Val Asp Gly Gly Ala Thr Ala Ile
                245                 250
 
<210>133
<211>750
<212>DNA
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>133
atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc  60
ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat  120
ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc  180
aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt  240
cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc  300
aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg  360
caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc  420
gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc  480
ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt  540
aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac  600
atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc  660
gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg  720
gacgttaacg gcggcatgtt aattcactaa                                   750
 
<210>134
<211>249
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>134
Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala
 1               5                  10                  15
Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala
            20                  25                  30
Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala
        35                  40                  45
Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp
    50                  55                  60
Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly
65                  70                  75                  80
Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys
                85                  90                  95
Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser
            100                 105                 110
Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg
        115                 120                 125
Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln
    130                 135                 140
Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala
145                 150                 155                 160
Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp
                165                 170                 175
Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile
            180                 185                 190
Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly
        195                 200                 205
Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala
    210                 215                 220
Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu
225                 230                 235                 240
Asp Val Asn Gly Gly Met Leu Ile His
                245
 
<210>135
<211>750
<212>DNA
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>135
atgttattga aagataaagt cgccattatt actggcgcgg cctccgcacg cggtttgggc 60
ttcgcgactg cgaaattatt cgccgaaaac ggcgcgaaag tggtcattat cgacctcaat 120
ggcgaagcca gtaaaaccgc cgcggcggca ttaggcgaag accatctcgg cctggcggcc 180
aacgtcgctg atgaagtgca ggtgcaggcg gccatcgaac agatcctggc gaaatacggt 240
cgggttgatg tactggtcaa taacgccggg attacccagc cgctgaagct gatggatatc 300
aagcgcgcca actatgacgc ggtgcttgat gttagcctgc gcggcacgct gctgatgtcg 360
caggcggtta tccccaccat gcgggcgcaa aaatccggca gcatcgtctg catctcgtcc 420
gtctccgccc agcgcggcgg cggtattttc ggcggaccgc actacagcgc ggcaaaagcc 480
ggggtgctgg gtctggcgcg ggcgatggcg cgcgagcttg gcccggataa cgtccgcgtt 540
aactgcatca ccccggggct gattcagacc gacattaccg ccggcaagct gactgatgac 600
atgacggcca acattcttgc cggcattccg atgaaccgcc ttggcgacgc gatagacatc 660
gcgcgcgccg cgctgttcct cggcagcgat ctttcctcct actccaccgg catcaccctg 720
gacgttaacg gcggcatgtt aattcactaa                                  750
 
<210>136
<211>249
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>136
Met Leu Leu Lys Asp Lys Val Ala Ile Ile Thr Gly Ala Ala Ser Ala
 1               5                  10                  15
Arg Gly Leu Gly Phe Ala Thr Ala Lys Leu Phe Ala Glu Asn Gly Ala
            20                  25                  30
Lys Val Val Ile Ile Asp Leu Asn Gly Glu Ala Ser Lys Thr Ala Ala
        35                  40                  45
Ala Ala Leu Gly Glu Asp His Leu Gly Leu Ala Ala Asn Val Ala Asp
    50                  55                  60
Glu Val Gln Val Gln Ala Ala Ile Glu Gln Ile Leu Ala Lys Tyr Gly
65                  70                  75                  80
Arg Val Asp Val Leu Val Asn Asn Ala Gly Ile Thr Gln Pro Leu Lys
                85                  90                  95
Leu Met Asp Ile Lys Arg Ala Asn Tyr Asp Ala Val Leu Asp Val Ser
            100                 105                 110
Leu Arg Gly Thr Leu Leu Met Ser Gln Ala Val Ile Pro Thr Met Arg
        115                 120                 125
Ala Gln Lys Ser Gly Ser Ile Val Cys Ile Ser Ser Val Ser Ala Gln
    130                 135                 140
Arg Gly Gly Gly Ile Phe Gly Gly Pro His Tyr Ser Ala Ala Lys Ala
145                 150                 155                 160
Gly Val Leu Gly Leu Ala Arg Ala Met Ala Arg Glu Leu Gly Pro Asp
                165                 170                 175
Asn Val Arg Val Asn Cys Ile Thr Pro Gly Leu Ile Gln Thr Asp Ile
            180                 185                 190
Thr Ala Gly Lys Leu Thr Asp Asp Met Thr Ala Asn Ile Leu Ala Gly
        195                 200                 205
Ile Pro Met Asn Arg Leu Gly Asp Ala Ile Asp Ile Ala Arg Ala Ala
    210                 215                 220
Leu Phe Leu Gly Ser Asp Leu Ser Ser Tyr Ser Thr Gly Ile Thr Leu
225                 230                 235                 240
Asp Val Asn Gly Gly Met Leu Ile His
                 245
<210>137
<211>714
<212>DNA
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
<400>137
atgacagcgt ttcacaacaa atcagtgctg gttttaggcg ggagtcgggg aattggcgcg 60
gcgatcgtca ggcgttttgt cgccgatggc gcgtcggtgg tgtttagcta ttccggttcg 120
ccggaagcgg ccgagcggct ggcggcagag accggcagca cggcggtgca ggcggacagc 180
gccgatcgcg atgcggtgat aagcctggtc cgcgacagcg gcccgctgga cgtgttagtg 240
gtcaatgccg ggatcgcgct tttcggtgac gctctcgagc aggacagcga tgcaatcgat 300
cgcctgttcc acatcaatat tcacgccccc taccatgcct ccgtcgaagc ggcgcgccgc 360
atgccggaag gcgggcgcat tattgtcatc ggctcagtca atggcgatcg catgccgttg 420
ccgggaatgg cggcctatgc gctcagcaaa tcggccctgc aggggctggc gcgcggcctg 480
gcgcgggatt ttggcccgcg cggcatcacg gtcaacgtcg tccagcccgg cccaattgat 540
accgacgcca acccggagaa cggcccgatg aaagagctga tgcacagctt tatggccatt 600
aagcgccatg gccgtccgga agaggtggcg ggaatggtgg cgtggctggc cggtccggag 660
gcgtcgtttg tcactggcgc catgcacacc atcgacggag cgtttggcgc ctga       714
 
<210>138
<211>237
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>138
Met Thr Ala Phe His Asn Lys Ser Val Leu Val Leu Gly Gly Ser Arg
 1               5                  10                  15
Gly Ile Gly Ala Ala Ile Val Arg Arg Phe Val Ala Asp Gly Ala Ser
            20                  25                  30
Val Val Phe Ser Tyr Ser Gly Ser Pro Glu Ala Ala Glu Arg Leu Ala
        35                  40                  45
Ala Glu Thr Gly Ser Thr Ala Val Gln Ala Asp Ser Ala Asp Arg Asp
    50                  55                  60
Ala Val Ile Ser Leu Val Arg Asp Ser Gly Pro Leu Asp Val Leu Val
65                  70                  75                  80
Val Asn Ala Gly Ile Ala Leu Phe Gly Asp Ala Leu Glu Gln Asp Ser
                85                  90                  95
Asp Ala Ile Asp Arg Leu Phe His Ile Asn Ile His Ala Pro Tyr His
            100                 105                 110
Ala Ser Val Glu Ala Ala Arg Arg Met Pro Glu Gly Gly Arg Ile Ile
        115                 120                 125
Val Ile Gly Ser Val Asn Gly Asp Arg Met Pro Leu Pro Gly Met Ala
    130                 135                 140
Ala Tyr Ala Leu Ser Lys Ser Ala Leu Gln Gly Leu Ala Arg Gly Leu
145                 150                 155                 160
Ala Arg Asp Phe Gly Pro Arg Gly Ile Thr Val Asn Val Val Gln Pro
                165                 170                 175
Gly Pro Ile Asp Thr Asp Ala Asn Pro Glu Asn Gly Pro Met Lys Glu
            180                 185                 190
Leu Met His Ser Phe Met Ala Ile Lys Arg His Gly Arg Pro Glu Glu
        195                 200                 205
Val Ala Gly Met Val Ala Trp Leu Ala Gly Pro Glu Ala Ser Phe Val
    210                 215                 220
Thr Gly Ala Met His Thr Ile Asp Gly Ala Phe Gly Ala
225                 230                 235
 
<210>139
<211>750
<212>DNA
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>139
atgaacggcc tgctaaacgg taaacgtatt gtcgtcaccg gtgcggcgcg cggtctcggg  60
taccactttg ccgaagcctg cgccgctcag ggcgcgacgg tggtgatgtg cgacatcctg  120
cagggagagc tggcggaaag cgctcatcgc ctgcagcaga agggctatca ggtcgaatct  180
cacgccatcg atcttgccag tcaagcatcg atcgagcagg tcttcagcgc catcggcgcg  240
caggggtcta tcgatggctt agtcaataac gcagcgatgg ccaccggcgt cggcggaaaa  300
aatatgatcg attacgatcc ggatctgtgg gatcgggtaa tgacggtcaa cgttaaaggc  360
acctggttgg tgacccgcgc ggcggtaccg ctgctgcgcg aaggggcggc gatcgtcaac  420
gtcgcttcgg ataccgcgct gtggggcgcg ccgcggctga tggcctatgt cgccagtaag  480
ggcgcggtga ttgcgatgac ccgctccatg gcccgcgagc tgggtgaaaa gcggatccgt  540
atcaacgcca tcgcgccggg actgacccgc gttgaggcca cggaatacgt tcccgccgag  600
cgtcatcagc tgtatgagaa cggccgcgcg ctcagcggcg cgcagcagcc ggaagatgtc  660
accggcagcg tggtctggct gctgagcgat ctttcgcgct ttatcaccgg ccaactgatc  720
ccggtcaacg gcggttttgt ctttaactaa                                   750
 
<210>140
<211>249
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>140
Met Asn Gly Leu Leu Asn Gly Lys Arg Ile Val Val Thr Gly Ala Ala
 1               5                  10                  15
Arg Gly Leu Gly Tyr His Phe Ala Glu Ala Cys Ala Ala Gln Gly Ala
            20                  25                  30
Thr Val Val Met Cys Asp Ile Leu Gln Gly Glu Leu Ala Glu Ser Ala
        35                  40                  45
His Arg Leu Gln Gln Lys Gly Tyr Gln Val Glu Ser His Ala Ile Asp
    50                  55                  60
Leu Ala Ser Gln Ala Ser Ile Glu Gln Val Phe Ser Ala Ile Gly Ala
65                  70                  75                  80
Gln Gly Ser Ile Asp Gly Leu Val Asn Asn Ala Ala Met Ala Thr Gly
                85                  90                  95
Val Gly Gly Lys Asn Met Ile Asp Tyr Asp Pro Asp Leu Trp Asp Arg
            100                 105                 110
Val Met Thr Val Asn Val Lys Gly Thr Trp Leu Val Thr Arg Ala Ala
        115                 120                 125
Val Pro Leu Leu Arg Glu Gly Ala Ala Ile Val Asn Val Ala Ser Asp
    130                 135                 140
Thr Ala Leu Trp Gly Ala Pro Arg Leu Met Ala Tyr Val Ala Ser Lys
145                 150                 155                 160
Gly Ala Val Ile Ala Met Thr Arg Ser Met Ala Arg Glu Leu Gly Glu
                165                 170                 175
Lys Arg Ile Arg Ile Asn Ala Ile Ala Pro Gly Leu Thr Arg Val Glu
            180                 185                 190
Ala Thr Glu Tyr Val Pro Ala Glu Arg His Gln Leu Tyr Glu Asn Gly
        195                 200                 205
Arg Ala Leu Ser Gly Ala Gln Gln Pro Glu Asp Val Thr Gly Ser Val
    210                 215                 220
Val Trp Leu Leu Ser Asp Leu Ser Arg Phe Ile Thr Gly Gln Leu Ile
225                 230                 235                 240
Pro Val Asn Gly Gly Phe Val Phe Asn
                245
 
<210>141
<211>795
<212>DNA
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
<400>141
atgaatgcac aaattgaagg gcgcgtcgcg gtagtcaccg gcggttcgtc aggaatcggc  60
tttgaaacgc tgcgcctgct gctgggcgaa ggggcgaaag tcgccttttg cggccgcaac  120
ccggatcggc ttgccagcgc ccatgcggcg ttgcaaaacg aatatccaga aggtgaggtg  180
ttctcctggc gctgtgacgt actgaacgaa gctgaagttg aggcgttcgc cgccgcggtc  240
gccgcgcgtt tcggcggcgt cgatatgctg attaataacg ccggccaggg ctatgtcgcc  300
cacttcgccg atacgccacg tgaggcctgg ctgcacgaag ccgaactgaa actgttcggc  360
gtgattaacc cggtaaaggc ctttcagtcc ctgctagagg cgtcggatat cgcctcgatt  420
acctgtgtga actcgctgct ggcgttacag ccggaagagc acatgatcgc cacctctgcc  480
gcccgcgccg cgctgctcaa tatgacgctg actctgtcga aagagctggt ggataaaggt  540
attcgtgtga attccattct gctggggatg gtggagtccg ggcagtggca gcgccgtttt  600
gagagccgaa gcgataagag ccagagttgg cagcagtgga ccgccgatat cgcccgtaag  660
cgggggatcc cgatggcgcg tctcggtaag ccgcaggagc cagcgcaagc gctgctattc  720
ctcgcttcgc cgctggcctc ctttaccacc ggcgcggcgc tggacgtttc cggcggtttc  780
tgtcgccatc tgtaa                                                   795
 
<210>142
<211>264
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>142
Met Asn Ala Gln Ile Glu Gly Arg Val Ala Val Val Thr Gly Gly Ser
 1               5                  10                  15
Ser Gly Ile Gly Phe Glu Thr Leu Arg Leu Leu Leu Gly Glu Gly Ala
            20                  25                  30
Lys Val Ala Phe Cys Gly Arg Asn Pro Asp Arg Leu Ala Ser Ala His
        35                  40                  45
Ala Ala Leu Gln Asn Glu Tyr Pro Glu Gly Glu Val Phe Ser Trp Arg
    50                  55                  60
Cys Asp Val Leu Asn Glu Ala Glu Val Glu Ala Phe Ala Ala Ala Val
65                  70                  75                  80
Ala Ala Arg Phe Gly Gly Val Asp Met Leu Ile Asn Asn Ala Gly Gln
                85                  90                  95
Gly Tyr Val Ala His Phe Ala Asp Thr Pro Arg Glu Ala Trp Leu His
            100                 105                 110
Glu Ala Glu Leu Lys Leu Phe Gly Val Ile Asn Pro Val Lys Ala Phe
        115                 120                 125
Gln Ser Leu Leu Glu Ala Ser Asp Ile Ala Ser Ile Thr Cys Val Asn
    130                 135                 140
Ser Leu Leu Ala Leu Gln Pro Glu Glu His Met Ile Ala Thr Ser Ala
145                 150                 155                 160
Ala Arg Ala Ala Leu Leu Asn Met Thr Leu Thr Leu Ser Lys Glu Leu
                165                 170                 175
Val Asp Lys Gly Ile Arg Val Asn Ser Ile Leu Leu Gly Met Val Glu
            180                 185                 190
Ser Gly Gln Trp Gln Arg Arg Phe Glu Ser Arg Ser Asp Lys Ser Gln
        195                 200                 205
Ser Trp Gln Gln Trp Thr Ala Asp Ile Ala Arg Lys Arg Gly Ile Pro
    210                 215                 220
Met Ala Arg Leu Gly Lys Pro Gln Glu Pro Ala Gln Ala Leu Leu Phe
225                 230                 235                 240
Leu Ala Ser Pro Leu Ala Ser Phe Thr Thr Gly Ala Ala Leu Asp Val
                245                 250                 255
Ser Gly Gly Phe Cys Arg His Leu
            260
 
<210>143
<211>1795
<212>DNA
<213>荧光假单孢菌
 
<400>143
cgccaagcaa tcgggctttg gggcagaatt gggtcgcgaa gggcttgagg agtttgccca  60
gtccaagatc atcaacgccg cgctataaat taaaggatcc cccatggcga tgattacagg  120
cggcgaactg gttgttcgca ccctaataaa ggctggggtc gaacatctgt tcggcctgca  180
cggcgcgcat atcgatacga tttttcaagc ctgtctcgat catgatgtgc cgatcatcga  240
cacccgccat gaggccgccg cagggcatgc ggccgagggc tatgcccgcg ctggcgccaa  300
gctgggcgtg gctggtcacg gcgggcgggg gatttaccaa tgcggtcacg cccattgcca  360
acgcttggct ggatcgcaag gccggtgtat tcctcacccg ggatcgggcg cgctgcgtga  420
tgatgaaacc aacacgttgc aggcggggat tgatcaggtc gccatggcgg cgcccattac  480
caaatgggcg catcgggtga tggcaaccga gcatatccca cggctggtga tgcaggcgat  540
ccgcgccgcg ttgagcgcgc cacgcgggcc ggtgttgctg gatctgccgt gggatattct  600
gatgaaccag attgatgagg atagcgtcat tatccccgat ctggtcttgt ccgcgcatgg  660
ggccagaccc gaccctgccg atctggatca ggctctcgcg cttttgcgca aggcggagcg  720
gccggtcatc gtgctcggct cagaagcctc gcggacagcg cgcaagacgg cgcttagcgc  780
cttcgtggcg gcgactggcg tgccggtgtt tgccgattat gaagggctaa gcatgctctc  840
ggggctgccc gatgctatgc ggggcgggct ggtgcaaaac ctctattctt ttgccaaagc  900
cgatgccgcg ccagatctcg tgctgatgct gggggcgcgc tttggcctta acaccgggca  960
tggatctggg cagttgatcc cccatagcgc gcaggtcatt caggtcgacc ctgatgcctg  1020
cgagctggga cgcctgcagg gcatcgctct gggcattgtg gccgatgtgg gtgggaccat  1080
cgaggctttg gcgcaggcca ccgcgcaaga tgcggcttgg ccggatcgcg gcgactggtg  1140
cgccaaagtg acggatctgg cgcaagagcg ctatgccagc atcgctgcga aatcgagcag  1200
cgagcatgcg ctccacccct ttcacgcctc gcaggtcatt gccaaacacg tcgatgcagg  1260
ggtgacggtg gtagcggatg gtgcgctgac ctatctctgg ctgtccgaag tgatgagccg  1320
cgtgaaaccc ggcggttttc tctgccacgg ctatctaggc tcgatgggcg tgggcttcgg  1380
cacggcgctg ggcgcgcaag tggccgatct tgaagcaggc cgccgcacga tccttgtgac  1440
cggcgatggc tcggtgggct atagcatcgg tgaatttgat acgctggtgc gcaaacaatt  1500
gccgctgatc gtcatcatca tgaacaacca aagctggggg gcgacattgc atttccagca  1560
attggccgtc ggccccaatc gcgtgacggg cacccgtttg gaaaatggct cctatcacgg  1620
ggtggccgcc gcctttggcg cggatggcta tcatgtcgac agtgtggaga gcttttctgc  1680
ggctctggcc caagcgctcg cccataatcg ccccgcctgc atcaatgtcg cggtcgcgct  1740
cgatccgatc ccgcccgaag aactcattct gatcggcatg gaccccttcg catga       1795
 
<210>144
<211>563
<212>PRT
<213>荧光假单孢菌
 
<400>144
Met Ala Met Ile Thr Gly Gly Glu Leu Val Val Arg Thr Leu Ile Lys
 1               5                  10                  15
Ala Gly Val Glu His Leu Phe Gly Leu His Gly Ala His Ile Asp Thr
            20                  25                  30
Ile Phe Gln Ala Cys Leu Asp His Asp Val Pro Ile Ile Asp Thr Arg
        35                  40                  45
His Glu Ala Ala Ala Gly His Ala Ala Glu Gly Tyr Ala Arg Ala Gly
    50                  55                  60
Ala Lys Leu Gly Val Ala Gly His Gly Gly Arg Gly Ile Tyr Gln Cys
65                  70                  75                  80
Gly His Ala His Cys Gln Arg Leu Ala Gly Ser Gln Gly Arg Cys Ile
                85                  90                  95
Pro His Pro Gly Ser Gly Ala Leu Arg Asp Asp Glu Thr Asn Thr Leu
            100                 105                 110
Gln Ala Gly Ile Asp Gln Val Ala Met Ala Ala Pro Ile Thr Lys Trp
        115                 120                 125
Ala His Arg Val Met Ala Thr Glu His Ile Pro Arg Leu Val Met Gln
    130                 135                 140
Ala Ile Arg Ala Ala Leu Ser Ala Pro Arg Gly Pro Val Leu Leu Asp
145                 150                 155                 160
Leu Pro Trp Asp Ile Leu Met Asn Gln Ile Asp Glu Asp Ser Val Ile
                165                 170                 175
Ile Pro Asp Leu Val Leu Ser Ala His Gly Ala Arg Pro Asp Pro Ala
            180                 185                 190
Asp Leu Asp Gln Ala Leu Ala Leu Leu Arg Lys Ala Glu Arg Pro Val
        195                 200                 205
Ile Val Leu Gly Ser Glu Ala Ser Arg Thr Ala Arg Lys Thr Ala Leu
    210                 215                 220
Ser Ala Phe Val Ala Ala Thr Gly Val Pro Val Phe Ala Asp Tyr Glu
225                 230                 235                 240
Gly Leu Ser Met Leu Ser Gly Leu Pro Asp Ala Met Arg Gly Gly Leu
                245                 250                 255
Val Gln Asn Leu Tyr Ser Phe Ala Lys Ala Asp Ala Ala Pro Asp Leu
            260                 265                 270
Val Leu Met Leu Gly Ala Arg Phe Gly Leu Asn Thr Gly His Gly Ser
        275                 280                 285
Gly Gln Leu Ile Pro His Ser Ala Gln Val Ile Gln Val Asp Pro Asp
    290                 295                 300
Ala Cys Glu Leu Gly Arg Leu Gln Gly Ile Ala Leu Gly Ile Val Ala
305                 310                 315                 320
Asp Val Gly Gly Thr Ile Glu Ala Leu Ala Gln Ala Thr Ala Gln Asp
                325                 330                 335
Ala Ala Trp Pro Asp Arg Gly Asp Trp Cys Ala Lys Val Thr Asp Leu
            340                 345                 350
Ala Gln Glu Arg Tyr Ala Ser Ile Ala Ala Lys Ser Ser Ser Glu His
        355                 360                 365
Ala Leu His Pro Phe His Ala Ser Gln Val Ile Ala Lys His Val Asp
    370                 375                 380
Ala Gly Val Thr Val Val Ala Asp Gly Ala Leu Thr Tyr Leu Trp Leu
385                 390                 395                 400
Ser Glu Val Met Ser Arg Val Lys Pro Gly Gly Phe Leu Cys His Gly
                405                 410                 415
Tyr Leu Gly Ser Met Gly Val Gly Phe Gly Thr Ala Leu Gly Ala Gln
            420                 425                 430
Val Ala Asp Leu Glu Ala Gly Arg Arg Thr Ile Leu Val Thr Gly Asp
        435                 440                 445
Gly Ser Val Gly Tyr Ser Ile Gly Glu Phe Asp Thr Leu Val Arg Lys
    450                 455                 460
Gln Leu Pro Leu Ile Val Ile Ile Met Asn Asn Gln Ser Trp Gly Ala
465                 470                 475                 480
Thr Leu His Phe Gln Gln Leu Ala Val Gly Pro Asn Arg Val Thr Gly
                485                 490                 495
Thr Arg Leu Glu Asn Gly Ser Tyr His Gly Val Ala Ala Ala Phe Gly
            500                 505                 510
Ala Asp Gly Tyr His Val Asp Ser Val Glu Ser Phe Ser Ala Ala Leu
        515                 520                 525
Ala Gln Ala Leu Ala His Asn Arg Pro Ala Cys Ile Asn Val Ala Val
    530                 535                 540
Ala Leu Asp Pro Ile Pro Pro Glu Glu Leu Ile Leu Ile Gly Met Asp
545                 550                 555                 560
Pro Phe Ala
 
<210>145
<211>9
<212>PRT
<213>人工序列
 
<220>
<223>与自动转运蛋白粘附或I型分泌靶重复相似的多肽
 
<220>
<221>变体
<222>3,5,7,8,9
<223>Xaa=任何氨基酸
 
<400>145
Gly Gly Xaa Gly Xaa Asp Xaa Xaa Xaa
 1               5
<210>146
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>146
gtctttattc atatatatat cctccttaat tcaaccgttc aatcaccatc    50
 
<210>147
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>147
gggcggccgc aaggggttcg cgttggccga                          30
 
<210>148
<211>22
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>148
ggagaaaata ccgcatcagg cg                                  22
 
<210>149
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>149
cgggatccaa gttgcaggat atgacgaaag cg                       32
 
<210>150
<211>33
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>150
gctctagaag attatccctg tctgcggaag cgg    33
 
<210>151
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>151
gctctagagg ggtgcctaat gagtgagcta ac     32
 
<210>152
<211>33
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>152
cgggatccgc gttaatattt tgttaaaatt cgc    33
 
<210>153
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
  
<400>153
gctctagagt ttatgtcgca cccgccgttg g     31
 
<210>154
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>154
cccaagctta gaaagggaaa ttgtggtagc cc    32
 
<210>155
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>155
ggaattccat atgcgtccct ctgccccggc c     31
 
<210>156
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>156
cgggatcctt agaactgctt gggaagggag                          30
 
<210>157
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>157
aggtacggtg aaataaagga ggatatacat atgtccaaaa agattgccgt    50
 
<210>158
<211>37
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>158
ttttcctttt gcggccgccc cgctggcatc gcctcac                   37
 
<210>159
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>159
ggcgatgcca gcgtaaagga ggatatacat atgaaaaact ggaaaacaag    50
 
<210>160
<211>37
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>160
ttttcctttt gcggccgccc cagcttagcg ccttcta                  37
 
<210>161
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>161
cccgagctct taggaggatt agtcatggaa c                      31
 
<210>162
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>162
gctctagatt attttgaata atcgtagaaa cc                     32
 
<210>163
<211>42
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>163
gctctagagg aggatatata tatgaaaaat tgtgtcatcg tc          42
 
<210>164
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>164
aactgcagtt aattcaaccg ttcaatcacc                        30
 
<210>165
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>165
cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg      46
 
<210>166
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>166
ggttgaatta aggaggatat atatatgaat aaagacacac taatacctac  50
 
<210>167
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>167
cccaagctta gccggcaagt acacatcttc                      30
 
<210>168
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>168
cgagctcagg aggatatata tatgaaaaat tgtgtcatcg tcagtg    46
 
<210>169
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>169
cccaagctta gccggcaagt acacatcttc                      30
 
<210>170
<211>40
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>170
aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg           40
 
<210>171
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>171
cggggtaccg cggatacata tttgaatgta tttag                35
 
<210>172
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>172
aaggaaaaaa gcggccgcgc ggatacatat ttgaatgtat ttag          44
 
<210>173
<211>43
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>173
gctctagagg aggatatata tatggctaac tacttcaata cac           43
 
<210>174
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>174
tgctgttgcg ggttaaggag gatatatata tgcctaagta ccgttccgcc    50
 
<210>175
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>175
aacggtactt aggcatatat atatcctcct taacccgcaa cagcaatacg    50
 
<210>176
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>176
acatgcatgc ttaacccccc agtttcgatt                          30
 
<210>177
<211>43
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>177
gctctagagg aggatatata tatggctaac tacttcaata cac          43
 
<210>178
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>178
acatgcatgc ttaacccccc agtttcgatt                     30
 
<210>179
<211>43
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>179
cccgagctca ggaggatata tatatggata aacagtatcc ggt     43
 
<210>180
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>180
gctctagatt acagaatttg actcaggt                       28
 
<210>181
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>181
cccgagctca ggaggatata tatatgttga caaaagcaac aaaag    45
 
<210>182
<211>25
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>182
ctctaaatct ctggaaaggg taccg                          25
 
<210>183
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>183
gctctagatt agagagcttt cgttttcatg                       30
 
<210>184
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>184
cccgagctca ggaggatata tatatgttga caaaagcaac aaaag      45
 
<210>185
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>185
gctctagatt agagagcttt cgttttcatg                       30
 
<210>186
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>186
cgagctcagg aggatatata tatgagccag caagtcatta ttttcg    46
 
<210>187
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>187
aaaactgcag cgtttgatga cgtggacgat agcgg                35
 
<210>188
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>188
cgagctcagg aggatatata tatgagccag caagtcatta ttttcg    46
 
<210>189
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>189
aggggtgtaa ggaggatata tatatggcta agacgttata cgaaaaattg      50
 
<210>190
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>190
cgtcttagcc atatatatat cctccttaca ccccttctgc tacatagcgg     50
 
<210>191
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>191
aaaactgcag cgtttgatga cgtggacgat agcgg                     35
 
<210>192
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>192
cgagctcagg aggatatata tatgagccag caagtcatta ttttcg        46
 
<210>193
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>193
aaaactgcag cgtttgatga cgtggacgat agcgg                    35
 
<210>194
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>194
cgagctcagg aggatatata tatgagccag caagtcatta ttttcg       46
 
<210>195
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>195
gaaaccgtgt gaggaggata tatatatgtc gaagaattac catattgccg    50
 
<210>196
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>196
aggggtgtaa ggaggatata tatatggcta agacgttata cgaaaaattg    50
 
<210>197
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>197
acattaaata aggaggatat atatatggca gagaaattta tcaaacacac    50
 
<210>198
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>198
attcttcgac atatatatat cctcctcaca cggtttcctt gttgttttcg    50
 
<210>199
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>199
cgtcttagcc atatatatat cctccttaca ccccttctgc tacatagcgg    50
 
<210>200
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>200
tttctctgcc atatatatat cctccttatt taatgttgcg aatgtcggcg    50
 
<210>201
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>201
aaaactgcag cgtttgatga cgtggacgat agcgg                    35
 
<210>202
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>202
cgagctcagg aggatatata tatgagccag caagtcatta ttttcg        46
 
<210>203
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>203
aaaactgcag cgtttgatga cgtggacgat agcgg                    35
 
<210>204
<211>40
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>204
aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg               40
 
<210>205
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>205
cggggtaccg cggatacata tttgaatgta tttag            35
 
<210>206
<211>42
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>206
aaggaaaaaa gcggccgcac ttttcatact cccgccattc ag    42
 
<210>207
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>207
caaaggccgt ctgcacgcgc cgaaaggcaa a                31
 
<210>208
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>208
tttgcctttc ggcgcgtgca gacggccttt g                31
 
<210>209
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>209
acatgcatgc cgtttgatga cgtggacgat agcgg           35
 
<210>210
<211>42
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>210
aaggaaaaaa gcggccgcac ttttcatact cccgccattc ag   42
 
<210>211
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>211
acatgcatgc cgtttgatga cgtggacgat agcgg                  35
 
<210>212
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>212
cccgagctca ggaggatata tatatgaatt atcagaacga cgatttac    48
 
<210>213
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>213
gcgtcgcggg taaggaggaa aattttatgt cctcacgtaa agagcttgcc   50
 
<210>214
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>214
gaactgctgt aaggaggtta aaattatgga gaggattgtc gttactctcg   50
 
<210>215
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>215
caatcagcgt aaggaggtat atataatgaa aaccgtaact gtaaaagatc   50
 
<210>216
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>216
tacaccaggc ataaggagga attaattatg gaaacctatg ctgtttttgg    50
 
<210>217
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>217
tacgtgagga cataaaattt tcctccttac ccgcgacgcg cttttactgc    50
 
<210>218
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>218
caatcctctc cataatttta acctccttac agcagttctt ttgctttcgc    50
 
<210>219
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>219
caatcagcgt aaggaggtat atataatgaa aaccgtaact gtaaaagatc    50
 
<210>220
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>220
tacggttttc attatatata cctccttacg ctgattgaca atcggcaatg    50
 
<210>221
<211>34
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>221
acatgcatgc ttacgcggac aattcctcct gcaa                     34
 
<210>222
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>222
cccgagctca ggaggatata tatatgaatt atcagaacga cgatttac     48
 
<210>223
<211>34
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>223
acatgcatgc ttacgcggac aattcctcct gcaa                     34
 
<210>224
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>224
cccgagctca ggaggatata tatatgacat cggaaaaccc gttactgg      48
 
<210>225
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>225
gatccaacct aaggaggaaa attttatgac acaacctctt tttctgatcg    50
 
<210>226
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>226
gatcaattgt taaggaggta tatataatgg aatccctgac gttacaaccc    50
 
<210>227
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>227
caggcagcct aaggaggaat taattatggc tggaaacaca attggacaac    50
 
<210>228
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>228
aggttgtgtc ataaaatttt cctccttagg ttggatcaac aggcactacg    50
 
<210>229
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>229
cagggattcc attatatata cctccttaac aattgatcgt ctgtgccagg    50
 
<210>230
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>230
gtttccagcc ataattaatt cctccttagg ctgcctggct aatccgcgcc    50
 
<210>231
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>231
acatgcatgc ttaccagcgt ggaatatcag tcttc                   35
 
<210>232
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>232
cccgagctca ggaggatata tatatgacat cggaaaaccc gttactgg     48
 
<210>233
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>233
acatgcatgc ttaccagcgt ggaatatcag tcttc                    35
 
<210>234
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>234
cccgagctca ggaggatata tatatggttg ctgaattgac cgcattac      48
 
<210>235
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>235
aatcgccagt aaggaggaaa attttatgac acaacctctt tttctgatcg    50
 
<210>236
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>236
gatcaattgt taaggaggta tatataatgg aatccctgac gttacaaccc    50
 
<210>237
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>237
caggcagcct aaggaggaat taattatggc tggaaacaca attggacaac    50
 
<210>238
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>238
gaggttgtgt cataaaattt tcctccttac tggcgattgt cattcgcctg    50
 
<210>239
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>239
cagggattcc attatatata cctccttaac aattgatcgt ctgtgccagg    50
 
<210>240
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>240
gtttccagcc ataattaatt cctccttagg ctgcctggct aatccgcgcc    50
 
<210>241
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>241
acatgcatgc ttaccagcgt ggaatatcag tcttc                    35
 
<210>242
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>242
cccgagctca ggaggatata tatatggttg ctgaattgac cgcattac     48
 
<210>243
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>243
acatgcatgc ttaccagcgt ggaatatcag tcttc                   35
 
<210>244
<211>40
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>244
aaggaaaaaa gcggccgccc ctgaaccgac gaccgggtcg         40
 
<210>245
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>245
gctctagaac ttttcatact cccgccattc ag                 32
 
<210>246
<211>34
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>246
gctctagagc ggatacatat ttgaatgtat ttag               34
 
<210>247
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>247
aaggaaaaaa gcggccgcgc ggatacatat ttgaatgtat ttag    44
 
<210>248
<211>26
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>248
catgccatgg ctatgattac tggtgg                        26
 
<210>249
<211>33
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>249
ccccgagctc ttacgcgccg gattggaaat aca                    33
 
<210>250
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>250
catgccatgg ccaaagttac aaatcaaaaa g                      31
 
<210>251
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>251
cgagctctta aaatgatttt atatagatat cc                    32
 
<210>252
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>252
catgccatgg gtattccaga aactcaaaaa g                     31
 
<210>253
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>253
cccgagctct tatttagaag tgtcaacaac g                     31
 
<210>254
<211>47
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>254
ccccgagctc aggaggatat acatatgaat aaagacacac taatacc    47
 
<210>255
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>255
cccaagctta gccggcaagt acacatcttc                    30
 
<210>256
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>256
cccgagctca ggaggatata tatatgtata cagtaggaga ttacc   45
 
<210>257
<211>33
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>257
gctctagatt atgatttatt ttgttcagca aat               33
 
<210>258
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>258
cccgagctca ggaggatata tatatgtata cagtaggaga ttacc  45
 
<210>259
<211>33
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>259
gctctagatt atgatttatt ttgttcagca aat              33
 
<210>260
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>260
cgagctcagg aggatatata tatgaaaaaa gtcgcacttg ttaccg        46
 
<210>261
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>261
ggccggcggc cgcgcgatgg cggtgaaagt g                        31
 
<210>262
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>262
aactaatcta gaggaggata tatatatgag catgacgttt tccggccagg    50
 
<210>263
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>263
ccttgcggag ggctcgatgg atgagttcga c                        31
 
<210>264
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>264
cactttcacc gccatcgcgc ggccgccggc c                        31
 
<210>265
<211>50
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>265
gctcatatat atatcctcct ctagattagt taaacaccat cccgccgtcg    50
 
<210>266
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>266
gtcgaactca tccatcgagc cctccgcaag g                     31
 
<210>267
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>267
cccaagctta gatcgcggtg gccccgccgt cg                    32
 
<210>268
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>268
cgagctcagg aggatatata tatgaaaaaa gtcgcacttg ttaccg    46
 
<210>269
<211>32
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>269
cccaagctta gatcgcggtg gccccgccgt cg                   32
 
<210>270
<211>43
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>270
gctctagagg aggatttaaa aatggaaatt aacgaaacgc tgc       43
 
<210>271
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>271
tccccgcggt taagcatggc gatcccgaaa tggaatccct ttgac    45
 
<210>272
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>272
ccgctcgagg aggatatata tatgagatcg aaaagatttg aagc     44
 
<210>273
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>273
gctctagatt agccaagttc attgggatcg                     30
 
<210>274
<211>33
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>274
cggggtacca cttttcatac tcccgccatt cag                 33
 
<210>275
<211>25
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>275
cggtaccctt tccagagatt tagag                          25
 
<210>276
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>276
ggaattccat atgttcacaa cgtccgccta                     30
 
<210>277
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>277
gcttgacggc catgtggccg aggccgc       27
 
<210>278
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>278
gcggcctcgg ccacatggcc gtcaagc       27
 
<210>279
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>279
cgggatcctt aggcggcctt ctggcgcg      28
 
<210>280
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>280
ggaattccat atggctattg caagaggtta    30
 
<210>281
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>281
cgggatcctt aagcgtcgag cgaggcca      28
 
<210>282
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>282
ggaattccat atgactaaaa caatgaaggc    30
 
<210>283
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>283
caccggggcc ggggtccggt attgcca       27
 
<210>284
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>284
tggcaatacc ggaccccggc cccggtg       27
 
<210>285
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>285
cgggatcctt aggcggcgag atccacga     28
 
<210>286
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>286
ggaattccat atgaccgggg cgaaccagcc   30
 
<210>287
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>287
atagccgctc atacgcctcg gttgcct      27
 
<210>288
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>288
aggcaaccga ggcgtatgag cggctat       27
 
<210>289
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>289
cgggatcctt aagcgccgtg cggaagga      28
 
<210>290
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>290
ggaattccat atgaccatgc atgccattca    30
 
<210>291
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>291
cgggatcctt attcggctgc aaattgca      28
 
<210>292
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>292
ggaattccat atgcgcgcgc tttattacga    30
 
<210>293
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>293
cgggatcctt attcgaaccg gtcgatga       28
 
<210>294
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>294
ggaattccat atgctggcga ttttctgtga     30
 
<210>295
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>295
cgggatcctt atgcgacctc caccatgc       28
 
<210>296
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>296
ggaattccat atgaaagcct tcgtcgtcga     30
 
<210>297
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>297
cgggatcctt aggatgcgta tgtaacca      28
 
<210>298
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>298
ggaattccat atgaaagcga ttgtcgccca    30
 
<210>299
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>299
cgggatcctt aggaaaaggc gatctgca      28
 
<210>300
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>300
ggaattccat atgccgatgg cgctcgggca    30
 
<210>301
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>301
cgggatcctt agaattcgat gacttgcc      28
 
<210>302
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>302
ggaattccat atgaaacatt ctcaggacaa    30
 
<210>303
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>303
gggcgccgat catgtggtgc gtttccg      27
 
<210>304
<211>27
<212>DNA
<213>人工序列
 
<220>
<223>引物
<400>304
cggaaacgca ccacatgatc ggcgccc      27
 
<210>305
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>305
cgggatcctt atgccatacg ttccatat     28
 
<210>306
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>306
ggaattccat atgcagcgtt ttaccaacag   30
 
<210>307
<211>28
<212>DNA
<213>人工序列
 
<220>
<223>引物
 
<400>307
cgggatcctt aggaaaacag gacgccgc     28
 
<210>308
<211>610
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH 78578
 
<400>308
Met Arg Tyr Ile Ala Gly Ile Asp Ile Gly Asn Ser Ser Thr Glu Val
 1               5                  10                  15
Ala Leu Ala Thr Val Asp Asp Ala Gly Val Leu Asn Ile Arg His Ser
            20                  25                  30
Ala Leu Ala Glu Thr Thr Gly Ile Lys Gly Thr Leu Arg Asn Val Phe
        35                  40                  45
Gly Ile Gln Glu Ala Leu Thr Gln Ala Ala Lys Ala Ala Gly Ile Gln
    50                  55                  60
Leu Ser Asp Ile Ser Leu Ile Arg Ile Asn Glu Ala Thr Pro Val Ile
65                  70                  75                  80
Gly Asp Val Ala Met Glu Thr Ile Thr Glu Thr Ile Ile Thr Glu Ser
                85                  90                  95
Thr Met Ile Gly His Asn Pro Lys Thr Pro Gly Gly Val Gly Leu Gly
            100                 105                 110
Val Gly Ile Thr Ile Thr Pro Glu Ala Leu Leu Ser Cys Ser Ala Asp
        115                 120                 125
Thr Pro Tyr Ile Leu Val Val Ser Ser Ala Phe Asp Phe Ala Asp Val
    130                 135                 140
Ala Ala Met Val Asn Ala Ala Thr Ala Ala Gly Tyr Gln Ile Thr Gly
145                 150                 155                 160
Ile Ile Leu Gln Gln Asp Asp Gly Val Leu Val Asn Asn Arg Leu Gln
                165                 170                 175
Gln Pro Leu Pro Val Ile Asp Glu Val Gln His Ile Asp Arg Ile Pro
            180                 185                 190
Leu Gly Met Leu Ala Ala Val Glu Val Ala Leu Pro Gly Lys Ile Ile
        195                 200                 205
Glu Thr Leu Ser Asn Pro Tyr Gly Ile Ala Thr Val Phe Asp Leu Asn
    210                 215                 220
Ala Glu Glu Thr Lys Asn Ile Val Pro Met Ala Arg Ala Leu Ile Gly
225                 230                 235                 240
Asn Arg Ser Ala Val Val Val Lys Thr Pro Ser Gly Asp Val Lys Ala
                245                 250                 255
Arg Ala Ile Pro Ala Gly Asn Leu Leu Leu Ile Ala Gln Gly Arg Ser
            260                 265                 270
Val Gln Val Asp Val Ala Ala Gly Ala Glu Ala Ile Met Lys Ala Val
        275                 280                 285
Asp Gly Cys Gly Lys Leu Asp Asn Val Ala Gly Glu Ala Gly Thr Asn
    290                 295                 300
Ile Gly Gly Met Leu Glu His Val Arg Gln Thr Met Ala Glu Leu Thr
305                 310                 315                 320
Asn Lys Pro Ala Gln Glu Ile Arg Ile Gln Asp Leu Leu Ala Val Asp
                325                 330                 335
Thr Ala Val Pro Val Ser Val Thr Gly Gly Leu Ala Gly Glu Phe Ser
            340                 345                 350
Leu Glu Gln Ala Val Gly Ile Ala Ser Met Val Lys Ser Asp Arg Leu
        355                 360                 365
Gln Met Ala Leu Ile Ala Arg Glu Ile Glu His Lys Leu Gln Ile Ala
    370                 375                 380
Val Gln Val Gly Gly Ala Glu Ala Glu Ala Ala Ile Leu Gly Ala Leu
385                 390                 395                 400
Thr Thr Pro Gly Thr Thr Arg Pro Leu Ala Ile Leu Asp Leu Gly Ala
                405                 410                 415
Gly Ser Thr Asp Ala Ser Ile Ile Asn Ala Gln Gly Glu Ile Ser Ala
            420                 425                 430
Thr His Leu Ala Gly Ala Gly Asp Met Val Thr Met Ile Ile Ala Arg
        435                 440                 445
Glu Leu Gly Leu Glu Asp Arg Tyr Leu Ala Glu Glu Ile Lys Lys Tyr
    450                 455                 460
Pro Leu Ala Lys Val Glu Ser Leu Phe His Leu Arg His Glu Asp Gly
465                 470                 475                 480
Ser Val Gln Phe Phe Pro Ser Ala Leu Pro Pro Ala Val Phe Ala Arg
                485                 490                 495
Val Cys Val Val Lys Pro Asp Glu Leu Val Pro Leu Pro Gly Asp Leu
            500                 505                 510
Pro Leu Glu Lys Val Arg Ala Ile Arg Arg Ser Ala Lys Ser Arg Val
        515                 520                 525
Phe Val Thr Asn Ala Leu Arg Ala Leu Arg Gln Val Ser Pro Thr Gly
    530                 535                 540
Asn Ile Arg Asp Ile Pro Phe Val Val Leu Val Gly Gly Ser Ser Leu
545                 550                 555                 560
Asp Phe Glu Ile Pro Gln Leu Val Thr Asp Ala Leu Ala His Tyr Arg
                565                 570                 575
Leu Val Ala Gly Arg Gly Asn Ile Arg Gly Cys Glu Gly Pro Arg Asn
            580                 585                 590
Ala Val Ala Ser Gly Leu Leu Leu Ser Trp Gln Lys Gly Gly Thr His
        595                 600                 605
Gly Glu
610
 
<210>309
<211>116
<212>PRT
<213>肺炎克雷伯氏菌肺炎亚种MGH78578
 
<400>309
Met Glu Ser Ser Val Val Ala Pro Ala Ile Val Ile Ala Val Thr Asp
 1               5                  10                  15
Glu Cys Ser Glu Gln Trp Arg Asp Val Leu Leu Gly Ile Glu Glu Glu
            20                  25                  30
Gly Ile Pro Phe Val Leu Gln Pro Gln Thr Gly Gly Asp Leu Ile His
        35                  40                  45
His Ala Trp Gln Ala Ala Gln Arg Ser Pro Leu Gln Val Gly Ile Ala
    50                  55                  60
Cys Asp Arg Glu Arg Leu Ile Val His Tyr Lys Asn Leu Pro Ala Ser
65                  70                  75                  80
Thr Pro Leu Phe Ser Leu Met Tyr His Gln Asn Arg Leu Ala Arg Arg
                85                  90                  95
Asn Thr Gly Asn Asn Ala Ala Arg Leu Val Lys Gly Ile Pro Phe Arg
            100                 105                 110
Asp Arg His Ala
        115
 
<210>310
<211>787
<212>PRT
<213>丁酸梭菌
 
<400>310
Met Ile Ser Lys Gly Phe Ser Thr Gln Thr Glu Arg Ile Asn Ile Leu
 1               5                  10                  15
Lys Ala Gln Ile Leu Asn Ala Lys Pro Cys Val Glu Ser Glu Arg Ala
            20                  25                  30
Ile Leu Ile Thr Glu Ser Phe Lys Gln Thr Glu Gly Gln Pro Ala Ile
        35                  40                  45
Leu Arg Arg Ala Leu Ala Leu Lys His Ile Leu Glu Asn Ile Pro Ile
    50                  55                 60
Thr Ile Arg Asp Gln Glu Leu Ile Val Gly Ser Leu Thr Lys Glu Pro
65                  70                  75                  80
Arg Ser Ser Gln Val Phe Pro Glu Phe Ser Asn Lys Trp Leu Gln Asp
                85                  90                  95
Glu Leu Asp Arg Leu Asn Lys Arg Thr Gly Asp Ala Phe Gln Ile Ser
            100                 105                 110
Glu Glu Ser Lys Glu Lys Leu Lys Asp Val Phe Glu Tyr Trp Asn Gly
        115                 120                 125
Lys Thr Thr Ser Glu Leu Ala Thr Ser Tyr Met Thr Glu Glu Thr Arg
    130                 135                 140
Glu Ala Val Asn Cys Asp Val Phe Thr Val Gly Asn Tyr Tyr Tyr Asn
145                 150                 155                 160
Gly Val Gly His Val Ser Val Asp Tyr Gly Lys Val Leu Arg Val Gly
                165                 170                 175
Phe Asn Gly Ile Ile Asn Glu Ala Lys Glu Gln Leu Glu Lys Asn Arg
            180                 185                 190
Ser Ile Asp Pro Asp Phe Ile Lys Lys Glu Lys Phe Leu Asn Ser Val
        195                 200                 205
Ile Ile Ser Cys Glu Ala Ala Ile Thr Tyr Val Asn Arg Tyr Ala Lys
    210                 215                 220
Lys Ala Lys Glu Ile Ala Asp Asn Thr Ser Asp Ala Lys Arg Lys Ala
225                 230                 235                 240
Glu Leu Asn Glu Ile Ala Lys Ile Cys Ser Lys Val Ser Gly Glu Gly
                245                 250                 255
Ala Lys Ser Phe Tyr Glu Ala Cys Gln Leu Phe Trp Phe Ile His Ala
            260                 265                 270
Ile Ile Asn Ile Glu Ser Asn Gly His Ser Ile Ser Pro Ala Arg Phe
        275                 280                 285
Asp Gln Tyr Met Tyr Pro Tyr Tyr Glu Asn Asp Lys Asn Ile Thr Asp
    290                 295                 300
Lys Phe Ala Gln Glu Leu Ile Asp Cys Ile Trp Ile Lys Leu Asn Asp
305                 310                 315                 320
Ile Asn Lys Val Arg Asp Glu Ile Ser Thr Lys His Phe Gly Gly Tyr
                325                 330                 335
Pro Met Tyr Gln Asn Leu Ile Val Gly Gly Gln Asn Ser Glu Gly Lys
            340                 345                 350
Asp Ala Thr Asn Lys Val Ser Tyr Met Ala Leu Glu Ala Ala Val His
        355                 360                 365
Val Lys Leu Pro Gln Pro Ser Leu Ser Val Arg Ile Trp Asn Lys Thr
    370                 375                 380
Pro Asp Glu Phe Leu Leu Arg Ala Ala Glu Leu Thr Arg Glu Gly Leu
385                 390                 395                 400
Gly Leu Pro Ala Tyr Tyr Asn Asp Glu Val Ile Ile Pro Ala Leu Val
                405                 410                 415
Ser Arg Gly Leu Thr Leu Glu Asp Ala Arg Asp Tyr Gly Ile Ile Gly
            420                 425                 430
Cys Val Glu Pro Gln Lys Pro Gly Lys Thr Glu Gly Trp His Asp Ser
        435                 440                 445
Ala Phe Phe Asn Leu Ala Arg Ile Val Glu Leu Thr Ile Asn Ser Gly
    450                 455                 460
Phe Asp Lys Asn Lys Gln Ile Gly Pro Lys Thr Gln Asn Phe Glu Glu
465                 470                 475                 480
Met Lys Ser Phe Asp Glu Phe Met Lys Ala Tyr Lys Ala Gln Met Glu
                485                 490                 495
Tyr Phe Val Lys His Met Cys Cys Ala Asp Asn Cys Ile Asp Ile Ala
            500                 505                 510
His Ala Glu Arg Ala Pro Leu Pro Phe Leu Ser Ser Met Val Asp Asn
        515                 520                 525
Cys Ile Gly Lys Gly Lys Ser Leu Gln Asp Gly Gly Ala Glu Tyr Asn
    530                 535                 540
Phe Ser Gly Pro Gln Gly Val Gly Val Ala Asn Ile Gly Asp Ser Leu
545                 550                 555                 560
Val Ala Val Lys Lys Ile Val Phe Asp Glu Asn Lys Ile Thr Pro Ser
                565                 570                 575
Glu Leu Lys Lys Thr Leu Asn Asn Asp Phe Lys Asn Ser Glu Glu Ile
            580                 585                 590
Gln Ala Leu Leu Lys Asn Ala Pro Lys Phe Gly Asn Asp Ile Asp Glu
        595                 600                 605
Val Asp Asn Leu Ala Arg Glu Gly Ala Leu Val Tyr Cys Arg Glu Val
    610                 615                 620
Asn Lys Tyr Thr Asn Pro Arg Gly Gly Asn Phe Gln Pro Gly Leu Tyr
625                 630                 635                 640
Pro Ser Ser Ile Asn Val Tyr Phe Gly Ser Leu Thr Gly Ala Thr Pro
                645                 650                 655
Asp Gly Arg Lys Ser Gly Gln Pro Leu Ala Asp Gly Val Ser Pro Ser
            660                 665                 670
Arg Gly Cys Asp Val Ser Gly Pro Thr Ala Ala Cys Asn Ser Val Ser
        675                 680                 685
Lys Leu Asp His Phe Ile Ala Ser Asn Gly Thr Leu Phe Asn Gln Lys
    690                 695                 700
Phe His Pro Ser Ala Leu Lys Gly Asp Asn Gly Leu Met Asn Leu Ser
705                 710                 715                 720
Ser Leu Ile Arg Ser Tyr Phe Asp Gln Lys Gly Phe His Val Gln Phe
                725                 730                 735
Asn Val Ile Asp Lys Lys Ile Leu Leu Ala Ala Gln Lys Asn Pro Glu
            740                 745                 750
Lys Tyr Gln Asp Leu Ile Val Arg Val Ala Gly Tyr Ser Ala Gln Phe
        755                 760                 765
Ile Ser Leu Asp Lys Ser Ile Gln Asn Asp Ile Ile Ala Arg Thr Glu
    770                 775                 780
His Val Met
785
 
<210>311
<211>304
<212>PRT
<213>肉毒梭菌
 
<400>311
Met Ser Lys Glu Ile Lys Gly Val Leu Phe Asn Ile Gln Lys Phe Ser
 1               5                  10                  15
Leu His Asp Gly Pro Gly Ile Arg Thr Ile Val Phe Phe Lys Gly Cys
            20                  25                  30
Ser Met Ser Cys Leu Trp Cys Ser Asn Pro Glu Ser Gln Asp Ile Lys
        35                  40                  45
Pro Gln Val Met Phe Asn Lys Asn Leu Cys Thr Lys Cys Gly Arg Cys
    50                  55                  60
Lys Ser Gln Cys Lys Ser Ala Ala Ile Asp Met Asn Ser Glu Tyr Arg
65                  70                  75                  80
Ile Asp Lys Ser Lys Cys Thr Glu Cys Thr Lys Cys Val Asp Asn Cys
                85                  90                  95
Leu Ser Gly Ala Leu Val Ile Glu Gly Arg Asn Tyr Ser Val Glu Asp
            100                 105                 110
Val Ile Lys Glu Leu Lys Lys Asp Ser Val Gln Tyr Arg Arg Ser Asn
        115                 120                 125
Gly Gly Ile Thr Leu Ser Gly Gly Glu Val Leu Leu Gln Pro Asp Phe
    130                 135                 140
Ala Val Glu Leu Leu Lys Glu Cys Lys Ser Tyr Gly Trp His Thr Ala
145                 150                 155                 160
Ile Glu Thr Ala Met Tyr Val Asn Ser Glu Ser Val Lys Lys Val Ile
                165                 170                 175
Pro Tyr Ile Asp Leu Ala Met Ile Asp Ile Lys Ser Met Asn Asp Glu
            180                 185                 190
Ile His Arg Lys Phe Thr Gly Val Ser Asn Glu Ile Ile Leu Gln Asn
        195                 200                 205
Ile Lys Leu Ser Asp Glu Leu Ala Lys Glu Ile Ile Ile Arg Ile Pro
    210                 215                 220
Val Ile Glu Gly Phe Asn Ala Asp Leu Gln Ser Ile Gly Ala Ile Ala
225                 230                 235                 240
Gln Phe Ser Lys Ser Leu Thr Asn Leu Lys Arg Ile Asp Leu Leu Pro
                245                 250                 255
Tyr His Asn Tyr Gly Glu Asn Lys Tyr Gln Ala Ile Gly Arg Glu Tyr
            260                 265                 270
Ser Leu Lys Glu Leu Lys Ser Pro Ser Lys Asp Lys Met Glu Arg Leu
        275                 280                 285
Lys Ala Leu Val Glu Ile Met Gly Ile Pro Cys Thr Ile Gly Ala Glu
    290                 295                 300
 
<210>312
<211>545
<212>PRT
<213>巴西固氮螺菌
 
<400>312
Met Lys Leu Ala Glu Ala Leu Leu Arg Ala Leu Lys Asp Arg Gly Ala
 1               5                  10                  15
Gln Ala Met Phe Gly Ile Pro Gly Asp Phe Ala Leu Pro Phe Phe Lys
            20                  25                  30
Val Ala Glu Glu Thr Gln Ile Leu Pro Leu His Thr Leu Ser His Glu
        35                  40                  45
Pro Ala Val Gly Phe Ala Ala Asp Ala Ala Ala Arg Tyr Ser Ser Thr
    50                  55                  60
Leu Gly Val Ala Ala Val Thr Tyr Gly Ala Gly Ala Phe Asn Met Val
65                  70                  75                  80
Asn Ala Val Ala Gly Ala Tyr Ala Glu Lys Ser Pro Val Val Val Ile
                85                  90                  95
Ser Gly Ala Pro Gly Thr Thr Glu Gly Asn Ala Gly Leu Leu Leu His
            100                 105                 110
His Gln Gly Arg Thr Leu Asp Thr Gln Phe Gln Val Phe Lys Glu Ile
        115                 120                 125
Thr Val Ala Gln Ala Arg Leu Asp Asp Pro Ala Lys Ala Pro Ala Glu
    130                 135                 140
Ile Ala Arg Val Leu Gly Ala Ala Arg Ala Gln Ser Arg Pro Val Tyr
145                 150                 155                 160
Leu Glu Ile Pro Arg Asn Met Val Asn Ala Glu Val Glu Pro Val Gly
                165                 170                 175
Asp Asp Pro Ala Trp Pro Val Asp Arg Asp Ala Leu Ala Ala Cys Ala
            180                 185                 190
Asp Glu Val Leu Ala Ala Met Arg Ser Ala Thr Ser Pro Val Leu Met
        195                 200                 205
Val Cys Val Glu Val Arg Arg Tyr Gly Leu Glu Ala Lys Val Ala Glu
    210                 215                 220
Leu Ala Gln Arg Leu Gly Val Pro Val Val Thr Thr Phe Met Gly Arg
225                 230                 235                 240
Gly Leu Leu Ala Asp Ala Pro Thr Pro Pro Leu Gly Thr Tyr Ile Gly
                245                 250                 255
Val Ala Gly Asp Ala Glu Ile Thr Arg Leu Val Glu Glu Ser Asp Gly
            260                 265                 270
Leu Phe Leu Leu Gly Ala Ile Leu Ser Asp Thr Asn Phe Ala Val Ser
        275                 280                 285
Gln Arg Lys Ile Asp Leu Arg Lys Thr Ile His Ala Phe Asp Arg Ala
    290                 295                 300
Val Thr Leu Gly Tyr His Thr Tyr Ala Asp Ile Pro Leu Ala Gly Leu
305                 310                 315                 320
Val Asp Ala Leu Leu Glu Arg Leu Pro Pro Ser Asp Arg Thr Thr Arg
                325                 330                 335
Gly Lys Glu Pro His Ala Tyr Pro Thr Gly Leu Gln Ala Asp Gly Glu
            340                 345                 350
Pro Ile Ala Pro Met Asp Ile Ala Arg Ala Val Asn Asp Arg Val Arg
        355                 360                 365
Ala Gly Gln Glu Pro Leu Leu Ile Ala Ala Asp Met Gly Asp Cys Leu
    370                 375                 380
Phe Thr Ala Met Asp Met Ile Asp Ala Gly Leu Met Ala Pro Gly Tyr
385                 390                 395                 400
Tyr Ala Gly Met Gly Phe Gly Val Pro Ala Gly Ile Gly Ala Gln Cys
                405                 410                 415
Val Ser Gly Gly Lys Arg Ile Leu Thr Val Val Gly Asp Gly Ala Phe
            420                 425                 430
Gln Met Thr Gly Trp Glu Leu Gly Asn Cys Arg Arg Leu Gly Ile Asp
        435                 440                 445
Pro Ile Val Ile Leu Phe Asn Asn Ala Ser Trp Glu Met Leu Arg Thr
    450                 455                 460
Phe Gln Pro Glu Ser Ala Phe Asn Asp Leu Asp Asp Trp Arg Phe Ala
465                 470                 475                 480
Asp Met Ala Ala Gly Met Gly Gly Asp Gly Val Arg Val Arg Thr Arg
                485                 490                 495
Ala Glu Leu Lys Ala Ala Leu Asp Lys Ala Phe Ala Thr Arg Gly Arg
            500                 505                 510
Phe Gln Leu Ile Glu Ala Met Ile Pro Arg Gly Val Leu Ser Asp Thr
        515                 520                 525
Leu Ala Arg Phe Val Gln Gly Gln Lys Arg Leu His Ala Ala Pro Arg
    530                 535                 540
Glu
545
 
<210>313
<211>348
<212>PRT
<213>红球菌ST-10
 
<400>313
Met Lys Ala Ile Gln Tyr Thr Arg Ile Gly Ala Glu Pro Glu Leu Thr
 1               5                  10                  15
Glu Ile Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val
            20                  25                  30
Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe Ile Met Ser Leu Pro
        35                  40                  45
Glu Glu Gln Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
    50                  55                  60
Ala Gly Lys Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp Ile
65                  70                  75                  80
Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Asn Cys Trp
                85                  90                  95
His Cys Ser Gln Gly Leu Glu Asn Tyr Cys Ser Arg Ala Gln Glu Leu
            100                 105                 110
Gly Ile Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe
        115                 120                 125
Met Ile Val Asp Ser Pro Arg His Leu Val Pro Ile Gly Asp Leu Asp
    130                 135                 140
Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145                 150                 155                 160
Ala Ile Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ser Tyr Ala Val
                165                 170                 175
Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg
            180                 185                 190
His Leu Ser Ala Ala Thr Val Ile Ala Leu Asp Val Ser Ala Asp Lys
        195                 200                 205
Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp
    210                 215                 220
Lys Asp Ala Ala Glu Asn Val Arg Lys Ile Thr Gly Ser Gln Gly Ala
225                 230                 235                 240
Ala Leu Val Leu Asp Phe Val Gly Tyr Gln Pro Thr Ile Asp Thr Ala
                245                 250                 255
Met Ala Val Ala Gly Val Gly Ser Asp Val Thr Ile Val Gly Ile Gly
            260                 265                 270
Asp Gly Gln Ala His Ala Lys Val Gly Phe Phe Gln Ser Pro Tyr Glu
        275                 280                 285
Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu Ile Glu
    290                 295                 300
Leu Ile Asp Leu Ala His Ala Gly Ile Phe Asp Ile Ser Val Glu Thr
305                 310                 315                 320
Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly
                325                 330                 335
Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu
            340                 345

Claims (60)

1.将多糖转化为大量生产型化学品的方法,包括:
(a)使所述多糖与多糖降解或解聚代谢系统接触,其中所述多糖任选地衍生自生物质,其中所述代谢系统选自:
(i)酶促或化学催化,和
(ii)微生物系统,其中所述微生物系统包含重组微生物,其中所述重组微生物包含一个或多个允许其在作为唯一碳源的所述多糖上生长的外源基因,
从而将所述多糖转化为适宜的单糖或寡糖;以及
(b)使所述适宜的单糖或寡糖与大量生产型化学品生物合成途径接触,其中所述大量生产型化学品生物合成途径包含醛或酮生物合成途径,
从而将所述多糖转化为所述大量生产型化学品。
2.如权利要求1所述的方法,其中所述生物质选自海洋生物质和蔬菜/果实/植物生物质。
3.如权利要求2所述的方法,其中所述海洋生物质选自海藻(kelp)、巨藻、马尾藻类海草、海藻(seaweed)、藻类、海洋微生物区系、微藻类以及海草。
4.如权利要求2所述的方法,其中所述蔬菜/果实/植物生物质包括植物皮或渣。
5.如权利要求2所述的方法,其中所述蔬菜/果实/植物生物质选自柑橘、马铃薯、番茄、葡萄、醋栗、胡萝卜、芒果、甜菜、苹果、柳枝稷、木材以及干草。
6.如权利要求1所述的方法,其中所述多糖选自藻酸盐、琼脂、角叉菜聚糖、岩藻依聚糖、果胶、多聚半乳糖醛酸盐、纤维素、半纤维素、木聚糖、阿拉伯聚糖以及甘露聚糖。
7.如权利要求1所述的方法,其中所述适宜的单糖或寡糖选自2-酮-3-脱氧D-葡糖酸盐(KDG)、D-甘露醇、古洛糖醛酸盐、甘露糖醛酸盐、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、阿拉伯糖、葡糖醛酸盐、半乳糖醛酸盐以及鼠李糖。
8.如权利要求1所述的方法,其中所述大量生产型化学品选自:甲烷、甲醇、乙烷、乙烯、乙醇、正-丙烷、1-丙烯、1-丙醇、丙醛、丙酮、丙酸盐、正-丁烷、1-丁烯、1-丁醇、丁醛、丁酸盐、异丁醛、异丁醇、2-甲基丁醛、2-甲基丁醇、3-甲基丁醛、3-甲基丁醇、2-丁烯、2-丁醇、2-丁酮、2,3-丁二醇、3-羟基-2-丁酮、2,3-丁二酮、乙苯、苯乙烯、2-苯基乙醇、苯乙醛、1-苯基丁烷、4-苯基-1-丁烯、4-苯基-2-丁烯、1-苯基-2-丁烯、1-苯基-2-丁醇、4-苯基-2-丁醇、1-苯基-2-丁酮、4-苯基-2-丁酮、1-苯基-2,3-丁二醇、1-苯基-3-羟基-2-丁酮、4-苯基-3-羟基-2-丁酮、1-苯基-2,3-丁二酮、正-戊烷、乙基苯酚、乙烯基苯酚、2-(4-羟苯基)乙醇、4-羟苯基乙醛、1-(4-羟苯基)丁烷、4-(4-羟苯基)-1-丁烯、4-(4-羟苯基)-2-丁烯、1-(4-羟苯基)-1-丁烯、1-(4-羟苯基)-2-丁醇、4-(4-羟苯基)-2-丁醇、1-(4-羟苯基)-2-丁酮、4-(4-羟苯基)-2-丁酮、1-(4-羟苯基)-2,3-丁二醇、1-(4-羟苯基)-3-羟基-2-丁酮、4-(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-2,3-丁二酮、吲哚乙烷、吲哚乙烯、2-(吲哚-3-)乙醇、正-戊烷、1-戊烯、1-戊醇、戊醛、戊酸盐、2-戊烯、2-戊醇、3-戊醇、2-戊酮、3-戊酮、4-甲基戊醛、4-甲基戊醇、2,3-戊二醇、2-羟基-3-戊酮、3-羟基-2-戊酮、2,3-戊二酮、2-甲基戊烷、4-甲基-1-戊烯、4-甲基-2-戊烯、4-甲基-3-戊烯、4-甲基-2-戊醇、2-甲基-3-戊醇、4-甲基-2-戊酮、2-甲基-3-戊酮、4-甲基-2,3-戊二醇、4-甲基-2-羟基-3-戊酮、4-甲基-3-羟基-2-戊酮、4-甲基-2,3-戊二酮、1-苯基戊烷、1-苯基-1-戊烯、1-苯基-2-戊烯、1-苯基-3-戊烯、1-苯基-2-戊醇、1-苯基-3-戊醇、1-苯基-2-戊酮、1-苯基-3-戊酮、1-苯基-2,3-戊二醇、1-苯基-2-羟基-3-戊酮、1-苯基-3-羟基-2-戊酮、1-苯基-2,3-戊二酮、4-甲基-1-苯基戊烷、4-甲基-1-苯基-1-戊烯、4-甲基-1-苯基-2-戊烯、4-甲基-1-苯基-3-戊烯、4-甲基-1-苯基-3-戊醇、4-甲基-1-苯基-2-戊醇、4-甲基-1-苯基-3-戊酮、4-甲基-1-苯基-2-戊酮、4-甲基-1-苯基-2,3-戊二醇、4-甲基-1-苯基-2,3-戊二酮、4-甲基-1-苯基-3-羟基-2-戊酮、4-甲基-1-苯基-2-羟基-3-戊酮、1-(4-羟苯基)戊烷、1-(4-羟苯基)-1-戊烯、1-(4-羟苯基)-2-戊烯、1-(4-羟苯基)-3-戊烯、1-(4-羟苯基)-2-戊醇、1-(4-羟苯基)-3-戊醇、1-(4-羟苯基)-2-戊酮、1-(4-羟苯基)-3-戊酮、1-(4-羟苯基)-2,3-戊二醇、1-(4-羟苯基)-2-羟基-3-戊酮、1-(4-羟苯基)-3-羟基-2-戊酮、1-(4-羟苯基)-2,3-戊二酮、4-甲基-1-(4-羟苯基)戊烷、4-甲基-1-(4-羟苯基)-2-戊烯、4-甲基-1-(4-羟苯基)-3-戊烯、4-甲基-1-(4-羟苯基)-1-戊烯、4-甲基-1-(4-羟苯基)-3-戊醇、4-甲基-1-(4-羟苯基)-2-戊醇、4-甲基-1-(4-羟苯基)-3-戊酮、4-甲基-1-(4-羟苯基)-2-戊酮、4-甲基-1-(4-羟苯基)-2,3-戊二醇、4-甲基-1-(4-羟苯基)-2,3-戊二酮、4-甲基-1-(4-羟苯基)-3-羟基-2-戊酮、4-甲基-1-(4-羟苯基)-2-羟基-3-戊酮、1-吲哚-3-戊烷、1-(吲哚-3)-1-戊烯、1-(吲哚-3)-2-戊烯、1-(吲哚-3)-3-戊烯、1-(吲哚-3)-2-戊醇、1-(吲哚-3)-3-戊醇、1-(吲哚-3)-2-戊酮、1-(吲哚-3)-3-戊酮、1-(吲哚-3)-2,3-戊二醇、1-(吲哚-3)-2-羟基-3-戊酮、1-(吲哚-3)-3-羟基-2-戊酮、1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3-)戊烷、4-甲基-1-(吲哚-3)-2-戊烯、4-甲基-1-(吲哚-3)-3-戊烯、4-甲基-1-(吲哚-3)-1-戊烯、4-甲基-2-(吲哚-3)-3-戊醇、4-甲基-1-(吲哚-3)-2-戊醇、4-甲基-1-(吲哚-3)-3-戊酮、4-甲基-1-(吲哚-3)-2-戊酮、4-甲基-1-(吲哚-3)-2,3-戊二醇、4-甲基-1-(吲哚-3)-2,3-戊二酮、4-甲基-1-(吲哚-3)-3-羟基-2-戊酮、4-甲基-1-(吲哚-3)-2-羟基-3-戊酮、正-己烷、1-己烯、1-己醇、己醛、己酸盐、2-己烯、3-己烯、2-己醇、3-己醇、2-己酮、3-己酮、2,3-己二醇、2,3-己二酮、3,4-己二醇、3,4-己二酮、2-羟基-3-己酮、3-羟基-2-己酮、3-羟基-4-己酮、4-羟基-3-己酮、2-甲基己烷、3-甲基己烷、2-甲基-2-己烯、2-甲基-3-己烯、5-甲基-1-己烯、5-甲基-2-己烯、4-甲基-1-己烯、4-甲基-2-己烯、3-甲基-3-己烯、3-甲基-2-己烯、3-甲基-1-己烯、2-甲基-3-己醇、5-甲基-2-己醇、5-甲基-3-己醇、2-甲基-3-己酮、5-甲基-2-己酮、5-甲基-3-己酮、2-甲基-3,4-己二醇、2-甲基-3,4-己二酮、5-甲基-2,3-己二醇、5-甲基-2,3-己二酮、4-甲基-2,3-己二醇、4-甲基-2,3-己二酮、2-甲基-3-羟基-4-己酮、2-甲基-4-羟基-3-己酮、5-甲基-2-羟基-3-己酮、5-甲基-3-羟基-2-己酮、4-甲基-2-羟基-3-己酮、4-甲基-3-羟基-2-己酮、2,5-二甲基己烷、2,5-二甲基-2-己烯、2,5-二甲基-3-己烯、2,5-二甲基-3-己醇、2,5-二甲基-3-己酮、2,5-二甲基-3,4-己二醇、2,5-二甲基-3,4-己二酮、2,5-二甲基-3-羟基-4-己酮、5-甲基-1-苯基己烷、4-甲基-1-苯基己烷、5-甲基-1-苯基-1-己烯、5-甲基-1-苯基-2-己烯、5-甲基-1-苯基-3-己烯、4-甲基-1-苯基-1-己烯、4-甲基-1-苯基-2-己烯、4-甲基-1-苯基-3-己烯、5-甲基-1-苯基-2-己醇、5-甲基-1-苯基-3-己醇、4-甲基-1-苯基-2-己醇、4-甲基-1-苯基-3-己醇、5-甲基-1-苯基-2-己酮、5-甲基-1-苯基-3-己酮、4-甲基-1-苯基-2-己酮、4-甲基-1-苯基-3-己酮、5-甲基-1-苯基-2,3-己二醇、4-甲基-1-苯基-2,3-己二醇、5-甲基-1-苯基-3-羟基-2-己酮、5-甲基-1-苯基-2-羟基-3-己酮、4-甲基-1-苯基-3-羟基-2-己酮、4-甲基-1-苯基-2-羟基-3-己酮、5-甲基-1-苯基-2,3-己二酮、4-甲基-1-苯基-2,3-己二酮、4-甲基-1-(4-羟苯基)己烷、5-甲基-1-(4-羟苯基)-1-己烯、5-甲基-1-(4-羟苯基)-2-己烯、5-甲基-1-(4-羟苯基)-3-己烯、4-甲基-1-(4-羟苯基)-1-己烯、4-甲基-1-(4-羟苯基)-2-己烯、4-甲基-1-(4-羟苯基)-3-己烯、5-甲基-1-(4-羟苯基)-2-己醇、5-甲基-1-(4-羟苯基)-3-己醇、4-甲基-1-(4-羟苯基)-2-己醇、4-甲基-1-(4-羟苯基)-3-己醇、5-甲基-1-(4-羟苯基)-2-己酮、5-甲基-1-(4-羟苯基)-3-己酮、4-甲基-1-(4-羟苯基)-2-己酮、4-甲基-1-(4-羟苯基)-3-己酮、5-甲基-1-(4-羟苯基)-2,3-己二醇、4-甲基-1-(4-羟苯基)-2,3-己二醇、5-甲基-1-(4-羟苯基)-3-羟基-2-己酮、5-甲基-1-(4-羟苯基)-2-羟基-3-己酮、4-甲基-1-(4-羟苯基)-3-羟基-2-己酮、4-甲基-1-(4-羟苯基)-2-羟基-3-己酮、5-甲基-1-(4-羟苯基)-2,3-己二酮、4-甲基-1-(4-羟苯基)-2,3-己二酮、4-甲基-1-(吲哚-3-)己烷、5-甲基-1-(吲哚-3)-1-己烯、5-甲基-1-(吲哚-3)-2-己烯、5-甲基-1-(吲哚-3)-3-己烯、4-甲基-1-(吲哚-3)-1-己烯、4-甲基-1-(吲哚-3)-2-己烯、4-甲基-1-(吲哚-3)-3-己烯、5-甲基-1-(吲哚-3)-2-己醇、5-甲基-1-(吲哚-3)-3-己醇、4-甲基-1-(吲哚-3)-2-己醇、4-甲基-1-(吲哚-3)-3-己醇、5-甲基-1-(吲哚-3)-2-己酮、5-甲基-1-(吲哚-3)-3-己酮、4-甲基-1-(吲哚-3)-2-己酮、4-甲基-1-(吲哚-3)-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二醇、4-甲基-1-(吲哚-3)-2,3-己二醇、5-甲基-1-(吲哚-3)-3-羟基-2-己酮、5-甲基-1-(吲哚-3)-2-羟基-3-己酮、4-甲基-1-(吲哚-3)-3-羟基-2-己酮、4-甲基-1-(吲哚-3)-2-羟基-3-己酮、5-甲基-1-(吲哚-3)-2,3-己二酮、4-甲基-1-(吲哚-3)-2,3-己二酮、正-庚烷、1-庚烯、1-庚醇、庚醛、庚酸盐、2-庚烯、3-庚烯、2-庚醇、3-庚醇、4-庚醇、2-庚酮、3-庚酮、4-庚酮、2,3-庚二醇、2,3-庚二酮、3,4-庚二醇、3,4-庚二酮、2-羟基-3-庚酮、3-羟基-2-庚酮、3-羟基-4-庚酮、4-羟基-3-庚酮、2-甲基庚烷、3-甲基庚烷、6-甲基-2-庚烯、6-甲基-3-庚烯、2-甲基-3-庚烯、2-甲基-2-庚烯、5-甲基-2-庚烯、5-甲基-3-庚烯、3-甲基-3-庚烯、2-甲基-3-庚醇、2-甲基-4-庚醇、6-甲基-3-庚醇、5-甲基-3-庚醇、3-甲基-4-庚醇、2-甲基-3-庚酮、2-甲基-4-庚酮、6-甲基-3-庚酮、5-甲基-3-庚酮、3-甲基-4-庚酮、2-甲基-3,4-庚二醇、2-甲基-3,4-庚二酮、6-甲基-3,4-庚二醇、6-甲基-3,4-庚二酮、5-甲基-3,4-庚二醇、5-甲基-3,4-庚二酮、2-甲基-3-羟基-4-庚酮、2-甲基-4-羟基-3-庚酮、6-甲基-3-羟基-4-庚酮、6-甲基-4-羟基-3-庚酮、5-甲基-3-羟基-4-庚酮、5-甲基-4-羟基-3-庚酮、2,6-二甲基庚烷、2,5-二甲基庚烷、2,6-二甲基-2-庚烯、2,6-二甲基-3-庚烯、2,5-二甲基-2-庚烯、2,5-二甲基-3-庚烯、3,6-二甲基-3-庚烯、2,6-二甲基-3-庚醇、2,6-二甲基-4-庚醇、2,5-二甲基-3-庚醇、2,5-二甲基-4-庚醇、2,6-二甲基-3,4-庚二醇、2,6-二甲基-3,4-庚二酮、2,5-二甲基-3,4-庚二醇、2,5-二甲基-3,4-庚二酮、2,6-二甲基-3-羟基-4-庚酮、2,6-二甲基-4-羟基-3-庚酮、2,5-二甲基-3-羟基-4-庚酮、2,5-二甲基-4-羟基-3-庚酮、正-辛烷、1-辛烯、2-辛烯、1-辛醇、辛醛、辛酸盐(octanoate)、3-辛烯、4-辛烯、4-辛醇、4-辛酮、4,5-辛二醇、4,5-辛二酮、4-羟基-5-辛酮、2-甲基辛烷、2-甲基-3-辛烯、2-甲基-4-辛烯、7-甲基-3-辛烯、3-甲基-3-辛烯、3-甲基-4-辛烯、6-甲基-3-辛烯、2-甲基-4-辛醇、7-甲基-4-辛醇、3-甲基-4-辛醇、6-甲基-4-辛醇、2-甲基-4-辛酮、7-甲基-4-辛酮、3-甲基-4-辛酮、6-甲基-4-辛酮、2-甲基-4,5-辛二醇、2-甲基-4,5-辛二酮、3-甲基-4,5-辛二醇、3-甲基-4,5-辛二酮、2-甲基-4-羟基-5-辛酮、2-甲基-5-羟基-4-辛酮、3-甲基-4-羟基-5-辛酮、3-甲基-5-羟基-4-辛酮、2,7-二甲基辛烷、2,7-二甲基-3-辛烯、2,7-二甲基-4-辛烯、2,7-二甲基-4-辛醇、2,7-二甲基-4-辛酮、2,7-二甲基-4,5-辛二醇、2,7-二甲基-4,5-辛二酮、2,7-二甲基-4-羟基-5-辛酮、2,6-二甲基辛烷、2,6-二甲基-3-辛烯、2,6-二甲基-4-辛烯、3,7-二甲基-3-辛烯、2,6-二甲基-4-辛醇、3,7-二甲基-4-辛醇、2,6-二甲基-4-辛酮、3,7-二甲基-4-辛酮、2,6-二甲基-4,5-辛二醇、2,6-二甲基-4,5-辛二酮、2,6-二甲基-4-羟基-5-辛酮、2,6-二甲基-5-羟基-4-辛酮、3,6-二甲基辛烷、3,6-二甲基-3-辛烯、3,6-二甲基-4-辛烯、3,6-二甲基-4-辛醇、3,6-二甲基-4-辛酮、3,6-二甲基-4,5-辛二醇、3,6-二甲基-4,5-辛二酮、3,6-二甲基-4-羟基-5-辛酮、正-壬烷、1-壬烯、1-壬醇、壬醛、壬酸盐、2-甲基壬烷、2-甲基-4-壬烯、2-甲基-5-壬烯、8-甲基-4-壬烯、2-甲基-5-壬醇、8-甲基-4-壬醇、2-甲基-5-壬酮、8-甲基-4-壬酮、8-甲基-4,5-壬二醇、8-甲基-4,5-壬二酮、8-甲基-4-羟基-5-壬酮、8-甲基-5-羟基-4-壬酮、2,8-二甲基壬烷、2,8-二甲基-3-壬烯、2,8-二甲基-4-壬烯、2,8-二甲基-5-壬烯、2,8-二甲基-4-壬醇、2,8-二甲基-5-壬醇、2,8-二甲基-4-壬酮、2,8-二甲基-5-壬酮、2,8-二甲基-4,5-壬二醇、2,8-二甲基-4,5-壬二酮、2,8-二甲基-4-羟基-5-壬酮、2,8-二甲基-5-羟基-4-壬酮、2,7-二甲基壬烷、3,8-二甲基-3-壬烯、3,8-二甲基-4-壬烯、3,8-二甲基-5-壬烯、3,8-二甲基-4-壬醇、3,8-二甲基-5-壬醇、3,8-二甲基-4-壬酮、3,8-二甲基-5-壬酮、3,8-二甲基-4,5-壬二醇、3,8-二甲基-4,5-壬二酮、3,8-二甲基-4-羟基-5-壬酮、3,8-二甲基-5-羟基-4-壬酮、正-癸烷、1-癸烯、1-癸醇、癸酸盐、2,9-二甲基癸烷、2,9-二甲基-3-癸烯、2,9-二甲基-4-癸烯、2,9-二甲基-5-癸醇、2,9-二甲基-5-癸酮、2,9-二甲基-5,6-癸二醇、2,9-二甲基-6-羟基-5-癸酮、2,9-二甲基-5,6-癸二酮、正-十一烷、1-十一碳烯、1-十一烷醇、十一醛、十一酸盐、正-十二烷、1-十二碳烯、1-十二烷醇、十二醛、十二酸盐、正-十二烷、1-decadecene、1-十二烷醇、十二醛、十二酸盐、正-十三烷、1-十三碳烯、1-十三烷醇、十三醛、十三酸盐、正-十四烷、1-十四碳烯、1-十四烷醇、十四醛、十四酸盐、正-十五烷、1-十五碳烯、1-十五烷醇、十五醛、十五酸盐、正-十六烷、1-十六碳烯、1-十六烷醇、十六醛、十六酸盐、正-十七烷、1-十七碳烯、1-十七烷醇、十七醛、十七酸盐、正-十八烷、1-十八碳烯、1-十八烷醇、十八醛、十八酸盐、正-十九烷、1-十九碳烯、1-十九烷醇、十九醛、十九酸盐、二十烷、1-二十碳烯、1-二十烷醇、二十醛、二十酸盐、3-羟基丙醛、1,3-丙二醇、4-羟基丁醛、1,4-丁二醇、3-羟基-2-丁酮、2,3-丁二醇、1,5-戊二醇、高柠檬酸盐、高异柠檬酸盐、b-羟基己二酸盐、戊二酸盐、glutarsemialdehyde、戊二醛、2-羟基-1-环戊酮、1,2-环戊二醇、环戊酮、环戊醇、(S)-2-乙酰乳酸、(R)-2,3-二羟基-异戊酸盐、2-氧代异戊酸盐、异丁酰辅酶A、异丁酸盐、异丁醛、5-氨基戊醛、1,10-二氨基癸烷、1,10-二氨基-5-癸烯、1,10-二氨基-5-羟基癸烷、1,10-二氨基-5-癸酮、1,10-二氨基-5,6-癸二醇、1,10-二氨基-6-羟基-5-癸酮、苯乙醛、1,4-二苯基丁烷、1,4-二苯基-1-丁烯、1,4-二苯基-2-丁烯、1,4-二苯基-2-丁醇、1,4-二苯基-2-丁酮、1,4-二苯基-2,3-丁二醇、1,4-二苯基-3-羟基-2-丁酮、1-(4-羟苯基)-4-苯基丁烷、1-(4-羟苯基)-4-苯基-1-丁烯、1-(4-羟苯基)-4-苯基-2-丁烯、1-(4-羟苯基)-4-苯基-2-丁醇、1-(4-羟苯基)-4-苯基-2-丁酮、1-(4-羟苯基)-4-苯基-2,3-丁二醇、1-(4-羟苯基)-4-苯基-3-羟基-2-丁酮、1-(吲哚-3)-4-苯基丁烷、1-(吲哚-3)-4-苯基-1-丁烯、1-(吲哚-3)-4-苯基-2-丁烯、1-(吲哚-3)-4-苯基-2-丁醇、1-(吲哚-3)-4-苯基-2-丁酮、1-(吲哚-3)-4-苯基-2,3-丁二醇、1-(吲哚-3)-4-苯基-3-羟基-2-丁酮、4-羟苯基乙醛、1,4-二(4-羟苯基)丁烷、1,4-二(4-羟苯基)-1-丁烯、1,4-二(4-羟苯基)-2-丁烯、1,4-二(4-羟苯基)-2-丁醇、1,4-二(4-羟苯基)-2-丁酮、1,4-二(4-羟苯基)-2,3-丁二醇、1,4-二(4-羟苯基)-3-羟基-2-丁酮、1-(4-羟苯基)-4-(吲哚-3-)丁烷、1-(4-羟苯基)-4-(吲哚-3)-1-丁烯、1-二(4-羟苯基)-4-(吲哚-3)-2-丁烯、1-(4-羟苯基)-4-(吲哚-3)-2-丁醇、1-(4-羟苯基)-4-(吲哚-3)-2-丁酮、1-(4-羟苯基)-4-(吲哚-3)-2,3-丁二醇、1-(4-羟苯基-4-(吲哚-3)-3-羟基-2-丁酮、吲哚-3-乙醛、1,4-二(吲哚-3-)丁烷、1,4-二(吲哚-3)-1-丁烯、1,4-二(吲哚-3)-2-丁烯、1,4-二(吲哚-3)-2-丁醇、1,4-二(吲哚-3)-2-丁酮、1,4-二(吲哚-3)-2,3-丁二醇、1,4-二(吲哚-3)-3-羟基-2-丁酮、琥珀酸半醛、己烷-1,8-二羧酸、3-己烯-1,8-二羧酸、3-羟基-己烷-1,8-二羧酸、3-己酮-1,8-二羧酸、3,4-己二醇-1,8-二羧酸、4-羟基-3-己酮-1,8-二羧酸、岩藻依聚糖、碘、叶绿素、类胡萝卜素、钙、镁、铁、钠、钾、以及磷酸盐。
9.将多糖转化为适宜的单糖或寡糖的方法,包括:
(a)使所述多糖与微生物系统接触足以将所述多糖转化为适宜的单糖或寡糖的时间,其中所述多糖任选地从生物质获得,其中所述微生物系统包含:
(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因,其中所述裂解酶和/或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域;
(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白和超通道(superchannel);以及
(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶和醛缩酶,
从而将所述多糖转化为适宜的单糖或寡糖。
10.将多糖转化为适宜的单糖或寡糖的方法,包括:
(a)使所述多糖与化学或酶促催化途径接触足以将所述多糖转化为第一单糖或寡糖的时间,其中所述多糖任选地由生物质获得;和
(b)使所述第一多糖或寡糖与微生物系统接触足以将所述第一多糖或寡糖转化为适宜的单糖或寡糖的时间,其中所述微生物系统包含:
(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因;
(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白和超通道(superchannel);以及
(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶和醛缩酶,
从而将所述多糖转化为所述适宜的单糖或寡糖。
11.如权利要求9或10所述的方法,其中所述裂解酶选自藻酸盐裂解酶、果胶酸裂解酶、多聚甘露糖醛酸裂解酶、多聚葡糖酸裂解酶、多聚半乳糖醛酸裂解酶以及鼠李聚糖半乳糖醛酸裂解酶。
12.如权利要求9或10所述的方法,其中所述水解酶选自藻酸盐水解酶、鼠李聚糖半乳糖醛酸水解酶、多聚甘露糖醛酸水解酶、果胶水解酶以及多聚半乳糖醛酸水解酶。
13.如权利要求9或10所述的方法,其中所述转运蛋白选自ABC转运蛋白、同向转运蛋白(symporter)以及外膜孔蛋白。
14.如权利要求13所述的方法,其中所述ABC转运蛋白选自Atu3021,Atu3022、Atu3023、Atu3024、algM1、algM2、AlgQ1、AlgQ2、AlgS、OG2516 05558、OG2516 05563、OG2516 05568、OG2516 05573、TogM、TogN、TogA、TogB、及其功能变体。
15.如权利要求13所述的方法,其中所述同向转运蛋白选自V12B01_24239(SEQ ID NO:26)、V12B01_24194(SEQ ID NO:8)和TogT,及其功能变体。
16.如权利要求13所述的方法,其中所述外膜孔蛋白包含选自V12B01_24269、KdgM和KdgN及其功能变体的孔蛋白。
17.能在作为唯一碳源的多糖上生长的重组微生物,其中所述多糖选自藻酸盐、果胶、三半乳糖醛酸盐、二半乳糖醛酸盐、纤维素以及半纤维素。
18.如权利要求17所述的重组微生物,其中所述多糖是藻酸盐。
19.如权利要求17所述的重组微生物,其中所述多糖是果胶。
20.如权利要求17所述的重组微生物,其中所述多糖是三半乳糖醛酸盐。
21.重组微生物,包含(i)至少一个编码和表达选自裂解酶和水解酶的酶的基因,其中所述裂解酶或水解酶任选地包含至少一个信号肽或至少一个自动转运蛋白结构域;(ii)至少一个编码和表达酶的基因,所述酶选自单糖转运蛋白、二糖转运蛋白、三糖转运蛋白、寡糖转运蛋白、多糖转运蛋白和超通道(superchannel);以及(iii)至少一个编码和表达酶的基因,所述酶选自单糖脱氢酶、异构酶、脱水酶、激酶以及醛缩酶。
22.如权利要求17-21中任一项所述的重组微生物,其中所述微生物能在作为唯一碳源的多糖上生长。
23.如权利要求22所述的重组微生物,其中所述多糖选自藻酸盐、果胶以及三半乳糖醛酸盐。
24.将适宜的单糖或寡糖转化为第一大量生产型化学品的方法,包括:
(a)使所述适宜的单糖或寡糖与微生物系统接触足以将所述适宜的单糖或寡糖转化为所述大量生产型化学品的时间,其中所述微生物系统包含重组微生物,其中所述微生物包含大量生产型化学品生物合成途径,
从而将所述适宜的单糖或寡糖转化为所述第一大量生产型化学品。
25.如权利要求24所述的方法,其中所述大量生产型化学品途径包含一个或多个编码醛或酮生物合成途径的基因。
26.如权利要求25所述的方法,其中所述醛或酮生物合成途径选自乙醛、丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛、2-吲哚-3-乙醛、戊二醛、5-氨基-戊醛、琥珀酸半醛以及琥珀酸4-羟苯基乙醛生物合成途径中的一个或多个。
27.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含乙醛生物合成途径和选自丙醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
28.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含丙醛生物合成途径和选自丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛以及苯乙醛生物合成途径的生物合成途径。
29.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含丁醛生物合成途径和选自异丁醛、2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
30.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含异丁醛生物合成途径和选自2-甲基-丁醛、3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
31.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含2-甲基-丁醛生物合成途径和选自3-甲基-丁醛、2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
32.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含3-甲基-丁醛生物合成途径和选自2-苯乙醛、2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
33.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含2-苯乙醛生物合成途径和选自2-(4-羟苯基)乙醛以及2-吲哚-3-乙醛生物合成途径的生物合成途径。
34.如权利要求26所述的方法,其中所述醛或酮生物合成途径包含2-(4-羟苯基)乙醛生物合成途径和2-吲哚-3-乙醛生物合成途径。
35.如权利要求24所述的方法,其中所述第一大量生产型化学品进一步被酶促和/或化学还原和脱水为第二大量生产型化学品。
36.将适宜的单糖或寡糖转化为大量生产型化学品的方法,包括:
(a)使所述适宜的单糖或寡糖与微生物系统接触足以将所述适宜的单糖或寡糖转化为所述大量生产型化学品的时间,其中所述微生物系统包含:
(i)一个或多个编码和表达醛生物合成途径的基因,其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因;和
(ii)一个或多个编码和表达醛还原酶的基因,从而将所述适宜的单糖或寡糖转化为所述大量生产型化学品。
37.如权利要求36所述的方法,其中所述脱羧酶是吲哚-3-丙酮酸脱羧酶(IPDC)。
38.如权利要求37所述的方法,其中所述IPDC包含与SEQ ID NO:312所示的氨基酸序列至少80%、90%、95%、98%或99%同一的氨基酸序列。
39.如权利要求36所述的方法,其中所述醛还原酶是苯乙醛还原酶(PAR)。
40.如权利要求39所述的方法,其中所述PAR包含与SEQ ID NO:313所示的氨基酸序列至少80%、90%、95%、98%或99%同一的氨基酸序列。
41.如权利要求36所述的方法,其中所述大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。
42.重组微生物,包含(i)一个或多个编码和表达醛生物合成途径的基因,其中所述醛生物合成途径包含一个或多个编码和表达脱羧酶的基因;以及(ii)一个或多个编码和表达醛还原酶的基因。
43.如权利要求42所述的重组微生物,其中所述醛生物合成途径还包含一个或多个编码和表达酶的基因,所述酶选自辅酶A连接的醛脱氢酶、醛脱氢酶以及醇脱氢酶。
44.如权利要求42所述的重组微生物,其中所述脱氢酶是吲哚-3-丙酮酸脱羧酶(IPDC)。
45.如权利要求42所述的重组微生物,其中所述醛还原酶是苯乙醛还原酶(PAR)。
46.如权利要求42所述的重组微生物,其中所述微生物能将适宜的单糖或寡糖转化为大量生产型化学品。
47.如权利要求46所述的重组微生物,其中所述大量生产型化学品选自2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。
48.如权利要求17-23或42-47所述的重组微生物,其中所述微生物包含与野生型微生物相比降低的乙醇产生能力。
49.如权利要求48所述的重组微生物,其中所述微生物包含乙酰辅酶A向乙醇的转化的降低或抑制。
50.如权利要求48所述的重组微生物,其中所述重组微生物包含乙醇脱氢酶的减少,从而提供降低的乙醇产生能力。
51.如权利要求50所述的重组微生物,其中所述乙醇脱氢酶是adhE、其同源物或变体。
52.如权利要求50所述的重组微生物,其中所述微生物包含adhE、其同源物或变体的缺失或敲除。
53.如权利要求17-23或42-47所述的重组微生物,其中所述重组微生物包含编码酶的基因的一个或多个缺失或敲除,所述酶选自催化乙酰辅酶A转化为乙醇的酶、催化丙酮酸盐转化为乳酸盐的酶、催化延胡索酸盐转化为琥珀酸盐的酶、催化乙酰辅酶A和磷酸盐转化为辅酶A和乙酰磷酸盐的酶、催化乙酰辅酶A和甲酸盐转化为辅酶A和丙酮酸盐的酶以及催化α-酮酸转化为支链氨基酸的酶。
54.如权利要求1-53中任一项所述的微生物系统或重组微生物,其中所述重组微生物或微生物系统包含选自以下的微生物:醋化醋酸杆菌(Acetobacter aceti)、无色杆菌(Achromobacter)、嗜酸菌(Acidiphilium)、不动杆菌(Acinetobacter)、马杜拉放线菌(Actinomadura)、游动放线菌(Actinoplanes)、敏捷好氧炽热球菌(Aeropyrum pernix)、农杆菌(Agrobacterium)、产碱杆菌(Alcaligenes)、菠萝(Ananas comosus)(M)、节杆菌(Arthrobacter)、黑曲霉(Aspargillus niger)、米曲霉(Aspargillus oryze)、蜜蜂曲霉(Aspergillus melleus)、粉状曲霉(Aspergillus pulverulentus)、斋藤曲霉(Aspergillus saitoi)、酱油曲霉(Aspergillus sojea)、宇佐美曲霉(Aspergillus usamii)、嗜碱芽孢杆菌(Bacillus alcalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、浸麻芽孢杆菌(Bacillus macerans)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、双歧杆菌(Bifidobacterium)、短短芽孢杆菌(Brevibacillus brevis)、洋葱伯克霍尔德氏菌(Burkholderia cepacia)、圆柱念珠菌(Candida cylindracea)、皱褶念珠菌(Candida rugosa)、番木瓜(Caricapapaya)(L)、纤维微菌(Cellulosimicrobium)、头孢霉菌(Cephalosporium)、变动毛壳菌(Chaetomium erraticum)、细丽毛壳菌(Chaetomium gracile)、梭菌(Clostridium)、丁酸梭菌(Clostridium butyricum)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维素梭菌(Clostridium thermocellum)、(谷氨酸)棒杆菌(Corynebacterium(glutamicum))、Corynebacterium efficiens、大肠杆菌(Escherichia coli)、肠球菌(Enterococcus)、菊欧文氏菌(Erwinachrysanthemi)、葡糖酸杆菌(Gliconobacter)、葡糖酸醋酸杆菌(Gluconacetobacter)、盐盒菌(Haloarcula)、特异腐质霉(Humicola insolens)、Humicola nsolens、西唐北里孢菌(Kitasatospora setae)、克雷伯氏菌(Klebsiella)、产酸克雷伯氏菌(Klebsiella oxytoca)、克鲁维酵母(Kluyveromyces)、脆壁克鲁维酵母(Kluyveromyces fragilis)、乳酸克鲁维酵母(Kluyveromyces lactis)、库克菌(Kocuria)、Lactlactis、乳酸杆菌(Lactobacillus)、发酵乳酸杆菌(Lactobacillus fermentum)、清酒乳酸杆菌(Lactobacillus sake)、乳球菌(Lactococcus)、乳酸乳球菌(Lactococcuslactis)、明串珠菌(Leuconostoc)、甲基孢囊菌(Methylocystis)、西西里甲烷叶菌(Methanolobus siciliae)、嗜器官产甲烷菌(Methanogeniumorganophilum)、布氏甲杆菌(Methanobacterium bryantii)、蛾微杆菌(Microbacterium imperiale)、溶壁微球菌(Micrococcus lysodeikticus)、小月菌(Microlunatus)、爪哇毛霉(Mucor javanicus)、分枝杆菌(Mycobacterium)、漆斑菌(Myrothecium)、硝化杆菌(Nitrobacter)、亚硝化单胞菌(Nitrosomonas)、诺卡氏菌(Nocardia)、番木瓜(Papaya carica)、片球菌(Pediococcus)、嗜盐片球菌(Pediococcus halophilus)、青霉菌(Penicillium)、产黄青霉(Penicillium camemberti)、橘青霉(Penicillium citrinum)、埃默森青霉(Penicillium emersonii)、娄地青霉(Penicillium roqueforti)、淡紫青霉(Penicillum lilactinum)、多色青霉(Penicillum multicolor)、好氧反硝化菌(Paracoccus pantotrophus)、丙酸杆菌(Propionibacterium)、假单胞菌(Pseudomonas)、荧光假单孢菌(Pseudomonas fluorescens)、脱氮假单胞杆菌(Pseudomonas denitrificans)、火球菌(Pyrococcus)、激烈火球菌(Pyrococcus furiosus)、堀野氏火球菌(Pyrococcus horikoshii)、根癌菌(Rhizobium)、米黑根毛霉(Rhizomucor miehei)、微小根毛霉(Rhizomucorpusillus Lindt)、根霉(Rhizopus)、德氏根霉(Rhizopus delemar)、东京根霉(Rhizopus japonicus)、雪白根霉(Rhizopus niveus)、米根霉(Rhizopus oryzae)、少孢根霉(Rhizopus oligosporus)、红球菌(Rhodococcus)、酿酒酵母(Sccharomyces cerevisiae)、Sclerotina libertina、多食鞘氨醇杆菌(sphingobacterium multivorum)、鞘氨醇杆菌(sphingobium)、鞘胺醇单胞菌(sphingomonas)、链球菌(Streptococcus)、嗜热链球菌(Streptococcusthermophilus)Y-1、链霉菌(Streptomyces)、灰色链霉菌(Streptomycesgriseus)、变铅青链霉菌(Streptomyces lividans)、鼠灰链霉菌(Streptomycesmurinus)、锈棕色链霉菌(Streptomyces rubiginosus)、紫红链霉菌(Streptomyces violaceoruber)、茂原链轮丝菌(Streptoverticilliummobaraense)、四体球菌(Tetragenococcus)、栖热菌(Thermus)、泛养硫球菌(Thiosphaera pantotropha)、栓菌(Trametes)、木霉(Trichoderma)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、潘氏丝孢酵母(Trichosporon penicillatum)、溶藻弧菌(Vibrio alginolyticus)、黄单胞菌(Xanthomonas)、酵母(yeast)、鲁氏接合酵母(Zygosaccharomyces rouxii)、发酵单胞菌(Zymomonas)以及运动发酵单胞菌(Zymomonus mobilis)。
55.如权利要求1-8或24-41中任一项所述的方法所产生的大量生产型化学品。
56.混合的大量生产型化学品,包含权利要求55所述的大量生产型化学品和精炼的石油产品。
57.如权利要求56所述的混合的大量生产型化学品,其中所述大量生产型化学品选自C10-C12烃、2-苯基乙醇、2-(4-羟苯基)乙醇以及吲哚-3-乙醇。
58.如权利要求57所述的混合的大量生产型化学品,其中所述C10-C12烃选自2,7-二甲基辛烷和和2,9-二甲基癸烷。
59.如权利要求56所述的混合的大量生产型化学品,其中所述精炼的石油产品选自喷气燃料和柴油燃料。
60.产生富大量生产型化学品的精炼的石油产品的方法,包括:
(a)将所述精炼的石油产品与通过权利要求1-8或21-41中任一项的方法所产生的所述大量生产型化学品混合,
从而产生所述富大量生产型化学品的精炼的石油产品。
CN2008801192815A 2007-10-04 2008-10-03 生物燃料生产 Pending CN101889092A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US97762807P 2007-10-04 2007-10-04
US60/977,628 2007-10-04
PCT/US2008/078850 WO2009046375A2 (en) 2007-10-04 2008-10-03 Biofuel production

Publications (1)

Publication Number Publication Date
CN101889092A true CN101889092A (zh) 2010-11-17

Family

ID=40227859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801192815A Pending CN101889092A (zh) 2007-10-04 2008-10-03 生物燃料生产

Country Status (12)

Country Link
US (8) US20090139134A1 (zh)
EP (1) EP2195440A2 (zh)
JP (1) JP2010539988A (zh)
KR (1) KR20100091162A (zh)
CN (1) CN101889092A (zh)
AU (1) AU2008308477A1 (zh)
BR (1) BRPI0817754A2 (zh)
CA (1) CA2699929A1 (zh)
CL (2) CL2008002960A1 (zh)
MX (1) MX2010003501A (zh)
NZ (1) NZ584162A (zh)
WO (2) WO2009046375A2 (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102286382A (zh) * 2011-05-20 2011-12-21 桂林理工大学 一种降解叶绿素的菌株及降解方法
CN103014075A (zh) * 2012-09-20 2013-04-03 江南大学 利用一株安全菌株发酵生物柴油副产物粗甘油生产2,3-丁二醇
CN103451112A (zh) * 2013-09-02 2013-12-18 中国农业科学院农业资源与农业区划研究所 一株耐盐碱长枝木霉及其应用
CN104561135A (zh) * 2013-10-15 2015-04-29 丰益(上海)生物技术研发中心有限公司 里氏木霉生产芳香物质的方法
CN106398780A (zh) * 2015-07-28 2017-02-15 北京特生物化工有限公司 一种低凝生物柴油及其制备方法
CN107208117A (zh) * 2014-12-16 2017-09-26 新派克股份公司 异丁醇生产的酶促方法
CN107231807A (zh) * 2014-12-10 2017-10-03 陶氏环球技术有限责任公司 基因修饰苯丙酮酸脱羧酶、其制备方法和用途
CN107636157A (zh) * 2015-06-10 2018-01-26 东丽株式会社 3‑羟基己二酸的制造方法
CN108285881A (zh) * 2018-01-04 2018-07-17 广州大学 一种具有同步产电和反硝化活性的分支杆菌及其应用
CN109205795A (zh) * 2017-12-21 2019-01-15 向勇 一种复合硝化菌及其生产方法
CN111187738A (zh) * 2020-02-11 2020-05-22 江南大学 产2,3-戊二酮的嗜热链球菌及其在制备豆乳中应用
CN113652366A (zh) * 2021-07-26 2021-11-16 北京联合大学 一种用于厨余垃圾降解的复合微生物菌剂的组合方法
CN114437988A (zh) * 2022-02-28 2022-05-06 贵州医科大学 纤维素降解菌及菌剂、制备方法、应用和降解酒糟的方法
CN114686541A (zh) * 2022-02-28 2022-07-01 北京焉支山科技有限公司 一种化妆品级己糖-6-磷酸组合物的生物酶法合成方法及其应用
CN115261293A (zh) * 2021-04-29 2022-11-01 北京化工大学 一种产羟基己二酸的基因工程菌
CN115572744A (zh) * 2022-06-30 2023-01-06 中国科学院天津工业生物技术研究所 一种1,4-二羟基-2-丁酮化合物的生物合成方法

Families Citing this family (100)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1069865A (ja) * 1996-07-31 1998-03-10 Chuka Eikan Kofun Yugenkoshi ビデオディスプレイ装置
US7024800B2 (en) 2004-07-19 2006-04-11 Earthrenew, Inc. Process and system for drying and heat treating materials
US7685737B2 (en) 2004-07-19 2010-03-30 Earthrenew, Inc. Process and system for drying and heat treating materials
US7610692B2 (en) 2006-01-18 2009-11-03 Earthrenew, Inc. Systems for prevention of HAP emissions and for efficient drying/dehydration processes
AU2008308477A1 (en) 2007-10-04 2009-04-09 Bio Architecture Lab, Inc. Biofuel production
US8309323B2 (en) * 2007-11-13 2012-11-13 Synthetic Genomics, Inc. Dimethyloctane as an advanced biofuel
WO2009086811A2 (de) * 2008-01-10 2009-07-16 Schmack Biogas Ag Paenibacillus macerans zur erzeugung von biogas
KR20100119877A (ko) * 2008-01-28 2010-11-11 바이오 아키텍쳐 랩, 인크. 단리된 알코올 디하이드로게나제 효소 및 이의 용도
US20100120111A1 (en) * 2008-11-13 2010-05-13 Robert Petcavich Method of producing hydrocarbon biofuels using genetically modified seaweed
RU2496880C2 (ru) * 2008-12-12 2013-10-27 СЕЛЕКСИОН, ЭлЭлСи Биологический синтез дифункциональных алканов из альфа-кетокислот
DE102009003587A1 (de) * 2009-03-07 2010-09-09 Schmack Biogas Gmbh Mikroorganismen zur Verflüssigung von Biomasse
WO2010072220A1 (de) * 2008-12-23 2010-07-01 Schmack Biogas Ag Paenibacillus macerans zur behandlung von biomasse
US8404465B2 (en) 2009-03-11 2013-03-26 Celexion, Llc Biological synthesis of 6-aminocaproic acid from carbohydrate feedstocks
CA3042565A1 (en) * 2009-04-30 2010-11-04 Genomatica, Inc. Microorganism expressing exogenous crotonase for producing 1,3-butanediol
US8420375B2 (en) * 2009-06-10 2013-04-16 Genomatica, Inc. Microorganisms and methods for carbon-efficient biosynthesis of MEK and 2-butanol
BRPI1010141A2 (pt) * 2009-06-22 2019-04-16 Joule Unlimited Tech Inc método para a produção biosintética de 1-alcenos, método para a produção biosintética de uma olefina, método para a produção biosintética de alcenos, cianobactéria manipulada e célula manipulada
FI122957B (fi) 2009-06-24 2012-09-14 Neste Oil Oyj Menetelmä rasvan tuottamiseksi
US7794969B1 (en) * 2009-07-09 2010-09-14 Joule Unlimited, Inc. Methods and compositions for the recombinant biosynthesis of n-alkanes
US7955820B1 (en) 2009-07-09 2011-06-07 Joule Unlimited, Inc. Methods and compositions for the recombinant biosynthesis of n-alkanes
US8912373B2 (en) * 2009-07-29 2014-12-16 The United States Of America As Represented By The Secretary Of The Navy Process for the dehydration of aqueous bio-derived terminal alcohols to terminal alkenes
US9242226B2 (en) 2009-07-29 2016-01-26 The Government Of The United States Of America As Represented By The Secretary Of The Navy Process for the dehydration of aqueous bio-derived terminal alcohols to terminal alkenes
US8987539B1 (en) * 2009-07-29 2015-03-24 The United States Of America As Represented By The Secretary Of The Navy Acyclic monoterpenes as biofuels based on linalool and method for making the same
US9932279B2 (en) 2009-07-29 2018-04-03 The United States Of America As Represented By The Secretary Of The Navy Process and apparatus for the selective dimerization of terpenes and poly-alpha-olefins with a single-stage reactor and a single-stage fractionation system
US9649626B2 (en) 2009-07-29 2017-05-16 The United States Of America As Represented By The Secretary Of The Navy Process for the dehydration of aqueous bio-derived terminal alcohols to terminal alkenes
US8785702B2 (en) 2009-07-29 2014-07-22 The United States Of America As Represented By The Secretary Of The Navy Turbine and diesel fuels and methods for making the same
US8969636B2 (en) 2009-07-29 2015-03-03 The United States Of America As Represented By The Secretary Of The Navy Homogeneous metallocene ziegler-natta catalysts for the oligomerization of olefins in aliphatic-hydrocarbon solvents
EP2464736A4 (en) * 2009-08-12 2013-07-31 Gevo Inc PATIENT LOCALIZATION OF CYTOSOLIC ISOBUTANOL FOR THE MANUFACTURE OF ISOBUTANOL
US9957530B2 (en) * 2009-08-21 2018-05-01 Lallemand Hungary Liquidity Management Llc Production of propanols, alcohols, and polyols in consolidated bioprocessing organisms
CA2772292A1 (en) * 2009-09-09 2011-03-17 Braskem S.A. Microorganisms and process for producing n-propanol
BR112012006939A2 (pt) 2009-09-29 2015-09-08 Butamax Tm Advanced Biofuels célula hospedeira de produção de levedura recombinante e método para a produção de um produto selecionado do grupo que consiste em 2,3-butanodiol, isobutanol, 2-butanol, 1-butanol, 2-butanona, valina, leucina, ácido lático, ácido málico, álcool, isoampilico e isoprenoides
WO2011044279A2 (en) * 2009-10-06 2011-04-14 Bio Architecture Lab, Inc. Microbial systems for producing commodity chemicals
CA2778453C (en) * 2009-10-26 2018-04-03 University Of Maine System Board Of Trustees Energy densification of biomass-derived organic acids
US8362306B2 (en) * 2009-10-26 2013-01-29 University Of Maine System Board Of Trustees Energy densification of biomass-derived organic acids
US8211677B2 (en) * 2009-10-26 2012-07-03 Saudi Arabian Oil Company Visible light-enhanced enzymatic promotion of hydrocarbon reactions
US8969635B2 (en) * 2009-10-27 2015-03-03 The United States Of America, As Represented By The Secretary Of The Navy Alkane enhancement of waste using microbial pre-treatement
WO2011057288A2 (en) * 2009-11-09 2011-05-12 The Regents Of The University Of California Isobutanol production with corynebacterium glutamicum
US20110124071A1 (en) * 2009-11-17 2011-05-26 LS9, Inc Methods and compositions for producing hydrocarbons
SG181607A1 (en) * 2009-12-10 2012-07-30 Genomatica Inc Methods and organisms for converting synthesis gas or other gaseous carbon sources and methanol to 1,3-butanediol
BR112012016043A2 (pt) 2009-12-29 2015-11-24 Butamax Advanced Biofuels Llc ''célula hospedeira de levedura recombinante, métodos para reproduzir isobutanol, para aumentar o consumo de glicose, para aumentar a formação de um produto de uma via biossintética e para melhorar o balanço de redox"
EP2524029B1 (en) 2010-01-15 2018-03-21 The Regents of The University of California Electro-autotrophic synthesis of higher alcohols
EP2529011A4 (en) * 2010-01-29 2015-07-15 Genomatica Inc MICROORGANISMS AND METHODS FOR BIOSYNTHESIS OF P-TOLUATE AND TEREPHTHALATE
CA2789583C (en) * 2010-02-12 2017-01-17 Gevo, Inc. Yeast microorganisms with reduced by-product accumulation for improved production of fuels, chemicals, and amino acids
SG182006A1 (en) * 2010-04-19 2012-07-30 Ngee Ann Polytechnic Trichoderma viride strain for cellulolytic enzyme production
US8999645B2 (en) 2010-05-07 2015-04-07 Menon Renewable Products, Inc. Bioreactors comprising fungal strains
CA2796789C (en) 2010-05-24 2019-10-15 Xyleco, Inc. Processing biomass
ES2685502T3 (es) 2010-05-25 2018-10-09 Neste Oyj Proceso y microorganismos para la producción de lípidos
WO2011159894A1 (en) 2010-06-17 2011-12-22 Butamax(Tm) Advanced Biofuels Llc Yeast production culture for the production of butanol
US8871488B2 (en) 2010-06-18 2014-10-28 Butamax Advanced Biofuels Llc Recombinant host cells comprising phosphoketolases
WO2011161685A2 (en) 2010-06-26 2011-12-29 Hcl Cleantech Ltd. Sugar mixtures and methods for production and use thereof
IL206678A0 (en) 2010-06-28 2010-12-30 Hcl Cleantech Ltd A method for the production of fermentable sugars
WO2012015949A2 (en) * 2010-07-29 2012-02-02 Joule Unlimited Technologies, Inc. Methods and compositions for improving yields of reduced products of photosynthetic microorganisms
WO2012021735A2 (en) 2010-08-11 2012-02-16 Menon & Associates, Inc. Pharmaceutical products from gungal strains
US8932602B2 (en) 2010-08-11 2015-01-13 Menon Renewable Products, Inc. Pharmaceutical products from fungal strains
WO2012027642A1 (en) * 2010-08-27 2012-03-01 Gevo, Inc. Balanced four-step pathways to renewable butanols
IL207945A0 (en) 2010-09-02 2010-12-30 Robert Jansen Method for the production of carbohydrates
US9023627B2 (en) 2010-09-15 2015-05-05 University Of Washington Through Its Center For Commercialization Systems and methods for biotransformation of carbon dioxide into higher carbon compounds
BR112013013136A2 (pt) * 2011-01-04 2016-07-12 Novozymes As processo de produção de biogás
US8652804B2 (en) * 2011-02-18 2014-02-18 The Regents Of The University Of California Transcription factor-based biosensors for detecting dicarboxylic acids
WO2012116254A2 (en) 2011-02-25 2012-08-30 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services Chrysophaentin analogs that inhibit ftsz protein
US9029124B2 (en) 2011-03-23 2015-05-12 Joule Unlimited Technologies, Inc. Photoalkanogens with increased productivity
US9512495B2 (en) 2011-04-07 2016-12-06 Virdia, Inc. Lignocellulose conversion processes and products
JP2013005764A (ja) * 2011-06-24 2013-01-10 National Institute Of Advanced Industrial Science & Technology 大腸菌において混合糖から有機物質を生産する方法
WO2013007786A1 (en) 2011-07-12 2013-01-17 Scientist Of Fortune S.A. Recombinant microorganism for the production of useful metabolites
CA2846234A1 (en) * 2011-08-22 2013-02-28 Suganit Systems, Inc. Production of bio-butanol and related products
US9617608B2 (en) 2011-10-10 2017-04-11 Virdia, Inc. Sugar compositions
WO2013115959A1 (en) * 2012-02-02 2013-08-08 Bio Architecture Lab, Inc. Methods and compositions for growth of yeast on alginate
WO2013130487A2 (en) * 2012-02-29 2013-09-06 Duke University Novel oxidoreductases for enantioselective reactions
RU2012112651A (ru) 2012-04-02 2013-10-10 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" (ЗАО "АГРИ") САМОИНДУЦИРУЕМАЯ ЭКСПРЕССИОННАЯ СИСТЕМА И ЕЕ ПРИМЕНЕНИЕ ДЛЯ ПОЛУЧЕНИЯ ПОЛЕЗНЫХ МЕТАБОЛИТОВ С ПОМОЩЬЮ БАКТЕРИИ СЕМЕЙСТВА Enterobacteriaceae
CN104411712A (zh) 2012-05-03 2015-03-11 威尔迪亚有限公司 用于处理木质纤维素材料的方法
KR101522682B1 (ko) * 2012-05-16 2015-05-26 한국생명공학연구원 로도코커스속 bfi332로부터 분리한 인돌-3-아세트알데하이드를 포함하는 생물막 형성 방지 또는 억제제 및 이를 이용한 생물막 형성 방지 또는 억제 방법
CN104619652B (zh) 2012-06-15 2017-06-13 微视生物技术有限公司 生物催化剂组合物和使用的方法
US9751815B2 (en) 2012-07-10 2017-09-05 Los Alamos National Security, Llc Conversion of oligomeric starch, cellulose, hydrolysates or sugars to hydrocarbons
WO2014011199A1 (en) * 2012-07-10 2014-01-16 Los Alamos National Security, Llc Conversion of oligomeric starch, cellulose, or sugars to hydrocarbons
CA2882276C (en) 2012-08-28 2016-11-01 Lanzatech New Zealand Limited Recombinant microorganisms expressing a stereospecific diol dehydratase enzyme
DK2935170T3 (da) 2012-12-20 2020-08-24 Archer-Daniels-Midland Company Hydrogeneringsprodukter fra biologisk-afledte carboxylsyreestere
WO2014169106A1 (en) * 2013-04-11 2014-10-16 Washington State University Modified plants for producing aroma/fine/specialty chemicals
WO2015002913A1 (en) 2013-07-03 2015-01-08 Butamax Advanced Biofuels Llc Partial adaptation for butanol production
JP2016192903A (ja) * 2013-09-17 2016-11-17 味の素株式会社 海藻由来バイオマスからのl−アミノ酸の製造方法
CN105745327A (zh) * 2013-09-17 2016-07-06 兹莫克姆有限公司 由可再生资源生产化合物的高产路线
WO2015089127A1 (en) 2013-12-12 2015-06-18 Dow Global Technologies Llc Processes to prepare elongated 2-ketoacids and c6-c10 compounds therefrom via genetic modifications to microbial metabolic pathways
CA2938361A1 (en) * 2014-02-11 2015-08-20 Pharnext Combination of baclofen, acamprosate and medium chain triglycerides for the treatment of neurological disorders
US11078548B2 (en) 2015-01-07 2021-08-03 Virdia, Llc Method for producing xylitol by fermentation
US9770045B2 (en) 2015-02-05 2017-09-26 Board Of Regents, The University Of Texas System Preservation of animal feed and hydrolysis of polysaccharides using amino acids as salts or with acids
BR112017025322A8 (pt) 2015-05-27 2022-08-23 Virdia Inc Processos integrados para recuperação de hidrolisato celulósico após hidrólise de polpa de celulose
WO2018008787A1 (ko) * 2016-07-04 2018-01-11 서울대학교산학협력단 알지네이트를 이용한 당알코올 형성 방법
CA3038660A1 (en) 2016-09-30 2018-04-05 Dow Global Technologies Llc Processes to prepare elongated 2-ketoacids and c5-c10 compounds therefrom via genetic modifications to microbial metabolic pathways
CA3052635A1 (en) 2017-02-06 2018-11-08 Zymergen Inc. Engineered biosynthetic pathways for production of tyramine by fermentation
US11613768B2 (en) 2017-07-25 2023-03-28 Arizona Board Of Regents On Behalf Of Arizona State University Microbial production of 2-phenylethanol from renewable substrates
EP3688175B1 (en) 2017-09-29 2024-03-13 Dow Global Technologies LLC Genetically modified isopropylmalate isomerase enzyme complexes and processes to prepare elongated 2-ketoacids and c5-c10 compounds therewith
KR20200074978A (ko) * 2017-10-23 2020-06-25 뉴트리리즈 비.브이. 람노갈락투로난-i 내 풍부화된 펙틱 다당류 단리물의 제조방법
KR102093546B1 (ko) * 2017-12-20 2020-04-23 건국대학교 산학협력단 에탄올에서 아세토인의 생산방법
BR112021021193A2 (pt) 2019-04-25 2022-01-04 Zymochem Inc Produção de produtos químicos a partir de fontes renováveis
WO2021012959A1 (zh) * 2019-07-24 2021-01-28 江南大学 一种褐藻胶裂解酶及其应用
CN110551654B (zh) * 2019-09-05 2021-04-30 中国农业科学院农业资源与农业区划研究所 阿氏芽孢杆菌、其代谢产物及其应用
CN110923041A (zh) * 2019-12-17 2020-03-27 沈阳中科腐蚀控制工程技术中心 生物质rna异构氢化酶半烃化稻壳锅炉燃料的方法
EP4121542A4 (en) * 2020-03-18 2024-05-15 Lanzatech, Inc. PRODUCTION BY FERMENTATION OF 2-PHENYLETHANOL FROM GASEOUS SUBSTRATES
WO2021189003A1 (en) * 2020-03-20 2021-09-23 Cemvita Factory, Inc. Biomanufacturing systems and methods for producing organic products from recombinant microorganisms
CN112048449A (zh) * 2020-07-31 2020-12-08 南京农业大学 一种堆肥复合菌剂及其应用
KR102191206B1 (ko) * 2020-08-20 2020-12-15 주은바이오주식회사농업회사법인 감귤박의 수분함량을 조절하는 신규 발효공정 및 이를 통하여 제조된 사료 조성물
WO2023245049A2 (en) * 2022-06-14 2023-12-21 Arzeda Corp. Compositions and methods for producing dihydrofurans from keto-sugars

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1997736A (zh) * 2004-03-25 2007-07-11 诺维信股份有限公司 用于降解或转化植物细胞壁多糖的方法
WO2007089677A2 (en) * 2006-01-27 2007-08-09 University Of Massachusetts Systems and methods for producing biofuels and related materials

Family Cites Families (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US566797A (en) * 1896-09-01 Hannibal w
US785118A (en) * 1904-05-02 1905-03-21 Charles A Pettie Vehicle-tire.
US5162516A (en) * 1988-05-31 1992-11-10 University Of Florida Cloning and sequencing of the alcohol dehydrogenase II gene from Zymomonas mobilis
US5821093A (en) * 1988-08-31 1998-10-13 University Of Florida Research Foundation, Inc. Recombinant cells that highly express chromosomally-integrated heterologous genes
US5028539A (en) * 1988-08-31 1991-07-02 The University Of Florida Ethanol production using engineered mutant E. coli
US7192772B1 (en) * 1988-08-31 2007-03-20 The University Of Florida Research Foundations, Inc. Recombinant cells that highly express chromosomally-integrated heterologous gene
US5554520A (en) * 1988-08-31 1996-09-10 Bioenergy International, L.C. Ethanol production by recombinant hosts
US5487989A (en) * 1988-08-31 1996-01-30 Bioenergy International, L.C. Ethanol production by recombinant hosts
US5000000A (en) * 1988-08-31 1991-03-19 University Of Florida Ethanol production by Escherichia coli strains co-expressing Zymomonas PDC and ADH genes
US6849434B2 (en) * 1988-08-31 2005-02-01 University Of Florida Research Foundation, Inc. Ethanol production in recombinant hosts
US5424202A (en) * 1988-08-31 1995-06-13 The University Of Florida Ethanol production by recombinant hosts
US5482846A (en) * 1988-08-31 1996-01-09 University Of Florida Ethanol production in Gram-positive microbes
US5298421A (en) * 1990-04-26 1994-03-29 Calgene, Inc. Plant medium-chain-preferring acyl-ACP thioesterases and related methods
US5344771A (en) * 1990-04-26 1994-09-06 Calgene, Inc. Plant thiosterases
US5455167A (en) * 1991-05-21 1995-10-03 Calgene Inc. Medium-chain thioesterases in plants
US5424846A (en) * 1993-05-05 1995-06-13 Ohio Electronic Engravers, Inc. Cylinder support apparatus and method for use in an engraver
KR20000064592A (ko) * 1996-03-15 2000-11-06 막스-플랑크-게젤샤프트 츄어 푀르더룽 데어 비쎈샤프텐 에.파우. 재조합단백질용엑스포트시스템
US6102690A (en) * 1997-04-07 2000-08-15 Univ. Of Florida Research Foundation, Inc. Recombinant organisms capable of fermenting cellobiose
US6280986B1 (en) * 1997-12-01 2001-08-28 The United States Of America As Represented By The Secretary Of Agriculture Stabilization of pet operon plasmids and ethanol production in bacterial strains lacking lactate dehydrogenase and pyruvate formate lyase activities
GB9726398D0 (en) * 1997-12-12 1998-02-11 Isis Innovation Polypeptide and coding sequences
US20040259151A1 (en) * 2001-03-02 2004-12-23 Joachim Jose Functional surface display of polypeptides
DE10142467A1 (de) * 2001-08-31 2003-03-20 Basf Ag Neue Pyruvatdecarboxylase, ihre Herstellung und Verwendung
US7060217B2 (en) * 2003-06-12 2006-06-13 General Electric Company Composite articles comprising resorcinol arylate polyester and method for making thereof
GB0403992D0 (en) * 2004-02-23 2004-03-31 Isis Innovation Oxidation by hydrogen peroxide
US7439034B2 (en) * 2004-06-01 2008-10-21 University Of Maryland Alginases, systems containing alginases and methods of cloning, purifying and/or utilizing alginases
CA2559760A1 (en) 2004-07-02 2006-07-06 Metanomics Gmbh Process for the production of fine chemicals
PT103331A (pt) * 2005-08-05 2007-02-28 Fundacao Da Faculdade De Cienc Expressão dum transportador activo de xilose em saccharomyces cerevisiae modificada geneticamente
EP1948814B1 (en) * 2005-10-26 2018-11-21 Butamax (TM) Advanced Biofuels LLC Fermentive production of four carbon alcohols
ES2763624T3 (es) 2006-05-19 2020-05-29 Genomatica Inc Producción de ácidos grasos y derivados de los mismos
US20100143985A1 (en) * 2007-02-08 2010-06-10 Biofuelchem Co., Ltd. Method for preparing butanol through butyryl-coa as an intermediate using yeast
AU2008308477A1 (en) 2007-10-04 2009-04-09 Bio Architecture Lab, Inc. Biofuel production
KR20100119877A (ko) 2008-01-28 2010-11-11 바이오 아키텍쳐 랩, 인크. 단리된 알코올 디하이드로게나제 효소 및 이의 용도
KR20110098936A (ko) 2008-12-11 2011-09-02 바이오 아키텍쳐 랩, 인크. 범용화학제품의 생합성
WO2011044279A2 (en) 2009-10-06 2011-04-14 Bio Architecture Lab, Inc. Microbial systems for producing commodity chemicals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1997736A (zh) * 2004-03-25 2007-07-11 诺维信股份有限公司 用于降解或转化植物细胞壁多糖的方法
WO2007089677A2 (en) * 2006-01-27 2007-08-09 University Of Massachusetts Systems and methods for producing biofuels and related materials

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
AKIHITO OCHIAI等: "A biosystem for alginate metabolism in Agrobacterium tumefaciens strain C58: Molecular identification of Atu3025 as an exotype family PL-15 alginate lyase", 《RESEARCH IN MICROBIOLOGY》 *
DORAN JB等: "Fermentations of pectin-rich biomass with recombinant bacteria to produce fuel ethanol", 《APPLIED BIOCHEMISTRY AND BIOTECHNOLOGY》 *
HORN SJ: "Bioenergy from brown seaweeds", 《A THESIS SUBMITTED IN PARTIAL FULFILMENT OF THE REQUIREMENTS FOR THE ACADEMIC TITLE DOKTOR INGENIØR》 *
HORN SJ等: "Ethanol production from seaweed extract", 《JOURNAL OF INDUSTRIAL MICROBIOLOGY&BIOTECHNOLOGY》 *
O. MIYAKE等: "An exotype alginate lyase in Sphingomonas sp. A1: overexpression in Escherichia coli, purification, and characterization of alginate lyase IV (A1-IV)", 《PROTEIN EXPRESSION AND PURIFICATION》 *
YANASE H等: "Ethanol production from cellobiose by Zymobacter palmae carrying the Ruminocuccus albus β-glucosidase gene", 《JOURNAL OF BIOTECHNOLOGY》 *
YANASE H等: "Genetic Engineering of Zymobacter palmae for Production of Ethanol from Xylose", 《APPLED AND ENVIRONMENTAL MICROBIOLOGY》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102286382B (zh) * 2011-05-20 2013-03-13 桂林理工大学 一种降解叶绿素的菌株及降解方法
CN102286382A (zh) * 2011-05-20 2011-12-21 桂林理工大学 一种降解叶绿素的菌株及降解方法
CN103014075A (zh) * 2012-09-20 2013-04-03 江南大学 利用一株安全菌株发酵生物柴油副产物粗甘油生产2,3-丁二醇
CN103014075B (zh) * 2012-09-20 2014-07-16 江南大学 利用一株安全菌株发酵生物柴油副产物粗甘油生产2,3-丁二醇
CN103451112A (zh) * 2013-09-02 2013-12-18 中国农业科学院农业资源与农业区划研究所 一株耐盐碱长枝木霉及其应用
CN103451112B (zh) * 2013-09-02 2015-06-17 中国农业科学院农业资源与农业区划研究所 一株耐盐碱长枝木霉及其应用
CN104561135B (zh) * 2013-10-15 2020-06-26 丰益(上海)生物技术研发中心有限公司 里氏木霉生产芳香物质的方法
CN104561135A (zh) * 2013-10-15 2015-04-29 丰益(上海)生物技术研发中心有限公司 里氏木霉生产芳香物质的方法
CN107231807A (zh) * 2014-12-10 2017-10-03 陶氏环球技术有限责任公司 基因修饰苯丙酮酸脱羧酶、其制备方法和用途
CN107231807B (zh) * 2014-12-10 2021-03-16 陶氏环球技术有限责任公司 基因修饰苯丙酮酸脱羧酶、其制备方法和用途
CN107208117A (zh) * 2014-12-16 2017-09-26 新派克股份公司 异丁醇生产的酶促方法
CN107636157B (zh) * 2015-06-10 2021-10-26 东丽株式会社 3-羟基己二酸的制造方法
CN107636157A (zh) * 2015-06-10 2018-01-26 东丽株式会社 3‑羟基己二酸的制造方法
CN106398780A (zh) * 2015-07-28 2017-02-15 北京特生物化工有限公司 一种低凝生物柴油及其制备方法
CN109205795A (zh) * 2017-12-21 2019-01-15 向勇 一种复合硝化菌及其生产方法
CN108285881B (zh) * 2018-01-04 2021-06-08 广州大学 一种具有同步产电和反硝化活性的分支杆菌及其应用
CN108285881A (zh) * 2018-01-04 2018-07-17 广州大学 一种具有同步产电和反硝化活性的分支杆菌及其应用
CN111187738A (zh) * 2020-02-11 2020-05-22 江南大学 产2,3-戊二酮的嗜热链球菌及其在制备豆乳中应用
CN111187738B (zh) * 2020-02-11 2021-08-20 江南大学 产2,3-戊二酮的嗜热链球菌及其在制备豆乳中应用
CN115261293A (zh) * 2021-04-29 2022-11-01 北京化工大学 一种产羟基己二酸的基因工程菌
CN115261293B (zh) * 2021-04-29 2024-02-02 北京化工大学 一种产羟基己二酸的基因工程菌
CN113652366A (zh) * 2021-07-26 2021-11-16 北京联合大学 一种用于厨余垃圾降解的复合微生物菌剂的组合方法
CN114437988A (zh) * 2022-02-28 2022-05-06 贵州医科大学 纤维素降解菌及菌剂、制备方法、应用和降解酒糟的方法
CN114437988B (zh) * 2022-02-28 2023-05-23 贵州医科大学 纤维素降解菌及菌剂、制备方法、应用和降解酒糟的方法
CN114686541A (zh) * 2022-02-28 2022-07-01 北京焉支山科技有限公司 一种化妆品级己糖-6-磷酸组合物的生物酶法合成方法及其应用
CN115572744A (zh) * 2022-06-30 2023-01-06 中国科学院天津工业生物技术研究所 一种1,4-二羟基-2-丁酮化合物的生物合成方法
WO2024001218A1 (zh) * 2022-06-30 2024-01-04 中国科学院天津工业生物技术研究所 一种1,4-二羟基-2-丁酮化合物的生物合成方法

Also Published As

Publication number Publication date
US8318473B2 (en) 2012-11-27
US20130252312A1 (en) 2013-09-26
CL2008002961A1 (es) 2009-05-08
WO2009046370A8 (en) 2009-07-23
KR20100091162A (ko) 2010-08-18
NZ584162A (en) 2012-05-25
JP2010539988A (ja) 2010-12-24
EP2195440A2 (en) 2010-06-16
US20110244553A1 (en) 2011-10-06
US8211689B2 (en) 2012-07-03
BRPI0817754A2 (pt) 2014-11-25
WO2009046370A3 (en) 2009-10-29
US20090139134A1 (en) 2009-06-04
US20110256595A1 (en) 2011-10-20
CA2699929A1 (en) 2009-04-09
US8318464B2 (en) 2012-11-27
US20110269215A1 (en) 2011-11-03
US20110236939A1 (en) 2011-09-29
MX2010003501A (es) 2010-06-09
US20090155873A1 (en) 2009-06-18
AU2008308477A1 (en) 2009-04-09
US8198056B2 (en) 2012-06-12
US20110236938A1 (en) 2011-09-29
WO2009046370A2 (en) 2009-04-09
WO2009046375A3 (en) 2009-09-24
CL2008002960A1 (es) 2009-05-08
WO2009046375A2 (en) 2009-04-09

Similar Documents

Publication Publication Date Title
CN101889092A (zh) 生物燃料生产
KR102121888B1 (ko) 재조합 미생물 및 이에 대한 용도
KR20110098936A (ko) 범용화학제품의 생합성
US20140170731A1 (en) Methods, systems and compositions related to microbial bio-production of butanol and/or isobutanol
AU2024201435A1 (en) Microorganisms and methods for the biological production of ethylene glycol
CN107771214A (zh) 用于具有增加的2,4‑二羟基丁酸外排物的优化的2,4‑二羟基丁酸产生的修饰的微生物
KR20160093648A (ko) 케톤을 생산하기 위한 방법 및 미생물
CN101748069B (zh) 一种重组蓝藻
CN110982773A (zh) 重组枯草芽孢杆菌及其在生产2,3-丁二醇中的应用
US11952607B2 (en) Microorganisms and methods for improved biological production of ethylene glycol
CN114015634B (zh) 高产琥珀酸的重组大肠杆菌及其构建方法和应用
CN110964704B (zh) 羟基氧化酶cyb5a突变体与环系列产品的制备方法
CN117693588A (zh) 用于改进乙二醇的生物产生的微生物和方法
KR20240046579A (ko) 이소프레노이드 알코올 및 유도체의 생성을 위한 미생물 발효

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20101117