CN107250368A - 脱氢酶催化的fdca的产生 - Google Patents

脱氢酶催化的fdca的产生 Download PDF

Info

Publication number
CN107250368A
CN107250368A CN201680010802.8A CN201680010802A CN107250368A CN 107250368 A CN107250368 A CN 107250368A CN 201680010802 A CN201680010802 A CN 201680010802A CN 107250368 A CN107250368 A CN 107250368A
Authority
CN
China
Prior art keywords
ala
leu
gly
val
cell
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680010802.8A
Other languages
English (en)
Inventor
H·J·鲁伊塞纳尔斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Purac Biochem BV
Original Assignee
Purac Biochem BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Purac Biochem BV filed Critical Purac Biochem BV
Publication of CN107250368A publication Critical patent/CN107250368A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08GMACROMOLECULAR COMPOUNDS OBTAINED OTHERWISE THAN BY REACTIONS ONLY INVOLVING UNSATURATED CARBON-TO-CARBON BONDS
    • C08G63/00Macromolecular compounds obtained by reactions forming a carboxylic ester link in the main chain of the macromolecule
    • C08G63/02Polyesters derived from hydroxycarboxylic acids or from polycarboxylic acids and polyhydroxy compounds
    • C08G63/12Polyesters derived from hydroxycarboxylic acids or from polycarboxylic acids and polyhydroxy compounds derived from polycarboxylic acids and polyhydroxy compounds
    • C08G63/16Dicarboxylic acids and dihydroxy compounds
    • C08G63/18Dicarboxylic acids and dihydroxy compounds the acids or hydroxy compounds containing carbocyclic rings
    • C08G63/181Acids containing aromatic rings
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0014Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
    • C12N9/0016Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with NAD or NADP as acceptor (1.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01001Alcohol dehydrogenase (1.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/01Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with NAD+ or NADP+ as acceptor (1.2.1)
    • C12Y102/01003Aldehyde dehydrogenase (NAD+) (1.2.1.3)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Polymers & Plastics (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Furan Compounds (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及表达具有5‑羟甲基‑2‑呋喃羧酸脱氢酶活性的多肽的细胞,以及表达具有呋喃化合物转运能力的多肽的细胞。本发明还涉及产生2,5‑呋喃‑二羧酸(FDCA)的方法,其中本发明的细胞用于氧化FDCA的呋喃前体。

Description

脱氢酶催化的FDCA的产生
发明领域
本发明涉及酶学、分子遗传学、生物转化和发酵技术领域。特别地,本发明涉及将5-(羟甲基)-2-糠酸氧化为5-甲酰-2-糠酸的脱氢酶,及涉及编码这种脱氢酶的多核苷酸及其在羟甲基糖醛至2,5-呋喃二羧酸的生物转化中的应用。
发明背景
2,5-呋喃二羧酸(FDCA)是一种单体化合物,其可以用于产生具有巨大经济影响的聚酯。在该领域中一个非常重要的化合物是聚对苯二甲酸乙二醇酯(PET),其是从对苯二甲酸(PTA)和乙二醇产生的。FDCA在聚酯PET中可代替PTA,在这种情况中产生聚呋喃二甲酸乙二醇酯(PEF)。PEF具有在聚酯大市场中代替PET的良好潜力。不仅是因为当其与PET相比时具有更优秀的性质,还因为其可以衍生自可再生原料。FDCA可以通过化学(De Jong et al2012.In:Biobased Monomers,Polymers,and Materials;Smith,P.,et al.;ACSSymposium Series;American Chemical Society:Washington,DC)或者组合的化学-生物途径(Wiercks et al 2011.Appl Microbiol Biotechnol92:1095-1105)从糖产生。在后者的情况中,单体糖如葡萄糖或果糖被化学转化为5-(羟甲基)-2-糠醛(HMF),其随后可以由酶氧化为FDCA。
从HMF中产生FDCA的生物途径已经基于HMF降解株Cupriavidus basilensisHMF14的分离(Wierckx et al 2010.Microbial Technology 3:336-343)而开发。鉴别了编码在C.basilensis HMF14中参与HMF降解途径的酶的基因簇及在恶臭假单胞菌(Pseudomonas putida)菌株中异源表达相关基因(Koopman et al 2010.PNAS 107:4919-4924),由此获得代谢HMF的能力。降解途径的第一个氧化步骤包括形成5-(羟甲基)-2-糠酸(HMFCA),其随之被氧化为5-甲酰-2-糠酸(FFA)及进一步氧化为FDCA。在随后的研究中(Koopman et al 2010.Bioresource Technology 101:6291-6296及WO 2011/026913),仅编码HMF氧化还原酶的C.basilensis HMF14的hmfli基因被导入恶臭假单胞菌中。所述氧化还原酶主要对于HMFCA作为氧化酶,但是其也可以氧化HMF或FFA。仅hmfli基因的异源表达可以使恶臭假单胞菌从HMF产生FDCA。在进一步优化的研究中(Wierckx et al 2011,supra;及WO 2012/064195),两个另外的基因在恶臭假单胞菌中表达,其分别编码HMFCA转运蛋白和具有未知特异性的醛脱氢酶。
然而,从HMF产生FDCA的氧化酶催化途径与脱氢酶催化途径相比具有一些固有的缺点,包括至少产生毒性H2O2、缺少从氧化步骤获得能量和不佳的O2亲和性及相关的系统高需氧量。因此,本发明的目的是通过提供用于从呋喃前体如HMF产生FDCA的新的脱氢酶催化途径的手段和方法,以及提供在这种方法中使用新的HMFCA转运蛋白的手段和方法,从而解决上述这些缺点。
发明概述
在第一方面,本发明涉及包含表达核苷酸序列的表达构建体的细胞,所述核苷酸序列编码具有与SEQ ID NO:1-11任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将5-羟甲基-2-呋喃羧酸(HMFCA)氧化为5-甲酰-2-糠酸(FFA)的能力。优选地,所述细胞进一步具有:a)醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸,其中优选所述细胞包含第二表达构建体,表达编码包含与SEQ ID NO:24、25、26、27、28、29和30任一氨基酸序列具有至少45%相同性的氨基酸序列的醛脱氢酶的核苷酸序列,其中第二表达构建体可以在细胞中表达,及与没有第二表达构建体的相应野生型细胞相比,所述醛脱氢酶的表达赋予所述细胞或增加所述细胞中如下至少一种能力:i)将5-羟甲基糠醛(HMF)氧化为HMFCA,ii)将DFF氧化为FFA,及iii)将FFA氧化为FDCA;及b)将呋喃化合物转运进/转运出细胞的能力,其中优选所述细胞包含第三表达构建体以表达编码具有将至少FDVIFCA转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与SEQ ID NO:17、31、32、33和34任一氨基酸序列具有至少45%相同性的氨基酸序列,其中第三表达构建体可以在细胞中表达,及与没有第三表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少FDVIFCA转运进细胞的能力。
另一方面,本发明涉及包含表达编码具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列的表达构建体的细胞,所述多肽包含与SEQ ID NO:17氨基酸序列具有至少86.5%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达至少赋予所述细胞或增加所述细胞中将至少HMFCA转运进细胞的能力,及其中所述细胞进一步包含将HMF转变为FDCA的酶,其中将HMF转变为FDCA的酶优选包括如下至少一种:a)醇脱氢酶,其将HMFCA氧化为FFA及醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸;及b)氧化还原酶,其将HMF、2,5-二羟甲基呋喃、HMFCA、FFA和2,5-二甲酰呋喃的一或多种氧化为FDCA,及任选存在的醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸。
本发明的细胞优选是微生物细胞,如细菌、酵母或丝状真菌细胞。本发明的酵母或丝状真菌细胞优选选自如下属:假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)、支顶孢属(Acremonium)、伞菌属(Agaricus)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、毁丝霉属(Myceliophthora)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、隐球菌属(Cryptococcus)、Filibasidium、镰刀菌属(Fusarium)、腐殖霉属(Humicola)、稻瘟菌属(Magnaporthe)、毛霉菌属(Mucor)、毁丝霉属(Myceliophthora)、新丽鞭毛菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、梨囊鞭菌属(Piromyces)、原毛平革菌属(Panerochaete)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)和木霉属(Trichoderma),最优选酵母或丝状真菌细胞选自如下种:乳酸克鲁维酵母(Kluyveromyceslactis)、酿酒酵母(S.cerevisiae)、多形汉逊酵母(Hansenula polymorpha)、解脂耶氏酵母(Yarrowia lipolytica)、巴斯德毕赤酵母(Pichia pastoris)、黑曲霉(Aspergillusniger)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、酱油曲霉(Aspergillus sojae)、烟曲霉(Aspergillus fumigatus)、埃默森踝节菌(Talaromycesemersonii)、米曲霉(Aspergillus oryzae)、嗜热毁丝霉(Myceliophthora thermophila)、里氏木霉(Trichoderma reesei)和产黄青霉菌(Penicillium chrysogenum)。本发明的细菌细胞优选选自如下菌属:埃希氏菌属(Escherichia)、鱼腥藻属(Anabaena)、Aeribacillus、解硫胺素杆菌属(Aneurinibacillus)、伯克霍尔德氏菌属(Burkholderia)、慢生根瘤菌属(Bradyrhizobium)、柄杆菌属(Caulobacter)、贪铜菌属(Cupriavidus)、脱硫肠状菌属(Desulfotomaculum)、Desulfurispora、葡糖杆菌属(Gluconobacter)、红杆菌属(Rhodobacter)、Pelotomaculum、假单胞菌属(Pseudomonas)、副球菌属(Paracoccus)、芽孢杆菌属(Bacillus)、地芽孢杆菌属(Geobacillus)、短小芽孢杆菌属(Brevibacillus)、短杆菌属(Brevibacterium)、棒杆菌属(Corynebacterium)、根瘤菌属(Rhizobium(中华根瘤菌属(Sinorhizobium))、黄杆菌属(Flavobacterium)、克雷伯氏菌属(Klebsiella)、肠杆菌属(Enterobacter)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、甲基杆菌属(Methylobacterium)、罗尔斯通氏菌属(Ralstonia)、红假单胞菌属(RhodoPseudomonas)、葡萄球菌属(Staphylococcus)及链霉菌属(Streptomyces),更优选细菌细胞选自如下菌种:A.pallidus、A.terranovensis、枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B.amyloliquefaciens)、凝结芽孢杆菌(B.coagulans)、克里不所类芽孢杆菌(B.kribbensis)、地衣芽孢杆菌(B.licheniformis)、B.puntis、巨大芽孢杆菌(B.megaterium)、耐盐芽孢杆菌(B.halodurans)、短小芽孢杆菌(B.pumilus)、热红短小芽孢杆菌(B.thermoruber)、B.panacihumi、C.basilensis、库氏脱硫肠状菌(D.kuznetsovii)、D.thermophila、嗜热地芽孢杆菌(G.kaustophilus)、氧化葡糖杆菌(Gluconobacter oxydans)、新月柄杆菌(Caulobacter crescentus)CB 15、扭托甲基杆菌(Methylobacterium extorquens)、类球红细菌(Rhodobacter sphaeroides)、Pelotomaculum thermopropionicum、Pseudomonas zeaxanthinifaciens、恶臭假单胞菌、Paracoccus denitrificans、大肠杆菌(E.coli)、谷氨酸棒杆菌(C.glutamicum)、肉葡萄球菌(Staphylococcus carnosus)、变铅青链霉菌(Streptomyces lividans)、苜蓿中华根瘤菌(Sinorhizobium melioti)和Rhizobium radiobacter。
再一方面,本发明涉及一种制备具有如以上方面定义的HMFCA脱氢酶活性的多肽和/或制备具有如以上方面定义的呋喃化合物转运能力的多肽的方法。所述方法优选包括在有益于一或多种多肽表达的条件下培养如上述方面定义的细胞及任选回收所述一或多种多肽的步骤。
另一方面,本发明涉及将HMFCA氧化为FFA的方法,所述方法包括在存在HMFCA条件下、优选在有益于细胞氧化HMFCA的条件下孵育上述任一方面定义的细胞的步骤。
再一方面,本发明涉及一种产生FDCA的方法,所述方法包括在包含FDCA的一或多个呋喃前体的培养基中孵育上述任一方面的细胞的步骤,优选在有益于细胞将FDCA的呋喃前体氧化为FDCA的条件下进行,及任选包括回收FDCA,其中优选FDCA的至少一个呋喃前体选自HMF、2,5-二羟甲基呋喃(DHF或HMF-OH)、HMFCA、FFA和2,5-二甲酰呋喃(DFF),最优选FDVIF,其中FDCA的呋喃前体得自一或多种己糖,优选得自木质纤维素生物质的一或多种己糖,优选通过酸催化的脱水获得,及其中优选通过包括酸或盐沉淀及随后冷却结晶和/或溶剂提取的方法从所述培养基中回收FDCA。
再一方面,本发明涉及一种从一或多个FDCA单体产生聚合物的方法,所述方法包括如下步骤:a)在根据上述方面的方法中制备FDCA单体;及从在a)中获得的FDCA单体产生聚合物。
本发明还涉及使用上述任何方面的细胞将FDCA的一或多种呋喃前体经生物转化为FDCA,其中优选FDCA的至少一种呋喃前体选自HMF、DHF、HMFCA、FFA和DFF,最优选HMF。
另一方面,本发明涉及具有HMFCA脱氢酶活性的多肽,所述多肽包含与SEQ ID NO:1所示氨基酸序列具有至少81.85%序列相同性的氨基酸序列。在这个方面,本发明还涉及包含如下至少一个序列的核酸分子:a)编码具有HMFCA脱氢酶活性的多肽的核苷酸序列,所述多肽包含与SEQ ID NO:1所示氨基酸序列具有至少81.85%序列相同性的氨基酸序列;b)SEQ ID NO:12或13所示核苷酸序列;c)如(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;d)序列由于遗传密码的简并而与b)或c)的核苷酸序列不同的核苷酸序列;及e)是a)-c)定义的核苷酸序列的反向补体的核苷酸序列,其中优选所述核酸分子是载体。在这个方面,本发明进一步涉及包含本方面的多肽和本方面的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。
在最后一方面,本发明涉及具有将至少HMFCA转运进细胞的能力的多肽,所述多肽包含与SEQ ID NO:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列。在这个方面,本发明还涉及核酸分子,其包含如下至少一个序列:a)编码具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与SEQ ID NO:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列;b)SEQ ID NO:18所示核苷酸序列;c)(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;d)序列由于遗传密码简并而与b)或c)的核苷酸序列不同的核苷酸序列;及e)是a)-d)定义的核苷酸序列的反向补体的核苷酸序列,其中优选所述核酸分子是载体。在这个方面中,本发明进一步涉及包含本方面的多肽和本方面的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。
发明描述
定义
术语“同源性”、“序列相同性”等在本文可互换使用。序列相同性在本文定义为通过序列对比确定的两或更多个氨基酸(多肽或蛋白质)序列或者两或更多个核酸(多核苷酸)序列之间的关系。在本领域中,“相同性”还是指氨基酸或核酸序列之间的序列相关性的程度,可以通过这种序列串之间的匹配确定。两个氨基酸序列之间的“相似性”是通过对比氨基酸序列及一个多肽至另一个多肽序列的保守氨基酸取代而确定的。“相同性”和“相似性”可易于通过已知方法计算。
“序列相同性”和“序列相似性”可以通过根据两个序列的长度使用整体或局部比对算法比对两个多肽或两个核苷酸序列而确定。相似长度的序列优选使用整体比对算法比对(例如Needleman Wunsch),这种方法在全长上最佳比对了序列,而显著不同长度的序列优选使用局部比对算法比对(例如Smith Waterman)。然后当其(当最佳比对时,例如使用默认参数的GAP或BESTFIT程序)共有至少一定最小百分比的序列相同性时(如下文定义),可以将所述序列称作“基本相同的”或者“基本相似的”。GAP使用Needleman和Wunsch整体比对算法以在完整长度(全长)比对两个序列,使匹配数最大化及缺口数最小化。整体比对适用于确定当两个序列具有相似长度时的序列相同性。通常,使用GAP默认参数,缺口产生罚分=50(核苷酸)/8(蛋白质),缺口延伸罚分=3(核苷酸)/2(蛋白质)。对于核苷酸,使用的默认评分矩阵是nwsgapdna,对于蛋白质,默认评分矩阵是Blosum62(Henikoff&Henikoff,1992,PNAS 89,915-919)。针对序列相同性百分比的序列比对和评分可以使用计算机程序确定,如GCG Wisconsin Package,Version 10.3,可得自Accelrys Inc.(9685ScrantonRoad,San Diego,CA 92121-3752USA),或者使用开源软件如EmbossWIN version 2.10.0中的程序“needle”(使用整体Needleman Wunsch算法)或者“water”(使用局部SmithWaterman算法),使用与上述GAP相同的参数或者使用默认设置(对于“needle”和“water”二者及对于蛋白质和DNA比对二者,默认缺口开放罚分是10.0及默认缺口延伸罚分是0.5;默认评分矩阵是Blossum62(蛋白质)和DNAFull(DNA))。当序列的整体长度显著不同时,优选局部比对法如使用Smith Waterman算法的那些。
或者,相似性或相同性百分比可以通过使用如FASTA、BLAST等算法搜索公共数据库而确定。因此,本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行公共数据库搜索,以例如鉴别其它家族成员或相关序列。这种搜索可以使用Altschul,et al.(1990)J.Mol.Biol.215:403-10所述BLASTn和BLASTx程序(2.0版)进行。BLAST核苷酸搜索可以使用NBLAST程序,得分=100,字长=12进行以获得与本发明的氧化还原酶核酸分子同源的核苷酸序列。BLAST蛋白质搜索可以使用BLASTx程序,得分=50,字长=3进行以获得与本发明的蛋白质分子同源的氨基酸序列。为了获得缺口比对以进行对比,可以使用如Altschul etal.,(1997)Nucleic Acids Res.25(17):3389-3402所述的Gapped BLAST。当使用BLAST和Gapped BLAST程序时,可以使用各个程序的默认参数(例如BLASTx和BLASTn)。见NationalCenter for Biotechnology Information主页http://www.ncbi.nlm.nih.gov/。
任选地,在确定氨基酸相似性程度中,技术人员也可以考虑到所谓的“保守”氨基酸取代,这些为技术人员所已知。保守氨基酸取代是指具有相似侧链的残基的可交换性。例如,具有脂肪族侧链的一组氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的一组氨基酸是丝氨酸和苏氨酸;具有含有酰胺侧链的一组氨基酸是天冬酰胺和谷氨酰胺;具有芳香族侧链的一组氨基酸是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的一组氨基酸是赖氨酸、精氨酸和组氨酸;具有含硫侧链的一组氨基酸是半胱氨酸和甲硫氨酸。优选的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸,及天冬酰胺-谷氨酰胺。本文揭示的氨基酸序列的取代变体是其中在揭示的序列中至少一个残基已经除去且在此位置插入一个不同残基的那些。优选地,所述氨基酸改变是保守的。优选的每个天然发生的氨基酸的保守取代如下所示:Ala至ser,Arg至lys,Asn至gln或his,Asp至glu,Cys至ser或ala,Gln至asn,Glu至asp,Gly至pro,His至asn或gln,Ile至leu或val,Leu至ile或val,Lys至arg,gln至glu,Met至leu或ile,Phe至met,leu至tyr,Ser至thr,Thr至ser,Trp至tyr,Tyr至trp或phe,及Val至ile或leu。
如本文所用,术语“选择性杂交”等相似用语是描述杂交和洗涤条件,在此条件下彼此至少66%、至少70%、至少75%、至少80%、优选至少85%、更优选至少90%、优选至少95%、更优选至少98%或更优选至少99%同源的核苷酸序列典型保持彼此杂交。也就是说,这种杂交序列可共有至少45%、至少50%、至少55%、至少60%、至少65、至少70%、至少75%、至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少98%或更优选至少99%序列相同性。
优选的非限制性的这种杂交条件例如是在6×氯化钠/柠檬酸钠(SSC)中在大约45℃杂交,随后在1×SSC、0.1%SDS中在大约50℃、优选大约55℃、优选大约60℃及更优选大约65℃进行一或多次洗涤。
高度严格条件包括例如在5×SSC/5×Denhardt's溶液/1.0%SDS中在大约68℃杂交及在0.2×SSC/0.1%SDS中在室温洗涤。或者,洗涤可以在42℃进行。
技术人员已知哪种条件应用于严格和高度严格杂交条件。关于这种条件的其它指导在本领域可易于获得,例如见于Sambrook et al.,1989,Molecular Cloning,ALaboratory Manual,Cold Spring Harbor Press,N.Y.;及Ausubel et al.(eds.),Sambrook and Russell(2001)"Molecular Cloning:A Laboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,New York1995,Current Protocols in Molecular Biology,(John Wiley&Sons,N.Y.)。
当然,仅与聚A序列(如mRNA的3’末端poly(A))或者T(或U)残基的互补节段序列杂交的多核苷酸不包含在用于特异性杂交本发明核酸一部分的本发明的多核苷酸中,因为这种多核苷酸将与含有poly(A)节段序列或其补体(例如实际上任何双链cDNA克隆)的任何核酸分子杂交。
“核酸构建体”或者“核酸载体”在本文应理解为是指使用重组DNA技术获得的人工核酸分子。术语“核酸构建体”因此不包括天然发生的核酸分子,尽管核酸构建体可包含(部分)天然发生的核酸分子。术语“表达载体”或者“表达构建体”是指能影响基因在与这种序列相容的宿主细胞或宿主生物体中表达的核苷酸序列。这些表达载体典型包括至少合适的转录调节序列及任选包括3’转录终止信号。也可以存在实现表达必需的或者有益的其它因子,如表达增强子元件。表达载体将被导入合适的宿主细胞中并能在宿主细胞中和体外细胞培养物中实现编码序列的表达。表达载体适于在本发明的宿主细胞或生物体中复制。
如本文所用,术语“启动子”或者“转录调节序列”是指发挥控制一或多个编码序列转录的核酸片段,其位于编码序列的转录起始位点的转录方向上游,通过存在DNA依赖性RNA聚合酶的结合位点、转录起始位点及任何其它DNA序列包括但不限于转录因子结合位点、阻抑物和激活物蛋白质结合位点及本领域技术人员已知的直接或间接调节从启动子的转录量的任何其它核苷酸序列而结构性鉴别。“组成型”启动子是在大多数组织中在大多数生理和发育条件下具有活性的启动子。“可诱导”启动子是受生理或发育调节的启动子,例如通过使用化学诱导剂调节。
术语“可选择标记”是本领域技术人员熟知的术语,在本文用于描述任何遗传实体,当其表达时可用于选择含有该选择标记的细胞。术语“报道子”可与标记互换使用,但是其主要用于描述可见标记,如绿色荧光蛋白(GFP)。可选择标记可以是显性或隐性或者双向的。
如本文所用,术语“可操纵地连接”是指核苷酸元件的功能关系连接。当核酸与另一核酸序列以功能关系放置时,其是“可操纵地连接的”。例如,如果转录调节序列影响编码序列的转录,则其与编码序列是可操纵地连接的。可操纵地连接是指被连接的DNA序列典型是连续的,及在需要时连接连续的及符合读框的两个蛋白质编码区。
术语“蛋白质”或“多肽”可互换使用,是指由氨基酸链组成的分子,不提及特定的作用模式、大小、三维结构或者来源。
术语“基因”是指包含一个区域(转录区)的DNA片段,其在细胞中被转录为RNA分子(例如mRNA),与合适的调节区(例如启动子)可操纵地连接。基因通常包含若干可操纵地连接的片段,如启动子、5’前导序列、编码区及包含聚腺苷酸化位点的3’非翻译序列(3’末端)。“基因的表达”是指其中与合适的调节区、特别是启动子可操纵地连接的DNA区被转录为RNA(其是生物活性的,即其能翻译为生物活性蛋白或肽)的过程。术语“同源”当用于表示指定(重组)核酸或多肽分子与给定宿主生物体或宿主细胞之间的关系时,应理解为是指事实上所述核酸或多肽分子是由相同物种、优选相同品种或株系的宿主细胞或生物体产生。如果与宿主细胞同源,则编码多肽的核酸序列将典型(但非必需地)与其自然环境中的另一(异源)启动子序列及如果可行则与另一(异源)分泌信号序列和/或终止子序列可操纵地连接。应理解调节序列、信号序列、终止子序列等也可以与宿主细胞同源。在这种情况中,仅使用“同源”序列元件可以构建“自克隆的”遗传修饰的生物体(GMO's)(自克隆在此如European Directive 98/81/EC Annex II所述定义)。当用于表示两个核酸序列的关系时,术语“同源”是指一个单链核酸序列可以杂交互补的单链核酸序列。杂交程度可依赖于许多因素,包括序列之间相同性的量及杂交条件如后文讨论的温度和盐浓度。
关于核酸(DNA或RNA)或蛋白质所用术语“异源”和“外源”是指不是作为其存在于之中的生物体、细胞、基因组或者DNA或RNA序列的一部分天然发生的核酸或蛋白质,或者是在与其天然发现的细胞或者基因组或DNA或RNA序列中的位置不同的细胞或位置发现的核酸或蛋白质。异源和外源核酸或蛋白质对于将其导入之中的细胞不是内源的,而是得自另一细胞或合成或重组产生的。通常,虽然不是必需的,这种核酸编码在所述DNA在之中被转录或表达的细胞中正常不产生的蛋白质,即外源蛋白质。相似地,外源RNA编码在所述外源RNA存在于之中的细胞中正常不表达的蛋白质。异源/外源核酸和蛋白质也可以称作外来核酸或蛋白质。本领域技术人员认为对于其在之中表达的细胞是外来的任何核酸或蛋白质在本文由术语异源或外源核酸或蛋白质涵盖。术语异源和外源还用于核酸或氨基酸序列的非天然组合,即其中组合序列的至少两个序列彼此是外来的。
在本文中酶的“比活性”应理解为是指特定酶的活性量/宿主细胞蛋白质总量,通常以酶活性单位/mg宿主总蛋白质表示。在本发明中,特定酶的比活性与所述酶在野生型宿主细胞(其它方面相同的)中的比活性相比可以增加或降低。
“呋喃化合物”是本文应理解为是2,5-呋喃-二羧酸(FDCA)以及具有呋喃基团的可被氧化为FDCA的任何化合物,后者在本文被称作“FDCA的前体”或者“FDCA的呋喃前体”。FDCA的前体至少包括:5-羟甲基糖醛(HMF)、2,5-二羟甲基呋喃(DHF或HMF-OH)或者2,5-二(羟甲基)呋喃(BHF)、5-羟甲基-2-呋喃羧酸或者5-羟甲基-2-糠酸(HMFCA)、5-甲酰-2-糠酸(FFA)和2,5-二甲酰呋喃(DFF)。应进一步了解的是在“呋喃化合物”中,呋喃环或者任何或其可取代的侧基可以在呋喃环中任何可利用的位置例如用OH、C1-C10烷基、烷基、烯丙基、芳基或者RO-醚组分、包括环形基团取代。
本文中在公共序列数据库中可获得的任何提及的核苷酸或氨基酸序列是指在本文件的提交日期可获得的序列条目的形式。
发明详述
表达HMFCA脱氢酶的细胞
第一方面,本发明涉及具有将5-羟甲基-2-呋喃羧酸(HMFCA)氧化为5-甲酰糠酸(FFA)的能力的细胞。将HMFCA氧化为FFA的能力优选通过用包含编码具有将HMFCA氧化为FFA的能力的脱氢酶的核苷酸序列的核酸构建体转化细胞而赋予所述细胞或者在所述细胞中增加。所述脱氢酶优选是醇脱氢酶(即具有EC 1.1活性)。因此,所述细胞优选是包含表达编码具有将HMFCA氧化为FFA的能力的脱氢酶的核苷酸序列的表达构建体的细胞。在本发明优选的细胞中,所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,所述脱氢酶的表达优选赋予所述细胞或增加所述细胞中将HMFCA氧化为FFA的能力。所述酶将HMFCA氧化为FFA的比活性在所述细胞中与在没有所述表达构建体的相应细胞中相比优选增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。
具有将HMFCA氧化为FFA的能力的脱氢酶因此是具有HMFCA脱氢酶活性的醇脱氢酶。多肽是否具有HMFCA脱氢酶活性可以通过将所述多肽在不能将HMFCA氧化为FFA的合适宿主细胞中表达并检测所述多肽的表达是否赋予细胞将HMFCA氧化为FFA的能力而测定。优选地,如本发明实施例IV所述测定HMFCA脱氢酶活性,由此编码待测定HMFCA脱氢酶活性的多肽的核苷酸序列替代pBT'hmfH-adh中的C.basilensis hmfH基因(在WO2012/064195中描述),之后将包含待测定HMFCA脱氢酶活性的多肽的编码序列的质粒导入含有pJNNhmfT1(t)的恶臭假单胞菌KT2440Agcd(在WO2012064195中描述)。将表达待测定HMFCA脱氢酶活性的多肽的恶臭假单胞菌转化体与HMP一起孵育,定期取样品进行FDCA分析。与没有待测定HMFCA脱氢酶活性的多肽(及hmfH基因)的相应恶臭假单胞菌转化体相比,FDCA产量增加表示所述多肽具有HMFCA脱氢酶活性。
在本发明的细胞中表达的HMFCA脱氢酶优选是依赖于辅因子的脱氢酶,所述辅因子选自腺嘌呤二核苷酸,如NADH或NADPH,黄素腺嘌呤二核苷酸(FAD),黄素单核苷酸(FMN)及吡咯喹啉喹诺酮(PQQ)。
在本发明的细胞中表达的FEVIFCA脱氢酶进一步优选是醇脱氢酶,其(也)具有将其它呋喃醇、优选在第2位具有羟基基团的呋喃醇氧化为相应醛的能力。因此,FEVIFCA脱氢酶优选具有将5-羟甲基糠醛(HMF)氧化为2,5-二甲酰呋喃(DFF)的能力。
在一个实施方案中,编码具有将FEVIFCA氧化为FFA的能力的脱氢酶的核苷酸序列选自:
(a)编码具有FEVIFCA脱氢酶活性的多肽的核苷酸序列,所述多肽包含与SEQ IDNO:1(Aeribacillus pallidus)、SEQ ID NO:2(克里不所类芽孢杆菌)、SEQ ID NO:3(嗜热地芽孢杆菌)、SEQ ID NO:4(Aneurinibacillus terranovensis)、SEQ ID NO:5(热红短小芽孢杆菌(Brevibacillus thermoruber))、SEQ ID NO:6(Brevibacillus panacihumi)、SEQ ID NO:7(芽孢杆菌FJAT-14578)、SEQ ID NO:8(库氏脱硫肠状菌)、SEQ ID NO:9(Desulfurispora thermophila)、SEQ ID NO:10(芽孢杆菌L1(2012))和SEQ ID NO:11(Pelotomaculum thermopropionicum)任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列;
(b)互补链与(a)的核苷酸序列杂交的核苷酸序列;及
(c)序列由于遗传密码简并而与(b)的核苷酸序列不同的核苷酸序列。
本发明优选的核苷酸序列因此编码这样的FEVIFCA脱氢酶,所述脱氢酶具有与可得自(或者天然发生于其中)芽孢杆菌目或梭菌目的细菌的FEVIFCA脱氢酶相同的氨基酸序列。在一个优选的实施方案中,所述细菌是芽孢杆菌科,更优选所述细菌是Aeribacillus、地芽孢杆菌属和芽孢杆菌属,最优选是Aeribacillus pallidus、克里不所类芽孢杆菌、嗜热地芽孢杆菌、Aneurinibacillus terranovensis、芽孢杆菌FJAT-14578和芽孢杆菌L1(2012)菌种。在另一优选的实施方案中,所述细菌是类芽孢杆菌科细菌,优选解硫胺素杆菌属和短小芽孢杆菌属菌属,最优选Aneurinibacillus terranovensis、热红短小芽孢杆菌和Brevibacillus panacihumi菌种。在再一个优选的实施方案中,所述细菌是消化球菌科细菌,优选脱硫肠状菌属、Desulfurispora和Pelotomaculum菌属,最优选库氏脱硫肠状菌、Desulfurispora thermophila和Pelotomaculum thermopropionicum菌种。
在一个实施方案中,本发明优选的核苷酸序列编码来自嗜常温菌的HMFCA脱氢酶,即在适中温度、典型在20-45℃最佳生长的细菌。优选地,本发明的核苷酸序列编码嗜常温HMFCA脱氢酶,其在20-45℃范围具有最佳活性和稳定性。举例的这种嗜常温脱氢酶是例如来自克里不所类芽孢杆菌(30℃)、Aneurinibacillus terranovensis(40℃)、热红短小芽孢杆菌(45℃)、Brevibacillus panacihumi(30℃)、芽孢杆菌FJAT-14578(30℃)和芽孢杆菌L1(2012)(30-50℃)的脱氢酶及其相关脱氢酶。
在一个实施方案中,本发明的优选核苷酸序列编码来自嗜热细菌的HMFCA脱氢酶,即在相对高温、典型在高于45-122℃最佳生长的细菌。优选地,本发明的核苷酸序列因此编码嗜热HMFCA脱氢酶,其在高于45℃-122℃具有最佳活性和稳定性。举例的这种嗜热脱氢酶是例如来自Aeribacillus pallidus(55℃)、嗜热地芽孢杆菌(55℃)、库氏脱硫肠状菌(60℃)、Desulfurispora thermophila(50℃)、Pelotomaculum thermopropionicum(55℃)和芽孢杆菌L1(2012)(30-50℃)的脱氢酶及其相关脱氢酶。
在一个实施方案中,所述核苷酸序列编码是天然发生的具有HMFCA脱氢酶活性的多肽,例如其可以分离自野生型来源生物体。或者,所述核苷酸序列可以编码工程化形式的上文定义的任何HMFCA脱氢酶,其与相应天然发生的HMFCA脱氢酶相比包含一或多个氨基酸取代、插入和/或缺失,但是仍在本文定义的相同性或相似性范围内。因此,在一个实施方案中,本发明的核苷酸序列编码HMFCA脱氢酶,其氨基酸序列在每个不变位置(在表2中用“*”表示)至少包含在不变位置存在的氨基酸。优选地,氨基酸序列在强保守位置(在表2中用“:”表示)也包含在强保守位置存在的氨基酸之一。更优选地,所述氨基酸序列进一步在低强度保守位置(在表2中用“.”表示)还包含在低强度保守位置存在的氨基酸之一。这些不变和保守位置之外的氨基酸取代不太可能影响HMFCA脱氢酶活性。
本发明的编码具有HMFCA脱氢酶活性的多肽的核苷酸序列通过使用本领域熟知的分离核苷酸序列的方法可得自真菌、酵母或细菌的基因组和/或cDNA,例如与上述来源生物体属于相同的门、纲或者属(见例如Sambrook and Russell(2001)"Molecular Cloning:ALaboratory Manual(3rd edition),Cold Spring Harbor Laboratory,Cold SpringHarbor Laboratory Press,New York)。本发明的核苷酸序列例如可以在这样的方法中获得,其中a)对合适生物体的基因组和/或cDNA使用简并PCR引物(基于保守氨基酸序列设计)以产生包含编码具有HMFCA脱氢酶活性的多肽的核苷酸序列的一部分的PCR片段;b)在a)中获得的PCR片段用作探针筛选所述生物体的cDNA和/或基因组文库;及c)产生包含编码具有HMFCA脱氢酶活性的多肽的核苷酸序列的cDNA或基因组DNA。
为了增加本发明的HMFCA脱氢酶在本发明转化的细胞中以足够水平及活性形式表达的可能性,优选调适编码这些酶以及本发明的其它酶(见下文)的核苷酸序列以将其密码子使用优化为在讨论的宿主细胞中的密码子使用。编码多肽的核苷酸序列对于宿主细胞的密码子使用的适应性可以用密码子适应指数(CAI)表示。密码子适应指数在本文定义为测量基因的密码子使用相对于在特定宿主细胞或生物体中高表达基因的密码子使用的相对适应性。每个密码子的相对适应性(w)是每个密码子的使用与相同氨基酸最丰富的密码子的使用的比率。CAI指数定义为这些相对适应性值的几何平均数。除外非同义密码子和终止密码子(根据遗传密码而定)。CAI值范围是0-1,较高数值表示较高比例的最丰富密码子(见Sharp and Li,1987,Nucleic Acids Research 15:1281-1295;也见Jansen et al.,2003,Nucleic Acids Res.31(8):2242-51)。经调适的核苷酸序列优选CAI为至少0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9。最优选是SEQ ID NO:13或14所示序列,其已经经过密码子优化以在恶臭假单胞菌细胞中表达。
用核酸构建体转化以表达编码本发明HMFCA脱氢酶的核苷酸序列的宿主细胞原则上可以是任何宿主细胞,其中本发明的HMFCA脱氢酶可以适当地表达,优选以功能性即以活性形式表达。本发明的宿主细胞优选是能将呋喃化合物主动或者被动转运进细胞以及转运出细胞的宿主。优选的本发明宿主细胞缺乏或者没有可检测的使羧化的呋喃化合物如特别是HMFCA、FFA和FDCA脱羧的活性。这种宿主细胞优选天然缺乏使羧化的呋喃化合物脱羧的能力。
优选地,所述宿主细胞是培养的细胞,例如可以在发酵方法、优选在深层发酵中培养的细胞。
根据一个实施方案,本发明的宿主细胞是真核宿主细胞。优选地,所述真核细胞是哺乳动物、昆虫、植物、真菌或者藻类细胞。优选的哺乳动物细胞包括例如中国仓鼠卵巢(CHO)细胞、COS细胞、293细胞、PerC6细胞和杂交瘤。优选的昆虫细胞包括例如Sf9和Sf21细胞及其衍生物。
然而,优选宿主细胞是微生物细胞。所述细胞可以是真核微生物细胞,优选真菌细胞,如酵母或丝状真菌细胞。优选的酵母宿主细胞包括例如来自如下酵母属的细胞,如假丝酵母属、汉逊酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属及耶氏酵母属。更优选来自如下酵母种的酵母,如乳酸克鲁维酵母、酿酒酵母、多形汉逊酵母、解脂耶氏酵母和巴斯德毕赤酵母。优选的丝状真菌细胞包括例如如下丝状真菌属的细胞:支顶孢属、伞菌属、曲霉属、短梗霉属、毁丝霉属、金孢子菌属、鬼伞属、隐球菌属、Filibasidium、镰刀菌属、腐殖霉属、稻瘟菌属、毛霉菌属、毁丝霉属、新丽鞭毛菌属、脉孢菌属、拟青霉属、青霉菌属、梨囊鞭菌属、原毛平革菌属、侧耳属、裂褶菌属、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属和木霉属。优选的丝状真菌细胞属于如下种:曲霉属、毁丝霉属、青霉菌属、毁丝霉属、踝节菌属或者木霉属,最优选选自如下种:黑曲霉、泡盛曲霉、臭曲霉、酱油曲霉、烟曲霉、埃默森踝节菌、米曲霉、嗜热毁丝霉、里氏木霉和产黄青霉菌。
微生物宿主细胞也可以是原核细胞,优选细菌细胞。属于“细菌细胞”包括革兰氏阴性和革兰氏阳性微生物。合适的细菌可选自埃希氏菌属、鱼腥藻属、Aeribacillus、解硫胺素杆菌属、伯克霍尔德氏菌属、慢生根瘤菌属、柄杆菌属、贪铜菌属、脱硫肠状菌属、Desulfurispora、葡糖杆菌属、红杆菌属、Pelotomaculum、假单胞菌属、副球菌属、芽孢杆菌属、地芽孢杆菌属、短小芽孢杆菌属、短杆菌属、棒杆菌属、根瘤菌属(中华根瘤菌属)、黄杆菌属、克雷伯氏菌属、肠杆菌属、乳杆菌属、乳球菌属、甲基杆菌属、罗尔斯通氏菌属、红假单胞菌属、葡萄球菌属和链霉菌属。优选地,细菌细胞选自如下菌种:A.pallidus、A.terranovensis、枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、克里不所类芽孢杆菌、地衣芽孢杆菌、B.puntis、巨大芽孢杆菌、耐盐芽孢杆菌、短小芽孢杆菌、热红短小芽孢杆菌、B.panacihumi、C.basilensis、库氏脱硫肠状菌、D.thermophila、嗜热地芽孢杆菌、氧化葡糖杆菌、新月柄杆菌CB 15、扭托甲基杆菌、类球红细菌、Pelotomaculumthermopropionicum、Pseudomonas zeaxanthinifaciens、恶臭假单胞菌、Paracoccusdenitrificans、大肠杆菌、谷氨酸棒杆菌、肉葡萄球菌、变铅青链霉菌、苜蓿中华根瘤菌和Rhizobium radiobacter。在恶臭假单胞菌菌种中,优选恶臭假单胞菌S12和恶臭假单胞菌KT2440菌株。
对于在本发明宿主细胞中产生的化合物的特异性应用,可以根据这种应用选择宿主细胞。在其中例如在本发明的宿主细胞中产生的化合物用于食品应用时,宿主细胞可选自食品级生物体如酿酒酵母。特异性应用包括但不限于食品、(动物)饲料、药物、农业如作物保护,和/或个人护理应用。
表达编码本发明HMFCA脱氢酶的核苷酸序列的表达构建体优选是与用所述构建体转化的宿主细胞异源或外源的表达构建体。当构建体包含不是在宿主细胞中天然发生的至少一个序列或序列元件和/或构建体包含不是在宿主细胞中天然发生的组合和/或顺序的至少两个序列元件时,即使所述元件自身在宿主细胞中天然发生,所述构建体在本文应理解为对于包含所述构建体的宿主细胞是异源或外源的。
在适当宿主细胞中表达编码本发明FDVIFCA脱氢酶的核苷酸序列的载体和表达构建体在下文更详细描述。
表达本发明的FDVIFCA脱氢酶的转化的细胞进一步优选具有醛脱氢酶活性(即具有EC 1.2活性)。优选地,醛脱氢酶活性能转化呋喃醛。更优选地,醛脱氢酶活性能将呋喃醛氧化为相应呋喃羧酸。更特别地,醛脱氢酶活性优选能够进行如下至少之一:i)将HMF氧化为HMFCA,ii)将2,5-二甲酰呋喃(DFF)氧化为5-甲酰-2-糠酸(FFA),及iii)将FFA变为FDCA。这种呋喃醛脱氢酶活性可以是细胞的内源活性,或者可以是赋予细胞的外源活性。优选地,通过用第二表达构建体转化细胞赋予或者增加细胞的呋喃脱氢酶活性。在本发明优选的细胞中,第二表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,呋喃醛脱氢酶的表达优选赋予所述细胞或增加所述细胞中i)将HMF氧化为HMFCA、ii)将DFF氧化为FFA及iii)将FFA氧化为FDCA中至少之一的能力。呋喃醛脱氢酶的比活性在所述细胞中与没有所述表达构建体的相应细胞相比优选增加至少1.05、1.1、1.2、1.5、2.0、5.0、10、20、50或100倍。第二表达构建体优选包含编码多肽的核苷酸序列,所述多肽:
a)具有i)将HMF氧化为HMFCA、ii)将DFF氧化为FFA及iii)将FFA氧化为FDCA的能力至少之一;及
b)包含与SEQ ID NO:24、25、26、27、28、29和30任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列。
多肽将i)HMF氧化为HMFCA、ii)将DFF氧化为FFA及iii)将FFA氧化为FDCA的至少之一的能力可以通过在恶臭假单胞菌宿主细胞、优选恶臭假单胞菌KT2440宿主细胞中将编码所述多肽的核苷酸序列与来自C.basilensis HMF 14的HmfH和HmfT1基因一起共表达而测定,将恶臭假单胞菌细胞在10mM FDVIF中孵育并检测与不表达所述多肽的相应恶臭假单胞菌细胞相比FDCA累积的增加情况,例如WO2012/064195的实施例IV所述。多肽将HMF氧化为HMFCA的能力也可以如Koopman et al 2010,PNAS(supra)所述测定。表达来自C.basilensis HMF14的HmfT1基因的菌株在本文应理解为表达具有SEQ ID NO:31所示氨基酸序列的基因产物。
表达本发明的HMFCA脱氢酶的转化的细胞进一步优选具有将呋喃化合物转运进和/或转运出细胞的能力。优选所述细胞具有将是FDCA前体的呋喃化合物转运进细胞的能力及优选将FDCA转运出细胞的能力。这种呋喃化合物转运能力可以是细胞的内源能力和/或可以是赋予细胞的外源能力。因此,本发明优选的细胞表达具有呋喃化合物转运能力的多肽。更优选地,所述细胞表达具有HMFCA转运能力的多肽。HMFCA转运能力应理解为是至少包括将HMFCA转运进细胞的能力。具有HMFCA转运能力的多肽的表达将增加HMFCA转运进细胞,这增加了其在细胞内转化为FDCA的可用性。因此可以改良HMFCA生物转化。
优选地,将呋喃化合物转运进和/或转运出细胞的能力是通过用第三表达构建体转化细胞而赋予所述细胞或增加的。在本发明优选的细胞中,第三表达构建体可以在细胞中表达,及与没有所述表达构建体的相应细胞如野生型细胞相比,呋喃化合物转运多肽的表达优选赋予所述细胞或增加所述细胞中将至少HMFCA转运进细胞的能力。第三表达构建体优选包含编码多肽的核苷酸序列,所述多肽:
a)具有至少HMFCA转运能力;及
b)包含与SEQ ID NO:17、31、32、33和34任一所示氨基酸序列具有至少45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列。
多肽将呋喃化合物、特别是HMFCA转运进细胞的能力可以通过在恶臭假单胞菌宿主细胞、优选恶臭假单胞菌KT2440宿主细胞中将编码所述转运多肽的核苷酸序列与来自C.basilensis HMF 14的HmfH基因及与来自C.basilensis HMF 14的HMF-降解操纵子相关的编码呋喃醛脱氢酶的基因(具有WO2012/064195中SEQ ID NO:19所示氨基酸序列)一起共表达而测定,将恶臭假单胞菌细胞在10mM HMF中孵育并检测与不表达所述转运多肽的相应恶臭假单胞菌细胞相比FDCA累积的增加情况,例如WO2012/064195的实施例IV所述。
在一个实施方案中,所述核苷酸序列编码天然发生的具有HMFCA转运能力的多肽,例如其可以分离自野生型来源生物体。或者,所述核苷酸序列可编码工程化形式的具有上文定义的HMFCA转运能力及与相应天然发生的具有HMFCA转运能力的多肽相比包含一或多个氨基酸取代、插入和/或缺失但是在本文定义的相同性或相似性范围内的任何多肽。因此,在一个实施方案中,本发明的核苷酸序列编码具有HMFCA转运能力的多肽,其氨基酸序列在每个不变位置(在表3中以“*”表示)至少包含在不变位置存在的氨基酸。优选地,所述氨基酸序列在强保守位置(在表3中以“:”表示)还包含在强保守位置存在的氨基酸之一。更优选地,所述氨基酸序列进一步在较低强度保守位置(在表3中以“.”表示)还包含在较低强度保守位置存在的氨基酸之一。这些不变和保守位置之外的氨基酸取代不太可能影响HMFCA转运能力。
本发明的编码具有HMFCA转运能力的多肽的核苷酸序列可得自真菌、酵母或细菌的基因组和/或cDNA,例如属于与上述来源生物体相同的门、纲或属,使用本领域技术人员熟知的分离核苷酸序列的方法以与上述用于编码本发明HMFCA脱氢酶的核苷酸序列的相似方式获得。
表达呋喃化合物转运蛋白的细胞
第二方面,本发明涉及表达编码具有呋喃化合物转运能力的多肽的核苷酸序列的细胞。优选将所述细胞用表达编码具有呋喃化合物转运能力的多肽的核苷酸序列的表达构建体转化。具有呋喃化合物转运能力的多肽优选是具有HMFCA转运能力的多肽,其至少包括将HMFCA转运进细胞的能力。优选所述细胞包含表达编码具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列的表达构建体,所述多肽包含与SEQ ID NO:17所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少HMFCA转运进细胞的能力。多肽将呋喃化合物、特别是HMFCA转运进细胞的能力可以如上述测定。
优选地,本发明这个方面的表达呋喃化合物转运蛋白的转化的细胞进一步包含将HMF转化为FDCA的酶活性。其中将HMF转化为FDCA的活性优选包括如下至少之一:
a)醇脱氢酶活性,其将HMFCA氧化为FFA,及醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸;及
b)氧化还原酶、优选氧化酶活性,其将HMF、2,5-二羟甲基呋喃、HMFCA、FFA和2,5-二甲酰呋喃的一或多个氧化为FDCA,及任选醛脱氢酶活性,其将呋喃醛氧化为相应呋喃羧酸。
将FDVIFCA氧化为FFA的醇脱氢酶活性及氧化呋喃醛的醛脱氢酶活性优选如上文定义。将HMF、2,5-二羟甲基呋喃、FDVIFCA、FFA和2,5-二甲酰呋喃的一或多个氧化为FDCA的氧化还原酶是具有EC 1.1和EC 1.2活性的氧化还原酶,如WO2011/026913所述。
除非特别指出,本发明这方面的表达呋喃化合物转运蛋白的转化的细胞进一步可具有上述本发明第一方面的表达FDVIFCA脱氢酶的细胞的特性。
表达本发明多肽的载体和构建体和方法
本发明另一方面涉及核酸构建体,如载体,包括克隆和表达载体,其包含本发明的多核苷酸,例如编码HMFCA脱氢酶或者本发明的转运蛋白或者其功能等价物的核苷酸序列,及在合适的宿主细胞中生长、转化或转染这种载体的方法,例如在其中发生本发明多肽表达的条件下进行。如本文所用,术语“载体”和“构建体”可互换使用,是指包含及优选能转运本发明的多核苷酸的构建的核酸分子。
本发明的多核苷酸可以掺入重组可复制载体中,例如克隆或表达载体。所述载体可用于在相容的宿主细胞中复制核酸。因此,在进一步的实施方案中,本发明提供了一种产生本发明多核苷酸的方法,通过将本发明的多核苷酸导入可复制载体中,将所述载体导入相容的宿主细胞中,及将所述宿主细胞在使得所述载体复制的条件下生长进行。所述载体可以从宿主细胞中回收。合适的宿主细胞如上文所述。
其中插入本发明的表达盒或多核苷酸的载体可以是可便利地进行重组DNA程序的任何载体,所述载体的选择通常依赖于其被导入之中的宿主细胞。
本发明的载体可以是自主复制载体,即以染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒。或者,所述载体可以是当被导入宿主细胞中时整合进宿主细胞基因组中并与其被整合进之中的染色体一起复制的载体。
一种类型的载体是“质粒”,其是指环形双链DNA环,其中可以连接另外的DNA节段。另一类型载体是病毒载体,其中另外的DNA节段可以连接在病毒基因组中。某些载体在其被导入之中的宿主细胞中能自主复制(例如具有细菌复制起点的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)在导入宿主细胞中时被整合进宿主细胞基因组中,从而随着宿主基因组一起复制。此外,某些载体能指导其可操纵地连接的基因的表达。这种载体在本文被称作“表达载体”。通常,用于重组DNA技术中的表达载体通常是质粒形式。术语“质粒”和“载体”在本文可互换使用,质粒是最常用的载体形式。然而,本发明包括这种其它形式的表达载体,如粘粒、病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺相关病毒)和噬菌体载体,其发挥等价功能。
本发明的载体可在体外用于例如产生RNA或者用于转染或转化宿主细胞。
本发明的载体可包含两或更多个、例如3、4或5个本发明的多核苷酸以例如过表达。
本发明的重组表达载体包含以适于在宿主细胞中核酸表达的形式的本发明的核酸,这意味着重组表达载体包含基于用于表达的宿主细胞选择的一或多个调节序列,其与被表达的核酸序列可操纵地连接。与编码序列“可操纵地连接”的调节序列如启动子、增强子或者其它表达调节信号以这样的方式安置,即编码序列的表达在与控制序列相容的条件下实现,或者如此安排序列以便其功能与其指定目的一致,例如转录在启动子起始并经由编码多肽的DNA序列继续进行。术语“调节序列”或者“控制序列”包括启动子、增强子及其它表达控制元件(例如聚腺苷酸化信号)。这种调节序列在例如Goeddel;Gene ExpressionTechnology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)中描述。术语调节或控制序列包括指导核苷酸序列在许多类型宿主细胞中组成型表达的那些序列以及指导核苷酸序列仅在某一宿主细胞中表达的那些序列(例如组织特异性调节序列)。
用于指定宿主细胞的载体或表达构建体因此可以包含从相对于编码本发明多肽的序列的编码链的5’末端至3’末端以连续顺序彼此可操纵地连接的如下元件:(1)启动子序列,其能指导编码多肽的核苷酸序列在指定宿主细胞中转录;(2)翻译起始序列,如真核细胞Kozak共有序列或者原核细胞核糖体结合位点/Shine-Dalgarno序列;(3)任选包括信号序列,其能指导多肽从指定宿主细胞分泌进培养基中;(4)本发明的编码成熟及优选活性形式本发明多肽的DNA序列,及优选还包含(5)转录终止区(终止子),其能终止编码多肽的核苷酸序列下游的转录。
本发明核苷酸序列的下游可以是3’非翻译区,其含有一或多个转录终止位点(例如终止子)。终止子的来源不关键。终止子例如对于编码多肽的DNA序列可以是天然的。然而,优选酵母终止子用于酵母宿主细胞中,丝状真菌终止子用于丝状真菌宿主细胞中。更优选地,终止子对于宿主细胞(其中编码多肽的核苷酸序列被表达)是内源的。在转录区中,可以存在核糖体结合位点以进行翻译。由构建体表达的成熟转录物的编码部分包括在起始处的翻译起始AUG及适当位于被翻译的多肽的末端的终止密码子。
本发明的多核苷酸的增强表达也可以通过选择异源调节区如启动子、分泌前导序列和/或终止区而实现,其可以增加表达,及如果需要时增加感兴趣的蛋白质从表达宿主的分泌水平和/或为本发明多肽的表达提供可诱导的控制。
本领域技术人员应意识到表达载体的设计可以依赖于如转化的宿主细胞的选择、希望的蛋白质表达水平等因素。本发明的载体如表达载体可以被导入宿主细胞中,从而产生由本文所述核酸编码的蛋白质或肽(例如本发明的HMFCA脱氢酶或转运蛋白、其突变体形式、片段、变体或者功能等价物、融合蛋白等)。
如上文所述,术语“控制序列”或者“调节序列”在本文定义为包括至少为多肽的表达必需的和/或有利的任何成分。任何控制序列对于本发明编码多肽的核酸序列均可以是天然或外来的。这种控制序列可包括但不限于启动子、前导序列、优化翻译起始序列(如Kozak,1991,J.Biol.Chem.266:19867-19870所述)或者原核细胞Shine-Delgarno序列、分泌信号序列、前肽序列、聚腺苷酸化序列、转录终止子。控制序列最低限度地典型包括启动子和翻译起始和终止信号。
稳定转化的微生物是具有导入的一或多个DNA片段的微生物,由此在生长培养中导入的分子得以维持、复制和隔离。稳定转化可以是由于多个或单一染色体整合或者通过染色体外元件如质粒载体所致。质粒载体能指导由特定DNA片段编码的多肽的表达。
表达可以是组成型表达或者由可诱导(可抑制)启动子调节的,使得功能相关的编码特定多肽的DNA片段高水平转录。
无论用于表达本发明多肽的实际机制如何,预期这种表达是可以通过使用本领域已知的方法在另一宿主细胞中导入编码这些多肽的基因而转移的。如本文定义的遗传元件包括具有产物如蛋白质、特别是酶的可表达编码序列的核酸(通常为DNA或RNA),脱辅基蛋白或者反义RNA,其表达或调节相关多肽的表达。表达的蛋白质可以发挥酶的功能,抑制或阻抑酶活性或者控制酶的表达或者发挥化合物如代谢物的转运蛋白的功能。编码这些可表达序列的重组DNA可以是染色体(通过例如同源重组整合进宿主细胞染色体中)或者染色体外(例如由一或多个质粒、粘粒及能自身复制的其它载体携带)DNA。应理解用于转化根据本发明的宿主细胞的重组DNA除了结构基因和转录因子之外还可包括表达控制序列,包括启动子、阻抑物和增强子,其控制蛋白质的编码序列、脱辅基蛋白或反义RNA的表达或脱阻抑。例如,这种控制序列可以插入野生型宿主细胞中以促进已经在宿主细胞基因组中编码的选择的多肽的过表达,或者另外其可用于控制染色体外编码的多肽的合成。
重组DNA可以通过任何方式导入宿主细胞中,包括但不限于质粒、粘粒、噬菌体、酵母人工染色体或者其它载体,其介导遗传元件转移进宿主细胞中。这些载体可包括复制起点,以及顺式作用控制元件,其控制载体及由载体携带的遗传元件的复制。可选择的标记可以存在于载体上以帮助鉴别其中已经导入遗传元件的宿主细胞。
将遗传元件导入宿主细胞的方式(例如克隆)为本领域技术人员熟知。技术人员可利用染色体外多拷贝质粒载体插入根据本发明的遗传元件。遗传元件经质粒导入宿主细胞中包括最初用限制酶裂解质粒载体,随后将质粒与编码根据本发明的靶向酶的遗传元件连接。在连接的重组质粒再环化时,使用感染(例如在噬菌体λ中包装)或其它质粒转移机制(例如电穿孔、显微注射等)将质粒转移进宿主细胞中。适于将遗传元件插入宿主细胞中的质粒为本领域技术人员熟知。
其它基因克隆方法包括但不限于将遗传材料定向整合进染色体中。这可以通过多种方式进行,包括在两侧是宿主染色体的同源DNA序列的非复制质粒上克隆本文所述遗传元件;在所述重组质粒转化进宿主中时,遗传元件通过DNA重组可以被导入染色体中。如果整合DNA片段含有可选择标记如抗生素抗性,则可以回收这种重组菌株。或者,遗传元件可以不使用非复制质粒而直接导入宿主细胞染色体中。这可以通过合成产生也含有宿主染色体的同源DNA序列的本发明的遗传元件的DNA片段而实现。再次,如果这些合成的DNA片段也含有可选择标记,则可以将遗传元件插入宿主染色体中。
本发明进一步涉及制备具有本发明HMFCA脱氢酶活性的多肽和/或具有本发明呋喃化合物转运能力的多肽的方法,所述方法包括在有益于所述多肽表达的条件下培养本发明的细胞,及任选回收表达的多肽,本发明还涉及通过这种方法可获得的多肽。
氧化呋喃化合物的方法
再一方面,本发明涉及氧化呋喃化合物的方法。特别地,本发明涉及其中FDCA的呋喃前体被氧化的方法。本发明的方法可包括单次氧化反应步骤获得产物(例如HMFCA氧化为FFA)。或者,本发明的方法可包括多于一个的氧化反应步骤,每个步骤均获得中间物,其中最后的中间物是终产物。其中HMF在相继的氧化步骤中被氧化为FDCA的这种一系列的步骤例如包括:1)首先将HMF氧化为HMFCA,后者在第二个步骤中被氧化为FFA,FFA随后最终被氧化为FDCA,或者如Dijkman et al.(2014,Angew.Chem.53(2014)6515-8)所述2)首先将HMF氧化为DFF,DFF在第二个步骤中被氧化为FFA,FFA随后被最终氧化为FDCA。因此,在优选的本发明方法中,FDCA的一或多个呋喃前体在一系列步骤中被最终氧化为FDCA。
在一个实施方案中,本发明涉及包括至少将HMFCA氧化为FFA的方法。优选地,所述方法是将HMFCA氧化为FFA的方法,其中所述方法包括将细胞在存在HMFCA条件下孵育的步骤,其中所述细胞是表达如上文定义的HMFCA脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的HMFCA脱氢酶或氧化酶活性的多肽的细胞。优选所述细胞在存在HMFCA在有益于细胞氧化HMFCA的条件下孵育,如下文详细说明。
在另一个实施方案中,本发明涉及产生FDCA的方法。产生FDCA的方法优选包括将细胞在包含FDCA的一或多种呋喃前体的培养基中孵育的步骤,其中所述细胞是表达如上文定义的HMFCA脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的HMFCA脱氢酶或氧化酶活性的多肽的细胞。优选将所述细胞在存在HMFCA在有益于细胞将FDCA的呋喃前体氧化为FDCA的条件下孵育,如下文详细说明。
优选在所述方法中,FDCA的至少一种呋喃前体选自HMF、DHF、HMFCA、FFA和DFF,最优选HMF。FDCA的呋喃前体优选得自一或多种己糖,优选通过常规方式的酸催化的脱水获得,例如通过在存在酸的条件下加热。从果糖产生HMF的技术已经充分确立及强力(见例如van Putten et al.,2013,Chem.Rev.113,1499-1597)。也可以利用葡萄糖富集的源料,但是从果糖更有效地热化学形成HMF。因此,可包括另外的酶促步骤以使用葡萄糖异构酶将葡萄糖转化为果糖。后一方法在食品工业中充分确立,例如从水解淀粉产生高果糖玉米糖浆(HFCS)。葡萄糖也可以通过使用催化剂与溶剂组合经化学异构为果糖,例如van Putten etal.(2013,supra)所述。
己糖通常得自生物质。术语“生物质”应理解为是指来自农业(包括植物如作物残余物,及动物物质)、林业(如木材资源)及相关工业包括渔业和水产业的生物学来源的可生物降解的产物、废物和残余物级分,以及可生物降解的工业和城市垃圾如市政固体垃圾或废纸的级分。在一个优选的实施方案中,生物质是植物生物质,更优选(可发酵的)己糖/葡萄糖/糖富集的生物质,例如甘蔗,含有淀粉的生物质,例如小麦粒或者玉米秸秆,或者甚至谷粒如玉米、小麦、大麦或者其混合物。优选的是天然富集果聚糖的农作物(例如洋姜或菊苣根)。
己糖可以通过水解这种生物质而获得。水解生物质的方法为本领域已知,包括使用例如蒸气和/或糖酶如葡糖淀粉酶获得。
用于本发明方法中的另一优选类型的生物质是所谓的“第二代”木质纤维素原料,如果以更持续方式生产大体积FDCA,则优选这种生物质。木质纤维素原料可以得自专用的能源作物,例如在边缘土地生长,因此与粮食作物不直接竞争。或者木质纤维素原料可以作为副产物获得,例如市政固体垃圾、废纸、木材剩余物(包括锯木和造纸废物),可以考虑作物残余物。举例的作物残余物包括甘蔗渣及一些玉米和小麦废物。在玉米副产物的情况中,三种废物是纤维、玉米棒和秸秆。此外,林业生物质可用作原料。为了将二代原料转化为本发明的发酵产物,纤维素和半纤维素需要释放为单糖。因此,应用热化学方法(通常称作预处理)、酶促方法或者两种方法的组合。预处理可以完全释放糖,或者使得聚合化合物对于随后的酶攻击更易于接近。不同类型的预处理包括液体热水、蒸汽喷发、酸预处理、碱预处理,以及离子液体预处理。各种化合物的相对量依赖于使用的原料和应用的预处理方法。为了从这种木质纤维素原料释放单糖,应用合适的糖酶,包括例如阿拉伯糖酶、木聚糖酶、葡聚糖酶、淀粉酶、纤维素酶、葡聚糖酶等。
本发明的方法进一步优选包括回收在所述方法中产生的氧化产物如FDCA或HMFCA的步骤。优选地,从孵育进行氧化步骤的细胞的培养基中回收氧化产物。氧化产物如FDCA、FDVIFCA等可以从反应混合物或者培养基中回收,通过例如(酸或盐)沉淀、随后冷却结晶及分离结晶的氧化产物如结晶的FDCA。然而,其它回收方法也是适用的,例如本领域已知的酸或盐沉淀及溶剂提取。回收FDCA的盐沉淀方法可以例如使用二价(金属)阳离子如Mg2+进行。
氧化反应优选在对于细胞及细胞中包含的氧化还原酶最佳的温度进行。因此,在嗜热细胞和酶的情况中,温度优选是45℃或更高,例如45-122℃的范围,例如高于50、55、60或65℃。然而,在含有来自嗜常温微生物的酶的嗜常温细胞的情况中,氧化反应优选在相对中等温度进行,例如10-80℃,更优选20-45℃,最优选大约25-40℃。
氧化反应优选在其中FDCA是中性形式或完全解离形式的pH进行,由此可以控制盐形成。鉴于在FDCA中存在两个酸部分,因此有两个单独优选的pH范围。在反应期间的pH可以是pH 1-6,优选pH 1-4,最优选pH 1-3。或者,在反应期间的pH可以是pH 5-9,优选pH 5-8,最优选pH 5-7。技术人员理解宿主细胞的要求也影响所述方法的合适pH值的选择。适于特定宿主细胞的pH值的选择在技术人员的技术范围内,可以得自标准教科书。对于恶臭假单胞菌、包括如恶臭假单胞菌S12或KT2440菌株,优选的pH范围是pH 5-7。
反应时间可以是6-150小时,更优选6-18小时。优选从氧源为反应培养基中的细胞提供氧,所述氧源如分子氧,例如纯氧或者于空气中氧,或者水,或者根据呋喃氧化酶的要求而不同的氧源。可以便利地使用空气作为分子氧的来源。
反应器可以是任何合适的(充气)生物反应器。反应器可以分批、持续或者优选补料分批操作。
本发明的氧化呋喃化合物的方法可有利地用于从认为其中的呋喃化合物是有害的原料中消除呋喃化合物,如用于发酵产生生物燃料和生化品的原料。更优选地,氧化呋喃化合物的方法用于FDCA的生物生产,其作为单体前体以产生聚酯(塑料),其中FDCA在聚酯PET中可以代替PTA,在这种情况中获得生物基聚呋喃二甲酸乙二醇酯(PEF)。FDCA也可以用作大量有价值化合物的底物,包括例如用作生产琥珀酸、2,5-二(氨基甲基)-四氢呋喃、2,5-二羟甲基-四氢呋喃、2,5-二羟甲基呋喃和2,5-呋喃二甲醛(2,5-furandicarbaldehyde)的底物。FDCA可用于生产涂层,例如在醇酸树脂和热塑涂层中。其也可以在生物燃料中用作二甲苯等价物及作为溶剂。FDCA可以被酯化,所述酯可用作增塑剂。FDCA可以转化为其二醇,可用于PET样聚酯和聚氨酯中。进一步地,FDCA可以转化为其二胺,二胺可以用作扩链剂,及二胺可以转化为二异氰酸酯,其可用于聚氨酯的生产中。
因此,本发明再一方面涉及从一或多个FDCA单体生产聚合物的方法,所述方法包括如下步骤:a)在如上述本发明的氧化方法中制备FDCA单体;及b)从在a)中获得的FDCA单体产生聚合物。优选所述聚合物是聚呋喃二甲酸乙二醇酯(PEF)。
再一方面,本发明涉及本发明细胞在将一或多个FDCA呋喃前体生物转化为FDCA中的应用,其中细胞是表达如上文定义的HMFCA脱氢酶的细胞,或者表达具有呋喃化合物转运能力及进一步包含如上文定义的HMFCA脱氢酶或氧化酶活性的多肽的细胞。优选地,被生物转化为FDCA的至少一种FDCA呋喃前体选自HMF、DHF、HMFCA、FFA和DFF,最优选HMF。
HMFCA脱氢酶多肽及编码HMFCA脱氢酶的核酸
另一方面,本发明涉及具有HMFCA脱氢酶活性的多肽。具有HMFCA脱氢酶活性的多肽包含或者由与SEQ ID NO:1(Aeribacillus pallidus)所示氨基酸序列具有至少81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但其它方面如上文定义的氨基酸序列组成。优选所述多肽是分离的多肽。
本发明进一步涉及核酸分子,其包含如下至少之一:
a)编码具有HMFCA脱氢酶活性的多肽的核苷酸序列,所述多肽包含或者由与SEQID NO:1所示氨基酸序列具有至少81.65、81.7、81.8、81.85、82、83、84、85、86、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸组成;
b)SEQ ID NO:12或13所示核苷酸序列;
c)(a)或(b)所述核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;
d)序列由于遗传密码简并而与b)或c)所述核苷酸序列不同的核苷酸序列;及
e)是a)-d)所述核苷酸序列的反向补体的核苷酸序列。
本发明另一方面涉及载体,包括克隆载体和表达载体,其包含如本章节中上文a)-e)所述核苷酸序列,所述载体其它方面如上文所述。
再一方面,本发明涉及包含i)具有如本章节上文定义的HMFCA脱氢酶活性的多肽及ii)本章节上文定义的核酸分子的至少之一的细胞。优选所述细胞是包含本章节上文a)-e)定义的核苷酸序列或用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选是分离的细胞或培养的细胞,所述细胞优选其它方面如上文定义及优选所述细胞包含如上文所述一或多个遗传修饰。所述细胞可用于如上文所述任何方法、过程和应用中。
呋喃化合物转运多肽及编码这种转运多肽的核酸
再一方面,本发明涉及具有呋喃化合物转运能力的多肽。所述多肽优选至少具有将HMFCA转运进细胞的能力。优选所述多肽包含或者由与SEQ ID NO:17(Aeribacilluspallidus)所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性但是其它方面如上文定义的氨基酸序列组成。优选所述多肽是分离的多肽。
本发明进一步涉及核酸分子,其包含如下至少之一:
a)编码具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列,所述多肽包含或者由与SEQ ID NO:17所示氨基酸序列具有至少86.5、87、88、89、90、91、92、93、94、95、95、96、97、98、99或100%序列相同性的氨基酸序列组成;
b)SEQ ID NO:18所示核苷酸序列;
c)(a)或(b)所述核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;
d)序列由于遗传密码简并而与b)或c)所示核苷酸序列不同的核苷酸序列;及
e)是a)-d)所述核苷酸序列的反向补体的核苷酸序列。
本发明另一方面载体,包括克隆载体和表达载体,其包含如本章节上文a)-e)定义的核苷酸序列,所述载体其它方面如上文所述。
再一方面,本发明涉及包含如下至少之一的细胞:i)如本章节上文定义具有呋喃化合物转运能力的多肽,及ii)如本章节上文定义的核酸分子。优选所述细胞是包含如本章节上文a)-e)定义的核苷酸序列或者用其转化、或者包含含有这种核苷酸序列的载体或用其转化的细胞。所述细胞优选是分离的细胞或者培养的细胞,所述细胞优选其它方面如上文所述及优选所述细胞包含上文所述一或多个遗传修饰。所述细胞可用于如上文所述任何方法、过程和应用中。
在本文及其权利要求书中,动词“包含”及其词形变化以非限制性含义使用,意味着包括在该单词后面的项目,但不除外未特别提及的项目。此外,以不定冠词“一个”或“一种”提及某元件时不除外存在超过一个/一种元件的可能性,除非文中明确要求是有一个及仅此一个元件。不定冠词“一个”或“一种”因此通常是指“至少一个/一种”。
本说明书中引用的所有专利及参考文献均以其全部内容并入本文作参考。
如下实施例只是例证本发明,无以任何方式限制本发明范围之意。
附图描述
图1A:恶臭假单胞菌CA2046对HMF的生物转化(恶臭假单胞菌;空心圆:HMF(5-羟甲基糠醛);空心方形:HMFCA(5-羟甲基糠酸);实心菱形:FDCA(2,5-呋喃二羧酸);实心灰色圆:OD600。
图1B:恶臭假单胞菌CA2101对HMF的生物转化;空心圆:HMF(5-羟甲基糠醛);空心方形:HMFCA(5-羟甲基糠酸);实心菱形:FDCA(2,5-呋喃二羧酸);实心灰色圆:OD600。
图2:恶臭假单胞菌CA2111对HMF的生物转化,共表达YiaY与来自C.basilensisHMF14的Aldh和HmfT1;空心圆:HMF(5-羟甲基糠醛);空心方形:HMFCA(5-羟甲基糠酸);实心菱形:FDCA(2,5-呋喃二羧酸);实心灰色圆:OD600。图中示出一式两份培养物的平均值。
图3:恶臭假单胞菌CA2112对HMF的生物转化,共表达YiaY与来自C.basilensisHMF14的Aldh和HmfT1;空心圆:HMF(5-羟甲基糠醛);空心方形:HMFCA(5-羟甲基糠酸);实心菱形:FDCA(2,5-呋喃二羧酸);实心灰色圆:OD600。图中示出一式两份培养物的平均值。
4:恶臭假单胞菌CA21780对HMF的生物转化,共表达来自克里不所类芽孢杆菌DSM17871的YiaY_与来自C.basilensis的Aldh和HmfT1。HMF-OH是二羟甲基呋喃,在本文也称作“DBF”。
5:恶臭假单胞菌CA21781对HMF的生物转化,共表达来自Aneurinibacillusterranovensis DSM18919的YiaY_与来自C.basilensis的Aldh和HmfT1。HMF-OH是二羟甲基呋喃,在本文也称作“DHF”。
6:恶臭假单胞菌CA21783对HMF的生物转化,共表达来自Brevibacilluspanacihumi W25的YiaY_与来自C.basilensis的Aldh和HmfT1。HMF-OH是二羟甲基呋喃,在本文也称作“DHF”。
实施例
一般方法
菌株与质粒
恶臭假单胞菌S12Agcd或者恶臭假单胞菌KT2440Agcd(分别为恶臭假单胞菌S12(ATCC 700801)和恶臭假单胞菌KT2440(DSM6125)的葡萄糖-脱氢酶缺陷型突变体)或者野生型恶臭假单胞菌S12用作宿主以表达来自Aeribacillus pallidus菌株CA1828的yiaY基因(见下文)。大肠杆菌菌株TG90用于一般克隆目的。
为了附加型表达A.pallidus基因,使用pBBR1MCS衍生的pBT’mcs(Koopman etal.,2010a,Biores Technol 101:6291-6196)。在pBT’mcs中,靶基因的表达由组成型tac启动子驱动。
培养基&培养条件
嗜常温无机盐培养基(MMM)含有如下成分(每升去矿物质水):15.52g的K2HPO4、6.52g的NaH2PO4、2.0g的(NH4)2SO4、0.1g的MgCl2.6H2O、10mg的EDTA、2mg的ZnSO4.7H2O、1mg的CaCl2.2H2O、5mg的FeSO4.7H2O、0.2mg的Na2MoO4.2H2O、0.2mg的CuSO4.5H2O、0.4mg的CoCl2.6H2O及1mg的MnCl2·2H2O,按照说明补充碳源。
嗜热矿物质盐培养基(TMM)含有如下成分(每升去矿物质水):10g的Bis-Tris、10μM FeSO4·7H2O、4mM三甲基甘氨酸、1.32mM K2HPO4、9.53mM NH4Cl、0.2g酵母提取物、5g的NaCl、1.47g的Na2SO4、0.08g的NaHCO3、0.25g的KCl、1.87g的MgCl2.6H2O、0.41g的CaCl2.2H2O、0.008g的SrCl2.6H2O、0.008g的H3BO3、0.90g的NaNO3和1ml的维生素溶液(硫胺素,0.1g/L;核黄素,0.1g/L;烟酸,0.5g/L;泛酸,0.1g/L;吡哆胺-HCl,0.5g/L;吡哆醛-HCl,0.5g/L;D-生物素,0.1g/L;叶酸,0.1g/L;对氨基苯甲酸,0.1g/L;维生素B12,0.1g/L)。按照说明补充碳源。
作为增殖嗜常温微生物的完全培养基,使用Luria-Bertani(LB)肉汤:10g/lBacto胰蛋白胨(Difco)、5g/l酵母提取物(Difco)、10g/l NaCl。对于平板培养,将LB用1.5%(w/v)琼脂(Difco)固化。为了选择携带pBT’mcs衍生质粒的大肠杆菌、恶臭假单胞菌S12或恶臭假单胞菌KT2440转化株,将50μg/ml卡那霉素(Km)加入培养基中。抗生素购自Sigma-Aldrich。将恶臭假单胞菌在30℃培养,大肠杆菌在37℃培养。
作为增殖嗜热微生物的完全培养基,使用TGP肉汤:17g/L胰蛋白胨、3g/L大豆胨、5g/L NaCl、2.5g/L K2HPO4、4g/L甘油和4g/L丙酮酸钠(pH7)。对于平板培养,将TGP用1.5%(w/v)琼脂(Difco)固化。将Aeribacillus pallidus在60℃培养。
测定&分析方法
细胞干重(CDW)测量
细菌培养物的CDW含量通过使用Biowave Cell Density Meter(WPA Ltd)或者μQuant MQX200通用微平板分光光度计(Biotek)使用平底96孔微平板(Greiner)测量在600nm的光密度(OD600)而确定。对于恶臭假单胞菌,1.0的OD600相应于0.56g CDW/L(Biowave)或者1.4g CDW/L(μQuant)。
HPLC分析
如Koopman et al.(2010a,Biores Technol 101:6291-6196)所述,通过RP-HPLC分析呋喃化合物(FDCA、HMF、HMF-醇、HMFCA和FFA)。
化学品
5-羟甲基糠醛(HMF)购自Eurolabs Ltd(Poynton,UK)。FDCA和5-羟甲基-糠酸(FDVIFCA)的分析标准物分别购自Immunosource B.V.(Halle-Zoersel,Belgium)和MatrixScientific(Columbia SC,USA)。所有其它化学品购自Sigma-Aldrich Chemie B.V.(Zwijndrecht,The Netherlands)。
分子和遗传技术:
使用MasterPureTM革兰氏阳性DNA纯化试剂盒(Epicentre)从A.pallidus CA1828分离基因组DNA。使用JETSTAR Maxi质粒纯化试剂盒(GENOMED,ITK diagnostics)分离质粒DNA。使用DNA Clean&ConcentratorTM(Zymo research)分离琼脂糖-捕获的DNA片段。使用Phusion Flash PCR Master Mix(Thermo Scientific)根据厂商指导进行PCR反应。寡核苷酸引物(在实施例中详细说明)由Sigma-Aldrich合成。使用Gene Pulser电穿孔装置(BioRad)将质粒DNA导入电感受态细胞中。其它标准分子生物学技术如Sambrook andRussell(2001,supra)所述进行。
实施例1:代谢HMF的Aeribacillus pallidus菌株的分离
将Compost(15g)与15ml的0.9%(w/v)NaCl溶液混合并在750rpm和80℃孵育40分钟。所得compost浆在于摇瓶中的补加0.65g/L的HMF的TMM中在60℃和180rpm孵育3天。将培养物定期移至新鲜TMM-HMF中并铺板于固体TMM-HMF上。将单一菌落重新在TMM-HMF和TGP平板上划线培养,及重新评定其代谢HMF及FDCA的能力。通过16S rDNA测序将代谢HMF和FDCA二者的两个分离株(菌株CA1809和CA1828)鉴别为Aeribacillus pallidus,选择用于进一步研究。
实施例II:在降解HMF的A.pallidus分离株中新的脱氢酶催化的HMF分解代谢途径的鉴别
通过PacBio测序方法对A.pallidus菌株CA1809和CA1828的基因组进行测序并进行自动ORF调用与注释(calling and annotation)。在注释的基因组中,鉴别了Cupriavidus basilensis HMF14的hmfABCDE基因的同系物,其组成糠酸降解簇(Koopmanet al.,2010,Proc Nat Acad Sci USA 107:4919-4924)。
考虑到菌株CA1809和CA1828除了代谢HMF之外还代谢FDCA的能力,强烈提示HMF是如在C.basilensis HMF14中通过FDCA代谢的。然而,意外地未发现组成通过FDCA从HMF至糠酸降解途径的C.basilensis HMF14的hmfFGH簇的同系物。这个结果提示在A.pallidus分离株中存在的将HMF氧化为FDCA及可能随后脱羧为糠酸的另一途径。挖掘(Mining)包含编码氧化和脱羧活性二者的基因的基因簇的基因组可以鉴别推定的HMF降解簇,包含编码醇脱氢酶、醛脱氢酶和两种脱羧酶的基因(表1A和B)。总之,这些基因编码如在C.basilensisHMF14中推定的通过羟甲基糠酸(HMFCA)将HMF氧化为FDCA的途径,但是包含醇脱氢酶活性而不是氧化酶活性以将HMFCA氧化为甲酰糠酸(FFA)。
表1A:推定的A.pallidus CA1809的HMF降解簇
表1B:推定的A.pallidus CA1828的HMF降解簇
实施例III:在恶臭假单胞菌S12中表达A.pallidus的YiaY赋予将HMF氧化为FDCA的能力
将yiaY基因在pBT'mcs产生质粒pKW007中克隆为1988-bp的合成的XbaI-SalI片段(SEQ ID NO:15),包括来自凝结芽孢杆菌DSM1的PldhL1启动子区。将质粒pKW007导入恶臭假单胞菌KT2440Agcd(CA1877)中,产生恶臭假单胞菌CA2101。携带pBT'mcs的恶臭假单胞菌KT2440Agcd(菌株CA2046)作为空载体对照进行检测。
将恶臭假单胞菌菌株CA2101和CA2046在含有10ml的MM+80mM甘油和2mM葡萄糖及补加50mg/L卡那霉素的100-ml摇瓶中生长。在对数生长期(OD600≈4)结束时收获细胞,洗涤并重悬浮于补加19.4g/L的K2HPO4、8.15g/L的NaH2PO4、80mM甘油和50mg/L卡那霉素的MM中。将等份的(10ml)洗涤的细胞悬浮液(OD600为1-2)与HMF在100-ml Erlenmeyer培养瓶中孵育,定期取样以分析FDCA。图1A示出在空载体对照中HMF被迅速氧化为羟甲基糠酸(FDVIFCA),然而完全不存在FDCA形成。当YiaY表达时(图1B),积累的FDVIFCA缓慢氧化为FDCA,这表明YiaY作为HMFCA氧化脱氢酶的功能性。
实施例IV:通过共表达A.pallidus的YiaY与C.basilensis HMF14的Aldh和HmfT1优化HMF至FDCA的氧化
合成A.pallidus CA1828的yiaY基因,其包含核糖体结合位点TAGGAAAGGAAGATTAACCC(SEQ ID NO:21)。将yiaY片段(SEQ ID NO:16)用KpnI和XbaI消化以置换pBT'hmfH-adh中hmfH基因(WO2012064195),产生质粒pKW010。将质粒pKW010导入携带pJNNhmfT1(t)(WO2012064195)的恶臭假单胞菌S12Agcd中产生恶臭假单胞菌CA2111,及导入恶臭假单胞菌KT2440Agcd(也携带pJNNhmfT1(t))中产生恶臭假单胞菌CA2112。因此,可以将yiaY编码的氧化HMFCA的醇脱氢酶与HMF脱氢酶和C.basilensis HMF14的HMFCA转运蛋白共表达,以消除HMF氧化为HMFCA及HMFCA摄取的瓶颈问题。
将恶臭假单胞菌CA2111和CA2112在含有10ml的MM+80mM甘油和2mM葡萄糖补加50mg/L卡那霉素、30mg/L庆大霉素和100μM水杨酸的100-ml摇瓶中生长。在对数生长期末(OD600≈4)收获细胞,洗涤并重悬浮于具有50mg/L卡那霉素、30mg/L庆大霉素和10μM水杨酸的MM中。将等份(10ml)洗涤的细胞悬浮液(OD600为1-2)与HMF在100-ml Erlenmeyer培养瓶中孵育,定期取样品分析FDCA。图2和3示出HMF被迅速氧化为HMFCA,HMFCA被进一步氧化为FDCA。显然YiaY与Aldh和HmfT1的共表达显著加速了HMF氧化为FDCA。
实施例V:通过共表达嗜常温HMFCA醇脱氢酶与C.basilensis HMF14的Aldh和HmfT1构建将HMF氧化为FDCA的优化菌株
合成克里不所类芽孢杆菌DSM17871、热红短小芽孢杆菌423、芽孢杆菌FJAT-14578和芽孢杆菌L1(2012)的yiaY同系物,其包含含有间隔区TAGGAAAGGAAGATTAACCC(SEQ IDNO:21)的核糖体结合位点以及限制酶(KpnI、NheI;与XbaI相容)识别位点以进行克隆(SEQID NO:19、36、38和39)。
合成Aneurinibacillus terranovensis DSM18919和Brevibacillus panacihumiW25的yiaY同系物,包括含有间隔区GAATTCCACATGACAAGGGGAGACCGC(SEQ ID NO:40)的核糖体结合位点以及限制酶(KpnI、XbaI)的识别位点以进行克隆(SEQ ID NO:35和37)。克里不所类芽孢杆菌酶(SEQ ID NO:19)、热红短小芽孢杆菌酶(SEQ ID NO:36)和两种芽孢杆菌酶(SEQ ID NO:38和39)的编码核苷酸序列通过使用http://www.kazusa.or.jp/codon/的恶臭假单胞菌密码子使用表经氨基酸序列逆向翻译(http://www.bioinformatics.org/sms2/rev_trans.html)而获得。A.terranova和B.panacihumi酶的编码序列通过使用大肠杆菌序列优化工具GeneArt(https://www.thermofisher.com/nl/en/home/life-science/cloning/gene-synthesis/geneart-gene-synthesis/geneoptimizer.html)经氨基酸序列逆向翻译而获得。
将克里不所类芽孢杆菌、热红短小芽孢杆菌、芽孢杆菌FJAT-14578和芽孢杆菌L1(2012)的yiaY-同系物片段用KpnI和NheI(与pBT'hmfH-adh中XbaI相容)消化以置换pBT'hmfH-adh(WO2012064195)中hmfH基因,产生质粒pKW2210、pKW2212、pKW2214和pKW2215。将A.terranovensis和B.panacihumi的yiaY同系物片段用KpnI和XbaI消化以置换pBT'hmfH-adh(WO2012064195)中的hmfH基因,产生质粒pKW2211和pKW2213。
将质粒pKW2210、pKW2211、pKW2212、pKW2213、pKW2214和pKW2215导入恶臭假单胞菌KT2440Agcd_pJNNhmfT1(CA1965)中,分别产生恶臭假单胞菌CA21780、CA21781、CA21782、CA21783、CA21784和CA21785以在包含aldh和hmfT1的优化宿主背景中表达YiaY同系物。对于性能评估,将恶臭假单胞菌菌株CA21780,CA21781,CA21782,CA21783,CA21784和CA21785在含有10ml的MM+80mM甘油和2mM葡萄糖及补加50mg/L卡那霉素、30mg/L庆大霉素和100μM水杨酸的100-ml摇瓶中生长。在对数生长期末(OD600≈4)收获细胞,洗涤并重悬浮于具有50mg/L卡那霉素、30mg/L庆大霉素和10μM水杨酸的MM中。将等份(10ml)的洗涤的细胞悬浮液(OD600为1-2)与HMF在100-ml Erlenmeyer培养瓶中孵育,定期取样分析FDCA。恶臭假单胞菌CA21780、CA21781和CA21783的结果分别在图4、5和6中示出。所有这三种转化的菌株均从FDVIF产生FDCA。然而,不同菌株示出HMFCA的瞬时积累显著不同,部分HMF还原为二羟甲基呋喃(HMF-OH或DHF)。还发现菌株恶臭假单胞菌CA21782、CA21784和CA21785从FDVIF产生FDCA,表明所有这六种醇脱氢酶酶作为氧化HMFCA的酶的功能性。
实施例VI:构建表达Aeribacillus pallidus proP编码的HMFCA转运蛋白的恶臭假单胞菌菌株
通过PCR使用引物proP(f)(gccgaattcATGAAGAATATCGCTAATACG;SEQ ID NO:22)和proP(r)(gccgctagcTTATTTGAGGTTTCCTTTTGTTTCC;SEQ ID NO:23)从Aeribacilluspallidus CA1828的基因组DNA扩增proP基因(SEQ ID NO:18)。将PCR产物作为1350-bpEcoRI-NheI片段(SEQ ID NO:20)导入pJNNmcs(t)中,产生pJNNproP(t)。将质粒pBT’hmfH_aldh和pJNNproP(t)相继导入恶臭假单胞菌KT2440Agcd(CA1877)中,产生恶臭假单胞菌CA21783。将恶臭假单胞菌CA21783在含有10ml的MM+80mM甘油和2mM葡萄糖及补加50mg/L卡那霉素、30mg/L庆大霉素和100μM水杨酸的100-ml摇瓶中培养。在对数生长期末(OD600≈4)收获细胞,洗涤并重悬浮于含有50mg/L卡那霉素、30mg/L庆大霉素和10μM水杨酸的MM中。将等份(10ml)洗涤的细胞悬浮液(OD600为1-2)与HMF在100-ml Erlenmeyer培养瓶中孵育,定期取样以分析FDCA。显然,表达proP编码的HMFCA转运蛋白与不表达proP的相应对照菌株相比显著加速HMF氧化为FDCA。
表2:YiaY氨基酸序列比对
Adh_Bp=SEQ ID NO:6(Brevibacillus panacihumi);Adh_Bk=SEQ ID NO:2(克里不所类芽孢杆菌);Adh_Bt=SEQ ID NO:5(热红短小芽孢杆菌);Adh_At=SEQ ID NO:4(Aneurinibacillus terranovensis);YiaY=SEQ ID NO:1(Aeribacillus pallidus);Adh_Gk=SEQ ID NO:3(嗜热地芽孢杆菌);Adh_Bsp=SEQ ID NO:7(芽孢杆菌FJAT-14578);Adh_BspL1=SEQ ID NO:10(芽孢杆菌L1(2012));Adh_Pt=SEQ ID NO:11(Pelotomaculumthermopropionicum);Adh_Dk=SEQ ID NO:8(库氏脱硫肠状菌);Adh_Dt=SEQ ID NO:9(Desulfurispora thermophila)。比对下面的符号表示:*=不变位置;:=强保守位置;.=低强度保守位置;无符号表示非保守位置。
序列表
<110> 普拉克生化公司
<120> 脱氢酶催化的FDCA的产生
<130> P6054479PCT
<150> EP15155401
<151> 2015-02-17
<160> 40
<170> PatentIn version 3.3
<210> 1
<211> 392
<212> PRT
<213> Aeribacillus pallidus
<400> 1
Met Ile Gly Asn Tyr Ala Lys Lys Ala Ile Asp Phe Glu Phe Thr Phe
1 5 10 15
Tyr Leu Pro Thr Leu Ile Glu Phe Gly Tyr Gly Lys Ala Ser Arg Met
20 25 30
Gly Glu Met Leu Glu Gln Met Gly Ile Lys Asn Val Phe Leu Val Thr
35 40 45
Asp Lys Gly Val Glu Ala Ala Gly Leu Leu Ala Gly Ile Val Gln Ser
50 55 60
Leu Glu Ser Ser Asn Ile Arg Tyr Val Ile Tyr Ser Asp Val Glu Pro
65 70 75 80
Asp Pro Ser Leu Glu Thr Ile Asp Arg Gly Ala Ser Val Phe Lys Glu
85 90 95
Gln Ser Phe Asp Cys Ile Leu Ala Val Gly Gly Gly Ser Pro Ile Asp
100 105 110
Thr Ala Lys Gly Ile Arg Val Val Val Thr Asn Gly Gly Asn Ile Gly
115 120 125
Asp Tyr Ala Gly Val Asn Arg Val Ala Lys Lys Ser Glu Ile Pro Leu
130 135 140
Val Ala Val Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Ile Phe
145 150 155 160
Gly Val Tyr Ser Asp Trp Glu Asn Gln Val Lys Val Thr Val Thr Ser
165 170 175
Pro Tyr Met Ala Pro Glu Ile Ala Leu Val Asp Pro Glu Leu Thr Met
180 185 190
Ser Leu Pro Gln Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala
195 200 205
His Gly Ile Glu Thr Phe Phe Ser Leu Arg Ser Arg Pro Ala Ser Asp
210 215 220
Ala Leu Ala Val Glu Ala Met Ala Thr Val Ser Ala Tyr Leu Arg Arg
225 230 235 240
Ala Val Glu Asp Gly Thr Asp Lys Glu Ala Arg Ile Gly Met Ser Gln
245 250 255
Gly Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu
260 265 270
Ala His Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Ser His
275 280 285
Gly Val Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ala
290 295 300
Arg Val Arg Pro Glu Lys Ala Ala Lys Ile Ala Glu Leu Leu Gly Val
305 310 315 320
Lys Gly Asp Arg Glu Glu Val Leu Ala Glu Gln Ala Ala Pro Ala Val
325 330 335
Ala Ser Leu Val Lys Glu Ile Gly Leu Pro Thr Arg Leu Arg Asp Val
340 345 350
Asp Val Ser Glu Glu Lys Leu Pro Asp Ile Ala Arg Asp Ala Phe Lys
355 360 365
Ser Gly Met Met Lys Phe Asn Pro Arg Gln Pro Ser Leu Ser Glu Val
370 375 380
Leu Thr Leu Leu Gln Gln Ile Tyr
385 390
<210> 2
<211> 383
<212> PRT
<213> Bacillus kribbensis
<400> 2
Met Asp Val Glu Phe Ser Phe His Leu Pro Thr Leu Ile Glu Phe Gly
1 5 10 15
Phe Gly Lys Ala Ser Leu Leu Gly Glu Arg Leu Leu Lys Leu Gly Val
20 25 30
Gly Asn Val Phe Leu Val Ser Asp Lys Gly Val Ala Ser Ala Gly Leu
35 40 45
Leu Gln Lys Leu Glu Gln Ser Leu Gln Thr Ser Asp Ile His Phe Lys
50 55 60
Thr Tyr Leu Glu Val Glu Pro Asp Pro Ser Leu Glu Thr Ile Asp Leu
65 70 75 80
Gly Ala Glu Ala Phe Asn Ser Gly Lys Tyr Asp Cys Ile Val Ala Val
85 90 95
Gly Gly Gly Ser Ala Ile Asp Thr Ala Lys Gly Ile Arg Val Val Ala
100 105 110
Gly Asn Gly Gly Ser Ile Gly Asp Phe Ala Gly Val Asp Lys Ile Gly
115 120 125
Lys Ala Pro Gln Ile Pro Leu Ile Ala Val Pro Thr Thr Ser Gly Thr
130 135 140
Gly Ser Glu Val Thr Ile Phe Gly Val Tyr Ser Asp Trp Val Lys Asn
145 150 155 160
Val Lys Val Thr Val Thr Ser Gln Tyr Met Ala Pro Thr Ile Ala Leu
165 170 175
Val Asp Pro Glu Leu Thr Met Arg Leu Pro Arg Lys Met Thr Ala Ala
180 185 190
Ser Gly Ile Asp Ala Leu Ala His Gly Ile Glu Ser Tyr Phe Ser Leu
195 200 205
Arg Ser Thr Ser Ala Ser Arg Ala Leu Ser Leu Glu Ala Ile Asn Ile
210 215 220
Val Gly Asn His Leu Arg Gln Ser Val Ala Asn Gly Glu Asp Lys Glu
225 230 235 240
Ala Arg Cys Gly Met Ser His Gly Ser Leu Leu Ala Gly Met Ala Phe
245 250 255
Asn Asn Gly Phe Leu Gly Leu Ala His Ala Ile Gly Ser Ala Leu Ser
260 265 270
Gly His Cys His Val Pro His Gly Val Ala Ile Gly Leu Leu Leu Pro
275 280 285
His Val Val Glu Phe Asn Ser Ser Glu Cys Pro Asp Gln Ala Ala Glu
290 295 300
Ile Ala Lys Ile Leu Gly Val Lys Ala Glu Asp Glu Arg Gln Leu Ala
305 310 315 320
Glu Gln Ala Ser His Ala Val Gly Asp Leu Val Lys Asp Ile Gly Leu
325 330 335
Pro Thr Arg Leu Arg Asp Met Asn Val Pro Glu Glu Lys Leu Ala Asp
340 345 350
Ile Ala Arg Asp Ser Phe Gln Ser Gly Met Met Lys Phe Asn Pro Arg
355 360 365
Arg Ala Ser Glu Ser Glu Val Leu Glu Leu Leu His Arg Val Tyr
370 375 380
<210> 3
<211> 391
<212> PRT
<213> Geobacillus kaustophilus
<400> 3
Met Val Gly His Tyr Ile Gln Lys Glu Val Glu Phe Glu Phe Ser Phe
1 5 10 15
His Leu Pro Thr Ser Ile Gln Phe Gly Tyr Gly Lys Ala Ser Gln Leu
20 25 30
Gly Asn Gln Leu Val Asp Met Gly Ile Lys Ser Ala Phe Leu Val Thr
35 40 45
Asp Arg Gly Val Glu Ala Thr Gly Leu Leu Ala Gly Ile Ile Gln Ser
50 55 60
Leu Glu Ser Ser Asn Ile Gln Tyr Cys Val Tyr Ala Asp Val Glu Pro
65 70 75 80
Asp Pro Ser Leu Glu Thr Ile Asp Gln Gly Ala Ala Ala Phe Lys Glu
85 90 95
Gln Pro Phe Asp Cys Ile Val Ala Ile Gly Gly Gly Ser Pro Ile Asp
100 105 110
Thr Ala Lys Gly Ile Arg Val Val Ala Thr Asn Gly Gly Ser Ile Gly
115 120 125
Asp Tyr Ala Gly Val Asn Arg Ile Lys Lys Lys Ser Glu Ile Pro Leu
130 135 140
Ile Ala Leu Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Ile Phe
145 150 155 160
Gly Val Tyr Ser Asp Trp Lys Asn Asn Val Lys Val Thr Val Thr Ser
165 170 175
Pro Tyr Met Ala Pro Glu Ile Ala Leu Val Asp Pro Lys Leu Thr Met
180 185 190
Ser Leu Pro Lys Lys Ile Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala
195 200 205
His Gly Ile Glu Thr Phe Phe Ser Leu Arg Ser Gln Pro Ile Ser Asp
210 215 220
Val Leu Ala Ile Glu Ala Met Thr Thr Val Asn Arg Tyr Leu Arg Arg
225 230 235 240
Ala Val Glu Asp Gly Thr Asn Lys Glu Ala Arg Ile Gly Met Ser Tyr
245 250 255
Gly Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu
260 265 270
Ala His Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Ser His
275 280 285
Gly Val Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ser
290 295 300
Val Val Gln Pro Glu Lys Ala Ala Lys Ile Ala Glu Leu Leu Gly Arg
305 310 315 320
Lys Gly Asn Gln Asn Thr Leu Val Gln Gln Ala Ala Leu Ala Val Ala
325 330 335
Ser Leu Val Lys Glu Ile Gly Leu Pro Thr Arg Leu Arg Asp Val Asp
340 345 350
Val Pro Lys Glu Lys Leu Pro Asp Ile Ala Lys Asp Ser Phe Lys Ser
355 360 365
Gly Met Met Arg Phe Asn Pro Arg Gln Pro Ser Glu Ala Glu Val Met
370 375 380
Thr Leu Leu Gln Gln Ile Tyr
385 390
<210> 4
<211> 390
<212> PRT
<213> Aneurinibacillus terranovensis
<400> 4
Met Ser Pro Ala Val Lys Ala Ile Asn Phe Glu Phe Ser Phe Asn Leu
1 5 10 15
Pro Thr Leu Ile Glu Phe Gly Tyr Gly Lys Met Glu Lys Phe Gly Gln
20 25 30
Gln Leu Ile Ser Ile Gly Val Lys Arg Ile Phe Met Val Thr Asp Lys
35 40 45
Gly Val Glu Ser Ala Gly Leu Leu Ala Ala Leu Thr Asp Ser Leu Gln
50 55 60
Ala Ala Ala Ile Gln Phe Asp Ile Tyr Thr Asp Val Glu Ser Asp Pro
65 70 75 80
Ser Leu Glu Thr Ile Asp Arg Gly Val Glu Val Phe Gln Gln Lys Pro
85 90 95
Tyr Asp Cys Ile Val Ala Val Gly Gly Gly Ser Pro Ile Asp Thr Ala
100 105 110
Lys Gly Ile Arg Val Val Ala Ala Asn Gly Gly Asn Ile Gly His Tyr
115 120 125
Ala Gly Val Asn Gln Ile Pro Val Ala Pro Thr Ile Pro Leu Leu Ala
130 135 140
Ile Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Gly Val
145 150 155 160
Tyr Ser Asp Trp Gln Asn Asn Val Lys Val Thr Val Thr Ser Gln Tyr
165 170 175
Met Ala Pro Thr Ile Ala Trp Val Asp Pro Ala Leu Thr Met Ser Leu
180 185 190
Pro Ala Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala His Gly
195 200 205
Ile Glu Thr Phe Phe Ser Leu Gly Ser Ser Pro Ala Ser Asp Ala Leu
210 215 220
Ala Ile Glu Ala Ile His Thr Val Asn Arg Tyr Leu Ser Arg Ala Val
225 230 235 240
His Asn Gly Ser Asp Met Glu Ala Arg Ile Gly Met Ser His Gly Ser
245 250 255
Leu Leu Ala Gly Met Ala Phe Asn Asn Gly Phe Leu Gly Leu Ala His
260 265 270
Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Pro His Gly Val
275 280 285
Ala Ile Gly Leu Leu Leu Pro Lys Val Val Glu Phe Asn Ala Thr Val
290 295 300
Arg Pro Asp Lys Ala Ala Lys Ile Ala Gly Leu Met Gly Met Lys Gly
305 310 315 320
Glu His Ser Glu Glu Leu Ala Leu Gln Ala Ser Pro Ala Val Ala Arg
325 330 335
Leu Val Glu Asp Ile Gly Leu Pro Thr Arg Leu Arg Glu Val Asp Val
340 345 350
Thr Glu Lys Lys Leu Phe Glu Ile Ala Lys Asp Ser Phe Lys Ser Gly
355 360 365
Met Met Lys Phe Asn Pro Arg Gln Pro Ser Glu Ser Glu Val Leu Gln
370 375 380
Leu Leu Lys Glu Ile Phe
385 390
<210> 5
<211> 390
<212> PRT
<213> Brevibacillus thermoruber
<400> 5
Met Ser Gln Thr Val Gln Gly Thr Asp Phe Ala Phe Ser Phe His Leu
1 5 10 15
Pro Thr Leu Ile Glu Phe Gly Tyr Gly Arg Ala Ser Arg Leu Gly Glu
20 25 30
Arg Leu Gln His Leu Gly Val Thr Asn Val Phe Val Val Thr Asp Lys
35 40 45
Gly Val Glu Ala Ala Gly Leu Leu Asn Gly Leu Val Gly Ser Leu Gln
50 55 60
Ser Ala Gly Ile Ala Phe Asp Leu Tyr Thr Glu Val Glu Pro Asp Pro
65 70 75 80
Gly Leu Glu Thr Ile Asp Arg Gly Ala Ala Val Phe Arg Ala Lys Pro
85 90 95
Tyr Asp Cys Leu Val Ala Val Gly Gly Gly Ser Pro Ile Asp Ala Ala
100 105 110
Lys Gly Met Arg Val Val Thr Ser Cys Gly Gly Ser Ile Ala Asp Tyr
115 120 125
Ala Gly Val Asn Arg Val Pro Met Ala Pro Ala Val Pro Leu Val Ala
130 135 140
Val Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Met Phe Gly Val
145 150 155 160
Tyr Ser Asp Trp His Asn His Val Lys Val Thr Val Thr Ser Pro His
165 170 175
Met Ala Pro Thr Ile Ala Leu Val Asp Pro Ala Leu Thr Val Ser Leu
180 185 190
Pro Ala Lys Met Thr Ala Ala Ser Gly Ile Asp Ala Leu Ala His Gly
195 200 205
Ile Glu Thr Phe Phe Ser Val Arg Ser Arg Pro Ala Ser Asp Ala Leu
210 215 220
Ala Met Glu Ala Ile Ala Ala Val Asn Ala His Leu Arg Arg Ala Val
225 230 235 240
His Asp Gly Ser Asp Val Glu Ala Arg Ile Gly Met Ser His Gly Ser
245 250 255
Leu Leu Ala Gly Met Ala Phe Thr Asn Gly Phe Leu Gly Leu Ala His
260 265 270
Ala Ile Gly Ser Ala Leu Ser Gly His Cys His Val Pro His Gly Ile
275 280 285
Ala Ile Gly Leu Leu Leu Pro His Val Val Ala Phe Asn Ala Pro Ala
290 295 300
Arg Pro Asp Lys Ala Ala Gln Leu Ala Arg Leu Leu Gly Val Glu Ala
305 310 315 320
Asn Pro Arg Glu Glu Arg Gly Glu Glu Thr Ser Ala Ala Val Ala Arg
325 330 335
Met Val Ala Asp Ile Gly Leu Pro Thr Arg Leu Arg Asp Val Gly Val
340 345 350
Pro Glu Glu Lys Leu Pro Ala Ile Ala Lys Asp Ala Phe Lys Ser Gly
355 360 365
Met Met Thr Cys Asn Pro Arg Gln Pro Thr Glu Gln Glu Val Arg Glu
370 375 380
Leu Leu Arg Arg Ala Phe
385 390
<210> 6
<211> 379
<212> PRT
<213> Brevibacillus panacihumi
<400> 6
Met Glu Ser Pro Phe Ser Phe His Leu Pro Thr Asn Val Gln Phe Gly
1 5 10 15
Val Gly Ser Ala Ser Arg Leu Gly Glu Met Leu Leu Ser Met Gly Val
20 25 30
Arg Arg Val Phe Leu Val Thr Asp Gln Gly Val Arg Gln Ala Gly Leu
35 40 45
Leu Asp Glu Val Ile His Ser Leu Glu Glu Lys Gly Leu His Phe Gln
50 55 60
Ile Tyr Ala Asp Val Glu Pro Asp Pro Ser Leu Glu Thr Ile Gln Ala
65 70 75 80
Gly Ala Ala Met Phe Gln Gln Gln Ser Phe Asp Cys Met Val Ala Ile
85 90 95
Gly Gly Gly Ser Pro Ile Asp Thr Ala Lys Gly Ile Arg Val Leu Ala
100 105 110
Ala Asn Gly Gly Gly Ile Gly Gln Tyr Ala Gly Val Asn Arg Val Pro
115 120 125
Ala Ala Ser Ala Ile Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr
130 135 140
Gly Ser Glu Val Thr Ile Phe Gly Val Tyr Ser Asp Trp Glu Asn His
145 150 155 160
Val Lys Ile Thr Val Thr Ser Pro His Met Ala Pro Ser Thr Ala Leu
165 170 175
Ile Asp Pro Ala Leu Thr Leu Ser Leu Pro Ala Lys Met Thr Ala Ala
180 185 190
Thr Gly Ile Asp Ala Leu Ala His Gly Ile Glu Thr Phe Phe Ser Leu
195 200 205
Arg Ser Ser Pro Ala Ser Asp Ala Leu Ala Ile His Ala Met Lys Met
210 215 220
Ile Ala Pro His Leu Arg Arg Ala Val Arg Asp Gly Ala Asp Met Glu
225 230 235 240
Ala Arg Ile Gly Met Ser Gln Gly Ser Val Leu Ala Gly Met Ala Phe
245 250 255
Asn Asn Gly Phe Leu Gly Leu Ala His Ala Ile Gly Ser Ala Leu Ser
260 265 270
Gly His Cys His Val Pro His Gly Val Ala Ile Gly Leu Leu Leu Pro
275 280 285
His Val Val Ala Phe Asn Thr Pro Val Arg Pro Glu Lys Ala Glu Leu
290 295 300
Ile Ala Asp Val Leu Gly Ser Val Gln Lys Glu Thr Gly Thr Ala Ala
305 310 315 320
Glu Leu Val Gly Gln Leu Val Gln Asp Ile Gly Leu Pro Gln Arg Leu
325 330 335
Gln Glu Val Gly Val Pro Glu Ala Lys Leu Val Asp Ile Ala Lys Asp
340 345 350
Ser Phe Lys Ser Gly Met Met Lys Trp Asn Pro Arg Leu Pro Thr Glu
355 360 365
Gln Glu Val Leu Glu Leu Leu Gln Lys Ala Phe
370 375
<210> 7
<211> 383
<212> PRT
<213> Bacillus sp. FJAT-14578
<400> 7
Met Tyr Pro Ser Phe Glu Phe His Leu Pro Thr Lys Ile His Phe Gly
1 5 10 15
Tyr Asn Thr Ile Lys Gln Leu Asp His Leu Pro Phe Glu Ile Lys Arg
20 25 30
Ala Phe Ile Val Thr Asp Gln Gly Val Leu Asn Ser Gly Leu Val Glu
35 40 45
Asn Val Thr Asn Ile Leu Lys Asp His Gln Ile Ser Tyr Val Ile Tyr
50 55 60
Ser Glu Val Glu Pro Asp Pro Ser Val Glu Thr Val Asp Lys Ala Ala
65 70 75 80
Gln Met Phe Gln Arg Glu Glu Ala Asp Ala Leu Ile Ala Ile Gly Gly
85 90 95
Gly Ser Pro Ile Asp Thr Ala Lys Gly Val Arg Val Ile Ala Gly Asn
100 105 110
Gly Gly Ser Ile Arg Asp Tyr Ala Gly Val Asn Leu Ile Lys Gln Lys
115 120 125
Ser Asn Ile Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr Gly Ser
130 135 140
Glu Val Thr Ile Phe Ala Val Phe Ser Asp Trp Glu Glu Asn Arg Lys
145 150 155 160
Val Thr Val Thr Ser Pro Phe Leu Ala Pro Asp Ile Ser Ile Val Asp
165 170 175
Pro Lys Met Thr Met Thr Ala Pro Pro Ala Ile Thr Ala Ala Ser Gly
180 185 190
Phe Asp Ala Phe Ala His Gly Ala Glu Thr Phe Val Ser Arg Ala Ser
195 200 205
Gln Pro Ala Ser Asp Val Leu Ala Phe Ser Ala Met Ser Thr Val Ser
210 215 220
Lys Tyr Leu Arg Arg Ala Val Tyr Asn Gly Glu Asp Val Glu Ala Arg
225 230 235 240
Ile Lys Met Ala Glu Ala Ser Leu Leu Ala Gly Met Ala Phe Asn Gln
245 250 255
Ser Tyr Leu Gly Leu Thr His Ala Ile Gly Ser Ala Leu Ser Gly His
260 265 270
Ala His Val Ser His Gly Val Ala Ile Gly Leu Leu Leu Pro Gly Val
275 280 285
Ile Arg Tyr Asn Ser Ile Ser Arg Met Asp Lys His Ile Glu Met Ala
290 295 300
Gly Ala Phe Arg Glu Ile Asp Arg Ser Leu Ser Asp Trp Glu Ile Ile
305 310 315 320
Asp Gln Leu Ile Glu Asp Val Ser Arg Leu Arg Asp Asp Ile Gly Leu
325 330 335
Pro Gln Arg Leu Gln Gln Val Gly Val Lys Glu Asp Gln Leu Lys Met
340 345 350
Ile Ala Ala Asp Ser Val Lys Ser Gly Met Trp Lys Phe Asn Pro Arg
355 360 365
Gln Ala Ser Glu Glu Glu Ile Leu Glu Leu Leu Lys Glu Leu Tyr
370 375 380
<210> 8
<211> 384
<212> PRT
<213> Desulfotomaculum kuznetsovii
<400> 8
Met Glu Ala Phe Thr Phe Gln Leu Lys Thr Thr Val Cys Phe Gly Ala
1 5 10 15
Asn Val Val Ser Gly Ile Val Asp Trp Cys Arg Asn Tyr Asn Ala Lys
20 25 30
Arg Val Leu Ile Val Thr Asp Gln Gly Val Arg Lys Ala Gly Ile Leu
35 40 45
Glu Lys Val Glu Lys Ile Leu Ser Asp Ala Gly Ile Glu Asn Val Val
50 55 60
Phe Asp Asp Val Glu Pro Asp Pro Gly Leu Glu Thr Ile His Arg Cys
65 70 75 80
Ala Ser Cys Phe Arg Glu Asn Lys Cys Asp Leu Ile Leu Ala Val Gly
85 90 95
Gly Gly Ser Pro Ile Asp Thr Ala Lys Gly Ala Arg Val Ile Val Glu
100 105 110
Asn Gly Gly His Ile Arg Asp Tyr Ala Gly Val Asn Lys Val Pro Arg
115 120 125
Ala Pro Val Thr Pro Leu Ile Ala Ile Pro Thr Thr Ser Gly Thr Gly
130 135 140
Ser Glu Val Thr Thr Phe Ala Val Leu Ser Asp Trp Glu Asn Arg Met
145 150 155 160
Lys Ile Thr Ile Ser Ser Pro Phe Leu Ala Pro Glu Val Ala Val Val
165 170 175
Asp Pro Leu Leu Thr Met Thr Ala Pro Pro Ser Val Thr Ala Ala Ser
180 185 190
Gly Ile Asp Ala Leu Ser His Ala Ile Glu Thr Tyr Val Ser Leu Lys
195 200 205
Ala Gln Pro Pro Ala Glu Ala Leu Ala Leu Lys Ala Ile Glu Leu Ile
210 215 220
Gly Glu Ser Leu Arg Thr Ala Val Ala Asp Gly Ser Asp Lys Glu Ala
225 230 235 240
Arg Thr Arg Met Ser Leu Gly Ser Leu Leu Ala Gly Met Ala Phe Asn
245 250 255
Asn Ser Leu Leu Gly Leu Thr His Ser Ile Gly Ala Ala Leu Ser Gly
260 265 270
His Ala His Val Ser His Gly Met Ala Ile Gly Leu Leu Leu Pro Tyr
275 280 285
Val Met Glu Phe Asn Ala Met Ala Arg Met Glu Lys Phe Ser Lys Ile
290 295 300
Ala Val Ala Leu Gly Glu Asp Val Lys Gly Leu Ser Leu Arg Glu Ala
305 310 315 320
Ala Leu Arg Ser Val Lys Ala Val Arg Glu Leu Val Glu Asp Ile Ser
325 330 335
Leu Pro Arg Arg Leu Gly Asp Val Gly Val Thr Gly Asp Met Ile Glu
340 345 350
Gly Met Ala Lys Asp Ala Met Gly His Gly Met Leu Lys Phe Asn Pro
355 360 365
Arg Ala Val Thr Glu Lys Asp Ile Ile Ala Ile Leu Arg Lys Ala Leu
370 375 380
<210> 9
<211> 377
<212> PRT
<213> Desulfurispora thermophila
<400> 9
Met Lys Thr Thr Val Cys Phe Gly Ala Asn Ile Val Ser Ser Ile Asp
1 5 10 15
Asp Arg Cys Arg Asp Tyr Asn Ala Arg His Val Leu Ile Val Thr Asp
20 25 30
Gln Gly Val Glu Lys Ala Gly Ile Leu Glu Lys Val Glu Lys Val Leu
35 40 45
Ser Asp Ala Gly Ile Glu Asn Val Val Phe Asp Asp Val Glu Pro Asp
50 55 60
Pro Gly Leu Glu Thr Ile His Arg Cys Ala Ser Cys Phe Arg Glu Asn
65 70 75 80
Lys Cys Asp Leu Phe Leu Ala Ile Gly Gly Gly Ser Pro Ile Asp Thr
85 90 95
Ala Lys Gly Ala Arg Ile Ile Val Asp Asn Gly Gly His Ile Arg Asp
100 105 110
Tyr Ala Gly Val Asn Lys Val Pro Arg Ala Pro Arg Thr Pro Leu Leu
115 120 125
Ala Ile Pro Thr Thr Ser Gly Thr Gly Ser Glu Val Thr Thr Phe Ala
130 135 140
Val Leu Ser Asp Trp Glu Asn Arg Met Lys Ile Thr Ile Ser Ser Pro
145 150 155 160
Phe Leu Ala Pro Glu Val Ala Val Val Asp Pro Ile Leu Thr Leu Thr
165 170 175
Ala Pro Pro Ser Val Thr Ala Ala Ser Gly Ile Asp Ala Leu Ser His
180 185 190
Ala Ile Glu Thr Tyr Val Ser Leu Lys Ala Gln Pro Pro Ala Glu Ala
195 200 205
Leu Ala Leu Lys Ala Ile Glu Leu Ile Gly Glu Ser Leu Arg Ala Ala
210 215 220
Val Ala Asp Gly Ser Asn Lys Glu Ala Arg Thr Lys Met Ser Leu Gly
225 230 235 240
Ser Leu Leu Ala Gly Met Ala Phe Asn Asn Ser Leu Leu Gly Leu Thr
245 250 255
His Ser Ile Gly Ala Ala Leu Ser Gly His Ala His Val Ser His Gly
260 265 270
Met Ala Val Gly Leu Leu Leu Pro Tyr Val Met Glu Phe Asn Ala Met
275 280 285
Ala Arg Leu Glu Lys Tyr Gly Lys Ile Ala Ile Ala Leu Gly Glu Asp
290 295 300
Val Lys Gly Leu Ser Leu Arg Glu Ala Ala Leu Arg Ser Val Lys Ala
305 310 315 320
Val Arg Glu Leu Val Glu Asp Ile Ser Leu Pro Arg Arg Leu Gly Glu
325 330 335
Val Gly Val Thr Gly Asp Met Ile Glu Gly Met Ala Lys Asp Ala Met
340 345 350
Gly His Gly Met Leu Lys Phe Asn Pro Arg Val Val Thr Glu Lys Asp
355 360 365
Ile Met Ala Ile Leu Gln Lys Ala Leu
370 375
<210> 10
<211> 383
<212> PRT
<213> Bacillus sp. L1(2012)
<400> 10
Met Tyr Thr Ser Phe Asn Phe His Leu Pro Thr Arg Ile Gln Phe Gly
1 5 10 15
Tyr Glu Lys Val Lys Glu Leu Lys Asn Leu Pro Phe Gln Ala Asn Arg
20 25 30
Ala Phe Ile Val Thr Asp Lys Gly Val Glu Lys Ala Gly Leu Leu Asn
35 40 45
Asp Val Ile Asp Ala Ile Lys Gln Ala Asn Met Thr Tyr Lys Ile Tyr
50 55 60
Arg Asp Val Glu Pro Asp Pro Ser Val Glu Thr Val Asp Lys Ala Ala
65 70 75 80
Lys Ala Phe Ala Glu Ala Glu Cys Asp Leu Leu Ile Ala Val Gly Gly
85 90 95
Gly Ser Pro Ile Asp Thr Ala Lys Gly Val Arg Val Val Ala Ser Asn
100 105 110
Gly Gly Ser Ile Arg Asn Tyr Ser Gly Val Asn Leu Val Lys Glu Ala
115 120 125
Pro Ser Val Pro Leu Val Ala Ile Pro Thr Thr Ala Gly Thr Gly Ser
130 135 140
Glu Val Thr Ile Phe Ala Val Phe Ser Asp Asp Lys Glu Asn Arg Lys
145 150 155 160
Val Thr Val Thr Ser Ser His Leu Ser Pro Asp Val Ser Ile Ile Asp
165 170 175
Pro Lys Leu Thr Leu Thr Ala Pro Pro Ser Ile Thr Ala Ala Ala Gly
180 185 190
Phe Asp Ala Phe Ala His Ala Ala Glu Ala Phe Val Ser Arg Ile Ser
195 200 205
Gln Pro Pro Ser Asp Ala Leu Ala Leu Ser Ala Met Lys Thr Val His
210 215 220
Thr Tyr Leu Arg Arg Ala Val Tyr Asn Gly Asp Asp Ile Glu Ala Arg
225 230 235 240
Met Lys Met Ala Glu Ala Ser Leu Leu Ala Gly Met Ala Phe Asn Gln
245 250 255
Ser Tyr Leu Gly Leu Ala His Ala Ile Gly Ser Ala Ile Ser Val His
260 265 270
Ala His Val Ser His Gly Val Val Ile Gly Leu Leu Leu Pro Lys Val
275 280 285
Ile Glu Tyr Asn Leu Val Ala Lys Ile Asp Lys Tyr Ala Glu Ala Gly
290 295 300
Lys Tyr Ile Glu Gln Ser Ser His Gly Leu Ser Asn Tyr Glu Ala Ala
305 310 315 320
Ala Leu Phe Ser Glu Thr Val Thr Gln Leu Arg Asn Asp Ile Gly Leu
325 330 335
Pro Lys Gln Leu Arg Glu Val Asn Val Lys Glu Ala Gln Leu Glu Ala
340 345 350
Ile Ser Lys Asp Ser Ile Lys Ser Gly Met Trp Gln Phe Asn Pro Arg
355 360 365
Arg Ala Ser Glu Gln Asp Val Tyr Gln Met Leu Arg Glu Met Leu
370 375 380
<210> 11
<211> 387
<212> PRT
<213> Pelotomaculum thermopropionicum
<400> 11
Met Ala Asp Tyr Asn Phe Ser Phe Ala Val Arg Thr Lys Val Phe Phe
1 5 10 15
Gly Arg Gly Val Val Phe Glu Gln Leu Pro Gly Ala Val Arg Glu Met
20 25 30
Gly Cys Lys Lys Ala Val Leu Val Ser Asp Pro Gly Ile Val Gly Thr
35 40 45
Gly Leu Ala Asp Arg Val Lys Asp Leu Leu Ala Gly Gly Gly Val Ala
50 55 60
Val Glu Val Phe Ser Glu Val Glu Pro Asp Pro Gly Leu Glu Thr Val
65 70 75 80
His Lys Ala Ala Ala Phe Leu Gly Arg Thr Arg Pro Asp Cys Leu Val
85 90 95
Ala Leu Gly Gly Gly Ser Ser Ile Asp Val Ala Lys Gly Ala Arg Val
100 105 110
Ile Tyr Asp Asn Gly Gly Lys Ile Ser Asp Tyr Ala Gly Val Asn Lys
115 120 125
Val Lys Val Lys Pro Ser Leu Pro Leu Met Ala Val Pro Thr Thr Ala
130 135 140
Gly Thr Gly Ser Glu Val Thr Val Phe Ala Val Leu Ser Asp Trp Glu
145 150 155 160
Gln Asn Ile Lys Ile Thr Val Thr Ser Glu Tyr Leu Ala Pro Glu Ala
165 170 175
Ala Phe Val Asp Pro Leu Ala Met Val Ser Ala Pro Pro Gly Ile Thr
180 185 190
Ala Ala Ser Gly Ile Asp Ala Leu Ser His Ala Val Glu Ala Tyr Val
195 200 205
Ser Arg Ala Ala Ser Pro Val Ser Asp Asn Leu Ala Leu Gly Ala Val
210 215 220
Glu Leu Ile Gly Gly His Leu Arg Gln Ala Val Ala Asn Gly Gly Asp
225 230 235 240
Leu Ala Ala Arg Thr Gly Ala Ala Leu Gly Ser Leu Leu Ala Gly Met
245 250 255
Ala Phe Asn Asn Ala Phe Leu Gly Leu Thr His Ser Ile Gly Ala Ala
260 265 270
Leu Ser Gly His Val His Val Ser His Gly Val Ala Val Gly Leu Leu
275 280 285
Leu Pro Tyr Val Met Glu Tyr Asn Leu Met Ala Lys Pro Asp Lys Phe
290 295 300
Ala Arg Leu Ala Arg Ala Met Gly Glu Val Thr Glu Gly Lys Ser Leu
305 310 315 320
Tyr Arg Ala Ala Ser Leu Ala Pro Arg Ala Val Lys Ala Met Val Lys
325 330 335
Ser Ile Gly Leu Pro Val Arg Leu Lys Glu Ile Gly Val Pro Glu Gly
340 345 350
Ala Leu Ala Ala Ile Ala Glu Thr Ala Leu Lys His Gly Met Ile Lys
355 360 365
Phe Asn Pro Arg Val Pro Ser Arg Glu Asp Ile Leu Asp Ile Val Lys
370 375 380
Lys Ala Tyr
385
<210> 12
<211> 1176
<212> DNA
<213> Aeribacillus pallidus
<400> 12
atgatcggaa attacgcaaa aaaggcgatt gatttcgagt tcacttttta tcttcctaca 60
ttgatcgaat tcggatacgg caaggcttcc cgaatgggag agatgcttga acagatgggt 120
ataaagaacg tttttttggt taccgacaaa ggagtggaag ctgcgggtct gttggcagga 180
atcgttcagt ctctggaatc atccaatatc cgatatgtta tttattcaga cgtagaacct 240
gacccgagct tagagacgat tgatcgtggt gcgtccgttt ttaaggagca gtcttttgac 300
tgtatcttag ctgtgggtgg aggaagtccg attgatacag ctaaggggat ccgtgtcgta 360
gtgacgaacg gaggaaacat cggtgactat gccggtgtta accgtgttgc gaaaaaatct 420
gaaattcctt tggtggctgt gccgactaca tccggcacgg gcagtgaagt aaccattttc 480
ggagtctact ccgattggga aaatcaagta aaggtgacgg taacaagccc atatatggcg 540
ccggagatcg ctttggtaga ccccgaactt accatgagtc taccgcaaaa aatgacagca 600
gcatcgggaa ttgatgctct agctcatggg attgaaactt tcttctcctt gcgttctcga 660
cctgcatccg atgccctagc ggtcgaagcg atggcgacgg tgagtgctta tttgcgccgt 720
gcggtggaag atggtacgga taaagaagcg aggatcggca tgtcccaggg cagtttgttg 780
gcagggatgg cattcaacaa tggcttctta ggtttggccc atgcgatcgg tagtgctttg 840
tctggccatt gtcatgtgtc ccatggtgtc gcaatcggtt tgttgctacc gaaagtggtg 900
gaatttaatg ctagggtgcg cccggaaaaa gctgcaaaaa tcgcagaatt gttgggagta 960
aaaggggatc gagaggaggt tcttgcggag caggcagctc ctgcagtcgc ctcgttagtc 1020
aaagagattg gtcttcccac tcgtttgcgt gatgttgatg tttctgaaga aaagctccca 1080
gatatcgcaa gagatgcatt taaaagcggt atgatgaagt ttaacccacg ccaaccaagt 1140
ttgtcagaag tgcttacact tttgcagcag atttat 1176
<210> 13
<211> 1179
<212> DNA
<213> Artificial
<220>
<223> Synthetic codon optimised for expression in P. putida
<400> 13
atgatcggca actacgccaa gaaggccatc gacttcgagt tcaccttcta cctgccgacc 60
ctgatcgagt tcggctacgg caaggccagc cgcatgggcg agatgctgga acaaatgggt 120
atcaagaacg tgttcctggt gaccgacaag ggcgtggaag ccgccggtct gctggccggc 180
atcgtgcaga gcctggaaag cagcaacatc cgctacgtga tctacagcga cgtggaaccg 240
gacccgagcc tggaaaccat cgaccgcggc gccagcgtgt tcaaagaaca gagcttcgac 300
tgcatcctgg ccgtgggcgg cggcagcccg atcgacaccg ccaagggcat ccgcgtggtg 360
gtgaccaacg gcggcaacat cggcgactac gccggcgtga accgcgtggc caagaagtcg 420
gagatcccgc tggtcgccgt gccaaccacc tcgggcaccg gcagcgaagt gaccatcttc 480
ggcgtgtaca gcgactggga gaaccaggtg aaggtgaccg tgaccagccc gtacatggcc 540
ccggaaatcg ccctggtgga cccggaactg accatgagcc tgccgcagaa gatgaccgcc 600
gccagcggca tcgacgccct ggcccacggc atcgaaacct tcttcagcct gcgcagccgc 660
ccagcctcgg atgccctggc ggtggaagcc atggccaccg tgagcgccta cctgcgccgc 720
gccgtcgagg acggcaccga caaagaagcc cgcatcggca tgagccaggg cagcctgctg 780
gcgggcatgg ccttcaacaa cggcttcctg ggcctggccc atgccatcgg cagcgccctg 840
agcggccatt gccatgtgag ccacggcgtg gccatcggcc tgctgctgcc gaaggtggtg 900
gaattcaacg cccgcgtgcg cccggaaaag gccgccaaga tcgccgaact gctgggcgtg 960
aagggcgacc gcgaagaggt gctggccgaa caggccgccc cagccgtggc cagcctggtg 1020
aaagaaatcg gcctgccgac ccgcctgcgc gacgtggacg tgagcgaaga gaagctgccg 1080
gacatcgccc gcgacgcctt caagagcggc atgatgaagt tcaacccgcg ccagccgagc 1140
ctgagcgagg tgctgaccct gctgcagcag atctactga 1179
<210> 14
<211> 1152
<212> DNA
<213> Artificial
<220>
<223> Synthetic codon optimised for expression in P.putida
<400> 14
atggacgtgg aattcagctt ccatctgccg accctgatcg agttcggctt cggcaaggcc 60
agcctgctgg gcgagcgcct gctgaagctg ggcgtgggca acgtgttcct ggtgagcgac 120
aagggcgtgg ccagcgcagg cctgctgcag aagctggaac agagcctgca gaccagcgac 180
atccacttca agacctacct ggaagtggaa ccggacccga gcctggaaac catcgacctg 240
ggtgccgagg ccttcaacag cggcaagtac gactgcatcg tggccgtggg tggtggcagc 300
gccatcgaca ccgccaaggg catccgcgtg gtggcaggca acggtggcag catcggcgac 360
ttcgcaggcg tggacaagat cggcaaggca ccgcagatcc cgctgatcgc cgtgccgacc 420
acctcgggca ccggcagcga agtgaccatc ttcggcgtgt acagcgactg ggtgaagaac 480
gtgaaggtga ccgtgaccag ccagtacatg gcaccgacca ttgccctggt ggacccggaa 540
ctgaccatgc gcctgccacg caagatgacc gcagccagcg gcatcgacgc cctggcccac 600
ggcatcgaga gctacttcag cctgcgcagc accagcgcca gccgtgccct gtcgctggaa 660
gccatcaaca tcgtgggcaa ccatctgcgc cagagcgtgg cgaacggcga ggacaaggaa 720
gcacgctgcg gcatgagcca cggcagcctg ctggcaggca tggcgttcaa caacggcttc 780
ctgggcctgg cccatgccat cggcagcgca ctgagcggtc actgccacgt gccgcacggc 840
gtggccatcg gcctgctgct gccgcacgtg gtggaattca acagcagcga gtgcccagac 900
caggcagccg agatcgccaa gatcctgggc gtgaaggccg aggacgaacg ccagctggcc 960
gaacaggcca gccacgccgt gggcgacctg gtgaaggaca tcggcctgcc gacccgtctg 1020
cgcgacatga acgtgccgga agagaagctg gccgacattg cacgcgacag cttccagagc 1080
ggcatgatga agttcaaccc acgtcgtgcc agcgagagcg aggtgctgga actgctgcac 1140
cgcgtgtact ga 1152
<210> 15
<211> 1994
<212> DNA
<213> Artificial
<220>
<223> Synthetic XbaI-SalI fragment
<400> 15
tctagatctt ctttgataat aaatgaaagc agccggtatg gagagaaaaa agtgcactta 60
tatgaagttg attttatggt cggctttatt ttgcccgtcg tactggctgt ccacacgatg 120
ttcatttttg atgcacaatt gaatggctgt acagttgcgt ttttgtcgat gtctggcggg 180
cacgcctcca tgcatgtgaa gcagattctt ttaagcgggc agcacccgct tttttggagg 240
gcaggcattc aggagcaaaa atggcagaga tcagttgggc gggatcagcc atttattcct 300
ccatccgggg cactttgtga aaatcagcac aagaatgaat aacgctttca tatctggctt 360
tttcaaataa aaccatttgt gaaaaatgta aacggatgat tttgaaaaac cgtcattttc 420
ctttaaaacc gggcatttgg gcagataaat tttcaaattt tcgccataaa atatgtgaat 480
ctaatcacaa aaatagtggt atacttaccc atgtggaatg aaggaaaatg aacggaacga 540
tccatttcag ccataaaagg gcatgccgtc catctatttc acaaaccgca cggcagcatt 600
tgctgcaaaa gtttaatcgt cctgctttaa aggaaaagca gtatggaatc cattaggagt 660
tggcacaata tccatagact ggataggggc ccgccatgcc gggcttgcaa aactgctttc 720
atacagtgga aatatttttt acttttgatg gggaggaaga ttatatatga tcggaaatta 780
cgcaaaaaag gcgattgatt tcgagttcac tttttatctt cctacattga tcgaattcgg 840
atacggcaag gcttcccgaa tgggagagat gcttgaacag atgggtataa agaacgtttt 900
tttggttacc gacaaaggag tggaagctgc gggtctgttg gcaggaatcg ttcagtctct 960
ggaatcatcc aatatccgat atgttattta ttcagacgta gaacctgacc cgagcttaga 1020
gacgattgat cgtggtgcgt ccgtttttaa ggagcagtct tttgactgta tcttagctgt 1080
gggtggagga agtccgattg atacagctaa ggggatccgt gtcgtagtga cgaacggagg 1140
aaacatcggt gactatgccg gtgttaaccg tgttgcgaaa aaatctgaaa ttcctttggt 1200
ggctgtgccg actacatccg gcacgggcag tgaagtaacc attttcggag tctactccga 1260
ttgggaaaat caagtaaagg tgacggtaac aagcccatat atggcgccgg agatcgcttt 1320
ggtagacccc gaacttacca tgagtctacc gcaaaaaatg acagcagcat cgggaattga 1380
tgctctagct catgggattg aaactttctt ctccttgcgt tctcgacctg catccgatgc 1440
cctagcggtc gaagcgatgg cgacggtgag tgcttatttg cgccgtgcgg tggaagatgg 1500
tacggataaa gaagcgagga tcggcatgtc ccagggcagt ttgttggcag ggatggcatt 1560
caacaatggc ttcttaggtt tggcccatgc gatcggtagt gctttgtctg gccattgtca 1620
tgtgtcccat ggtgtcgcaa tcggtttgtt gctaccgaaa gtggtggaat ttaatgctag 1680
ggtgcgcccg gaaaaagctg caaaaatcgc agaattgttg ggagtaaaag gggatcgaga 1740
ggaggttctt gcggagcagg cagctcctgc agtcgcctcg ttagtcaaag agattggtct 1800
tcccactcgt ttgcgtgatg ttgatgtttc tgaagaaaag ctcccagata tcgcaagaga 1860
tgcatttaaa agcggtatga tgaagtttaa cccacgccaa ccaagtttgt cagaagtgct 1920
tacacttttg cagcagattt attaattgtt cgggtttcag tgttccattt tcaaatattc 1980
cgttaagggt cgac 1994
<210> 16
<211> 1258
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-XbaI fragment
<400> 16
ggtaccttca cacaggaaac aggaggtaca atgatcggaa attacgcaaa aaaggcgatt 60
gatttcgagt tcacttttta tcttcctaca ttgatcgaat tcggatacgg caaggcttcc 120
cgaatgggag agatgcttga acagatgggt ataaagaacg tttttttggt taccgacaaa 180
ggagtggaag ctgcgggtct gttggcagga atcgttcagt ctctggaatc atccaatatc 240
cgatatgtta tttattcaga cgtagaacct gacccgagct tagagacgat tgatcgtggt 300
gcgtccgttt ttaaggagca gtcttttgac tgtatcttag ctgtgggtgg aggaagtccg 360
attgatacag ctaaggggat ccgtgtcgta gtgacgaacg gaggaaacat cggtgactat 420
gccggtgtta accgtgttgc gaaaaaatct gaaattcctt tggtggctgt gccgactaca 480
tccggcacgg gcagtgaagt aaccattttc ggagtctact ccgattggga aaatcaagta 540
aaggtgacgg taacaagccc atatatggcg ccggagatcg ctttggtaga ccccgaactt 600
accatgagtc taccgcaaaa aatgacagca gcatcgggaa ttgatgctct agctcatggg 660
attgaaactt tcttctcctt gcgttctcga cctgcatccg atgccctagc ggtcgaagcg 720
atggcgacgg tgagtgctta tttgcgccgt gcggtggaag atggtacgga taaagaagcg 780
aggatcggca tgtcccaggg cagtttgttg gcagggatgg cattcaacaa tggcttctta 840
ggtttggccc atgcgatcgg tagtgctttg tctggccatt gtcatgtgtc ccatggtgtc 900
gcaatcggtt tgttgctacc gaaagtggtg gaatttaatg ctagggtgcg cccggaaaaa 960
gctgcaaaaa tcgcagaatt gttgggagta aaaggggatc gagaggaggt tcttgcggag 1020
caggcagctc ctgcagtcgc ctcgttagtc aaagagattg gtcttcccac tcgtttgcgt 1080
gatgttgatg tttctgaaga aaagctccca gatatcgcaa gagatgcatt taaaagcggt 1140
atgatgaagt ttaacccacg ccaaccaagt ttgtcagaag tgcttacact tttgcagcag 1200
atttattaat tgttcgggtt tcagtgttcc attttcaaat attccgttaa ggtctaga 1258
<210> 17
<211> 446
<212> PRT
<213> Aeribacillus pallidus
<400> 17
Met Lys Asn Ile Ala Asn Thr Ser Thr Glu Arg Pro Val Asn Asp Ala
1 5 10 15
Ser Val Lys Asn Arg Gln Met Val Arg Ala Thr Ile Ala Ser Leu Ile
20 25 30
Gly Trp Ser Leu Asp Leu Tyr Asp Leu Phe Leu Leu Leu Phe Val Ala
35 40 45
Thr Thr Ile Gly Asn Leu Phe Phe Pro Ala Ser Asn Gln Thr Leu Ser
50 55 60
Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg Pro
65 70 75 80
Leu Gly Ser Ala Ile Phe Gly Ile Tyr Ala Asp Lys Asn Gly Arg Lys
85 90 95
Lys Ala Met Thr Val Ala Ile Ile Gly Ala Gly Leu Cys Thr Ala Ala
100 105 110
Phe Gly Leu Leu Pro Thr Ile His Gln Val Gly Val Val Ala Ala Ile
115 120 125
Ala Phe Leu Ile Leu Arg Leu Val Gln Gly Val Phe Val Gly Gly Val
130 135 140
Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Ala Ser Pro Lys Tyr
145 150 155 160
Arg Gly Phe Met Ser Gly Leu Ile Gly Gly Gly Gly Ala Gly Leu Gly
165 170 175
Ala Leu Phe Ala Ser Ile Ser Tyr Ser Val Val Thr Ala Ile Phe Pro
180 185 190
Gly Glu Ala Phe Asp Val Trp Gly Trp Arg Val Met Phe Phe Thr Gly
195 200 205
Ile Ile Gly Ser Leu Phe Gly Leu Phe Ile Phe Arg Ser Leu Glu Glu
210 215 220
Ser Pro Leu Trp Lys Gln Leu Lys Glu Glu Asn Ser Lys Gly Glu Val
225 230 235 240
Ser Glu Phe Gln Lys Ala Pro Leu Lys Thr Phe Phe Thr Lys Tyr Tyr
245 250 255
Lys Val Leu Leu Val Asn Leu Met Ile Val Ile Gly Gly Gly Ser Gly
260 265 270
Tyr Tyr Leu Thr Ser Gly Phe Ile Pro Thr Phe Leu Lys Val Val Asn
275 280 285
Lys Val Ser Ala Ser Val Ser Ser Gly Val Leu Ile Ala Thr Ser Ile
290 295 300
Met Thr Ile Val Ala Ala Val Leu Val Gly His Leu Ser Glu Val Ile
305 310 315 320
Gly Arg Lys Lys Thr Phe Leu Leu Ile Gly Ile Leu Cys Leu Val Gly
325 330 335
Leu Pro Tyr Phe Tyr Leu Ser Leu Ala Asn Ser Thr Thr Thr Thr Gly
340 345 350
Ile Tyr Leu Asn Ala Leu Gly Leu Ile Phe Leu Gly Asn Ala Ala Tyr
355 360 365
Ala Pro Val Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg
370 375 380
Ser Thr Gly Thr Gly Leu Ser Trp Asn Met Gly Phe Ala Ile Gly Gly
385 390 395 400
Met Met Pro Thr Phe Val Asn Leu Ala Ser Gly Thr Val Glu His Ile
405 410 415
Pro Tyr Thr Leu Met Tyr Phe Thr Ile Gly Ile Tyr Leu Val Tyr Ile
420 425 430
Leu Gly Ser Leu Ile Ile Pro Glu Thr Lys Gly Asn Leu Lys
435 440 445
<210> 18
<211> 1338
<212> DNA
<213> Aeribacillus pallidus
<400> 18
gtgaagaata tcgctaatac gagtaccgaa cgacctgtaa atgatgcttc agttaagaat 60
cgtcaaatgg tgcgagctac gattgcctcg ctcatagggt ggtcactcga tctttacgat 120
ttatttctgc tgctttttgt tgcgacgacc atagggaatt tgttttttcc cgccagcaat 180
caaacacttt ctttggctgc cgtgtatgct tcctttgccg ttacgctttt gatgcggcct 240
ttgggttccg ccattttcgg catttatgcg gataaaaacg ggagaaagaa agcgatgact 300
gtggcaatca ttggagcagg cttgtgcacg gcggctttcg gtctgttacc tacgatccac 360
caagttggag tggtcgctgc gatcgccttc ttgattttac gtttagttca aggagtgttt 420
gtcggcggag tggttgcttc cacccatacg ataggaacgg aatccgcatc gccaaaatat 480
cgggggttta tgtcgggatt gatcggtggt ggcggagcag gattgggagc actgtttgct 540
tctatttctt attcggttgt gacggcaatt tttccgggag aggcttttga tgtttgggga 600
tggcgtgtca tgtttttcac aggcattatc ggttccctct tcggcctttt catattccgg 660
tcccttgagg aatctcctct ctggaaacaa ttgaaagaag aaaatagtaa aggcgaagtg 720
tccgagtttc agaaagcacc gctgaagacg tttttcacta aatattacaa ggtattgctc 780
gtcaacctta tgatcgtcat cggtggtggc tccggttatt atctgactag tggatttatt 840
cctacatttt taaaggtagt taacaaagta tcagcctctg tttcgtcggg ggtactcatt 900
gcgacaagta ttatgaccat tgtagccgcc gttctcgtgg gacacctgag cgaggtcatc 960
ggcagaaaga aaacatttct gttaatcggt attctttgtc ttgtcggact tccgtatttt 1020
tatctgtcat tggcaaactc aactacgaca acgggcatct acttaaatgc tcttggactc 1080
atattcttgg ggaatgctgc atatgcaccg gtactcatct tcttgaacga acgttttccc 1140
acatcgatcc gttcaacagg taccggatta tcatggaaca tgggtttcgc cattggcggg 1200
atgatgccga cgtttgtgaa cttagccagt ggtacggtgg aacatattcc ttacacgctg 1260
atgtatttta ctatcggaat ttacttggtt tatatccttg gcagcctgat tattccggaa 1320
acaaaaggaa acctcaaa 1338
<210> 19
<211> 1184
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI - NheI fragment with codon optimized B.kribbensis
YiaY
<400> 19
ggtacctagg aaaggaagat taacccatgg acgtggaatt cagcttccat ctgccgaccc 60
tgatcgagtt cggcttcggc aaggccagcc tgctgggcga gcgcctgctg aagctgggcg 120
tgggcaacgt gttcctggtg agcgacaagg gcgtggccag cgcaggcctg ctgcagaagc 180
tggaacagag cctgcagacc agcgacatcc acttcaagac ctacctggaa gtggaaccgg 240
acccgagcct ggaaaccatc gacctgggtg ccgaggcctt caacagcggc aagtacgact 300
gcatcgtggc cgtgggtggt ggcagcgcca tcgacaccgc caagggcatc cgcgtggtgg 360
caggcaacgg tggcagcatc ggcgacttcg caggcgtgga caagatcggc aaggcaccgc 420
agatcccgct gatcgccgtg ccgaccacct cgggcaccgg cagcgaagtg accatcttcg 480
gcgtgtacag cgactgggtg aagaacgtga aggtgaccgt gaccagccag tacatggcac 540
cgaccattgc cctggtggac ccggaactga ccatgcgcct gccacgcaag atgaccgcag 600
ccagcggcat cgacgccctg gcccacggca tcgagagcta cttcagcctg cgcagcacca 660
gcgccagccg tgccctgtcg ctggaagcca tcaacatcgt gggcaaccat ctgcgccaga 720
gcgtggcgaa cggcgaggac aaggaagcac gctgcggcat gagccacggc agcctgctgg 780
caggcatggc gttcaacaac ggcttcctgg gcctggccca tgccatcggc agcgcactga 840
gcggtcactg ccacgtgccg cacggcgtgg ccatcggcct gctgctgccg cacgtggtgg 900
aattcaacag cagcgagtgc ccagaccagg cagccgagat cgccaagatc ctgggcgtga 960
aggccgagga cgaacgccag ctggccgaac aggccagcca cgccgtgggc gacctggtga 1020
aggacatcgg cctgccgacc cgtctgcgcg acatgaacgt gccggaagag aagctggccg 1080
acattgcacg cgacagcttc cagagcggca tgatgaagtt caacccacgt cgtgccagcg 1140
agagcgaggt gctggaactg ctgcaccgcg tgtactgagc tagc 1184
<210> 20
<211> 1359
<212> DNA
<213> Artificial
<220>
<223> EcoRI-NheI PCR fragment with A.pallidus proP coding sequence
<400> 20
gccgaattca tgaagaatat cgctaatacg agtaccgaac gacctgtaaa tgatgcttca 60
gttaagaatc gtcaaatggt gcgagctacg attgcctcgc tcatagggtg gtcactcgat 120
ctttacgatt tatttctgct gctttttgtt gcgacgacca tagggaattt gttttttccc 180
gccagcaatc aaacactttc tttggctgcc gtgtatgctt cctttgccgt tacgcttttg 240
atgcggcctt tgggttccgc cattttcggc atttatgcgg ataaaaacgg gagaaagaaa 300
gcgatgactg tggcaatcat tggagcaggc ttgtgcacgg cggctttcgg tctgttacct 360
acgatccacc aagttggagt ggtcgctgcg atcgccttct tgattttacg tttagttcaa 420
ggagtgtttg tcggcggagt ggttgcttcc acccatacga taggaacgga atccgcatcg 480
ccaaaatatc gggggtttat gtcgggattg atcggtggtg gcggagcagg attgggagca 540
ctgtttgctt ctatttctta ttcggttgtg acggcaattt ttccgggaga ggcttttgat 600
gtttggggat ggcgtgtcat gtttttcaca ggcattatcg gttccctctt cggccttttc 660
atattccggt cccttgagga atctcctctc tggaaacaat tgaaagaaga aaatagtaaa 720
ggcgaagtgt ccgagtttca gaaagcaccg ctgaagacgt ttttcactaa atattacaag 780
gtattgctcg tcaaccttat gatcgtcatc ggtggtggct ccggttatta tctgactagt 840
ggatttattc ctacattttt aaaggtagtt aacaaagtat cagcctctgt ttcgtcgggg 900
gtactcattg cgacaagtat tatgaccatt gtagccgccg ttctcgtggg acacctgagc 960
gaggtcatcg gcagaaagaa aacatttctg ttaatcggta ttctttgtct tgtcggactt 1020
ccgtattttt atctgtcatt ggcaaactca actacgacaa cgggcatcta cttaaatgct 1080
cttggactca tattcttggg gaatgctgca tatgcaccgg tactcatctt cttgaacgaa 1140
cgttttccca catcgatccg ttcaacaggt accggattat catggaacat gggtttcgcc 1200
attggcggga tgatgccgac gtttgtgaac ttagccagtg gtacggtgga acatattcct 1260
tacacgctga tgtattttac tatcggaatt tacttggttt atatccttgg cagcctgatt 1320
attccggaaa caaaaggaaa cctcaaataa gctagcggc 1359
<210> 21
<211> 20
<212> DNA
<213> Artificial
<220>
<223> ribosome binding site
<400> 21
taggaaagga agattaaccc 20
<210> 22
<211> 30
<212> DNA
<213> Artificial
<220>
<223> PCR primer proP(f)
<400> 22
gccgaattca tgaagaatat cgctaatacg 30
<210> 23
<211> 34
<212> DNA
<213> Artificial
<220>
<223> PCR primer proP(r)
<400> 23
gccgctagct tatttgaggt ttccttttgt ttcc 34
<210> 24
<211> 500
<212> PRT
<213> Cupriavidus basilensis
<400> 24
Met Asn Ala Gln His Trp Ile Ala Gly Ala Trp Thr Gly Glu Pro Ser
1 5 10 15
Ala Asp Ser Val Asn Pro Ala Asp Gly Thr Leu Ile Gly Gln Phe Ala
20 25 30
Asp Gly Gly Thr Trp Gln Ala Glu Ala Ala Ile Ala Ala Ala Arg His
35 40 45
Val Phe Glu Arg Thr Thr Trp Gly Gln Asp Ala Arg Leu Arg Gln Asp
50 55 60
Val Leu Leu Ala Trp Ala Gly Ala Leu Glu Ala Glu Arg Glu Arg Leu
65 70 75 80
Ala Ser Leu Leu Thr Ala Glu Asn Gly Lys Pro Val Ala Gln Ala Arg
85 90 95
Gly Glu Val Gly Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu
100 105 110
Ala Arg His Ile Pro Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile
115 120 125
Ser Thr Ile Leu Arg Glu Pro Ala Gly Val Ala Ala Ile Ile Val Pro
130 135 140
Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu
145 150 155 160
Ala Ala Gly Cys Thr Ala Val Val Lys Ser Ala Ala Gln Thr Thr Leu
165 170 175
Phe Thr Ala Ala Met Leu Arg Leu Phe Glu Arg Thr Ala Leu Pro Ala
180 185 190
Gly Ala Val Asn Leu Val Cys Glu Thr Gly Tyr Ala Ala Ala Asp His
195 200 205
Leu Val Arg Ser Arg Asp Val Asp Val Val Ser Phe Thr Gly Ser Thr
210 215 220
Ala Thr Gly Lys Lys Ile Met Ile Ala Ala Ala Asp Ser Val Lys Lys
225 230 235 240
Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe Asp Asp
245 250 255
Val Asp Ala Gln Ala Val Ala Lys Arg Leu Ala Leu Ala Ala Thr Val
260 265 270
Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Glu
275 280 285
Ala Ile Ala Pro Gln Met Arg Arg His Leu Thr Glu Ala Leu Ala Ala
290 295 300
Leu Arg Leu Gly Pro Gly Ile Glu Pro Asp Thr Gln Ile Gly Pro Leu
305 310 315 320
Ile Asp His Pro Thr Arg Ala Met Val Ser Ala Gln Val Glu Arg Ala
325 330 335
Cys Asp Glu Ala Asp Thr Val Leu Leu Arg Gly Thr Met Pro Gly Gly
340 345 350
Ala Leu Ala Arg Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Ser
355 360 365
Asp Pro Gly Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro Phe Val
370 375 380
Thr Phe Glu Thr Phe Ala Thr Glu Asp Glu Ala Leu Ala Lys Ala Asn
385 390 395 400
Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp Thr His His Gly Glu
405 410 415
Arg Ala Ile Arg Leu Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Val
420 425 430
Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg
435 440 445
Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe
450 455 460
Thr Glu Leu Lys His Ile Cys Ile Gln Ala Gly Leu Pro Lys Gly Met
465 470 475 480
Ser Gln Ala Gly Cys Arg Leu Ser Gly Val Ala Ala Arg Glu Arg Met
485 490 495
Gly Val Ser Val
500
<210> 25
<211> 479
<212> PRT
<213> Burkholderia sp. CCGE1002
<400> 25
Met Asn Ala Arg His Trp Ile Ala Gly Glu Trp Thr Gly Thr Pro Asn
1 5 10 15
Ile Asp Ser Ile Asp Pro Ala Thr Gly Asp Ala Ile Gly Arg Phe Ala
20 25 30
Asp Gly Gly Ser Ser Glu Ala Asp Ala Ala Ile Ala Ala Ala Arg His
35 40 45
Ala Phe Asp Arg Thr Thr Trp Ala Gln Asp Ala Arg Leu Arg Gln Asp
50 55 60
Val Leu Leu Gly Trp Ala Ser Ala Leu Glu Ala Glu Arg Asp Met Leu
65 70 75 80
Ala Thr Leu Leu Thr Arg Glu Asn Gly Lys Ala Ile Ala Gln Ser Arg
85 90 95
Asp Glu Ile Ala Gly Ala Ile Ser Glu Val Arg Tyr Tyr Ala Gly Leu
100 105 110
Ala Arg His Ile Ala Gly His Val Leu Glu Pro Glu Pro Gly Thr Ile
115 120 125
Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile Val Pro
130 135 140
Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro Ala Leu
145 150 155 160
Ala Ala Gly Cys Thr Val Ile Val Lys Pro Ala Ala Gln Thr Ser Leu
165 170 175
Leu Thr Ala Ala Met Leu Arg Cys Phe Glu His Thr Ala Leu Pro Glu
180 185 190
Gly Ala Val Asn Leu Val Asn Glu Arg Gly Tyr Ala Ala Ser Gln Arg
195 200 205
Leu Val Asp Ser His Gly Val Asp Val Val Ser Phe Thr Gly Ser Thr
210 215 220
Ala Thr Gly Lys Lys Ile Met Ala Ala Ala Ala Asp Ser Met Lys Lys
225 230 235 240
Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Val Val Phe Asp Asp
245 250 255
Ala Asp Val Ala Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala Thr Ile
260 265 270
Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val His Ala
275 280 285
Ser Arg Ala Ala Gln Met Arg Glu Gln Leu Ala Ser Ala Leu Ala Ser
290 295 300
Leu Arg Val Gly Pro Gly Ile Asp Pro Ala Thr Asp Ile Gly Ala Leu
305 310 315 320
Ile Asp Gly Thr Thr Arg Asp Ala Val Ala Arg Thr Ile Glu Arg Ala
325 330 335
Cys Gly Thr Ala Glu Arg Val Leu Leu Arg Gly Thr Cys Ser Gly His
340 345 350
Ala Phe Leu Ser Pro Thr Leu Val Glu His Asp Asp Pro Lys Ala Phe
355 360 365
Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu Glu Val Phe
370 375 380
Glu Asn Glu Met Glu Ala Ile Glu Lys Ala Asn Asp Thr Val Phe Gly
385 390 395 400
Leu Ser Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Leu Arg Val
405 410 415
Ala Arg Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys
420 425 430
Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly
435 440 445
Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu Leu Lys His
450 455 460
Ile Cys Met Pro Ala Gly Val Ala Glu Gly Ile Ala Pro Leu Arg
465 470 475
<210> 26
<211> 483
<212> PRT
<213> Burkholderia graminis C4D1M
<400> 26
Met Glu Arg Asp Ala Met Asn Trp Ile Ala Gly Glu Trp Ala Gly Lys
1 5 10 15
Pro Val Leu Ala Ser Ser Asp Pro Ser Asn Gly Glu Thr Leu Gly Arg
20 25 30
Phe Val Ser Ser Asn Thr Gln Asp Ala Asp Ala Ala Val Ser Ala Ala
35 40 45
Arg His Thr Phe Asp His Thr Thr Trp Ala Gln Asp Ala Arg Arg Arg
50 55 60
Gln Asp Val Leu Leu Arg Trp Ala Gln Ala Leu Glu Leu Ser Val Glu
65 70 75 80
Pro Leu Ala Glu Leu Leu Thr His Glu Asn Gly Lys Thr Ile Gly Gln
85 90 95
Ala Arg Gly Glu Met Arg Ala Ala Ile Ser Glu Val Arg Tyr Tyr Ala
100 105 110
Gly Leu Ala Arg His Ile Ala Gly His Val Ile Glu Pro Glu Pro Gly
115 120 125
Thr Ile Ser Thr Met Leu Arg Glu Ala Ala Gly Val Ala Ala Ile Ile
130 135 140
Val Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ser Leu Ala Pro
145 150 155 160
Ala Leu Ala Ala Gly Cys Thr Ala Ile Val Lys Pro Ala Ala Gln Thr
165 170 175
Ser Leu Ile Thr Ala Ala Met Ile Arg Cys Leu Asp Gln Pro Ala Leu
180 185 190
Pro Ala Gly Ala Val Asn Leu Leu Leu Glu Asn Gly Ala Glu Ala Ala
195 200 205
Ala Arg Leu Val Glu Ser Ala Asp Val Asp Val Ile Ser Phe Thr Gly
210 215 220
Ser Thr Glu Val Gly Lys Arg Ile Met Arg Ala Ala Ala Asp Ser Met
225 230 235 240
Lys Arg Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe
245 250 255
Glu Asp Ser Asp Val Lys Ala Ile Ala Pro Arg Leu Ala Arg Ala Ala
260 265 270
Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Ile Leu Val
275 280 285
His Val Ser Lys Ala Asp Gln Met Arg Asp Glu Leu Val Lys Ala Leu
290 295 300
Ala Ser Leu Lys Val Gly Pro Gly Ile Asp Pro Ala Ser Asp Ile Gly
305 310 315 320
Ala Leu Ile Asp Ala Ala Ser Arg Asp Ala Val Gln Thr Thr Val Glu
325 330 335
Arg Ala Cys Asp Leu Ala Asp Arg Val Leu Leu Arg Gly Thr Ser Ser
340 345 350
Gly Pro Gly Ala Phe Leu Ser Pro Thr Leu Val Glu His Gly Glu Pro
355 360 365
His Ala Phe Phe Cys Gln Asp Glu Ile Phe Gly Pro Phe Val Thr Leu
370 375 380
Glu Thr Phe Val Thr Glu Lys Glu Ala Val Glu Lys Ala Asn Asn Thr
385 390 395 400
Val Phe Gly Leu Ser Ala Ser Val Trp Thr His Asp Ser Ala Arg Ala
405 410 415
Phe Arg Ile Ala Arg Ala Leu Arg Asp Gly Thr Val Trp Ile Asn Asp
420 425 430
His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly Tyr Arg Gln Ser
435 440 445
Gly Leu Gly Arg Leu His Gly Tyr Asp Ala Leu Ala Asp Phe Thr Glu
450 455 460
Ile Lys His Ile Cys Val Gly Ala Gly Val Leu Glu Gly Ile Glu Val
465 470 475 480
Leu Gly Ser
<210> 27
<211> 483
<212> PRT
<213> Azospirillum sp. B510
<400> 27
Met Thr Asn Leu Asp Ser Arg His Trp Ile Asp Gly Ala Trp Val Pro
1 5 10 15
Gly Thr Asp Arg Phe Ala Ser Ile Asn Pro Ala Asp Gly Ser Val Leu
20 25 30
Gly His Ala Ala Asp Gly Gly Arg Ala Glu Ala Glu Ala Ala Ile Ala
35 40 45
Ala Ala His Ala Ala Phe Asn Arg Pro Asp Trp Ala Gln Asn Pro Arg
50 55 60
Leu Arg Gln Ser Ile Leu Leu Gly Trp Ala Asp Arg Leu Asp Thr Gln
65 70 75 80
Ala Glu Asp Leu Ala Arg Leu Leu Thr Leu Glu Asn Gly Lys Ala Ile
85 90 95
Ala Gln Ser Arg Gly Glu Ile Ala Gly Ala Ile Ser Glu Ile Arg Tyr
100 105 110
Tyr Gly Gly Leu Ala Arg His Val Pro Gly His Val Leu Glu Val Glu
115 120 125
Pro Gly Val Leu Ser Thr Met Leu Arg Glu Pro Ala Gly Val Ala Ala
130 135 140
Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu Ala Arg Ala Ile
145 150 155 160
Gly Pro Ala Leu Ala Cys Gly Cys Thr Val Val Val Lys Pro Ala Ala
165 170 175
Gln Thr Thr Leu Leu Thr Ala Ala Phe Leu Arg Ala Leu Ser Glu Val
180 185 190
Pro Ser Leu Pro Arg Gly Val Cys Asn Met Ile Ser Glu Thr Gly His
195 200 205
Ala Ala Ala Ala Arg Leu Val Asp Ser Pro Leu Val Asp Val Val Ser
210 215 220
Phe Thr Gly Ser Thr Ala Thr Gly Lys Arg Ile Met Val Ala Ala Ala
225 230 235 240
Asp Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys
245 250 255
Leu Val Phe Pro Asp Ala Asp Pro Ala Glu Thr Ala Ala Arg Ile Ala
260 265 270
Thr Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg
275 280 285
Val Leu Val His Ala Ser Ala Phe Asp Ala Met Lys Thr His Leu Arg
290 295 300
Ala Ala Leu Ala Ala Met Thr Val Gly Asn Gly Leu Asp Pro Ala Ile
305 310 315 320
Arg Met Gly Pro Leu Ile Asp Arg Pro Ala Arg Asp Gln Val Gln Thr
325 330 335
Gln Val Glu Arg Ala Phe Asp Ala Cys Asp Glu Val Leu Leu Arg Gly
340 345 350
Gly Val Pro Thr Asp Ser Pro Ala Ala Ala Ser Phe Leu Thr Pro Ser
355 360 365
Leu Val Ala His Asp Asp Pro Ser Ala Phe Phe Cys Gln Asp Glu Ile
370 375 380
Phe Gly Pro Phe Val Val Leu Glu Arg Phe Glu Thr Glu Ala Glu Ala
385 390 395 400
Val Ala Lys Ala Asn Asn Thr Val Phe Gly Leu Ser Ala Ser Val Trp
405 410 415
Thr Arg Asp Gly Ala Arg Ala Leu Arg Met Ala Arg Ala Leu Arg Asn
420 425 430
Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu
435 440 445
Thr Gly Gly Tyr Arg Gln Ser Gly Leu Gly Arg Leu His Gly Tyr Asp
450 455 460
Ala Phe Ala Asp Phe Thr Glu Leu Lys His Val Cys Gln Thr Val Gly
465 470 475 480
Thr Ile Gly
<210> 28
<211> 480
<212> PRT
<213> Pseudomonas putida
<400> 28
Met Gln Ser Gln His Tyr Ile Asp Gly Gln Trp Thr Ser Thr Asp Arg
1 5 10 15
Trp Thr Asp Ser Leu Asp Pro Ala Ser Gly Glu Leu Ile Gly Cys Phe
20 25 30
Ala Asp Gly Gly Glu Ala Glu Ala Glu Ala Ala Val Ala Ala Ala Ala
35 40 45
Arg Ala Phe Asn Asp Pro Gln Trp Ala Gln Asn Pro Arg Leu Arg Gln
50 55 60
Gln Leu Leu Leu Glu Trp Ala Ala Gly Leu Lys Ala Arg Gln Glu Gln
65 70 75 80
Leu Ala Gln Leu Leu Thr Arg Glu Asn Gly Lys Ala Leu Ala Gln Ser
85 90 95
Arg Gly Glu Ile Gly Gly Ala Ile Ser Glu Ile Leu Tyr Tyr Ala Gly
100 105 110
Leu Ala Arg His Asn Pro Gly His Met Leu Glu Val Ala Pro Gly Glu
115 120 125
Phe Ser Ser Met Leu Arg Glu Pro Ala Gly Val Ala Gly Leu Ile Ile
130 135 140
Pro Trp Asn Ala Pro Ala Val Leu Leu Val Arg Ala Leu Ala Pro Ala
145 150 155 160
Ile Ala Ala Gly Cys Thr Val Val Ile Lys Pro Ala Pro Gln Thr Ala
165 170 175
Leu Phe Asn Ala Ala Met Leu Glu Pro Leu Phe Ala Leu Pro Gly Leu
180 185 190
Pro Ala Gly Ala Val Asn Leu Phe Ala Glu Ser Gly His Ala Gly Ala
195 200 205
Ala His Leu Val Ala Ser Pro Arg Val Asp Val Leu Ser Phe Thr Gly
210 215 220
Ser Thr Ala Thr Gly Gln Arg Ile Met Arg Asp Cys Ala Ala Thr Met
225 230 235 240
Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser Cys Cys Leu Val Phe
245 250 255
Glu Asp Ala Asp Ile Ala Ala Ile Ala Pro Lys Leu Ala Ala Ala Ala
260 265 270
Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala Arg Arg Val Leu Val
275 280 285
His Ala Ser Arg Phe Ala Glu Met Lys Thr Ala Leu Ser Ala Ala Leu
290 295 300
Gly Gln Ile Arg Leu Gly Asn Gly Leu Asp Pro Ala Asn Asn Met Gly
305 310 315 320
Pro Leu Ile Asp Trp His Ser Arg Asp Ser Val Glu Arg Arg Ile Gly
325 330 335
Glu Ala Leu Asp Ser Cys Asp Glu Val Leu Leu Ala Gly Gly Arg Pro
340 345 350
Gln Gly Glu Leu Ser Lys Gly Ala Phe Leu Ala Pro Ser Leu Ile Ala
355 360 365
His Arg Asp Ser Ser Ala Phe Phe Cys Gln Glu Glu Ile Phe Gly Pro
370 375 380
Leu Leu Val Leu Glu Ser Phe Glu Asp Glu Thr Glu Ala Val Ala Arg
385 390 395 400
Ala Asn His Thr Glu Phe Gly Leu Ser Ala Ser Val Trp Thr Asp Gln
405 410 415
Gly Ala Arg Ala Trp Arg Val Ala Arg Ala Leu Arg Asn Gly Thr Val
420 425 430
Trp Leu Asn Asp His Asn Arg Leu Phe Ala Glu Ala Glu Thr Gly Gly
435 440 445
Tyr Arg Lys Ser Gly Leu Gly Arg Leu His Gly Val Asp Ala Leu Leu
450 455 460
Asp Phe Ser Glu Leu Lys His Ile Tyr Gln Asn Val Gly Thr Leu Gly
465 470 475 480
<210> 29
<211> 486
<212> PRT
<213> Rhodopseudomonas palustris
<400> 29
Met Gly Met Thr Ala Leu His Ala Asp Asn Leu Ile Asp Gly Ala Trp
1 5 10 15
Gln Pro Ala Gln Ser Gly Ala Thr Ala Pro Ser Leu Asp Pro Ser Ser
20 25 30
Gly Gly Thr Ile Gly Gly Phe Ala Ala Gly Gly Ala Ala Asp Ala Gln
35 40 45
Ala Ala Val Ala Ala Ala Arg Arg Ala Phe Glu Arg Pro Glu Trp Ser
50 55 60
Gln Asn Pro Arg Ala Arg Gln Met Val Met Leu Arg Trp Ala Asp Arg
65 70 75 80
Met Glu Ala Gln Ala Asp Gln Leu Ala Arg Leu Leu Thr Leu Glu Asn
85 90 95
Gly Lys Pro Leu Pro Gln Ser Arg Gly Glu Ile Ala Gly Ser Val Ser
100 105 110
Glu Ile Arg Tyr Tyr Ala Gly Leu Thr Arg Tyr Ile Pro Gly His Val
115 120 125
Phe Glu Val Glu Pro Gly Ser Phe Ser Thr Leu Leu Lys Glu Pro Ala
130 135 140
Gly Val Ala Gly Leu Ile Ile Pro Trp Asn Ala Pro Ala Val Leu Leu
145 150 155 160
Ile Arg Ala Leu Thr Pro Ala Leu Ala Ala Gly Cys Thr Val Val Ile
165 170 175
Lys Pro Ala Pro Gln Thr Ala Gln Ile Thr Ala Ala Ile Ile Lys Cys
180 185 190
Leu His Glu Val Asp Gly Leu Pro Arg Gly Val Val Asn Leu Val Ser
195 200 205
Glu Gln Gly His Gln Val Ala Glu His Leu Val Thr Ser Asn Asp Val
210 215 220
Asp Val Ile Ser Phe Thr Gly Ser Asn Ala Thr Gly Ala Arg Ile Met
225 230 235 240
Ala Ala Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly
245 250 255
Lys Ser Ala Cys Leu Val Phe Asp Asp Ala Asp Ile Ala Asp Val Ala
260 265 270
Pro Lys Leu Ala Ala Ala Ala Thr Ile Ile Ala Gly Gln Gln Cys Thr
275 280 285
Ala Ala Arg Arg Val Leu Val His Ala Ser Arg Tyr Asp Glu Met Lys
290 295 300
Ala Ala Leu Lys Ala Ala Leu Ala Asn Ile Arg Ile Ala Pro Gly Ser
305 310 315 320
Ala Ala Gly Ala Glu Met Gly Pro Leu Ile Asp Ala Ala Ser Leu Ala
325 330 335
Ala Val Ala Lys Arg Ala Asp Glu Ala Met Gln Ala Ala Asp Glu Val
340 345 350
Val Leu Arg Gly Gly Arg Pro Ala Gly Asp Leu Ala Asn Gly Tyr Phe
355 360 365
Leu Ser Pro Thr Leu Val Ala His Arg Asp Thr Ser Ala Phe Phe Val
370 375 380
Gln Glu Glu Ile Phe Gly Pro Leu Val Val Leu Glu Lys Phe Glu Asp
385 390 395 400
Glu Lys Glu Ala Val Ala Arg Ala Asn His Ser Asp Tyr Gly Leu Ser
405 410 415
Ala Ser Val Trp Thr His Asp Gly Ala Arg Ala Met Arg Val Ala Arg
420 425 430
Ala Leu Arg Asn Gly Thr Val Trp Ile Asn Asp His Asn Lys Leu Phe
435 440 445
Ala Glu Ala Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu
450 455 460
His Gly Tyr Asp Ala Leu Ile Asp Phe Leu Glu Ile Lys His Val Tyr
465 470 475 480
Gln Ser Cys Gly Val Val
485
<210> 30
<211> 485
<212> PRT
<213> Dinoroseobacter shibae DFL 12
<400> 30
Met Thr Thr Thr Asp Leu Ile Ala Arg His Met Ile Gly Gly Ser Tyr
1 5 10 15
Ser Asp Ala Gly Asp Lys Ile Ala Ser Ile Asn Pro Ala Thr Gly Ala
20 25 30
Val Val Gly His Val Arg Ala Asp Gly Ala Ala Gln Ala Thr Ala Ala
35 40 45
Ile Ala Ala Ala Arg Ala Ala Phe Asp Thr Thr Leu Trp Pro Gln Ser
50 55 60
Pro Arg Asp Arg Gln Met Ala Leu Leu Arg Trp Ala Asp Ala Leu Glu
65 70 75 80
Ala Asp Leu Ala Arg Leu Ala Glu Leu Leu Thr Leu Thr Asn Gly Lys
85 90 95
Pro Leu Gly Ala Ser Lys Gly Glu Leu Gly Ala Ala Ile Ser Glu Ile
100 105 110
Arg Tyr Tyr Ala Gly Leu Thr Arg His Asn Pro Gly His Ala Met Glu
115 120 125
Val Ala Pro Gly Glu Leu Ser Val Met Leu Arg Glu Pro Ala Gly Val
130 135 140
Ala Gly Ile Ile Val Pro Trp Asn Ala Pro Ala Val Leu Leu Ile Arg
145 150 155 160
Ser Leu Ala Pro Ala Leu Ala Val Gly Cys Thr Thr Val Thr Lys Pro
165 170 175
Ala Pro Gln Thr Ala Leu Phe Thr Ala Ala Cys Met Ala Pro Leu Phe
180 185 190
Glu Asp Ala Ala Ile Pro Ala Gly Val Val Asn Val Val Phe Glu Val
195 200 205
Gly His Asp Ala Ala Gln Thr Leu Val Thr Ser Pro Asp Val Asp Val
210 215 220
Ile Ser Phe Thr Gly Ser Asn Ala Val Gly Gln Arg Ile Met Ala Asp
225 230 235 240
Ala Ala Pro Thr Met Lys Lys Leu Ser Leu Glu Leu Gly Gly Lys Ser
245 250 255
Cys Cys Ile Val Leu Asp Asp Ala Asp Ile Gly Val Val Ala Pro Lys
260 265 270
Leu Ala Ala Ala Ala Thr Ile Ile Ser Gly Gln Gln Cys Thr Ala Ala
275 280 285
Arg Arg Val Leu Val His Glu Ser Arg Leu Asp Glu Ala Lys Ser Ala
290 295 300
Leu Ser Ala Ala Leu Gln Ala Val Ser Ile Gly Asp Gly Met Ser Asp
305 310 315 320
Gly Thr Ala Met Gly Pro Leu Ile Asp Ile Gln Ser Arg Asp Arg Val
325 330 335
Met Arg Asp Cys Gly Thr Val Tyr Asp Thr Ala Asp Glu Val Val Leu
340 345 350
Arg Gly Gly Pro Leu Asp Gly Pro Lys Gly Ser Ala Phe Met Ser Pro
355 360 365
Ala Leu Val Val His Ser Asp Pro Asn Ala Ser Phe Val Gln Asp Glu
370 375 380
Ile Phe Gly Pro Leu Val Val Leu Glu Thr Phe Arg Asp Glu Ala Asp
385 390 395 400
Ala Val Ala Lys Ala Asn Asn Thr Val Tyr Gly Leu Ser Ala Ser Ile
405 410 415
Trp Thr His Arg Gly Asp Ala Ser Trp Arg Leu Ala Arg Ala Leu Arg
420 425 430
Asn Gly Thr Val Trp Ile Asn Asp His Asn Arg Leu Phe Ala Glu Ala
435 440 445
Glu Thr Gly Gly Tyr Arg Arg Ser Gly Leu Gly Arg Leu His Gly Phe
450 455 460
Asp Gly Leu Leu Asp Phe Cys Glu Leu Lys His Val Tyr Gln Asn Val
465 470 475 480
Gly Val Val Gly His
485
<210> 31
<211> 447
<212> PRT
<213> Cupriavidus basilensis
<400> 31
Met Glu Ala Val Ala Lys Lys Arg Thr Glu Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Thr Asn Arg Gln Val Phe Gly Ala Val Thr Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Thr Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Ile
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Pro Ala Gly Ala Ser Ala Ala Ile Leu Met Ala Ser Ser Val Gly
290 295 300
Val Ile Val Ala Ser Ile Ile Ala Gly His Leu Ser Thr Leu Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Leu Leu
325 330 335
Pro Leu Ile Tyr Gln Arg Met Pro Ala Ala Pro Asp Val Thr Thr Leu
340 345 350
Gly Ile Tyr Ala Val Ala Leu Ala Met Leu Gly Ser Thr Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala
370 375 380
Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Ile Gly Gly Met
385 390 395 400
Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Asp Leu Pro
405 410 415
Lys Val Leu Gly Ile Phe Val Ala Val Val Thr Ala Ile Tyr Leu Ala
420 425 430
Gly Ala Ala Ile Val Pro Glu Thr Ala Gly Arg Leu Gly Glu Lys
435 440 445
<210> 32
<211> 449
<212> PRT
<213> Cupriavidus basilensis
<400> 32
Met Glu Ala Val Ala Lys Lys Ser Ala Ala Thr Ile Ser Glu Ala Leu
1 5 10 15
Pro Ala Ala Ser Asn Arg Gln Val Phe Gly Ala Val Ala Ala Ser Cys
20 25 30
Met Gly Trp Ala Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Phe Val
35 40 45
Ala Pro Val Ile Gly Arg Leu Phe Phe Pro Ser Glu His Ala Met Leu
50 55 60
Ser Leu Ala Ala Val Tyr Ala Ser Phe Ala Val Thr Leu Leu Met Arg
65 70 75 80
Pro Leu Gly Ser Ala Ile Phe Gly Ser Tyr Ala Asp Arg His Gly Arg
85 90 95
Lys Gly Ala Met Val Val Ala Val Thr Gly Val Gly Leu Ser Thr Ala
100 105 110
Ala Phe Gly Leu Leu Pro Thr Val Gly Gln Val Gly Leu Leu Ala Pro
115 120 125
Ala Leu Phe Ile Leu Leu Arg Leu Val Gln Gly Ile Phe Val Gly Gly
130 135 140
Val Val Ala Ser Thr His Thr Ile Gly Thr Glu Ser Val Pro Pro Ser
145 150 155 160
Trp Arg Gly Ala Val Ser Gly Leu Val Gly Gly Gly Gly Ala Gly Leu
165 170 175
Gly Ala Leu Leu Ala Ser Ile Thr Tyr Met Ala Met Thr Ala Leu Phe
180 185 190
Pro Gly Glu Ala Phe Asp Ala Trp Gly Trp Arg Cys Met Phe Phe Ser
195 200 205
Gly Ile Ile Ser Ser Val Leu Gly Leu Phe Ile Phe Asn Ser Leu Glu
210 215 220
Glu Ser Pro Leu Trp Lys Gln Leu Gln Ala Ala Lys Gly His Ala Ala
225 230 235 240
Pro Val Glu Asn Pro Leu Arg Val Ile Phe Ser Arg Gln Tyr Arg Gly
245 250 255
Val Leu Phe Val Asn Ile Leu Leu Thr Val Gly Gly Gly Ser Ala Tyr
260 265 270
Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Phe Leu Lys Val Val Val Lys
275 280 285
Ala Ser Ala Gly Glu Ser Ala Ala Ile Leu Met Ala Ser Ser Leu Gly
290 295 300
Val Ile Val Ala Ser Ile Leu Ala Gly His Leu Ser Thr Met Ile Gly
305 310 315 320
Arg Lys Arg Ala Phe Leu Leu Ile Gly Ala Leu Asn Val Val Val Leu
325 330 335
Pro Leu Leu Tyr Gln Trp Met Pro Ala Ala Pro Asp Thr Thr Thr Leu
340 345 350
Gly Leu Tyr Ala Val Val Leu Ser Met Leu Gly Cys Ser Gly Phe Ala
355 360 365
Pro Ile Leu Ile Phe Leu Asn Glu Arg Phe Pro Thr Ser Ile Arg Ala
370 375 380
Thr Gly Thr Gly Leu Ser Trp Asn Ile Gly Phe Ala Val Gly Gly Met
385 390 395 400
Met Pro Thr Phe Ala Ser Leu Cys Ala Ser Thr Pro Ala Glu Leu Pro
405 410 415
Met Val Leu Gly Ile Phe Leu Ala Val Val Thr Ile Ile Tyr Leu Val
420 425 430
Gly Ala Phe Ile Val Pro Glu Thr Val Gly Arg Leu Gly Asp Asn Gly
435 440 445
Ala
<210> 33
<211> 449
<212> PRT
<213> Methylobacterium radiotolerans
<400> 33
Met Gln Thr Ala Ala Thr Phe Ala Ser Asp Pro Pro Ala Leu Ala Lys
1 5 10 15
Pro Thr Gly Arg Gln Thr Val Thr Ala Ala Met Ala Ser Leu Phe Gly
20 25 30
Trp Gly Leu Asp Leu Phe Asp Leu Phe Ile Leu Leu Tyr Val Ala Pro
35 40 45
Val Val Gly Thr Leu Phe Phe Pro Ala Asp Lys Pro Met Leu Ser Leu
50 55 60
Ala Gly Ala Tyr Ala Ser Phe Ala Val Thr Leu Leu Ile Arg Pro Leu
65 70 75 80
Gly Ser Ala Leu Phe Gly Ser Tyr Ala Asp Arg Phe Gly Arg Arg Arg
85 90 95
Ala Leu Met Val Ala Val Val Gly Val Gly Ile Ser Thr Ala Val Phe
100 105 110
Gly Leu Leu Pro Thr Val Gly Gln Ile Gly Trp Leu Ala Thr Ala Val
115 120 125
Phe Leu Phe Phe Arg Leu Val Gln Gly Ile Phe Val Gly Gly Val Val
130 135 140
Ala Ala Ser His Thr Ile Gly Thr Glu Ser Val Pro Glu Arg Trp Arg
145 150 155 160
Gly Leu Met Ser Gly Ala Val Gly Gly Gly Gly Ser Ala Ile Gly Gly
165 170 175
Leu Leu Ala Ser Leu Val Phe Tyr Val Val Ser Leu Met Ala Pro Gly
180 185 190
Glu Ala Phe Ala Glu Trp Gly Trp Arg Leu Met Phe Phe Ser Gly Leu
195 200 205
Leu Thr Ser Val Ile Gly Leu Ile Leu Phe Arg Asn Leu Glu Glu Ser
210 215 220
Pro Ile Phe Lys Glu Leu Gln Ala Arg Lys Ala Ala Leu Arg Ala Gly
225 230 235 240
Ala Pro Ala Glu Ala Ser Pro Ile Arg Ser Leu Phe Ser Pro Ser Asn
245 250 255
Arg Gly Ser Phe Ala Val Ala Thr Leu Ile Ser Phe Gly Gly Gly Ala
260 265 270
Ala Tyr Tyr Leu Thr Ser Gly Tyr Leu Pro Thr Leu Leu Lys Leu Val
275 280 285
Asn Gly Val Pro Asn Ala Thr Ala Ser Met Ile Leu Ile Gly Ala Asn
290 295 300
Val Ala Ala Ala Ile Gly Ala Cys Gly Met Gly Glu Leu Ser Gln His
305 310 315 320
Ile Gly Arg Lys Arg Ser Phe Leu Leu Met Gly Val Ile Arg Leu Leu
325 330 335
Ala Phe Pro Ala Leu Phe Leu Thr Met Ala Asn Thr Thr Ser Leu Val
340 345 350
Gly Val Ala Ala Cys Ala Phe Leu Leu Ala Leu Ile Ala Asn Gly Ser
355 360 365
Tyr Gly Pro Leu Leu Ile Phe Leu Asn Glu Lys Phe Pro Thr Ala Val
370 375 380
Arg Ala Thr Gly Thr Gly Leu Thr Trp Asn Ile Gly Phe Ala Leu Gly
385 390 395 400
Gly Met Leu Pro Thr Leu Val Ser Leu Val Ala Asp Gly Pro Thr Gln
405 410 415
Ile Pro Met Val Leu Ala Val Ile Thr Thr Gly Val Thr Leu Val Tyr
420 425 430
Leu Val Gly Ala Phe Leu Thr Asp Glu Thr Gln Gly Asn Leu Asp Arg
435 440 445
Ala
<210> 34
<211> 443
<212> PRT
<213> Sulfolobus acidocaldarius
<400> 34
Met Lys Lys Glu Glu Lys Phe Thr Ser Asn His Phe Lys Trp Thr Leu
1 5 10 15
Ala Thr Phe Phe Thr Trp Thr Phe Asp Leu Tyr Asp Leu Phe Thr Ile
20 25 30
Leu Leu Val Ala Pro Tyr Ile Ser Ser Leu Phe Phe Pro Ser Ser Ile
35 40 45
Thr Phe Leu Ser Ile Ala Ala Thr Tyr Ala Gly Phe Ala Thr Ser Leu
50 55 60
Ile Met Arg Pro Val Gly Ala Thr Val Phe Gly Ser Arg Val Ser Asp
65 70 75 80
Lys Val Gly Arg Lys Arg Ala Ile Phe Tyr Gly Leu Ile Gly Leu Val
85 90 95
Ile Thr Ser Thr Leu Gln Gly Ala Leu Pro Thr Tyr Gln Val Val Gly
100 105 110
Val Ile Ala Pro Ile Leu Leu Leu Ala Val Arg Leu Ile Gln Gly Val
115 120 125
Phe Ile Gly Gly Ile Thr Ala Gly Ser His Val Ile Gly Pro Glu Ser
130 135 140
Val Pro Glu Arg Tyr Arg Gly Ile Val Gly Gly Leu Gly Phe Ser Ala
145 150 155 160
Ala Gly Val Ala Tyr Leu Ile Ala Ala Gly Trp Phe Phe Leu Thr Thr
165 170 175
Ile Leu Tyr Pro Gly Ser Ser Tyr Leu Val Trp Gly Trp Arg Val Met
180 185 190
Phe Phe Gly Gly Leu Leu Ser Leu Ala Val Leu Gly Phe Val Asn Tyr
195 200 205
Leu Val Pro Glu Ser Glu Val Trp Thr Lys Ile Lys Lys Arg Gly Ser
210 215 220
Val Val Lys Ser Pro Leu Lys Glu Ile Phe Ser Lys Tyr Arg Tyr Gln
225 230 235 240
Leu Gly Val Ala Leu Leu Leu Ser Ile Gly Trp Gly Ala Ser Phe Tyr
245 250 255
Val Thr Asp Gly Ile Leu Pro Thr Phe Leu Ser Ser Val Asn Lys Leu
260 265 270
Ala Lys Thr Glu Ile Ala Ile Val Met Ile Ile Gly Ser Ile Gly Met
275 280 285
Ser Ile Gly Pro Leu Ile Gly Gly Glu Ile Ser Gln Ile Ile Gly Arg
290 295 300
Lys Ile Thr Ser Leu Ile Gly Ala Ile Ile Val Leu Ala Val Val Gly
305 310 315 320
Pro Leu Phe Leu Ser Leu Gly Ser Leu Lys Ser Gly Asp Leu Asn Gln
325 330 335
Ile Ile Leu His Ser Phe Ala Ile Leu Phe Leu Val Asp Ile Gly Gly
340 345 350
Gly Met Leu Met Thr Tyr Leu Asn Glu Ile Tyr Pro Ala Ser Val Arg
355 360 365
Gly Thr Gly Val Gly Phe Thr Trp Asn Thr Gly Phe Ala Ile Gly Gly
370 375 380
Thr Ile Pro Thr Ile Ile Ser Leu Ala Val Ala Ser Ala Gly Leu Ser
385 390 395 400
Ala Phe Pro Ser Ile Met Phe Tyr Thr Leu Ile Val Val Ser Val Ile
405 410 415
Ile Leu Val Gly Thr Val Leu Thr Lys Glu Thr Lys Gly Thr Ile Ser
420 425 430
Lys Glu Glu Tyr Glu Ile Gln Lys Glu Thr Leu
435 440
<210> 35
<211> 1240
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Aneurinibacillus terranovensis
<400> 35
ggtaccgaat tccacatgac aaggggagac cgcatgacca ttagtccggc agttaaagcc 60
atcaactttg aattttcatt taacctgccg accctgatcg aatttggtta tggtaaaatg 120
gaaaaattcg gccagcagct gattagcatt ggtgttaaac gcatttttat ggtgaccgat 180
aaaggtgttg aaagcgcagg tctgctggca gcactgaccg attcactgca ggcagcagca 240
attcagtttg atatctatac cgatgtggaa agcgatccga gcctggaaac cattgatcgt 300
ggtgttgaag tttttcagca gaaaccgtat gattgcattg ttgcagttgg tggtggtagc 360
ccgattgata ccgcaaaagg tattcgtgtt gttgcagcaa atggtggtaa tattggtcat 420
tatgccggtg ttaatcagat tccggttgca ccgaccattc cgctgctggc aattccgacc 480
accagtggca ccggtagcga agttaccaat tttggtgttt atagcgattg gcagaacaac 540
gttaaagtta ccgttaccag ccagtatatg gcaccgacaa ttgcatgggt tgatccggca 600
ctgaccatga gcctgcctgc aaaaatgacc gcagcaagcg gtattgatgc actggcacat 660
ggtattgaaa ccttttttag cctgggtagc agtccggcaa gtgatgccct ggcaattgaa 720
gcaattcata ccgttaatcg ttatctgagc cgtgcagttc ataatggtag cgatatggaa 780
gcacgtattg gtatgagcca tggtagcctg ctggctggca tggcatttaa caatggtttt 840
ctgggtctgg cccatgccat tggtagcgca ctgagcggtc attgtcatgt tccgcatggt 900
gttgcaattg gtctgctgct gccgaaagtt gttgaattta atgcaaccgt tcgtccggat 960
aaagcagcaa aaattgcagg tctgatgggt atgaaaggtg aacatagcga agaactggcc 1020
ctgcaggcat caccggcagt tgcacgtctg gttgaagata ttggcctgcc gacacgtctg 1080
cgtgaagttg atgttaccga aaaaaaactg ttcgagatcg ccaaagatag ctttaaaagc 1140
ggcatgatga aattcaatcc gcgtcagccg agcgaaagcg aagttctgca gctgctgaaa 1200
gaaatctttt gaagaccgaa gcgaattcct cgagtctaga 1240
<210> 36
<211> 1205
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Brevibacillus thermoruber
<400> 36
ggtacctagg aaaggaagat taacccatga gccagaccgt gcagggcacc gacttcgcct 60
tcagcttcca cctgccgacc ctgatcgagt tcggctacgg ccgcgccagc cgcctgggcg 120
agcgcctgca gcacctgggc gtgaccaacg tgttcgtggt gaccgacaag ggcgtggagg 180
ccgccggcct gctgaacggc ctggtgggca gcctgcagag cgccggcatc gccttcgacc 240
tgtacaccga ggtggagccg gacccgggcc tggagaccat cgaccgcggc gccgccgtgt 300
tccgcgccaa gccgtacgac tgcctggtgg ccgtgggcgg cggcagcccg atcgacgccg 360
ccaagggcat gcgcgtggtg accagctgcg gcggcagcat cgccgactac gccggcgtga 420
accgcgtgcc gatggccccg gccgtgccgc tggtggccgt gccgaccacc agcggcaccg 480
gcagcgaggt gaccatgttc ggcgtgtaca gcgactggca caaccacgtg aaggtgaccg 540
tgaccagccc gcacatggcc ccgaccatcg ccctggtgga cccggccctg accgtgagcc 600
tgccggccaa gatgaccgcc gccagcggca tcgacgccct ggcccacggc atcgagacct 660
tcttcagcgt gcgcagccgc ccggccagcg acgccctggc catggaggcc atcgccgccg 720
tgaacgccca cctgcgccgc gccgtgcacg acggcagcga cgtggaggcc cgcatcggca 780
tgagccacgg cagcctgctg gccggcatgg ccttcaccaa cggcttcctg ggcctggccc 840
acgccatcgg cagcgccctg agcggccact gccacgtgcc gcacggcatc gccatcggcc 900
tgctgctgcc gcacgtggtg gccttcaacg ccccggcccg cccggacaag gccgcccagc 960
tggcccgcct gctgggcgtg gaggccaacc cgcgcgagga gcgcggcgag gagaccagcg 1020
ccgccgtggc ccgcatggtg gccgacatcg gcctgccgac ccgcctgcgc gacgtgggcg 1080
tgccggagga gaagctgccg gccatcgcca aggacgcctt caagagcggc atgatgacct 1140
gcaacccgcg ccagccgacc gagcaggagg tgcgcgagct gctgcgccgc gccttctgag 1200
ctagc 1205
<210> 37
<211> 1228
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Brevibacillus panacihumi
<400> 37
ggtaccgaat tccacatgac aaggggagac cgcatgagcg caaatcagag cgttcagggt 60
attgaaagcc cgtttagctt tcatctgccg accaatgttc agtttggtgt tggtagcgca 120
agccgtctgg gtgaaatgct gctgagcatg ggtgttcgtc gtgtttttct ggttaccgat 180
cagggtgtgc gtcaggcagg tctgctggat gaagttattc atagcctgga agaaaaaggc 240
ctgcactttc agatttatgc agatgttgaa ccggatccga gcctggaaac cattcaggca 300
ggcgcagcaa tgtttcagca gcagagcttt gattgtatgg ttgcaattgg tggtggtagt 360
ccgattgata ccgcaaaagg tattcgtgtt ctggcagcaa atggtggcgg tattggtcag 420
tatgccggtg ttaatcgcgt tccggcagca agcgcaattc cgctgattgc aattccgacc 480
accagtggca ccggtagcga agttaccatt tttggtgttt atagcgattg ggagaaccac 540
gtgaaaatta ccgttaccag tccgcatatg gcaccgagca ccgcactgat tgatccggca 600
ctgaccctga gcctgcctgc aaaaatgacc gcagcaaccg gtattgatgc actggcacat 660
ggcattgaaa ccttttttag cctgcgtagc agtccggcaa gtgatgccct ggcaattcat 720
gcaatgaaaa tgattgcacc gcatctgcgt cgtgcagttc gtgatggtgc agatatggaa 780
gcacgtattg gtatgagcca gggtagcgtg ctggcaggta tggcatttaa caatggtttt 840
ctgggtctgg cccatgccat tggtagtgca ctgagcggtc attgtcatgt tccgcatggt 900
gttgcgattg gcctgctgct gccgcatgtg gttgcattta atacaccggt tcgtccggaa 960
aaagcagaac tgattgccga tgttctgggt agcgttcaga aagaaaccgg caccgcagcc 1020
gaactggttg gtcagctggt tcaggatatt ggtctgccgc agcgtctgca agaagttggc 1080
gttccggaag cgaaactggt tgatattgca aaagatagct ttaaaagcgg catgatgaaa 1140
tggaatccgc gtctgccgac agaacaagaa gttctggaac tgctgcagaa agccttttga 1200
agaccgaagc gaattcctcg agtctaga 1228
<210> 38
<211> 1184
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Bacillus sp. FJAT-14578
<400> 38
ggtacctagg aaaggaagat taacccatgt acccgagctt cgagttccac ctgccgacca 60
agatccactt cggctacaac accatcaagc agctggacca cctgccgttc gagatcaagc 120
gcgccttcat cgtgaccgac cagggcgtgc tgaacagcgg cctggtggag aacgtgacca 180
acatcctgaa ggaccaccag atcagctacg tgatctacag cgaggtggag ccggacccga 240
gcgtggagac cgtggacaag gccgcccaga tgttccagcg cgaggaggcc gacgccctga 300
tcgccatcgg cggcggcagc ccgatcgaca ccgccaaggg cgtgcgcgtg atcgccggca 360
acggcggcag catccgcgac tacgccggcg tgaacctgat caagcagaag agcaacatcc 420
cgctgatcgc catcccgacc accagcggca ccggcagcga ggtgaccatc ttcgccgtgt 480
tcagcgactg ggaggagaac cgcaaggtga ccgtgaccag cccgttcctg gccccggaca 540
tcagcatcgt ggacccgaag atgaccatga ccgccccgcc ggccatcacc gccgccagcg 600
gcttcgacgc cttcgcccac ggcgccgaga ccttcgtgag ccgcgccagc cagccggcca 660
gcgacgtgct ggccttcagc gccatgagca ccgtgagcaa gtacctgcgc cgcgccgtgt 720
acaacggcga ggacgtggag gcccgcatca agatggccga ggccagcctg ctggccggca 780
tggccttcaa ccagagctac ctgggcctga cccacgccat cggcagcgcc ctgagcggcc 840
acgcccacgt gagccacggc gtggccatcg gcctgctgct gccgggcgtg atccgctaca 900
acagcatcag ccgcatggac aagcacatcg agatggccgg cgccttccgc gagatcgacc 960
gcagcctgag cgactgggag atcatcgacc agctgatcga ggacgtgagc cgcctgcgcg 1020
acgacatcgg cctgccgcag cgcctgcagc aggtgggcgt gaaggaggac cagctgaaga 1080
tgatcgccgc cgacagcgtg aagagcggca tgtggaagtt caacccgcgc caggccagcg 1140
aggaggagat cctggagctg ctgaaggagc tgtactgagc tagc 1184
<210> 39
<211> 1184
<212> DNA
<213> Artificial
<220>
<223> Synthetic KpnI-NheI fragment for expression of alcohol
dehydrogenase of Bacillus sp. L1(2012)
<400> 39
ggtacctagg aaaggaagat taacccatgt acaccagctt caacttccac ctgccgaccc 60
gcatccagtt cggctacgag aaggtgaagg agctgaagaa cctgccgttc caggccaacc 120
gcgccttcat cgtgaccgac aagggcgtgg agaaggccgg cctgctgaac gacgtgatcg 180
acgccatcaa gcaggccaac atgacctaca agatctaccg cgacgtggag ccggacccga 240
gcgtggagac cgtggacaag gccgccaagg ccttcgccga ggccgagtgc gacctgctga 300
tcgccgtggg cggcggcagc ccgatcgaca ccgccaaggg cgtgcgcgtg gtggccagca 360
acggcggcag catccgcaac tacagcggcg tgaacctggt gaaggaggcc ccgagcgtgc 420
cgctggtggc catcccgacc accgccggca ccggcagcga ggtgaccatc ttcgccgtgt 480
tcagcgacga caaggagaac cgcaaggtga ccgtgaccag cagccacctg agcccggacg 540
tgagcatcat cgacccgaag ctgaccctga ccgccccgcc gagcatcacc gccgccgccg 600
gcttcgacgc cttcgcccac gccgccgagg ccttcgtgag ccgcatcagc cagccgccga 660
gcgacgccct ggccctgagc gccatgaaga ccgtgcacac ctacctgcgc cgcgccgtgt 720
acaacggcga cgacatcgag gcccgcatga agatggccga ggccagcctg ctggccggca 780
tggccttcaa ccagagctac ctgggcctgg cccacgccat cggcagcgcc atcagcgtgc 840
acgcccacgt gagccacggc gtggtgatcg gcctgctgct gccgaaggtg atcgagtaca 900
acctggtggc caagatcgac aagtacgccg aggccggcaa gtacatcgag cagagcagcc 960
acggcctgag caactacgag gccgccgccc tgttcagcga gaccgtgacc cagctgcgca 1020
acgacatcgg cctgccgaag cagctgcgcg aggtgaacgt gaaggaggcc cagctggagg 1080
ccatcagcaa ggacagcatc aagagcggca tgtggcagtt caacccgcgc cgcgccagcg 1140
agcaggacgt gtaccagatg ctgcgcgaga tgctgtgagc tagc 1184
<210> 40
<211> 27
<212> DNA
<213> Artificial
<220>
<223> ribosome binding site containing spacer no. 2
<400> 40
gaattccaca tgacaagggg agaccgc 27

Claims (15)

1.一种将5-羟甲基-2-呋喃羧酸(HMFCA)氧化为5-甲酰-2-糠酸(FFA)的方法,所述方法包括将细胞在存在FDVIFCA、优选在有益于细胞氧化FDVIFCA的条件下孵育的步骤,其中所述细胞包含表达构建体,所述表达构建体用于表达编码具有与SEQ ID NO:1-11所示任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶的核苷酸序列,及其中所述表达构建体可以在所述细胞中表达,并且与在没有所述表达构建体的相应野生型细胞中相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将FDVIFCA氧化为FFA的能力。
2.一种产生FDCA的方法,所述方法包括将细胞在包含FDCA的一或多种呋喃前体的培养基中孵育的步骤,优选在有益于细胞将FDCA的呋喃前体氧化为FDCA的条件下进行,及任选回收FDCA,其中所述细胞包含表达构建体,用于表达编码具有与SEQ ID NO:1-11所示任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶的核苷酸序列,其中所述表达构建体可以在所述细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将HMFCA氧化为FFA的能力,
其中优选FDCA的至少一种呋喃前体选自HMF、2,5-二羟甲基呋喃(DHF)、HMFCA、FFA和2,5-二甲酰呋喃(DFF),其中最优选HMF,及
其中优选FDCA的呋喃前体得自一或多种己糖,优选得自木质纤维素生物质的一或多种己糖,优选通过酸催化的脱水获得。
3.权利要求2的产生FDCA的方法,其中FDCA通过包括酸或盐沉淀、随后冷却结晶和/或溶剂提取的方法从培养基中回收。
4.从一或多个FDCA单体产生聚合物的方法,所述方法包括如下步骤:
a)根据权利要求2或3的方法制备FDCA单体,及
b)从在a)中获得的FDCA单体产生聚合物。
5.细胞用于将一或多种呋喃前体生物转化为FDCA的应用,其中优选FDCA的至少一种呋喃前体选自HMF、DHF、HMFCA、FFA和DFF,最优选HMF,其中所述细胞包含表达构建体,所述表达构建体用于表达编码具有与SEQ ID NO:1-11所示任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶的核苷酸序列,及其中所述表达构建体可以在所述细胞中表达,及与没有所述表达构建体的相应野生型细胞相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将HMFCA氧化为FFA的能力。
6.细胞,其包含表达构建体,用于表达编码具有与SEQ ID NO:1-11所示任一氨基酸序列具有至少45%相同性的氨基酸序列的脱氢酶的核苷酸序列,其中所述表达构建体可在所述细胞中表达,并且与没有所述表达构建体的相应野生型细胞相比,所述脱氢酶的表达赋予所述细胞或增加所述细胞中将HMFCA氧化为FFA的能力,
并且其中所述细胞进一步具有如下至少之一:
a)醛脱氢酶活性,其将呋喃醛氧化为相应的呋喃羧酸,其中优选所述细胞包含第二表达构建体,所述第二表达构建体用于表达编码包含与SEQ ID NO:24、25、26、27、28、29和30所示任一氨基酸序列具有至少45%相同性的氨基酸序列的醛脱氢酶的核苷酸序列,其中所述第二表达构建体可以在细胞中表达,并且与没有所述第二表达构建体的相应野生型细胞相比,所述醛脱氢酶的表达赋予所述细胞或增加所述细胞中如下至少一种能力:i)将5-羟甲基糠醛(HMF)氧化为HMFCA,ii)将DFF氧化为FFA,及iii)将FFA氧化为FDCA;及
b)将呋喃化合物转运进和/或转运出细胞的能力,其中优选所述细胞包含第三表达构建体,所述第三表达构建体用于表达编码具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与SEQ ID NO:17、31、32、33和34所示任一氨基酸序列具有至少45%相同性的氨基酸序列,其中所述第三表达构建体可以在细胞中表达,并且与没有所述第三表达构建体的相应野生型细胞相比,所述多肽的表达赋予所述细胞或增加所述细胞中将至少HMFCA转运进细胞的能力。
7.权利要求6的细胞,其中所述细胞是微生物细胞,优选所述细胞是选自如下菌属的酵母或者丝状真菌细胞:假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)、支顶孢属(Acremonium)、伞菌属(Agaricus)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、毁丝霉属(Myceliophthora)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、隐球菌属(Cryptococcus)、Filibasidium、镰刀菌属(Fusarium)、腐殖霉属(Humicola)、稻瘟菌属(Magnaporthe)、毛霉菌属(Mucor)、毁丝霉属(Myceliophthora)、新丽鞭毛菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、梨囊鞭菌属(Piromyces)、原毛平革菌属(Panerochaete)、侧耳属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)和木霉属(Trichoderma),更优选是选自如下种的酵母或丝状真菌细胞:乳酸克鲁维酵母(Kluyveromyces lactis)、酿酒酵母(S.cerevisiae)、多形汉逊酵母(Hansenulapolymorpha)、解脂耶氏酵母(Yarrowia lipolytica)、巴斯德毕赤酵母(Pichiapastoris)、黑曲霉(Aspergillus niger)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、酱油曲霉(Aspergillus sojae)、烟曲霉(Aspergillusfumigatus)、埃默森踝节菌(Talaromyces emersonii)、米曲霉(Aspergillus oryzae)、嗜热毁丝霉(Myceliophthora thermophila)、里氏木霉(Trichoderma reesei)和产黄青霉菌(Penicillium chrysogenum);或者
优选所述细胞是选自如下菌属的细菌细胞:埃希氏菌属(Escherichia)、鱼腥藻属(Anabaena)、Aeribacillus、解硫胺素杆菌属(Aneurinibacillus)、伯克霍尔德氏菌属(Burkholderia)、慢生根瘤菌属(Bradyrhizobium)、柄杆菌属(Caulobacter)、贪铜菌属(Cupriavidus)、脱硫肠状菌属(Desulfotomaculum)、Desulfurispora、葡糖杆菌属(Gluconobacter)、红杆菌属(Rhodobacter)、Pelotomaculum、假单胞菌属(Pseudomonas)、副球菌属(Paracoccus)、芽孢杆菌属(Bacillus)、地芽孢杆菌属(Geobacillus)、短小芽孢杆菌属(Brevibacillus)、短杆菌属(Brevibacterium)、棒杆菌属(Corynebacterium)、根瘤菌属(Rhizobium)(中华根瘤菌属(Sinorhizobium))、黄杆菌属(Flavobacterium)、克雷伯氏菌属(Klebsiella)、肠杆菌属(Enterobacter)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、甲基杆菌属(Methylobacterium)、罗尔斯通氏菌属(Ralstonia)、红假单胞菌属(RhodoPseudomonas)、葡萄球菌属(Staphylococcus)及链霉菌属(Streptomyces),更优选是选自如下菌种的细菌细胞:A.pallidus、A.terranovensis、枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B.amyloliquefaciens)、凝结芽孢杆菌(B.coagulans)、克里不所类芽孢杆菌(B.kribbensis)、地衣芽孢杆菌(B.licheniformis)、B.puntis、巨大芽孢杆菌(B.megaterium)、耐盐芽孢杆菌(B.halodurans)、短小芽孢杆菌(B.pumilus)、热红短小芽孢杆菌(B.thermoruber)、B.panacihumi、C.basilensis、库氏脱硫肠状菌(D.kuznetsovii)、D.thermophila、嗜热地芽孢杆菌(G.kaustophilus)、氧化葡糖杆菌(Gluconobacter oxydans)、新月柄杆菌(Caulobacter crescentus)CB15、扭托甲基杆菌(Methylobacterium extorquens)、类球红细菌(Rhodobacter sphaeroides)、Pelotomaculum thermopropionicum、Pseudomonas zeaxanthinifaciens、恶臭假单胞菌(Pseudomonas putida)、Paracoccus denitrificans、大肠杆菌(E.coli)、谷氨酸棒杆菌(C.glutamicum)、肉葡萄球菌(Staphylococcus carnosus)、变铅青链霉菌(Streptomyceslividans)、苜蓿中华根瘤菌(Sinorhizobium melioti)和Rhizobium radiobacter。
8.具有HMFCA脱氢酶活性的多肽,其包含与SEQ ID NO:1所示氨基酸序列具有至少81.65%序列相同性的氨基酸序列。
9.包含如下至少之一的核酸分子:
a)编码权利要求8定义的具有HMFCA脱氢酶活性的多肽的核苷酸序列;
b)SEQ ID NO:12或13所示核苷酸序列;
c)(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;
d)序列由于遗传密码简并而与b)或c)所示核苷酸序列的序列不同的核苷酸序列;及
e)是a)-d)定义的核苷酸序列的反向补体的核苷酸序列,
其中,优选所述核酸分子是载体。
10.包含权利要求8定义的多肽及权利要求9定义的核酸分子至少之一的细胞,其中优选所述细胞是培养的细胞。
11.包含表达构建体的细胞,所述表达构建体用于表达编码具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列,所述多肽包含与SEQ ID NO:17所示氨基酸序列具有至少86.5%相同性的氨基酸序列,其中所述表达构建体可以在细胞中表达,并且与没有所述表达构建体的相应野生型细胞相比,所述多肽的表达至少赋予所述细胞或增加所述细胞中将至少HMFCA转运进细胞的能力,并且其中所述细胞进一步包含将HMF转化为FDCA的酶,其中将HMF转化为FDCA的酶优选包括如下至少之一:
a)将HMFCA氧化为FFA的醇脱氢酶活性及将呋喃醛氧化为相应呋喃羧酸的醛脱氢酶活性;及
b)将HMF、2,5-二羟甲基呋喃、HMFCA、FFA和2,5-二甲酰呋喃的一或多种氧化为FDCA的氧化还原酶活性及任选存在的将呋喃醛氧化为相应的呋喃羧酸的醛脱氢酶活性。
12.权利要求11的细胞,其中所述细胞是微生物细胞,优选所述细胞是酵母或丝状真菌细胞,选自如下菌属:假丝酵母属、汉逊酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属、耶氏酵母属、支顶孢属、伞菌属、曲霉属、短梗霉属、毁丝霉属、金孢子菌属、鬼伞属、隐球菌属、Filibasidium、镰刀菌属、腐殖霉属、稻瘟菌属、毛霉菌属、毁丝霉属、新丽鞭毛菌属、脉孢菌属、拟青霉属、青霉菌属、梨囊鞭菌属、原毛平革菌属、侧耳属、裂褶菌属、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属和木霉属,更优选是选自如下种的酵母或丝状真菌细胞:乳酸克鲁维酵母、酿酒酵母、多形汉逊酵母、解脂耶氏酵母、巴斯德毕赤酵母、黑曲霉、泡盛曲霉、臭曲霉、酱油曲霉、烟曲霉、埃默森踝节菌、米曲霉、嗜热毁丝霉、里氏木霉和产黄青霉菌;或者
优选所述细胞是选自如下菌属的细菌细胞:埃希氏菌属、鱼腥藻属、Aeribacillus、解硫胺素杆菌属、伯克霍尔德氏菌属、慢生根瘤菌属、柄杆菌属、贪铜菌属、脱硫肠状菌属、Desulfurispora、葡糖杆菌属、红杆菌属、Pelotomaculum、假单胞菌属、副球菌属、芽孢杆菌属、地芽孢杆菌属、短小芽孢杆菌属、短杆菌属、棒杆菌属、根瘤菌属(中华根瘤菌属)、黄杆菌属、克雷伯氏菌属、肠杆菌属、乳杆菌属、乳球菌属、甲基杆菌属、罗尔斯通氏菌属、红假单胞菌属、葡萄球菌属及链霉菌属,更优选是选自如下菌种的细菌细胞:A.pallidus、A.terranovensis、枯草芽孢杆菌、解淀粉芽孢杆菌、凝结芽孢杆菌、克里不所类芽孢杆菌、地衣芽孢杆菌、B.puntis、巨大芽孢杆菌、耐盐芽孢杆菌、短小芽孢杆菌、热红短小芽孢杆菌、B.panacihumi、C.basilensis、库氏脱硫肠状菌、D.thermophila、嗜热地芽孢杆菌、氧化葡糖杆菌、新月柄杆菌CB 15、扭托甲基杆菌、类球红细菌、Pelotomaculumthermopropionicum、Pseudomonas zeaxanthinifaciens、恶臭假单胞菌、Paracoccusdenitrificans、大肠杆菌、谷氨酸棒杆菌、肉葡萄球菌、变铅青链霉菌、苜蓿中华根瘤菌和Rhizobium radiobacter。
13.具有将至少HMFCA转运进细胞的能力的多肽,所述多肽包含与SEQ ID NO:17所示氨基酸序列具有至少86.5%序列相同性的氨基酸序列。
14.核酸分子,其包含如下至少之一:
a)编码权利要求13所定义的具有将至少HMFCA转运进细胞的能力的多肽的核苷酸序列;
b)SEQ ID NO:18所示核苷酸序列;
c)(a)或(b)定义的核苷酸序列的片段,其长度为10、15、20、30、50或100个核苷酸;
d)序列由于遗传密码简并而与b)或c)所示核苷酸序列的序列不同的核苷酸序列;及
e)是a)-d)定义的核苷酸序列的反向补体的核苷酸序列,
其中,优选所述核酸分子是载体。
15.包含权利要求13定义的多肽及权利要求14定义的核酸分子的至少之一的细胞,其中优选所述细胞是培养的细胞。
CN201680010802.8A 2015-02-17 2016-02-17 脱氢酶催化的fdca的产生 Pending CN107250368A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15155401.1 2015-02-17
EP15155401 2015-02-17
PCT/NL2016/050108 WO2016133384A1 (en) 2015-02-17 2016-02-17 Dehydrogenase-catalysed production of fdca

Publications (1)

Publication Number Publication Date
CN107250368A true CN107250368A (zh) 2017-10-13

Family

ID=52469748

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680010802.8A Pending CN107250368A (zh) 2015-02-17 2016-02-17 脱氢酶催化的fdca的产生

Country Status (13)

Country Link
US (1) US10457965B2 (zh)
EP (1) EP3259349B1 (zh)
JP (2) JP2018504904A (zh)
KR (1) KR20170116051A (zh)
CN (1) CN107250368A (zh)
AU (1) AU2016220612B2 (zh)
BR (1) BR112017017525A2 (zh)
CA (1) CA2975226A1 (zh)
DK (1) DK3259349T3 (zh)
ES (1) ES2817001T3 (zh)
MX (1) MX2017010459A (zh)
TW (1) TWI727941B (zh)
WO (1) WO2016133384A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109234245A (zh) * 2018-09-21 2019-01-18 南京农业大学 一种吲哚乙醛脱氢酶基因ald2及其过表达和应用
CN109536466A (zh) * 2018-11-19 2019-03-29 华南理工大学 醛脱氢酶及其基因、重组菌构建及其在呋喃羧酸合成中的应用
CN109750015A (zh) * 2019-03-27 2019-05-14 云南师范大学 一种热稳性提高的木聚糖酶突变体及其应用
CN110272402A (zh) * 2019-07-15 2019-09-24 南京林业大学 一种化学反应和生物反应耦合生产2,5-呋喃二甲酸的方法
CN110591995A (zh) * 2019-09-12 2019-12-20 华南理工大学 一种共表达重组菌及其在合成呋喃羧酸中的应用
CN110724654A (zh) * 2019-11-22 2020-01-24 南京科技职业学院 一株生产5-羟甲基-2呋喃甲酸的铜绿假单胞菌及其应用
CN110819565A (zh) * 2019-11-20 2020-02-21 青岛农业大学 一株具有抑制植物病原菌作用的耐盐芽孢杆菌bw9及其应用
CN113748211A (zh) * 2019-03-01 2021-12-03 布拉斯科公司 用于4-羟甲基糠醛及其衍生物的体内合成的方法
CN113956537A (zh) * 2020-07-21 2022-01-21 中国科学院宁波材料技术与工程研究所 增塑剂及其制备方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017050815A1 (en) * 2015-09-21 2017-03-30 Purac Biochem B.V. Fungal production of fdca
AU2017207824B2 (en) 2016-01-13 2021-05-20 Stora Enso Oyj Processes for the preparation of 2,5-furandicarboxylic acid and intermediates and derivatives thereof
EP3378931A1 (en) * 2017-03-21 2018-09-26 Purac Biochem B.V. Fdca-decarboxylating monooxygenase-deficient host cells for producing fdca
CN108977472B (zh) * 2017-06-02 2021-06-29 中国科学院大连化学物理研究所 一种串联酶法制备2,5-呋喃二甲酸的方法
US11192872B2 (en) 2017-07-12 2021-12-07 Stora Enso Oyj Purified 2,5-furandicarboxylic acid pathway products
CN110408659B (zh) * 2019-08-20 2023-08-22 华南理工大学 一种可控合成呋喃羧酸的方法
CN116024184B (zh) * 2022-07-26 2024-03-15 南京科技职业学院 醛脱氢酶突变体及其在制备5-羟甲基-2-呋喃甲酸中的应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006092449A2 (en) * 2005-03-02 2006-09-08 Metanomics Gmbh Process for the production of fine chemicals
CN101899145A (zh) * 2010-07-28 2010-12-01 江南大学 一种2,5-呋喃二甲酸基聚酯的制备方法
CN103502441A (zh) * 2011-03-08 2014-01-08 普拉克生物化学有限公司 基因修饰的细胞和使用所述细胞的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN2012DN01652A (zh) * 2009-09-02 2015-06-05 Dsm Ip Assets Bv
WO2017050815A1 (en) * 2015-09-21 2017-03-30 Purac Biochem B.V. Fungal production of fdca

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006092449A2 (en) * 2005-03-02 2006-09-08 Metanomics Gmbh Process for the production of fine chemicals
CN101899145A (zh) * 2010-07-28 2010-12-01 江南大学 一种2,5-呋喃二甲酸基聚酯的制备方法
CN103502441A (zh) * 2011-03-08 2014-01-08 普拉克生物化学有限公司 基因修饰的细胞和使用所述细胞的方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109234245B (zh) * 2018-09-21 2022-04-22 南京农业大学 一种吲哚乙醛脱氢酶基因ald2及其过表达和应用
CN109234245A (zh) * 2018-09-21 2019-01-18 南京农业大学 一种吲哚乙醛脱氢酶基因ald2及其过表达和应用
CN109536466A (zh) * 2018-11-19 2019-03-29 华南理工大学 醛脱氢酶及其基因、重组菌构建及其在呋喃羧酸合成中的应用
CN109536466B (zh) * 2018-11-19 2022-04-22 华南理工大学 醛脱氢酶及其基因、重组菌构建及其在呋喃羧酸合成中的应用
CN113748211A (zh) * 2019-03-01 2021-12-03 布拉斯科公司 用于4-羟甲基糠醛及其衍生物的体内合成的方法
CN109750015A (zh) * 2019-03-27 2019-05-14 云南师范大学 一种热稳性提高的木聚糖酶突变体及其应用
CN109750015B (zh) * 2019-03-27 2023-05-23 云南师范大学 一种热稳性提高的木聚糖酶突变体及其应用
CN110272402A (zh) * 2019-07-15 2019-09-24 南京林业大学 一种化学反应和生物反应耦合生产2,5-呋喃二甲酸的方法
CN110591995A (zh) * 2019-09-12 2019-12-20 华南理工大学 一种共表达重组菌及其在合成呋喃羧酸中的应用
CN110819565A (zh) * 2019-11-20 2020-02-21 青岛农业大学 一株具有抑制植物病原菌作用的耐盐芽孢杆菌bw9及其应用
CN110819565B (zh) * 2019-11-20 2021-04-13 青岛农业大学 一株具有抑制植物病原菌作用的耐盐芽孢杆菌bw9及其应用
CN110724654A (zh) * 2019-11-22 2020-01-24 南京科技职业学院 一株生产5-羟甲基-2呋喃甲酸的铜绿假单胞菌及其应用
CN113956537A (zh) * 2020-07-21 2022-01-21 中国科学院宁波材料技术与工程研究所 增塑剂及其制备方法
CN113956537B (zh) * 2020-07-21 2023-04-18 中国科学院宁波材料技术与工程研究所 增塑剂及其制备方法

Also Published As

Publication number Publication date
EP3259349A1 (en) 2017-12-27
BR112017017525A2 (pt) 2018-04-17
TWI727941B (zh) 2021-05-21
KR20170116051A (ko) 2017-10-18
TW201638336A (zh) 2016-11-01
WO2016133384A1 (en) 2016-08-25
US10457965B2 (en) 2019-10-29
EP3259349B1 (en) 2020-06-17
US20180030488A1 (en) 2018-02-01
DK3259349T3 (da) 2020-08-10
AU2016220612B2 (en) 2021-09-30
AU2016220612A1 (en) 2017-08-17
JP2021101708A (ja) 2021-07-15
MX2017010459A (es) 2018-04-24
ES2817001T3 (es) 2021-04-06
JP2018504904A (ja) 2018-02-22
CA2975226A1 (en) 2016-08-25

Similar Documents

Publication Publication Date Title
CN107250368A (zh) 脱氢酶催化的fdca的产生
CN102834386B (zh) 具有氧化还原酶活性的多肽及其用途
JP2022025108A (ja) Fdcaの真菌による生産
WO2016183163A1 (en) Expression constructs and methods of genetically engineering methylotrophic yeast
CN109576244B (zh) 一种新型脂肪酶及其制备与应用
US20200102584A1 (en) FDCA-decarboxylating monooxygenase-deficient host cells for producing FDCA
WO2019008131A1 (en) PSEUDOMONAS PUTIDA RECOMBINANT FOR THE PRODUCTION OF D-XYLONATE FROM D-XYLOSE
CN104928272A (zh) 融合多肽、编码它的核酸分子以及使用它产生衣康酸的方法
US9670493B2 (en) Low-phosphate repressible promoter

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20171013