CN117083382A - 细菌中非天然单不饱和脂肪酸的产生 - Google Patents

细菌中非天然单不饱和脂肪酸的产生 Download PDF

Info

Publication number
CN117083382A
CN117083382A CN202280025239.7A CN202280025239A CN117083382A CN 117083382 A CN117083382 A CN 117083382A CN 202280025239 A CN202280025239 A CN 202280025239A CN 117083382 A CN117083382 A CN 117083382A
Authority
CN
China
Prior art keywords
recombinant
proteus
heterologous
leu
ala
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280025239.7A
Other languages
English (en)
Inventor
安德烈亚斯·沃尔特·席尔默
艾琳·弗朗西斯·佩里
A·I·拉默斯-索利斯
安杰莉亚·扎巴拉-保蒂斯塔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genomatica Inc
Original Assignee
Genomatica Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genomatica Inc filed Critical Genomatica Inc
Publication of CN117083382A publication Critical patent/CN117083382A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • A23D9/02Other edible oils or fats, e.g. shortenings, cooking oils characterised by the production or working-up
    • AHUMAN NECESSITIES
    • A23FOODS OR FOODSTUFFS; TREATMENT THEREOF, NOT COVERED BY OTHER CLASSES
    • A23DEDIBLE OILS OR FATS, e.g. MARGARINES, SHORTENINGS, COOKING OILS
    • A23D9/00Other edible oils or fats, e.g. shortenings, cooking oils
    • A23D9/02Other edible oils or fats, e.g. shortenings, cooking oils characterised by the production or working-up
    • A23D9/04Working-up
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B1/00Production of fats or fatty oils from raw materials
    • C11B1/10Production of fats or fatty oils from raw materials by extracting
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B1/00Production of fats or fatty oils from raw materials
    • C11B1/10Production of fats or fatty oils from raw materials by extracting
    • C11B1/108Production of fats or fatty oils from raw materials by extracting after-treatment, e.g. of miscellae
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11BPRODUCING, e.g. BY PRESSING RAW MATERIALS OR BY EXTRACTION FROM WASTE MATERIALS, REFINING OR PRESERVING FATS, FATTY SUBSTANCES, e.g. LANOLIN, FATTY OILS OR WAXES; ESSENTIAL OILS; PERFUMES
    • C11B3/00Refining fats or fatty oils
    • C11B3/16Refining fats or fatty oils by mechanical means
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/19Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with oxidation of a pair of donors resulting in the reduction of molecular oxygen to two molecules of water (1.14.19)
    • C12Y114/19002Acyl-[acyl-carrier-protein] desaturase (1.14.19.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y301/00Hydrolases acting on ester bonds (3.1)
    • C12Y301/02Thioester hydrolases (3.1.2)
    • C12Y301/02014Oleoyl-[acyl-carrier-protein] hydrolase (3.1.2.14), i.e. ACP-thioesterase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/01Hydro-lyases (4.2.1)
    • C12Y402/010593-Hydroxyacyl-[acyl-carrier-protein] dehydratase (4.2.1.59)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Food Science & Technology (AREA)
  • Polymers & Plastics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本文提供了包含异源酰基‑ACP去饱和酶和异源酰基‑ACP硫酯酶的重组变形菌门,包括γ‑变形菌纲,其中天然双3‑羟基酰基‑ACP脱水酶/异构酶被缺失。重组变形菌门产生非天然单不饱和游离脂肪酸或其衍生物。除了重组变形菌门产生的细胞培养物和脂肪酸组合物外,还提供了生产非天然单不饱和游离脂肪酸或其衍生物的方法。重组变形菌门可用于生产昆虫信息素或其前体,以及香料或其前体。

Description

细菌中非天然单不饱和脂肪酸的产生
序列表的引用
本申请包含对氨基酸序列和/或核酸序列的引用,这些氨基酸序列和/或核酸序列作为标题为“6281099_1.TXT”的序列表文本文件已经与本文同时提交,文件大小为93千字节(KB),创建于2022年3月14日。根据37 C.F.R.§1.52(e)(5),上述序列表通过援引以其全文特此并入。
技术领域
本披露涉及专用化学品及其合成方法领域。本披露提供了经工程化以产生非天然单不饱和脂肪酸及其衍生物的变形菌门。本披露进一步提供了用于生物生产各种单不饱和游离脂肪酸及其衍生物的生化途径、重组微生物和方法。
背景技术
单不饱和脂肪酸(mUFA)和脂肪酸衍生物作为许多不同产品的基础是有吸引力的。例如,mUFA是良好营养的组分(参见例如,Nettleton J.A(2016)Ann NutrMetab[营养与代谢年鉴].68:249-257);它们作为生产许多有用分子的基础,例如调味剂和香料(参见例如,国际专利申请公开WO 2016/157719)。已经对从天然mUFA衍生物(例如,大环内酯麝香顺式异黄葵内酯)或非天然ω-9mUFA衍生物(例如,大环内酯麝香黄葵内酯)生产麝香香料前体进行了描述。参见WO 2014/201474和WO 2020/047088,两者均通过援引以其全文并入本文。
另外,mUFA也是生物柴油的理想组分,因为mUFA改善了低温下的流动性并有助于生物柴油产品的氧化稳定性(参见例如,Yujin Cao等人(2014)Biotechnol Biofuels[生物燃料的生物技术].;7:59)。
用于营养、生物柴油以及调味剂和/或香料化学品的mUFA的大多数来源依赖于植物或动物来源,因此在数量和质量上都可能受到限制。
近年来,已经成功开发了用于生产脂肪酸和脂肪酸衍生物的技术,参见例如美国专利9,951,322;9,890,401;9,879,239;9,873,865;9,758,769;9,683,247;9,683,219;9,670,512;9,598,706;9,587,231;9,481,899(其中每一个均通过援引以其全文并入本文)。能够将这种技术用于mUFA和脂肪酸衍生物的工业规模生产将是非常有益的。特别地,使用重组变形菌门制备mUFA和脂肪酸衍生物将是非常有益的。
重组变形菌门相对于其他微生物在脂肪酸衍生物的工业生产方面具有许多优势(参见例如,Front Microbiol[微生物学前沿].2014;5:172.)。尽管有这些优势,但在生产mUFA和脂肪酸衍生物时也存在缺点。如本领域所熟知的,大多数变形菌门,如大肠杆菌,在从碳链还原端开始计数的第七个和第八个碳之间(即在ω-7位置处)将双键掺入mUFA中。因此,在例如ω-3、ω-5、ω-6、ω-8、ω-9、ω-11、ω-12等位置具有双键的单不饱和脂肪酸的产生对于大多数变形菌门来说是非天然的。
大多数变形菌门通过典型的“氧非依赖性”(厌氧)mUFA生物合成途径在mUFA的ω-7位置掺入双键(参见例如,Magnuson等人(1993)Appl.Microbial Rev.[应用微生物学综述]57(3):522-542)。大肠杆菌具有两种3-羟基酰基-ACP脱水酶,即FabZ和FabA。mUFA合成的关键酶是FabA,其是一种双功能脱水酶/异构酶。FabA将反式-2-癸烯酰基-ACP异构化为顺式-3-癸烯酰基-ACP。后者不能被反式-2-烯酰基-ACP还原酶(FabI)还原,但可以被β-酮脂酰-ACP合酶I(FabB)延长,从而将双键位置固定在ω-7位置(参见例如图1)。FabA对于反式-2-癸烯酰基-ACP的异构化非常特异,导致在这些变形菌门中主要产生ω-7mUFA。
因此,关于各种mUFA的合成,希望生产在除ω-7位置以外的位置具有双键的mUFA并且希望利用细菌平台的优势和力量的制造商面临着一个难题。可以在工业规模上生产mUFA的变形菌门通常产生在脂肪酸的ω-7位置具有双键的mUFA。因此,野生型变形菌门在它们可以产生的mUFA的广度上受到限制。
因此,需要新的方法来生产mUFA分子,其允许生产全谱的mUFA分子,包括但不限于在非天然位置具有双键的mUFA,例如ω-3、ω-5、ω-6、ω-8、ω-9、ω-11、ω-12等。
发明内容
本文披露了包含酰基-ACP去饱和酶和酰基-ACP硫酯酶的重组变形菌门,其中一种或两种可以是异源的,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱,并且其中重组变形菌门产生非天然mUFA或其衍生物。在各种实施方案中,重组变形菌门进一步包含一种或多种另外的酶,例如铁氧还蛋白、铁氧还蛋白还原酶和/或黄素氧还蛋白还原酶、3-羟基酰基-ACP-脱水酶(FabZ)、羧酸还原酶、醇脱氢酶、磷酸泛酰巯基乙胺基转移酶、醇乙酰-CoA转移酶、ω-羟化酶、醇氧化酶/脱氢酶、脂肪酸代谢调节蛋白(fadR)、醛氢化酶和β-酮脂酰-ACP合酶,其中一种或多种另外的酶是异源的。在一些包含酰基-ACP去饱和酶和酰基-ACP硫酯酶的重组变形菌门中,重组变形菌门进一步包含异源双3-羟基酰基-ACP脱水酶/异构酶(FabA)。
重组变形菌门可以是γ-变形菌纲,例如大肠杆菌(Escherichia coli)。重组变形菌门可产生一种或多种非天然mUFA,包括但不限于在ω-3、ω-5、ω-6、ω-9、ω-11、ω-12或其他位置具有双键的mUFA。
本文还披露了用于生产非天然mUFA或其衍生物的方法,所述方法包括培养包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶的重组变形菌门,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
本文还披露了编码异源酰基-ACP去饱和酶和/或异源酰基-ACP硫酯酶中的一种或两种的核苷酸序列,其可操作地连接到一种或多种异源调节元件。核苷酸序列可以在载体中。
本文还披露了昆虫信息素和昆虫信息素前体以及用于制备昆虫信息素或昆虫信息素前体的方法,这些昆虫信息素和昆虫信息素前体包含由所披露的包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶的重组变形菌门产生的非天然mUFA或其衍生物,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
本文还披露了香料和香料前体以及用于制备香料或香料前体的方法,这些香料和香料前体包含由所披露的包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶的重组变形菌门产生的非天然mUFA或其衍生物,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
本文还披露了包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶的重组变形菌门的用,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱用于产生昆虫信息素、昆虫信息素前体、香料和/或香料前体。
本文还披露了组合物,这些组合物包含的ω-5不饱和脂肪酸衍生物多于ω-7不饱和脂肪酸衍生物。组合物可以由本文披露的重组变形菌门产生。例如,组合物包含的ω-5不饱和脂肪醇可以比ω-7不饱和脂肪醇更多,例如约90%的ω-5不饱和脂肪醇和约10%的ω-7不饱和脂肪醇(例如约80%的z11-十六碳烯醇和约10%的z13-十八碳烯醇和约10%的z9-十六碳烯醇)。
附图说明
图1描述了将酰基-ACP转化为信息素或信息素前体的细菌生物合成途径。
图2描述了将酰基-ACP转化为香料或香料前体的细菌生物合成途径。
图3A描述了通过二甲基二硫醚(DMDS)衍生化后ω-5Δ9-十四碳烯酸的碎裂。
图3B描述了DMDS衍生化后ω-5Δ9-十四碳烯酸的质谱和离子碎裂模式。
图4A描述了通过DMDS衍生化后ω-5Δ11-十六碳烯酸的碎裂。
图4B描述了DMDS衍生化后ω-5Δ11-十六碳烯酸的质谱和离子碎裂模式。
图5A描述了DMDS衍生化后ω-5(z11)16-羟基-十六碳烯酸的碎裂。
图5B描述了DMDS衍生化后ω-5z11-16-羟基-十六碳烯酸的质谱和离子碎裂模式。
具体实施方式
I.定义
以下定义是指上文和整个披露中使用的各种术语。
如本文所用,在描述要素的上下文中单数冠词如“一个/种(a)”和“一个/种(an)”和“该”以及的类似指代物应被解释为涵盖单数和复数,除非本文另有说明或与上下文明显矛盾。
如本文所用,“约”被本领域普通技术人员所理解,并且在某种程度上可以取决于其使用的上下文而变化。如果使用本领域普通技术人员不清楚的术语,则在使用该术语“约”的上下文中,“约”将意指该特定术语的至多加或减10%。
如本领域技术人员将理解的,出于任何和所有目的,本文披露的所有范围还涵盖任何和所有可能的子范围及其子范围的组合。此外,如本领域技术人员将理解的,范围包括每个单独的成员。因此,例如,具有1-3个原子的基团是指具有1、2或3个原子的基团。类似地,具有1-5个原子的基团是指具有1、2、3、4或5个原子的基团,依此类推。
除非另有定义,否则本文中使用的技术和科学术语具有如本领域普通技术人员通常理解的相同含义。特别地,本披露利用了重组遗传学、有机化学、发酵和生物化学领域中的常规技术。
如本文所用,术语“脂肪酸”是指具有式RCOOH的脂肪族羧酸,其中R是具有至少4个碳原子,典型地约4至约28个碳原子的脂肪族基团。脂肪族R基团可以是饱和的或不饱和的、支化的或非支化的。支链脂肪族R基团可包括包含低级烷基支链(例如C1-C4烷基,优选地在ω-1或ω-2位置)的支链。在一些实施方案中,支化脂肪族R基团在ω-1或ω-2位置可以为甲基。不饱和脂肪酸可以是单不饱和的或多不饱和的。
如本文所用,一种或多种脂肪酸可以通过脂肪酸生物合成过程,通过脂肪酸降解或β-氧化的逆转在细胞内产生,或者它们可以被供给细胞。如本领域所熟知的,脂肪酸生物合成通常是丙二酰-CoA依赖性的酰基-ACP或酰基CoA合成,而β-氧化结果的逆转是乙酰-CoA依赖性的并导致酰基-CoA的合成。供给细胞的脂肪酸被转化为酰基-CoA,并且可以被转化为酰基-ACP。脂肪酸可以通过天然脂肪酸生物合成途径在细胞中合成,或可以从异源脂肪酸生物合成途径合成,这些途径包括导致酰基-CoA和/或酰基-ACP的合成的脂肪酸生物合成和/或降解酶的组合。
如本文所用,术语“脂肪酸衍生物”是指衍生自脂肪酸的产物。因此,脂肪酸衍生物是包括具有修饰的如上定义的脂肪酸的化合物。通常,脂肪酸衍生物包括丙二酰-CoA衍生的化合物,包括酰基-ACP或酰基-ACP衍生物。因此,脂肪酸衍生物包括烷基硫酯和酰基硫酯。此外,脂肪酸衍生物包括衍生自包括脂肪酸衍生物酶的代谢途径的分子/化合物。示例性脂肪酸衍生物包括脂肪酸、脂肪酸酯(例如蜡)、脂肪酸甲酯(FAME)、脂肪酸乙酯(FAEE)、脂肪醇乙酸酯(FACE)、脂肪胺、脂肪醛、脂肪醇、烃(例如烷烃、烯烃等)、酮、末端烯烃、内烯烃、3-羟基脂肪酸衍生物、双官能脂肪酸衍生物(例如,ω-羟基脂肪酸、(ω-1)-羟基脂肪酸、(ω-2)-羟基脂肪酸、(ω-3)-羟基脂肪酸、10-羟基脂肪酸、1,3脂肪二醇、α,ω-二醇、α,ω-3-羟基三醇、ω-羟基FAME、ω-OH FAEE等)和不饱和脂肪酸衍生物,包括上述各脂肪酸衍生物的不饱和化合物。
如本文所用,表述“脂肪酸组合物”是指mUFA或其衍生物的组合物,例如由本文所述的重组变形菌门(例如包含酰基-ACP去饱和酶和酰基-ACP硫酯酶的重组变形菌门)产生的脂肪酸组合物,其中天然双3-羟基酰基-ACP脱水酶/异构酶被缺失。脂肪酸衍生物组合物可包含单一脂肪酸衍生物种类或可包含脂肪酸衍生物种类的混合物。在一些示例性实施方案中,脂肪酸衍生物的混合物包括多于一种类型的脂肪酸衍生物产物(例如,脂肪酸、脂肪酸酯、脂肪醇、脂肪醇乙酸酯、脂肪醛、脂肪胺、双官能脂肪酸衍生物和非天然单不饱和脂肪酸衍生物等)。在其他示例性实施方案中,脂肪酸衍生物的混合物包括具有不同链长、饱和度和/或支化特征的非天然单不饱和脂肪酸酯(或另一种脂肪酸衍生物)的混合物。在其他示例性实施方案中,脂肪酸衍生物的混合物主要包含一种类型的脂肪酸衍生物,例如ω-3-单不饱和脂肪酸或脂肪酸衍生物组合物、ω-5-单不饱和脂肪酸或脂肪酸衍生物组合物、ω-11-单不饱和脂肪酸或脂肪酸衍生物组合物等。在又其他示例性实施方案中,脂肪酸衍生物组合物包含多于一种类型的脂肪酸衍生物产物的混合物,例如,具有不同链长、饱和度和/或支化特征的脂肪酸衍生物。在又其他示例性实施方案中,“脂肪酸衍生物组合物”包含脂肪酯和3-羟基酯的混合物。在又其他示例性实施方案中,脂肪酸衍生物组合物包含脂肪醇和脂肪醛的混合物,例如非天然单不饱和脂肪醇或脂肪醛的混合物。在其他示例性实施方案中,脂肪酸衍生物的混合物包括具有不同链长、饱和度和/或官能团特征的非天然单不饱和脂肪酸衍生物的混合物。
如本文所用,术语“减弱”是指蛋白质或酶(例如双3-羟基酰基-ACP脱水酶/异构酶(FabA))的表达,其与野生型变形菌门中蛋白质或酶的野生型或传统表达水平相比降低。减弱程度没有特别限制,并且涵盖表达降低,例如,至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约35%、至少约40%、至少约45%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%和至少约95%。当蛋白质或酶的表达被完全消除时,蛋白质或酶被认为是“缺失”而不是“减弱”。
如本文所用,术语“非天然单不饱和脂肪酸衍生物”是指衍生自mUFA酰基硫酯的任何mUFA衍生物,其中双键位置对生产细胞(例如变形菌门)是非天然的。例如,在大肠杆菌中,单不饱和脂肪酸酰基硫酯中的天然双键位置是ω-7。因此,例如在大肠杆菌中,衍生自mUFA酰基硫酯的mUFA衍生物在除ω-7以外的位置具有双键,被定义为该细菌的非天然mUFA衍生物。非天然mUFA及其衍生物的实例在ω-3、ω-5、ω-6、ω-8、ω-9、ω-11和/或ω-12处具有双键。
脂肪酸组合物可包含非天然mUFA或其衍生物。包含由本文披露的重组变形菌门产生的非天然mUFA或其衍生物的组合物典型地包含其中非天然mUFA或其衍生物占所产生的总mUFA(包括天然和非天然的mUFA)的至少约10%的组合物。在一些实施方案中,包含由本文披露的重组变形菌门产生的非天然mUFA或其衍生物的组合物包含其中非天然mUFA或其衍生物占总mUFA或其衍生物的至少约20%的组合物。在其他实施方案中,包含由本文披露的重组变形菌门产生的非天然mUFA或其衍生物的组合物包含其中非天然mUFA或其衍生物占总mUFA或其衍生物的至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%的组合物。
本说明书全文中的序列登录号是从以下获得的:美国国立卫生研究院维护的NCBI(国家生物技术信息中心)提供的数据库(在本文中称为“NCBI登录号”或替代地“GenBank登录号”或替代地简称为“登录号”),以及瑞士生物信息学研究所提供的UniProt知识库(UniProtKB)和Swiss-Prot数据库(在本文中称为“UniProtKB登录号”)。
术语“酶分类(EC)编号”是指表示特定多肽序列或酶的编号。EC编号根据酶催化的反应对酶进行分类。EC编号由国际生物化学和分子生物学联合会(IUBMB)命名委员会确定,其说明可在万维网上的IUBMB酶命名网站上找到。
如本文所用,就产物(例如本文所披露的mUFA衍生物)而言,术语“分离的”是指从细胞组分、细胞培养基或化学或合成前体中分离的产物。通过本文披露的方法产生的本文披露的mUFA衍生物可以在发酵液中以及在细胞质中相对不混溶。因此,在示例性实施方案中,本文披露的非天然mUFA衍生物在细胞外聚集在有机相中,并因此被“分离”。
如本文所用,术语“多肽”和“蛋白质”可互换使用,是指长度典型地为12个或更多个氨基酸的氨基酸残基的聚合物。长度小于12个氨基酸的多肽在本文中称为“肽”。这些术语适用于其中的一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,并且适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。术语“重组多肽”是指通过重组技术产生的多肽,其中通常将编码表达的蛋白质的DNA或RNA插入合适的表达载体中,该表达载体又用于转化宿主细胞以产生多肽。在一些示例性实施方案中,将编码表达的肽、多肽或蛋白质的DNA或RNA通过同源重组或本领域所熟知的其他手段插入宿主染色体,并因此用于转化宿主细胞以产生肽或多肽。类似地,术语“重组多核苷酸”或“重组核酸”或“重组DNA”通过本领域技术人员已知的重组技术产生(参见例如,Sambrook等人描述的方法(Sambrook等人,Molecular Cloning--A Laboratory Manual[分子克隆实验室手册],Cold Spring Harbor Press[冷泉港出版社]第4版(冷泉港,纽约州2012)和/或Current Protocols in Molecular Biology[当前分子生物学方案](第1-3卷,JohnWiley&Sons,Inc.[约翰·威利父子公司](1994-1998)和增刊1-115(1987-2016).)。
当提及两个核苷酸或多肽序列时,两个序列之间的“序列同一性百分比”是通过在比较窗口上比较两个最佳比对序列来确定的,其中比较窗口中多核苷酸序列的部分与参考序列(其不包含添加或缺失)相比可以包含添加或缺失(即,缺口),以实现两个序列的最佳比对。通过以下方式计算“序列同一性百分比”:确定在两个序列中存在相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗口中的位置的总数目,然后将这些结果乘以100以产生序列同一性的百分比。
因此,在两个或多个核酸序列或肽或多肽的上下文中,表述“同一性百分比”,或等同地“序列同一性百分比”、“同源性”,或“同源”是指两个或多个序列或子序列相同或具有指定百分比的相同核苷酸或氨基酸(例如,当在比较窗口或指定区域上进行比较和比对以获得最大对应时,在指定区域上约50%同一性,优选地55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性),例如,使用具有默认参数的BLAST或BLAST 2.0序列比较算法(参见例如,Altschul等人(1990)J.Mol.Biol.[分子生物学杂志].215(3):403-410)和/或NCBI网站ncbi.nlm.nih.gov/BLAST/)或通过手动比对和目视检查进行测量的。也可以使用例如已集成到GCG软件包中的GAP程序中的Needleman和Wunsch算法,使用Blossum 62矩阵或PAM250矩阵,以及16、14、12、10、8、6或4的空位权重,1、2、3、4、5或6的长度权重,来确定两个核酸或氨基酸序列之间的序列同一性百分比(Needleman和Wunsch(1970)J.Mol.Biol.[分子生物学杂志]48:444-453)。也可以使用GCG软件包中的GAP程序,使用NWSgapdna.CMP矩阵,以及40、50、60、70或80的空位权重和1、2、3、4、5或6的长度权重来确定两个核苷酸序列之间的序列同一性百分比。本领域普通技术人员可以进行初始序列同一性计算并相应地调整算法参数。如果从业者不确定应使用哪些参数确定分子是否在权利要求的序列同一性限制之内,则可以使用一组参数,其是空位罚分为12、空位延伸罚分为4、移码空位罚分为5的Blossum 62评分矩阵。序列比对的另外方法在生物技术领域是已知的(参见例如,Rosenberg(2005)BMC Bioinformatics[BMC生物信息学]6:278;Altschul等人(2005)FEBS J[FEBS杂志].272(20):5101-5109)。
当如上所述对两个或多个核酸或氨基酸序列进行比对和分析并且发现它们在指定区域内具有约50%的同一性,优选地为55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性时,所述两个或多个核酸或氨基酸序列被称为“基本相同”。如果两个序列的核苷酸或氨基酸残基的序列在如上所述进行最大对应比对时分别相同,则两个核酸序列或多肽序列被称为“相同”。该定义也指或可以用于对测试序列的补充。典型地在长度至少约25个氨基酸或核苷酸的区域上,或更优选在长度为50-100个氨基酸或核苷酸的区域上,或在给定序列的整个长度上,计算同一性。
如本文所用,术语“内源”是指从细胞内产生的物质,例如核酸、蛋白质等。因此,内源多核苷酸或多肽是指由细胞产生的多核苷酸或多肽。在一些示例性实施方案中,内源多肽或多核苷酸由亲本细胞(或宿主细胞)的基因组编码。在其他示例性实施方案中,内源多肽或多核苷酸由亲本细胞(或宿主细胞)携带的自主复制质粒编码。在一些示例性实施方案中,内源基因是当细胞最初从自然界分离时存在于细胞中的基因,即该基因对于细胞是天然的。在其他示例性实施方案中,“内源”基因已经通过重组技术例如通过改变控制序列和/或编码序列的关系而被改变。因此,在一些示例性实施方案中,“异源”基因对于宿主细胞可以是“内源”的。另外,变体(即突变体)多肽可以由此产生并且被认为是内源多肽。
相反,“外源”多核苷酸或多肽或其他物质(例如脂肪酸衍生物、小分子化合物等)是指不是由细胞编码或产生的并因此从细胞外添加到细胞、细胞培养物或测定中的多核苷酸或多肽或其他物质。添加到细胞、细胞培养物或测定中的变体(即突变体)多肽是外源多肽的一个实例。
如本文所用,术语“天然”是指从自然界中分离的核酸、蛋白质、多肽或其片段的形式,或处于其自然状态的核酸、蛋白质、多肽或其片段的形式,不在结构序列中有意引入突变和/或在表达中没有任何工程化改变,例如将发育调节基因改变为组成型表达基因。如本文所用,“天然”也指“野生型(wildtype)”或“野生型(wild-type)”,其中核酸、蛋白质、多肽或其片段以如典型地在天然发现的生物体中发现的序列、数量和相对量存在。野生型生物体可作为测定细胞功能(例如产生的一种或多种mUFA的身份和/或数量或异源调节元件(例如FadR)与同源DNA序列的相对结合)的对照和/或参考。
术语“非天然”在本文中用于指核酸序列、氨基酸序列、脂肪酸及其衍生物,和/或非天然存在于宿主中的小分子。异源基因被认为是“非天然的”。已从宿主细胞中去除、经实验室操作并引入或重新引入宿主细胞的核酸序列或氨基酸序列被认为是“非天然的”。引入宿主细胞的合成或部分合成基因是“非天然的”。非天然基因进一步包括对于宿主微生物而言内源和/或天然但可操作地连接到一个或多个已重组到宿主基因组中的异源调节序列的基因。在异源调节序列控制下的天然存在的基因被认为是“非天然的”。
如本文所用,术语“基因”是指编码RNA产物或蛋白产物的核酸序列例如,DNA序列,以及影响RNA或蛋白产物表达的可操作地连接的核酸序列(例如,表达控制序列,例如,启动子、增强子、核糖体结合位点、翻译控制序列等)。术语“基因产物”是指从特定基因表达的RNA(例如tRNA、mRNA)和/或蛋白质。
如本文所用,关于基因的术语“表达”或“表达的”是指基因的一种或多种转录产物和/或翻译产物的产生。在示例性实施方案中,基于细胞内存在的相应mRNA的量或由细胞产生的DNA编码的蛋白质的量来确定细胞中DNA分子的表达水平。术语“表达的基因”是指转录成信使RNA(mRNA)然后翻译成蛋白质的基因,以及转录成其他类型的RNA的基因,例如转移RNA(tRNA)、核糖体RNA(rRNA)和调节RNA,它们不被翻译成蛋白质。
核酸分子在细胞或无细胞系统中的表达水平受“表达控制序列”或等同地“调节序列”或“调节元件”的影响。表达控制序列、调节序列或调节元件是本领域已知的,并且包括,例如,启动子、增强子、聚腺苷酸化信号、转录终止子、影响RNA稳定性的核苷酸序列、内部核糖体进入位点(IRES)等,它们提供多核苷酸序列在宿主细胞中的表达。在示例性实施方案中,“表达控制序列”与参与转录的细胞蛋白特异性相互作用(参见例如,Maniatis等人,Science[科学],236:1237-1245(1987);Goeddel,Gene Expression Technology:Methodsin Enzymology[基因表达技术:酶学方法],第185卷,Academic Press[学术出版社],加利福尼亚州圣地亚哥(1990))。在示例性方法中,表达控制序列、调节序列或调节元件可操作地连接到多核苷酸序列。“可操作地连接”意指多核苷酸序列和一个或多个表达控制序列或一个或多个调节元件功能性连接,以便当适当的分子(例如,转录激活蛋白)接触该一个或多个表达控制序列时允许该多核苷酸序列的表达。在示例性实施方案中,就转录和翻译的方向而言,可操作地连接的启动子位于所选多核苷酸序列的上游。在一些示例性实施方案中,可操作地连接的增强子可以位于所选多核苷酸的上游、内部或下游。
如本文所用,短语“所述核苷酸序列的表达相对于野生型核苷酸序列被修饰”是指与对照核苷酸序列例如野生型对照相比,例如天然核苷酸序列表达水平增加或减少的变化或例如编码异源或非天然多肽的核苷酸序列表达水平增加或减少的变化。在一些示例性实施方案中,短语“所述核苷酸序列的表达相对于野生型核苷酸序列被修饰”是指与对照表达模式相比,核苷酸序列表达模式的变化,例如与发育定时表达(developmentally timedexpression)相比的组成型表达。
“对照”样品(例如,对照核苷酸序列、对照多肽序列、对照细胞等,或值)是指用作参考的样品,通常是已知参考,用于与测试样品进行比较。例如,在一个示例性实施方案中,测试样品包含由重组变形菌门制备的非天然单不饱和脂肪酸衍生物组合物,该重组变形菌门包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FadA)被缺失,如本文所披露的,而对照样品包含由相应或指定的细菌制备的非天然单不饱和脂肪酸衍生物组合物,该相应或指定的细菌不包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶,并且其天然双3-羟基酰基-ACP脱水酶/异构酶(FadA)不缺失。另外,对照细胞或微生物可以被称为相应的野生型或宿主细胞。本领域技术人员将认识到,可以设计对照来评估任意数量的参数。此外,本领域技术人员将理解哪些对照在给定情况下是有价值的,并且将能够基于与对照值的比较来分析数据。
如本文所用,术语“过表达”或“上调”是指其表达与对照表达水平相比升高的基因。在示例性实施方案中,基因的过表达是由与该基因的天然转录速率相比提高的转录速率引起的。在其他示例性实施方案中,过表达是由与该基因的天然翻译速率相比该基因翻译速率提高引起的。测试过表达的方法是本领域所熟知的,例如转录的RNA水平可以使用rtPCR进行评估,蛋白质水平可以使用SDS page凝胶分析进行评估。
在其他实施方案中,具有改变的表达水平的多肽、多核苷酸或烃被“减弱”或具有“降低的表达水平”或被“下调”。如本文所用,这些术语意指在细胞中以比在相同条件下在相应对照细胞(例如野生型细胞)中正常表达的浓度更低的浓度表达多核苷酸、多肽或烃或使其被表达。换句话说,术语“减弱”意指弱化、降低或减小。例如,可以通过修饰多肽以降低其活性(例如,通过修饰编码多肽的核苷酸序列)来减弱多肽。
多核苷酸或多肽可以使用本领域已知的任何方法进行减弱。例如,在一些示例性实施方案中,基因或由该基因编码的多肽的表达通过突变控制基因表达的调控多核苷酸序列来减弱。在其他示例性实施方案中,基因或由该基因编码的多肽的表达通过过表达阻遏蛋白或通过提供激活阻遏蛋白的外源调节元件来减弱。在又其他示例性实施方案中,使用基于DNA或RNA的基因沉默方法来减弱基因或多核苷酸的表达。在一些实施方案中,基因或多肽的表达被完全减弱,例如,通过缺失基因的多核苷酸序列的全部或部分。
过表达或减弱的程度可以是1.5倍或更多,例如2倍或更多、3倍或更多、5倍或更多、10倍或更多或15倍或更多。替代地,或者另外,过表达或减弱的程度可以是500倍或更少,例如100倍或更少、50倍或更少、25倍或更少或20倍或更少。因此,过表达或减弱的程度可以由上述端点中的任何两个来界定。例如,过表达或减弱的程度可以是1.5-500倍、2-50倍、10-25倍或15-20倍。
如本文所用,重组宿主细胞中蛋白质/多肽的“经修饰的活性”或“改变的活性水平”是指与合适的对照蛋白(例如相应的亲本蛋白或相应的野生型蛋白)的特征相比,该蛋白质/多肽的活性中的一个或多个特征的差异。因此,在示例性实施方案中,具有“经修饰的活性”的蛋白质与相应的对照蛋白相比的活性差异通过以下来确定:测量重组宿主细胞中经修饰的蛋白的活性,并将其与在其他方面等基因的宿主细胞中的相应对照蛋白的相同活性的测量值进行比较。经修饰的活性可以是以下的结果:例如,蛋白质结构变化(例如,一级结构的变化,例如,蛋白质核苷酸编码序列的变化,这导致底物特异性的变化、观察到的动力学参数的变化、溶解度的变化等);蛋白质稳定性的变化(例如,蛋白质降解的增加或减少)等。
如本文所用,术语“异源”是指处于非天然状态的多肽或多核苷酸。因此,当多核苷酸和/或多肽与细胞在自然界中未发现彼此间的相同关系时,多核苷酸或多肽对细胞而言是“异源的”。因此,如果多核苷酸或多肽序列源自不同的生物体、不同的细胞类型或不同的物种,或者如果来自同一物种,它从其原始形式被修饰,则其对生物体或第二序列而言是“异源的”。因此,在一个示例性实施方案中,当多核苷酸或多肽不天然存在于给定生物体中时,它是“异源的”。例如,可以通过重组方法将对于蓝细菌天然的多核苷酸序列引入大肠杆菌的宿主细胞中,则来自蓝细菌的多核苷酸对大肠杆菌细胞(即现在重组的大肠杆菌细胞)而言是异源的。
类似地,当多核苷酸或多肽从其天然形式或从其与其他多核苷酸序列的关系修饰或以非天然状态存在于重组宿主细胞中时,它是异源的。因此,在一个示例性实施方案中,异源多核苷酸或多肽包含在自然界中未发现彼此间的相同关系的两个或多个子序列。例如,启动子可操作地连接到衍生自与衍生出启动子的物种不同的物种的核苷酸编码序列。替代地,在另一个实施例中,如果启动子可操作地连接到衍生自与衍生出该启动子的物种相同的物种的核苷酸编码序列,则如果该编码序列不与该启动子天然相关联(例如,可操作地连接到衍生自与启动子的物种相同的物种的发育调节编码序列的组成型启动子),可操作连接的启动子和编码序列是“异源的”。在其他示例性实施方案中,异源多核苷酸或多肽相对于天然存在于相应野生型宿主细胞中的野生型序列进行修饰,例如,有意修饰,例如,多核苷酸或多肽序列中的有意突变或多核苷酸或多肽表达水平的修饰。典型地,异源核酸或多核苷酸是重组产生的。
如本文所用,术语“重组”是指经遗传修饰的多核苷酸、多肽、细胞、组织或生物体。当关于细胞使用时,术语“重组”表示细胞已通过引入异源核酸或蛋白质而被修饰,或已通过改变天然核酸或蛋白质而被修饰,或该细胞是从如此修饰的细胞中衍生的并且衍生的细胞包含修饰。因此,例如,“重组细胞”或等同地“重组宿主细胞”可以被修饰以表达在细胞的天然(非重组)形式中找不到的基因,或者可以被修饰以异常表达天然基因,例如天然基因可以过表达、表达不足或根本不表达。在示例性实施方案中,“重组细胞”或“重组宿主细胞”被工程化以表达能够产生双官能脂肪酸衍生物分子的异源酶途径。重组细胞可以衍生自微生物,例如细菌、变形菌门、古细菌、病毒或真菌。此外,重组细胞可以衍生自植物或动物细胞。在示例性实施方案中,“重组宿主细胞”或“重组细胞”用于产生一种或多种非天然单不饱和脂肪酸衍生物,包括但不限于非天然单不饱和脂肪酸、非天然单不饱和脂肪酯(例如蜡)、脂肪酸酯、脂肪酯、脂肪酸甲酯(FAME)、脂肪酸乙酯(FAEE)、非天然单不饱和脂肪酰基乙酸酯(FACE)、非天然单不饱和脂肪醇(如多元醇)、非天然单不饱和脂肪醛、非天然单不饱和脂肪胺、非天然单不饱和末端烯烃、非天然单不饱和酮等。因此,在一些示例性实施方案中,“重组宿主细胞”是“生产宿主”或等同地“生产宿主细胞”。在一些示例性实施方案中,重组细胞包括一个或多个多核苷酸,每个多核苷酸编码具有脂肪酸生物合成酶活性的多肽,其中重组细胞在有效表达多核苷酸的条件下在(简单)碳源存在下培养时产生非天然单不饱和脂肪酸衍生物组合物。
当关于多核苷酸使用时,术语“重组”表示多核苷酸已经通过与该多核苷酸的天然形式或天然存在形式进行比较而被修饰,或者已经通过与该核苷酸的天然存在的变体进行比较而被修饰。在一个示例性实施方案中,重组多核苷酸(或重组多核苷酸的拷贝或互补序列)是已经被人为操纵以不同于其天然存在形式的重组多核苷酸。因此,在一个示例性实施方案中,重组多核苷酸是天然基因的突变形式或天然基因的天然存在变体的突变形式,其中该突变是通过有意的人类操作进行的,例如,通过使用诱变寡核苷酸的饱和诱变进行,通过使用UV辐射、诱变化学品、化学合成等进行。相对于基因的天然形式或天然存在的变体形式,这样的重组多核苷酸可以包含一个或多个点突变、缺失和/或插入。类似地,包含与第二多核苷酸(例如,编码序列)可操作地连接的启动子的多核苷酸是“重组”多核苷酸。因此,重组多核苷酸包括自然界中未发现的多核苷酸组合。重组蛋白(上文讨论的)典型地是由重组多核苷酸表达的蛋白,并且重组细胞、组织和生物体是包含重组序列(多核苷酸和/或多肽)的那些。
如本文所用,术语“载体”是指多核苷酸序列,其包含感兴趣的基因(例如,编码本文所述的一种或多种蛋白质或酶)和可操作地连接到感兴趣的脂肪酸生物合成多核苷酸序列的启动子。一旦制备并分离了一种或多种编码脂肪酸生物合成途径多肽的多核苷酸序列,就可以使用各种方法来构建表达盒、载体和其他DNA构建体。技术人员非常了解表达构建体/载体上必须存在的遗传元件,以便成功地在宿主细胞中转化、选择和繁殖表达构建体。用于操作核酸的技术,例如将核酸序列亚克隆到表达载体中、标记探针、DNA杂交是本领域所熟知的。
如本文所用,术语“微生物”通常是指微观生物体。微生物可以是原核的或真核的。示例性原核微生物包括例如细菌(包括γ-变形菌纲)、古细菌、蓝细菌等。示例性变形菌门是大肠杆菌。示例性真核微生物包括例如酵母、原生动物、藻类等。在示例性实施方案中,“重组微生物”是已被遗传改变并因此表达或涵盖异源核酸序列和/或异源蛋白的微生物。
如本文所用,表述“活细菌(viable bacterium)”或“活细菌(viable bacteria)”或“活微生物”是指生长在碳源例如简单碳源上的细菌(包括变形菌门),其中用于培养微生物的培养基不含有任何外源脂肪酸或脂肪酸衍生物,也不含有任何作为脂肪酸生物合成抑制剂的化合物,例如,三氯生,其抑制fabl型反式-2-烯酰基-ACP还原酶。典型地,如本文所用,包括重组变形菌门的活的重组细菌包含至少一种异源酰基-ACP去饱和酶和至少一种异源酰基-ACP硫酯酶,并且其中3-羟基酰基-ACP天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。在一些实施方案中,重组变形菌门是γ变形菌纲(gammaproteobacterium)(也称为γ-变形菌纲(γ-proteobacterium))。在一些实施方案中,重组变形菌门可以是大肠杆菌、沙门氏菌属物种(Salmonella spp.)、需钠弧菌(Vibrionatriegens)、铜绿假单胞菌(Pseudomonas aeruginosa)、恶臭假单胞菌(Pseudomonasputida)、荧光假单胞菌(Pseudomonas fluorescens)、地毯草黄单胞菌(Xanthomonasaxonopodis)、丁香假单胞菌(Pseudomonas syringae)、苛养木杆菌(Xyella fastidiosa)、水油海杆菌(Marinobacter aquaeolei)、鼠疫耶尔森菌(Yersinia pestis)或霍乱弧菌(Vibrio cholerae)。
如本文所用,术语“培养物”典型地是指包含活细胞的液体培养基。在一个实施方案中,培养物包含在受控条件下在预定培养基中繁殖的细胞,例如,在包含所选碳源和氮的液体培养基中生长的重组宿主细胞的培养物。
“进行培养”或“培养”是指在合适的条件下在液体或固体培养基中使重组宿主细胞群体生长。在特定实施方案中,培养是指将底物发酵生物转化为终产物。培养基是熟知的,并且这样的培养基的各个组分可以从商业来源获得,例如,在DifcoTM和BBLTM商标下。在一个非限制性实施例中,水性营养培养基是包含氮、盐和碳的复杂来源的“富培养基”,例如YP培养基,其包含10g/L蛋白胨和10g/L这种培养基的酵母提取物。
典型地,如本文披露的“重组变形菌门”将在其细胞脂肪酸/膜磷脂中包含由细胞产生的具有特征双键结构的非天然单不饱和脂肪酸(或脂肪酸衍生物)。在一些实施方案中,非天然单不饱和脂肪酸衍生物包含至少5%的膜磷脂。在其他实施方案中,非天然单不饱和脂肪酸衍生物包含至少10%的膜磷脂。在又其他实施方案中,非天然单不饱和脂肪酸衍生物包含至少11%、至少12%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%的膜磷脂。在另一个实施方案中,重组变形菌门将包含至少11%、至少12%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少60%或至少70%的非天然单不饱和脂肪酸的游离脂肪酸组合物。
“生产宿主”或等同地“生产宿主细胞”是用于生产产物的细胞。如本文所披露的,生产宿主典型地被修饰以表达或过表达所选基因,或者具有所选基因的减弱的表达。因此,生产宿主或生产宿主细胞是重组宿主或等同地重组宿主细胞。生产宿主的非限制性实例包括例如如上所披露的重组变形菌门。示例性生产宿主是包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶的重组变形菌门,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
如本文所用,术语“进行纯化”、“纯化的”或“纯化”意指通过例如分离(isolation或separation)将分子从其环境中除去或分离。“基本上纯化的”分子是至少约60%不含(例如,至少约65%不含、至少约70%不含、至少约75%不含、至少约80%不含、至少约85%不含、至少约90%不含、至少约95%不含、至少约96%不含、至少约97%不含、至少约98%不含、至少约99%不含)与它们缔合的其他组分。如本文所用,这些术语也指从样品中去除污染物。
如本文所用,术语“碳源”是指适合用作原核或简单真核细胞生长的碳源的底物或化合物。碳源可以是各种形式,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如,CO和CO2)。示例性碳源包括但不限于单糖,例如葡萄糖、果糖、甘露糖、半乳糖、木糖和阿拉伯糖;低聚糖,例如低聚果糖和低聚半乳糖;多糖,例如淀粉、纤维素、果胶和木聚糖;双糖,例如蔗糖、麦芽糖、纤维二糖和松二糖;纤维素材料和变体,例如半纤维素、甲基纤维素和羧甲基纤维素钠;琥珀酸盐、乳酸盐和乙酸盐;醇类,例如乙醇、甲醇和甘油,或它们的混合物。碳源也可以是光合作用的产物,例如葡萄糖。在某些实施方案中,碳源是生物质。在其他实施方案中,碳源是葡萄糖。在其他实施方案中,碳源是蔗糖。在其他实施方案中,碳源是甘油。在其他实施方案中,碳源是简单碳源,例如葡萄糖。在其他实施方案中,碳源是可再生碳源。在其他实施方案中,碳源为天然气。在其他实施方案中,碳源包含天然气的一种或多种组分,例如甲烷、乙烷或丙烷。在其他实施方案中,碳源为烟气或合成气。在又其他实施方案中,碳源包含烟气或合成气中的一种或多种组分,例如一氧化碳、二氧化碳、氢气等。如本文所用,术语“碳源”或“简单碳源”明确排除了油脂化学品,例如饱和或不饱和脂肪酸。
如本文所用,术语“酰基-ACP去饱和酶”是指属于氧化还原酶家族的酶并催化饱和酰基-ACP与顺式单不饱和酰基-ACP的反应的酶。例如,饱和酰基-ACP可以是硬脂酰基-ACP,并且顺式单不饱和酰基-ACP可以是油酰基-ACP。酰基-ACP去饱和酶对于细胞可以是天然的(例如,以自然状态存在于细胞中,没有任何有意诱导的突变或其表达变化),或可以是异源的(例如,以非自然状态存在于细胞中,例如酶被有意突变或具有有意改变的表达)。在一些实施方案中,其中酰基-ACP去饱和酶是异源的,它可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,其中酰基-ACP去饱和酶是异源的,它可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,本文所述的酰基-ACP去饱和酶可属于EC 1.14.19.2。特定的酰基-ACP去饱和酶决定了mUFA或衍生物中顺式双键的位置。在一个特定实施方案中,酰基-ACP去饱和酶是Δ9-十四烷酰基-酰基-ACP去饱和酶。在进一步的实施方案中,酰基-ACP去饱和酶与SEQ ID NO:2具有约85%的序列同一性。在又进一步的实施方案中,酰基-ACP去饱和酶与SEQ ID NO:2具有约90%的序列同一性,与SEQ ID NO:2具有约95%的序列同一性,与SEQID NO:2具有约99%的序列同一性,或者是SEQ ID NO:2(例如,100%序列同源性)。在另一个实施方案中,酰基-ACP去饱和酶与SEQ ID NO:12具有约85%的序列同一性。在又进一步的实施方案中,异源酰基-ACP去饱和酶与SEQ ID NO:12具有约90%的序列同一性,与SEQID NO:12具有约95%的序列同一性,与SEQ ID NO:12具有约99%的序列同一性或者是SEQID NO:12(例如,100%序列同源性)。
如本文所用,术语“酰基-ACP硫酯酶”是指催化硫酯键水解以终止脂肪酰基延伸的酶。酰基-ACP硫酯酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源酰基-ACP硫酯酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源酰基-ACP硫酯酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,本文所述的酰基-ACP硫酯酶可属于EC 3.1.2.14。特定的酰基-ACP硫酯酶决定了mUFA或其衍生物的链长。在一个特定实施方案中,酰基-ACP硫酯酶是植物FatA型硫酯酶(其对具有C16和C18链长的酰基-ACP具有特异性)、植物FatB型硫酯酶(其对具有C14链长的酰基-ACP具有特异性)或细菌酰基-ACP硫酯酶(例如,来自热纤维梭菌(C.thermocellum)的硫酯酶,其水解各种链长的酰基-ACP,包括z9-十四烷醇)。在进一步的实施方案中,酰基-ACP硫酯酶与SEQ ID NO:8具有约85%的序列同一性。在又进一步的实施方案中,酰基-ACP硫酯酶与SEQ ID NO:8具有约90%的序列同一性,与SEQ ID NO:8具有约95%的序列同一性,与SEQ ID NO:8具有约99%的序列同一性,或者是SEQ ID NO:8(例如,100%序列同源性)。
大肠杆菌具有两种3-羟基酰基-ACP脱水酶,即FabZ和FabA[EC 4.2.1.59]。mUFA合成的关键酶是这些酶中的一种,即FabA,它是一种双功能脱水酶/异构酶。FabA将反式-2-癸烯酰基-ACP异构化为顺式-3-癸烯酰基-ACP。后者不能被反式-2-烯酰基-ACP还原酶(FabI)还原,但可以被β-酮脂酰-ACP合酶I(FabB)延长,从而将双键位置固定在具有链长C10、C12、C14、C16和C18的mUFA的ω-7位置(即天然位置,从酰基链的还原端计数)。应该注意的是,常见的化学命名法指定了从羧基而不是还原端计数的脂肪酸中的双键位置,并且它使用(z)表示顺式构型,使用(e)表示反式构型,因此大肠杆菌中的天然mUFA为z3-C10:1(=ω7-C10:1)、z5-C12:1(=ω7-C12:1)、C14:1(=ω7-C14:1)、z9-C16:1(=ω7-C16:1)和z11-C18:1(=ω7-C18:1)。因此,如本文所用,表述“双3-羟基酰基-ACP脱水酶/异构酶”是指具有(3-羟基酰基-[酰基载体蛋白]脱水酶)活性(由EC编号:EC 4.2.1.59描述)和烯酰基-酰基-载体蛋白异构酶活性(由EC编号:EC 5.3.3.14描述)的酶(参见例如,Heath RJ,Rock CO(1996)Roles of the FabA and FabZ beta-hydroxyacyl-acyl carrier proteindehydratases in Escherichia coli fatty acid biosynthesis[FabA和FabZβ-羟基酰基-酰基载体蛋白脱水酶在大肠杆菌脂肪酸生物合成中的作用].J Biol Chem[生物化学杂志]271:27795-801)。双3-羟基酰基-ACP脱水酶/异构酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源3-羟基酰基-ACP脱水酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)是由细胞产生的。在另一个实施方案中,双3-羟基酰基-ACP脱水酶/异构酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,本文所述的3-羟基酰基-ACP脱水酶可属于EC4.2.1.59。
如本文所用,术语“羧酸还原酶”是指将脂肪酸转化为其相应醛的酶。羧酸还原酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源羧酸还原酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源羧酸还原酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,本文所述的羧酸还原酶可属于EC 1.2.1.30。在进一步的实施方案中,羧酸还原酶与SEQ ID NO:18具有约85%的序列同一性。在又进一步的实施方案中,羧酸还原酶与SEQ ID NO:18具有约90%的序列同一性,与SEQ ID NO:18具有约95%的序列同一性,与SEQ ID NO:18具有约99%的序列同一性,或者是SEQ ID NO:18(例如,100%序列同源性)。
如本文所用,术语“铁氧还蛋白”是指在代谢反应中介导电子转移的铁硫蛋白。铁氧还蛋白对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源铁氧还蛋白可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源铁氧还蛋白可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,铁氧还蛋白是指PetF、铁氧还蛋白还原酶(PetH)和黄素氧还蛋白/铁氧还蛋白-NADP+还原酶(Fpr)。在一些实施方案中,本文所述的铁氧还蛋白可属于EC 1.18.1.2。
如本文所用,术语“醇脱氢酶”是指催化脂肪族醇(例如,脂肪族中链醇)与其相应醛之间的相互转化的酶。醇脱氢酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,并且在一些条件下,醇脱氢酶将醇转化为醛。在一些实施方案中,并且在一些条件下,醇脱氢酶将醛转化为醇。在一些实施方案中,异源醇脱氢酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源醇脱氢酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,醇脱氢酶可属于EC 1.1.1.1。在进一步的实施方案中,醇脱氢酶与SEQ IDNO:20具有约85%的序列同一性。在又进一步的实施方案中,醇脱氢酶与SEQ ID NO:20具有约90%的序列同一性,与SEQ ID NO:20具有约95%的序列同一性,与SEQ ID NO:20具有约99%的序列同一性,或者是SEQ ID NO:20(例如,100%序列同源性)。
如本文所用,术语“ω-羟化酶”是指在ω-位置水解脂肪酸衍生物的酶。ω-羟化酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源ω-羟化酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源ω-羟化酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,ω-羟化酶可属于EC 1.14.15.3或1.14.14.80。在进一步的实施方案中,ω-羟化酶可以是杂交融合P450酶或其变体,例如WO 2014/201474或WO2017/106205中披露的一种,它们通过援引以其全文并入本文。在一个特定实施方案中,ω-羟化酶与SEQ ID NO:22具有约85%的序列同一性。在又进一步的实施方案中,ω-羟化酶与SEQ ID NO:22具有约90%的序列同一性,与SEQ ID NO:22具有约95%的序列同一性,与SEQID NO:22具有约99%的序列同一性,或者是SEQ ID NO:22(例如,100%序列同源性)。
如本文所用,术语“醇乙酰-CoA转移酶”是指将醇转化为乙酰酯的酶。醇乙酰-CoA转移酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源醇乙酰-CoA转移酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源醇乙酰-CoA转移酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,醇乙酰-CoA转移酶可属于EC2.3.1.84。在进一步的实施方案中,醇乙酰-CoA转移酶与SEQ ID NO:24具有约85%的序列同一性。在又进一步的实施方案中,醇乙酰-CoA转移酶与SEQ ID NO:24具有约90%的序列同一性,与SEQ ID NO:24具有约95%的序列同一性,与SEQ ID NO:24具有约99%的序列同一性,或者是SEQ ID NO:24(例如,100%序列同源性)。
如本文所用,术语“磷酸泛酰巯基乙胺基转移酶”是指将4′-磷酸泛酰巯基乙胺部分从CoA转移到酰基载体蛋白的酶。磷酸泛酰巯基乙胺基转移酶对于重组变形菌门可以是天然的,或者可以是异源的。例如,entD基因编码磷酸泛酰巯基乙胺基转移酶。天然大肠杆菌entD(磷酸泛酰巯基乙胺基转移酶)的过表达能够将羧酸还原酶CarB从apo-CarB活化为holo-CarB,从而允许游离脂肪酸转化为脂肪醛,然后可以通过脂肪醛还原酶将其转化为脂肪醇。参见,例如,美国专利9,340,801,其通过援引并入本文。在一些实施方案中,异源磷酸泛酰巯基乙胺基转移酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源磷酸泛酰巯基乙胺基转移酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。在一些实施方案中,磷酸泛酰巯基乙胺基转移酶可属于EC 2.7.8.7。在进一步的实施方案中,磷酸泛酰巯基乙胺基转移酶与SEQ ID NO:26具有约85%的序列同一性。在又进一步的实施方案中,磷酸泛酰巯基乙胺基转移酶与SEQ ID NO:26具有约90%的序列同一性,与SEQ ID NO:26具有约95%的序列同一性,与SEQ ID NO:26具有约99%的序列同一性,或者是SEQ ID NO:26(例如,100%序列同源性)。
如本文所用,术语“醛脱氢酶”是指将醛转化为羧酸的酶。醛脱氢酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源醛脱氢酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源醛脱氢酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。醛脱氢酶可以用编号EC 1.2.1.3来描述。在进一步的实施方案中,异源醛脱氢酶与SEQ IDNO:30-32中的一个具有约85%的序列同一性。在又进一步的实施方案中,醛脱氢酶与SEQID NO:30-32中的一个具有约90%的序列同一性,与SEQ ID NO:30-32中的一个具有约95%的序列同一性,与SEQ ID NO:30-32中的一个具有约99%的序列同一性,或者是SEQ ID NO:30-32中的一个(例如,100%序列同源性)。
如本文所用,术语“β-酮脂酰-ACP-合酶”,其包括“FabB”或“FabF”,是指催化缩合反应以延长脂肪酸链的酶。β-酮脂酰-ACP合酶对于重组变形菌门可以是天然的,或者可以是异源的。在一些实施方案中,异源β-酮脂酰-ACP-合酶可以是内源的,其中酶或编码酶的多核苷酸(例如RNA)由细胞产生。在另一个实施方案中,异源β-酮脂酰-ACP-合酶可以是外源的,其中酶或编码酶的多核苷酸不是由细胞产生的,而是从细胞外添加到细胞中。β-酮脂酰-ACP-合酶可以用编号EC 2.3.1.41来描述。在进一步的实施方案中,β-酮脂酰-ACP-合酶与SEQ ID NO:33具有约85%的序列同一性。在又进一步的实施方案中,β-酮脂酰-ACP-合酶与SEQ ID NO:33具有约90%的序列同一性,与SEQ ID NO:33具有约95%的序列同一性,与SEQ ID NO:33具有约99%的序列同一性,或者是SEQ ID NO:33(例如,100%序列同源性)。
II.重组变形菌门与新型Δ9-十四烷酰基-酰基-ACP去饱和酶
如上所述,需要新的和有效的重组方法来生产非天然mUFA及其衍生物。因此,在一个实施方案中,本文描述了产生非天然mUFA及其衍生物的重组变形菌门,其包括异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。在一些实施方案中,重组变形菌门是γ-变形菌纲(gamma-proteobacterium)(例如,γ-变形菌纲)。在进一步的实施方案中,重组变形菌门可以是大肠杆菌、沙门氏菌属物种、需钠弧菌、铜绿假单胞菌、恶臭假单胞菌、荧光假单胞菌、地毯草黄单胞菌、丁香假单胞菌、苛养木杆菌、水油海杆菌、鼠疫耶尔森菌或霍乱弧菌。在一个特定实施方案中,重组变形菌门是大肠杆菌。
所述重组变形菌门可产生一种或多种非天然mUFA或其衍生物,例如ω-3、ω-5、ω-6、ω-8、ω-9、ω-11、ω-12等mUFA或其衍生物。在一个特定实施方案中,重组变形菌门产生ω-5mUFA或其衍生物。
在另一个特定实施方案中,异源酰基-ACP去饱和酶是来自葡萄(Vitis Vinifera)的新发现的Δ9-十四烷酰基-酰基-ACP去饱和酶,其与SEQ ID NO:12具有至少85%的序列同一性,或来自天竺葵(Pelargonium xhortorum)的Δ9-十四烷酰基-酰基-ACP去饱和酶,其与SEQ ID NO:2具有至少85%的序列同一性。一些主要在植物中发现的去饱和酶作用于酰基-ACP。作用于酰基-ACP底物的去饱和酶是可溶的,并且能够改变酰基-ACP中的顺式双键位置,而不是天然存在的ω-7位置。不受理论约束,当酰基-ACP去饱和酶在变形菌门中表达时,生物体可以产生具有位于非天然位置(例如ω-3、ω-5、ω-6、ω-8、ω-9、ω-11和ω-12位置)的双键的mUFA和衍生物。
另外或替代地,重组变形菌门进一步包含一种或多种酶,例如铁氧还蛋白、铁氧还蛋白还原酶或黄素氧还蛋白还原酶、3-羟基酰基-ACP-脱水酶(FabZ)、硫酯酶、羧酸还原酶、醇脱氢酶、磷酸泛酰巯基乙胺基转移酶、醇乙酰-CoA转移酶、ω-羟化酶、醇氧化酶/脱氢酶、脂肪酸代谢调节蛋白(fadR)、醛氢化酶、和/或β-酮脂酰-ACP合酶。前述酶中的一种或多种对于重组变形菌门可以是天然的,或者前述酶中的一种或多种可以是异源的(例如,非天然的)。例如,对于重组ΔFabA菌株(例如,其中FabA被缺失)中另外的3-羟基酰基-ACP脱水酶活性,可以使用各种异源FabZ酶,优选具有使所有3-羟基酰基-ACP链长(C4至C18)脱水的活性的3-羟基酰基-ACP脱水酶,例如来自贝氏不动杆菌(Acinetobacter baylyi)的FabZ(UniProtKB-Q6FCG4;SEQ ID NO:16)、来自丙酮丁醇梭菌(Clostridium acetobutylicum)的FabZ(UniProtKB-Q97DA9;SEQ ID NO:27)或来自细长聚球藻(Synechococcuselongatus)的FabZ(UniProtKB-Q31PQ9;SEQ ID NO:28)。
在另一个实施方案中,除了缺失天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)之外,重组变形菌门还可以被进一步设计以包含异源双3-羟基酰基-ACP脱水酶/异构酶(FabA),例如通过WO 2020/047088中报道的方法,如上所述,将其通过援引以其全文并入本文。
在一些实施方案中,重组变形菌门产生至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的总mUFA或其衍生物。在进一步的实施方案中,重组变形菌门可产生大于90%的非天然mUFA或其衍生物,例如ω-5不饱和脂肪酸或其衍生物。特别地,mUFA或其衍生物可以是z9-十四碳烯酸、z11-十六碳烯酸和z13-十八碳烯酸中的一种或多种。替代地,mUFA或其衍生物可以是z9-十四碳烯醇、z11-十六碳烯醇、z13-十八碳烯醇、z7-十四碳烯醇、z9-十六碳烯醇和z11-十八碳烯醇中的一种或几种。
在一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶和异源铁氧还蛋白,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。在另一个实施方案中,重组变形菌门过表达内源黄素氧还蛋白还原酶或铁氧还蛋白还原酶(例如,具有稳健的组成型启动子)或表达异源铁氧还蛋白还原酶或异源黄素氧还蛋白还原酶。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶和异源3-羟基酰基-ACP脱水酶(FabZ),以及任选地异源铁氧还蛋白和黄素氧还蛋白还原酶或铁氧还蛋白还原酶,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。
在另一个特定实施方案中,重组变形菌门包含增加的FadR多肽表达水平。在该实施方案中,增加的FadR表达可以是天然FadR、异源FadR、内源FadR或异源和内源FadR。在另一个实施方案中,与相应的野生型变形菌门相比,重组变形菌门包含增加的FadR的DNA结合活性水平,其中FadR以在自然条件下正常的水平存在。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶和异源羧酸还原酶,以及任选地异源铁氧还蛋白、异源黄素氧还蛋白还原酶或铁氧还蛋白还原酶和/或异源3-羟基酰基-ACP脱水酶(FabZ),其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。在进一步的实施方案中,该重组变形菌门产生不饱和脂肪醛或不饱和脂肪醇。不饱和脂肪醛或不饱和脂肪醇可以是z9-十四碳烯醛、z11-十六碳烯醛、z13-十八碳烯醛、z9-十四碳烯醇、z11-十六碳烯醇、z13-十八碳烯醇及其组合。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源羧酸还原酶和异源醇脱氢酶,以及任选地异源铁氧还蛋白、异源黄素氧还蛋白还原酶或铁氧还蛋白还原酶、以及异源3-羟基酰基-ACP-脱水酶(FabZ)中的一种或多种,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源羧酸还原酶和异源磷酸泛酰巯基乙胺基转移酶,以及任选地异源铁氧还蛋白、异源黄素氧还蛋白还原酶或铁氧还蛋白还原酶、异源3-羟基酰基-ACP-脱水酶(FabZ)和异源醇脱氢酶中的一种或多种,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源羧酸还原酶和异源醇乙酰-CoA转移酶,以及任选地异源铁氧还蛋白、异源黄素氧还蛋白还原酶或铁氧还蛋白还原酶、异源3-羟基酰基-ACP脱水酶(FabZ)、异源醇脱氢酶和异源磷酸泛酰巯基乙胺基转移酶中的一种或多种,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。在一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、羧酸还原酶和异源醇乙酰-CoA转移酶。在进一步的实施方案中,该重组变形菌门产生不饱和脂肪醇乙酸酯。不饱和脂肪醇乙酸酯可由z9-十四碳烯基乙酸酯、z11-十六碳烯基乙酸酯、z13-十八碳烯基乙酸酯或其组合组成。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、和异源ω-羟化酶,以及任选地异源铁氧还蛋白、异源黄素氧还蛋白还原酶或铁氧还蛋白还原酶、异源3-羟基酰基-ACP-脱水酶(FabZ)、异源羧酸还原酶、异源醇脱氢酶、异源磷酸泛酰巯基乙胺基转移酶和异源醇乙酰-CoA转移酶中的一种或多种,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。在进一步的实施方案中,该重组变形菌门产生不饱和ω-羟基脂肪酸。不饱和ω-羟基脂肪酸可以是(z9)14-羟基-十四碳烯酸、(z11)16-羟基-十六碳烯酸、(z13)18-羟基-十八碳烯酸或其组合。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、和异源醇氧化酶/脱氢酶,以及任选地异源铁氧还蛋白、异源3-羟基酰基-ACP-脱水酶(FabZ)、异源羧酸还原酶、异源醇脱氢酶、异源磷酸泛酰巯基乙胺基转移酶、异源醇乙酰-CoA转移酶和异源ω-羟化酶中的一种或多种,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。
在另一个特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶和异源醛脱氢酶,以及任选地异源铁氧还蛋白、异源3-羟基酰基-ACP-脱水酶(FabZ)、异源羧酸还原酶、异源醇脱氢酶、异源磷酸泛酰巯基乙胺基转移酶、异源醇乙酰-CoA转移酶、异源ω-羟化酶和异源醇氧化酶/脱氢酶中的一种或多种,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。在进一步的实施方案中,该重组变形菌门产生不饱和α/ω-二羧酸。不饱和α/ω-二羧酸可以是(z5)1,14-十四碳烯二酸、(z5)1,16-十六碳烯二酸、(z5)1,18-十八碳烯二酸或其组合。
在特定实施方案中,重组变形菌门包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源3-羟基酰基-ACP-脱水酶(FabZ)、异源铁氧还蛋白和异源黄素氧还蛋白还原酶或铁氧还蛋白还原酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。
在另一个特定实施方案中,重组变形菌门产生非天然mUFA和异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源羧酸还原酶和异源3-羟基酰基-ACP脱水酶,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。另外,重组变形菌门可包含异源乙酰-CoA转移酶。
在另一个特定实施方案中,重组变形菌门产生非天然mUFA并包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源酰基-ACP还原酶和异源醇脱氢酶,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
在另一个特定实施方案中,重组变形菌门产生非天然mUFA并包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源ω-羟化酶和异源3-羟基酰基-ACP脱水酶,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。另外,重组变形菌门可包含异源醇脱氢酶和/或异源醛脱氢酶。
在特定实施方案中,重组变形菌门产生非天然mUFA并包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源铁氧还蛋白和异源β-酮脂酰-ACP合酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。另外或替代地,与相应的野生型变形菌门相比,重组变形菌门具有增加水平的内源β-酮脂酰-ACP-合酶的表达。例如,可以产生的非天然ω5-不饱和脂肪酸衍生物包括z9-十四碳烯酸、z11-十六碳烯酸和/或z13-十八碳烯酸。
在特定实施方案中,重组变形菌门产生不饱和脂肪醇并包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源羧酸还原酶、异源醇脱氢酶、异源磷酸泛酰巯基乙胺基转移酶、异源铁氧还蛋白和异源β-酮脂酰-ACP合酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。例如,可以产生脂肪醇(z9-十四碳烯醇、z11-十六碳烯醇和/或z13-十八碳烯醇)。
在特定实施方案中,重组变形菌门产生ω-羟基脂肪酸并包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源铁氧还蛋白和异源β-酮脂酰-ACP合酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。例如,可以产生ω-羟基脂肪酸((z9)14-羟基-十四碳烯酸、(z11)16-羟基-十六碳烯酸和/或(z13)18-羟基-十八碳烯酸)。
在特定实施方案中,重组变形菌门产生脂肪醇乙酸酯并包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源羧酸还原酶、异源铁氧还蛋白和异源乙酰-CoA转移酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。例如,可以产生脂肪醇乙酸酯(z9-十四碳烯基乙酸酯、z11-十六碳烯基乙酸酯和/或z13-十八碳烯基乙酸酯)。
在特定实施方案中,重组变形菌门产生脂肪醛并包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、羧酸还原酶、异源铁氧还蛋白并在醇脱氢酶和/或醛还原酶基因中具有一个或多个缺失。例如,可以产生脂肪醛(z11-十六碳烯醛、z9-十四碳烯醛和/或z13-十八碳烯醛)。
在特定实施方案中,重组变形菌门产生α/ω-二羧酸并包含异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源醇脱氢酶、异源ω-羟化酶和异源醛脱氢酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失。例如,可以产生α/ω-二羧酸((z5)1,14-十四碳烯二酸、(z5)1,16-十六碳烯二酸和/或(z5)1,18-十八碳烯二酸)。
在特定实施方案中,重组变形菌门产生非天然单不饱和游离脂肪酸并包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源羧酸还原酶和异源3-羟基酰基-ACP脱水酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
在特定实施方案中,重组变形菌门产生非天然单不饱和脂肪醛和/或脂肪醇并包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源酰基-ACP还原酶和异源醇脱氢酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
在特定实施方案中,重组变形菌门产生ω-羟基脂肪酸并包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源ω-羟化酶和异源3-羟基酰基-ACP脱水酶,并且其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。
在一些示例性实施方案中,宿主细胞(例如,重组变形菌门)可进一步包含遗传操作和改变,以增强或以其他方式微调非天然mUFA或其衍生物的产生。任选的遗传操作可以在一个宿主细胞与另一个宿主细胞之间互换使用,这取决于宿主细胞中存在什么其他异源酶和什么天然酶途径。一些任选的遗传操作包括以下中的一项或多项:
FadE(酰基-CoA脱氢酶)催化脂肪酸利用/降解(β-氧化循环)中的第一步,即酰基-CoA氧化为2-烯酰基-CoA(参见例如,Campbell,J.W.和Cronan,J.E.Jr(2002)J.Bacteriol.[细菌学杂志].184(13):3759-3764,Lennen,R.M.和Pfleger,B.F(2012)TrendsBiotechnol[生物技术趋势].30(12):659-667)。由于FadE启动β-氧化循环,因此当大肠杆菌缺乏FadE时,它不能在脂肪酸作为碳源上生长(参见例如,Campbell,J.W.和Cronan同上)。同样的效果可以通过减弱β-氧化循环中的其他酶来实现,例如FadA,这是一种3-酮脂酰-CoA硫解酶,或FadB,这是一种双3-羟基酰基-CoA脱氢酶/脱水酶。
然而,当大肠杆菌除脂肪酸以外的碳源上生长,例如,在糖、乙酸盐等上生长时,FadE减弱是任选的,因为在这样的条件下FadE表达被FadR抑制。因此,当细胞在简单的碳源(例如葡萄糖)上生长时,FadE基因产物已经被减弱。因此,当在除脂肪酸以外的碳源上生长时,FadE突变/缺失是任选的。
在一些实施方案中,生产宿主中的脂肪酸生物合成途径使用前体乙酰-CoA和丙二酰-CoA。经工程化以过量产生这些组分的大肠杆菌或其他宿主生物体可以作为后续遗传工程步骤的起点,以提供特定输出产物(例如,脂肪酸、脂肪酯、烃、脂肪醇)。可以组合地或单独地对宿主菌株进行几种不同的修饰,以获得增加的乙酰-CoA/丙二酰-CoA/脂肪酸和脂肪酸衍生物的产量。参见例如,美国专利申请公开2010/0199548,其通过援引以其全文并入本文。
宿主细胞的其他示例性修饰包括,例如,参与酰基-ACP合成的非天然基因和/或天然基因和/或基因变体的过表达。通常,增加酰基-ACP合成使酰基-ACP的量增加,酰基-ACP是硫酯酶、酯合酶和酰基-ACP还原酶的底物。增加酰基-ACP产量的示例性酶包括例如构成“脂肪酸合酶”(FAS)的酶。如本领域已知的(参见例如,U.S.2010/0199548),FAS酶是一组催化酰基链的起始和延长的酶。酰基载体蛋白(ACP)与FAS途径中的酶一起控制产生的脂肪酸的长度、饱和度和支化。上文中讨论了FAS途径酶(FabA、FabB、FabZ和FadR)。构成FAS的另外的酶包括例如AccABCD、FabD、FabH、FabG、FabI、FabK、FabL、FabM、FabQ、FabV、FabX和FabF。取决于所需的产物,这些基因中的一个或多个可以被减弱或过表达。
在一些实施方案中,宿主菌株可以过表达一个或多个FAS基因。可以被过表达的示例性FAS基因包括例如,来自大肠杆菌的FadR(NP_415705.1)、来自大肠杆菌的FabB(P0A953)或来自贝氏不动杆菌的FabZ(Q6FCG4)。在一些示例性实施方案中,编码脂肪酸生物合成中的酶和调节因子的这些基因中的一个或多个的过表达用于在特定培养条件下进一步增加脂肪酸衍生物化合物的滴度。
在另一个实施方案中,重组变形菌门是通过野生型变形菌门或不同的重组变形菌门的适应性进化产生的。在一个特定实施方案中,菌株sAS.561经历适应性进化以获得sAS.571。在另一个实施方案中,进化的变形菌门含有一个或多个突变。在一个特定实施方案中,突变可以是yibL基因的启动子区域中的C→T突变,其可以上调或下调yibL基因产物的表达;18bp框内插入ptsI基因中,这可能会影响PtsI表达和/或活性;以及IS1介导的65bp插入uof基因的上游区域,这与Fur的翻译有关,Fur是响应铁的基因表达的主要调节因子(fur调节子)。在又进一步的实施方案中,进化的变形菌门包含yibL基因的启动子区域中的C→T突变,18bp框内插入ptsI基因中,以及IS1介导的65bp插入uof基因的上游区域中的每一个。
III.载体
本文还描述了包含编码一种或多种异源酶的核苷酸序列的载体,该一种或多种异源酶包括以下一种或多种:异源酰基-ACP去饱和酶、异源酰基-ACP硫酯酶、异源铁氧还蛋白、异源3-羟基酰基-ACP脱水酶(FabZ)、异源羧酸还原酶、异源醇脱氢酶、异源磷酸泛酰巯基乙胺基转移酶、异源醇乙酰-CoA转移酶、异源ω-羟化酶、异源醇氧化酶/脱氢酶、异源脂肪酸代谢调节蛋白(fadR)、异源醛氢化酶和异源β-酮脂酰-ACP合酶。例如,包含编码Δ9-十四烷酰基-酰基-ACP去饱和酶(与SEQ ID NO:12具有至少85%、至少90%、至少95%或100%的序列同一性)的核苷酸序列的载体可以通过本领域所熟知的方法构建。
编码一种或多种酶(例如Δ9-十四烷酰基-酰基-ACP去饱和酶)的核苷酸序列可以可操作地连接到一种或多种异源调节元件。当载体包含编码上述多于一种酶的核苷酸序列时,载体可以包含指导两种酶表达的单个异源调节元件或独立指导载体编码的每种酶表达的多个异源调节元件。
如上所述,多核苷酸或多肽可以使用本领域熟知的方法过表达。在一些实施方案中,多肽的过表达是通过使用外源调节元件来实现的。术语“外源调节元件”通常是指源自宿主细胞外的调节元件。然而,在某些实施方案中,术语“外源调节元件”可以指衍生自宿主细胞的调节元件,其功能被复制或篡夺以用于控制内源多肽的表达。例如,如果宿主细胞是大肠杆菌细胞,并且FadR多肽由内源fadR基因编码,则内源fadR的表达可以通过衍生自另一个大肠杆菌基因的启动子来控制。
在一些实施方案中,外源调节元件是化学化合物,例如小分子。如本文所用,术语“小分子”是指分子量小于约1,000g/mol的物质或化合物。
在一些实施方案中,外源调节元件是通过重组整合到宿主细胞的基因组中可操作地连接到内源基因的表达控制序列。在某些实施方案中,使用本领域熟知的方法通过同源重组将表达控制序列整合到宿主细胞染色体中(例如,Datsenko等人,Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊],97(12):6640-6645(2000))。
在一些实施方案中,本文所述的载体包含可操作地连接到多核苷酸序列的启动子。在某些实施方案中,启动子是发育调节的启动子、细胞器特异性启动子、组织特异性启动子、诱导型启动子、组成型启动子或细胞特异性启动子。
在一些实施方案中,本文所述的载体包含至少一个序列,该序列可以是(a)可操作地偶联到多核苷酸序列的表达控制序列(或调节元件);(b)可操作地偶联到多核苷酸序列的选择标记;(c)可操作地偶联到多核苷酸序列的标记序列;(d)可操作地偶联到多核苷酸序列的纯化部分;(e)可操作地偶联到多核苷酸序列的分泌序列;和(f)可操作地偶联到多核苷酸序列的靶向序列。
本文所述的表达载体包括本文所述的多核苷酸序列,其形式适合于在宿主细胞中表达多核苷酸序列。本领域技术人员将理解,表达载体的设计可以取决于诸如要转化的宿主细胞的选择、所需多肽的表达水平等因素。可以将本文所述的表达载体引入宿主细胞中以产生由如本文所述的多核苷酸序列编码的多肽,包括融合多肽。
编码多肽的基因在原核生物(例如大肠杆菌)中的表达最常使用含有指导融合多肽或非融合多肽表达的组成型或诱导型启动子的载体进行。融合载体将许多氨基酸添加到其中编码的多肽中,通常添加到重组多肽的氨基或羧基末端。这样的融合载体典型地用于以下三个目的中的一个或多个:(1)增加重组多肽的表达;(2)增加重组多肽的溶解度;以及(3)通过作为亲和纯化中的配体起作用帮助重组多肽的纯化。通常,在融合表达载体中,在融合部分和重组多肽的连接处引入蛋白水解切割位点。这使得能够在纯化融合多肽后将重组多肽从融合部分分离。这样的酶及其同源识别序列的实例包括因子Xa、凝血酶和肠激酶。示例性融合表达载体包括pGEX(Pharmacia Biotech公司(Pharmacia Biotech,Inc.),新泽西州皮斯卡塔韦;Smith等人,Gene[基因],67:31-40(1988))、pMAL(新英格兰生物实验室(New England Biolabs),马萨诸塞州贝弗利)和pRITS(Pharmacia Biotech公司,新泽西州皮斯卡塔韦),它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合到靶重组多肽上。
用于原核细胞和真核细胞两者的合适表达系统是本领域熟知的;参见例如,Sambrook等人,“Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],”第二版,Cold Spring Harbor Laboratory[冷泉港实验室](1989)。诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amann等人,Gene[基因],69:301-315(1988))和PET 11d(Studier等人,Gene Expression Technology:Methods in Enzymology[基因表达技术:酶学方法]185,Academic Press[学术出版社],加利福尼亚州圣地亚哥,第60-89页(1990))。在某些实施方案中,本发明的多核苷酸序列可操作地连接到衍生自噬菌体T5的启动子。用于在酵母中表达的载体的实例包括pYepSec1(Baldari等人,EMBO J[欧洲分子生物学学会杂志].,6:229-234(1987))、pMFa(Kurjan等人,Cell[细胞],30:933-943(1982))、pJRY88(Schultz等人,Gene[基因],54:113-123(1987))、pYES2(英杰公司(Invitrogen Corp.),加利福尼亚州圣地亚哥)和picZ(英杰公司,加利福尼亚州圣地亚哥)。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白质的杆状病毒载体包括例如,pAc系列(Smith等人,Mol.Cell Biol.[细胞分子生物学],3:2156-2165(1983))和pVL系列(Lucklow等人,Virology[病毒学],170:31-39(1989))。哺乳动物表达载体的实例包括pCDM8(Seed,Nature[自然],329:840(1987))和pMT2PC(Kaufinan等人,EMBO J[欧洲分子生物学学会杂志].,6:187-195(1987))。
可经由常规转化或转染技术将载体引入原核或真核细胞中。如本文所用,术语“转化”和“转染”是指将外来核酸(例如DNA)引入宿主细胞的各种本领域公认的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质转染或电穿孔。用于转化或转染宿主细胞的合适方法可以在例如Sambrook等人(同上)中找到。
对于细菌细胞的稳定转化,已知取决于所使用的表达载体和转化技术,只有一小部分细胞会摄取并复制表达载体。为了鉴定和选择这些转化体,可以将编码选择标记(例如,抗生素抗性)的基因与感兴趣的基因一起引入宿主细胞中。选择标记包括赋予对药物的抗性的那些标记,例如但不限于氨苄青霉素、卡那霉素、氯霉素或四环素。可以将编码选择标记的核酸在与编码本文所述多肽的载体相同的载体上引入宿主细胞,或者可以在单独的载体上引入。可以通过在适当的选择药物存在下生长来鉴定被引入的核酸稳定转化的细胞。
类似地,对于哺乳动物细胞的稳定转染,已知取决于所使用的表达载体和转染技术,只有一小部分细胞可以将外来DNA整合到其基因组中。为了鉴定和选择这些整合体,可以将编码选择标记(例如,抗生素抗性)的基因与感兴趣的基因一起引入宿主细胞中。优选的选择标记包括赋予对药物(例如G418、潮霉素和甲氨蝶呤)的抗性的那些。可以将编码选择标记的核酸在与编码本文所述多肽的载体相同的载体上引入宿主细胞,或者可以在单独的载体上引入。可以通过在适当的选择药物存在下生长来鉴定被引入的核酸稳定转染的细胞。
IV.生产非天然mUFA或其衍生物的方法、细胞培养物和脂肪酸组合物
本文还描述了生产非天然mUFA或其衍生物的方法、细胞培养物和脂肪酸组合物。
本文所述的重组变形菌门可用于生产mUFA或其衍生物,特别是ω-5mUFA或其衍生物。因此,在一个实施方案中,本文提供的方法包括在合适的碳源中或在其上培养包含酰基-ACP去饱和酶和酰基-ACP硫酯酶的重组变形菌门,其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱。如上所述,重组变形菌门可以进一步包含一种或多种酶,例如铁氧还蛋白、黄素氧还蛋白还原酶或铁氧还蛋白还原酶、3-羟基酰基-ACP脱水酶(FabZ)、羧酸还原酶、醇脱氢酶、磷酸泛酰巯基乙胺基转移酶、醇乙酰-CoA转移酶、ω-羟化酶、醇氧化酶/脱氢酶、脂肪酸代谢调节蛋白(fadR)、醛氢化酶和β-酮脂酰-ACP合酶。这些酶可以是天然的或异源的、内源的或外源的。重组变形菌门还可以包含异源双3-羟基酰基-ACP脱水酶/异构酶(FabA)。
通常,非天然mUFA和/或其衍生物是通过在合适的碳源上或在其中生长和/或发酵重组变形菌门来制备的。重组变形菌门在适当的条件下生长和/或发酵足够长的时间段以产生mUFA和/或其衍生物。碳源可以是包含碳水化合物(例如,单糖、低聚糖和多糖)、补充剂(例如,氨基酸、抗生素、聚合物、酸、醇、醛、酮、肽和气体)和矿物盐的培养基。在一个特定实施方案中,碳源是以葡萄糖作为碳源的LB培养基或氮(N)-矿质培养基。
因此,本文还提供了包含本文所述的重组变形菌门和一种或多种mUFA或其衍生物的细胞培养物。本文另外提供了由本文所述的重组变形菌门产生的脂肪酸组合物。
在一些实施方案中,将mUFA或其衍生物置于包含mUFA或其衍生物的组合物中,其中该mUFA或其衍生物通过培养和/或发酵重组变形菌门来制备。在一些实施方案中,组合物包含一种或多于一种(例如,两种、三种、四种、五种或更多种)mUFA或其衍生物。
另外,本文提供的组合物包含的ω-5不饱和脂肪酸或其衍生物多于ω-7不饱和脂肪酸或其衍生物。组合物可以由本文披露的重组变形菌门产生,并且该组合物可包含不饱和脂肪酸或其他衍生物,例如脂肪酸、脂肪酸酯、FAME、FAEE、FACE、脂肪胺、脂肪醛、脂肪醇、烃、酮、末端烯烃、内烯烃、3-羟基脂肪酸衍生物、双官能脂肪酸衍生物和本文披露的不饱和脂肪酸衍生物。例如,基于组合物的总重量,组合物包含的ω-5不饱和脂肪酸或其衍生物可以比ω-7不饱和脂肪酸或其衍生物多至少约5%、多至少约10%、多至少约15%、多至少约20%、多至少约25%、多至少约30%、多至少约35%、多至少约40%、多至少约45%、多至少约50%、多至少约55%、多至少约60%、多至少约65%、多至少约70%、多至少约75%、多至少约80%、多至少约85%、多至少约90%、多至少约95%、或多至少约99%。替代地,组合物包含ω-5不饱和脂肪酸或其衍生物并且没有或基本上没有ω-7不饱和脂肪酸或其衍生物(例如,仅痕量的ω-7不饱和脂肪酸或其衍生物)。
在另一个实施方案中,基于组合物的总重量,组合物可包含至少约55%、至少约60%、至少约65%、至少约70%、至少约80%、至少约85%、至少约90%、至少约95%、或至少约99%的ω-5不饱和脂肪酸或其衍生物。另外,基于组合物的总重量,组合物可包含约50%或更少、约45%或更少、约40%或更少、约35%或更少、约30%或更少、约25%或更少、约20%或更少、约15%或更少、约10%或更少、约5%或更少、约4%或更少、约3%或更少、约2%或更少、约1%或更少或基本上没有ω-7不饱和脂肪酸或其衍生物。
本文提供的组合物的ω-5不饱和脂肪酸或其衍生物与ω-7不饱和脂肪酸或其衍生物的混合物比率的实例包括但不限于55%/45%、60%/40%、65%/35%、70%/30%、75%/25%、80%/20%、85%/15%、90%/10%、95%/5%、96%/4%、97%/3%、98%/2%、99%/1%,其中第一百分比值为组合物中ω-5不饱和脂肪酸或其衍生物的%,第二百分比值为组合物中ω-7不饱和脂肪酸或其衍生物的%。替代地,组合物可不包含或仅包含痕量的ω-7不饱和脂肪酸。
在一个特定的实施例中,组合物包含的ω-5不饱和脂肪醇可以比ω-7不饱和脂肪醇更多,例如约90%的ω-5不饱和脂肪醇和10%的ω-7不饱和脂肪醇(例如80%的z11-十六碳烯醇和10%的z13-十八碳烯醇和10%的z9-十六碳烯醇)。
在另一个特定的实施例中,组合物包含的ω-5不饱和脂肪酸可以比ω-7不饱和脂肪酸更多,例如约95%的ω-5不饱和脂肪酸和5%的ω-7不饱和脂肪酸。在另一个实施方案中,组合物可包含约99%或大于99%的ω-5不饱和脂肪酸(例如z11-十六碳烯酸和z9-十四碳烯酸)和约1%或小于1%的ω-7不饱和脂肪酸。在又另一个实施方案中,组合物可基本上仅包含ω-5不饱和脂肪酸且不含或仅包含痕量的ω-7不饱和脂肪酸。
V.用途
本文所述的重组变形菌门可用于多种目的。特别地,重组变形菌门可用于生产昆虫信息素或其前体,也可用于生产香料或其前体。
在一些实施方案中,由培养和/或发酵的重组变形菌门制备的mUFA或其衍生物在组合物中使用。在一些实施方案中,mUFA或其衍生物是重组变形菌门的发酵产物。在其他实施方案中,组合物包含一种或多于一种(例如,两种、三种、四种、五种或更多种)特定种类的mUFA或其衍生物。在一个特定实施方案中,组合物是昆虫信息素或其前体,或香料或其前体。在一个特定实施方案中,mUFA或其衍生物是纯化的。
在一些实施方案中,mUFA或其衍生物的制备时间和/或地点与制备组合物时不同。例如,mUFA或其衍生物可以由重组变形菌门在一个地点(例如,第一设施、城市、州或国家)产生,运输到另一个地点(例如,第二设施、城市、州或国家)并掺入包含mUFA或其衍生物的组合物中。
在一些实施方案中,mUFA或其衍生物在其用于组合物中之前被纯化。mUFA或衍生物可以被纯化到至少约60%不含(例如,至少约65%不含、至少约70%不含、至少约75%不含、至少约80%不含、至少约85%不含、至少约90%不含、至少约95%不含、至少约96%不含、至少约97%不含、至少约98%不含、或至少约99%不含)与它们缔合的其他组分的纯度。
在一些实施方案中,mUFA或其衍生物不溶于水或高度不溶于水。在这种情况下,mUFA或其衍生物处于与重组变形菌门所在的环境(例如发酵液)分开的相中。在一些实施方案中,mUFA或其衍生物在室温下是固体。在另一个实施方案中,mUFA或其衍生物(例如,醇衍生物)是液体。
在一个特定实施方案中,mUFA或其衍生物的纯化涉及分离和回收长链醇。发酵的产物可以是由生物质构成的固相、发酵液的水相和由分泌产物构成的轻质液态有机相的非均相混合物。这些相的分离可以通过离心来实现。盘堆喷嘴离心机(disk-stacknozzlecentrifuge)或盘堆喷射离心机(disk-stackejectorcentrifuge)都可以在不同的配置中高效地使用。典型地,当使用喷射机时,推荐2级离心方案,以在轻质相(产物)中获得高透明度,同时使损失最小化。喷嘴离心机可在单步离心中更好地澄清产物,但可能需要更仔细地调整培养液调节和离心条件。在这两种情况下,可能需要对发酵液进行一些调节(例如pH和温度调整),以提高离心机的整体性能。
回收的轻质相是由脂肪醇的混合物组成的粗有机相,其组成由所用微生物的性能决定。这种粗材料可以通过水洗进一步清洗,以去除可能已携带的任何水溶性化合物,然后进行水分离(离心或重力沉降)和干燥。
取决于最终产物的应用和规格,可能需要另外的纯化步骤。如果需要高纯度的单链长度,这些步骤可能包括皂化、漂白和最终蒸馏。所有这些都是行业中经常使用的标准单元操作。
在另一个特定实施方案中,mUFA或其衍生物的纯化涉及分离和回收脂肪酸。脂肪酸的纯化与醇的分离不同之处在于,与生物质混合的脂肪酸都是固体。
可以应用两种不同的方法:
一种方法包括通过倾析离心回收生物质加产物的固相,然后用适当的溶剂(即甲醇或乙醇)从生物质中对产物进行溶剂提取。脂肪酸溶解在溶剂中,并通过离心或过滤去除生物质。然后通过蒸发溶剂来实现脂肪酸的回收。取决于应用,该产物可以进一步用作溶剂中的溶液或用作固体。可以应用其他纯化步骤(包括蒸馏)来满足最终规格。
另一种方法包括通过用水不混溶溶剂进行全培养液提取来回收产物。在这种方法中,发酵液以分批或连续方案与适当的溶剂(即乙酸丁酯、中链醇或酯)接触,以使产物完全溶解在溶剂中。轻质有机溶剂相可以与水相分离,其方式与针对长链醇的回收描述的那些方式相似。一旦获得澄清的溶剂相,通过溶剂蒸发再次回收最终产物。
在另一个实施方案中,将由重组变形菌门制备的mUFA或其衍生物,或包含由重组变形菌门制备的mUFA或其衍生物的组合物掺入到产物中。本产物通过以下方式制成:组合、混合或以其他方式使用由重组变形菌门产生的mUFA或其衍生物与其他或多种另外的组分的组合来制备产物。该产物可包含一种或多于一种(例如,两种、三种、四种、五种或更多种)由重组变形菌门制备的mUFA或其衍生物。在一个特定实施方案中,产物是信息素或其前体、香料或其前体、或营养补充剂或其前体。
作物保护中的昆虫信息素及其前体
全球对食品的需求不断增长,加上对过度使用通常有毒的杀虫剂造成的环境影响的日益关注,放大了对更自然和可持续的作物保护手段的需求,例如昆虫信息素及其前体,它们通常是mUFA或其衍生物。使用昆虫信息素是自然且无毒的害虫防治方式,近年来在农业中引起了关注。昆虫信息素可用作捕虫器中的诱饵或喷洒在作物上以破坏昆虫交配。然而,到目前为止,合成信息素的生产成本很高,并且主要通过有时复杂和/或低产量的化学合成由石油衍生的原料合成。因此,在一个实施方案中,本文所述的重组变形菌门可用于生产昆虫信息素或信息素前体。
由本文所述的重组变形菌门产生的昆虫信息素或其前体可以包括ω-5不饱和非天然脂肪酸的衍生物,例如z9-十四碳烯醇、z11-十六碳烯醇、z13-十八碳烯醇、z9-十四碳烯醛、z11-十六碳烯醛、z13-十八碳烯醛、z9-十四碳烯基乙酸酯、z11-十六碳烯基乙酸酯和z13-十八碳烯基乙酸酯。重要作物害虫的昆虫信息素的特定实例包括但不限于美国棉铃虫、条纹水稻螟虫(striped rice stemborer)和小菜蛾(十字花科蔬菜的害虫)的z11-十六碳烯醛和/或z11-十六碳烯基乙酸酯;草地贪夜蛾(玉米害虫)、苹果蠹蛾和卷叶蛾的z9-十四碳烯醛和/或z9-十四碳烯基乙酸酯;以及西南玉米螟虫和亚洲稻螟(Asiatic riceborer)的z13-十八碳烯醛和/或z13-十八碳烯基乙酸酯。所有这些信息素都是ω-5mUFA的衍生物。
图1总结了将细菌酰基-ACP转化为信息素或信息素前体的生化途径。羧酸还原酶可以有效地将ω-5非天然mUFA z9-十四碳烯酸、z11-十六碳烯酸和z13-十八碳烯酸分别转化为脂肪醛z9-十四碳烯醛、z11-十六碳烯醛和z13-十八碳烯醛。特定的羧酸还原酶或其变体来自耻垢分枝杆菌(Mycobacterium smegmatis)。参见WO 2010/062480和WO 2013/152052,两者均通过援引以其全文并入。
在一个实施方案中,诸位发明人开发了用于ω-5不饱和信息素或信息素前体的高效细菌生产系统,该系统使用酰基-ACP中间体和新的生化途径,该生化途径包括可溶性Δ9-十四烷酰基-ACP去饱和酶、酰基-ACP硫酯酶和羧酸还原酶。昆虫信息素途径不包含任何来自昆虫的基因,并且重组变形菌门的FabA基因被缺失。因此,仅可以产生痕量的天然ω-7不饱和脂肪酸衍生物。例如,一种重组菌株产生约800mg/L的z11-十六碳烯醇(所有产生的脂肪酸衍生物的约80%),但在小规模制备中仅产生痕量的z9-十六碳烯醇。来自拟南芥(Arabidopsis thaliana)的硫酯酶FatA对具有C16链长的酰基ACP具有高特异性。由于变形菌门(例如大肠杆菌)具有II型脂肪酸生物合成机制,因此细胞质中很容易获得短链酰基ACP,供硫酯酶作用。如果用例如对具有C14链长的酰基-ACP具有高特异性的酰基-ACP硫酯酶(例如,来自樟树(Cinnamomum camphorum)的FatB或来自热纤梭菌(Clostridiumthermocellum)的TE)替换FatA,则该菌株可能主要产生z9-十四碳烯醇。
香料及其前体
另外或替代地,本文所述的重组变形菌门可用于生产香料或香料前体。图2总结了将细菌酰基-ACP转化为香料前体的生化途径。有时这些可以被称为麝香香料。
诸位发明人发现了一种新途径,其利用酰基ACP-去饱和酶(例如,Δ9-十四烷酰基-ACP去饱和酶)、酰基-ACP硫酯酶和ω-羟化酶在重组变形菌门如大肠杆菌中产生麝香香料前体。在一个特定实施方案中,ω-羟化酶是如在WO 2014/201474和/或WO 2017/106205中披露的杂交融合P450酶或其变体,两者均通过援引以其全文并入文。在进一步的特定实施方案中,ω-羟化酶与SEQ ID NO:22具有至少85%、至少90%、至少95%或100%的序列同一性。
可由本文所述的重组变形菌门产生的香料前体包括ω-5非天然mUFA的衍生物,例如(z9)14-羟基-十四碳烯酸、(z11)16-羟基-十六碳烯酸、(z13)18-羟基-十八碳烯酸、(z5)1,14-十四碳烯二酸、(z5)1,16-十六碳烯二酸和(z5)1,18-十八碳烯二酸。
在本文的实施例6中,描述了ω5-非天然不饱和ω-羟基脂肪酸((z11)-16-羟基十六碳烯酸)的生产。当该前体进行化学内酯化时(方法参见例如,国际专利申请公开WO2015/157719A9,其通过援引以其全文并入本文),产生了(12z)-1-氧杂环十七烷-12-烯-2-酮,其结构类似于麝香香料黄葵内酯((8z)-1-氧杂环十七烷-8-烯-2-酮)、顺式异黄葵内酯((10z)-1-氧杂环十七烷-10-烯-2-酮)或异黄葵内酯((10e)-1-氧杂环十七烷-10-烯-2-酮)。据报道,(12z)-1-氧杂环十七烷-12-烯-2-酮具有类似于黄葵籽的强烈环十五内酯样气味(参见U.S.6,255,276),因此是一种有吸引力的新型麝香香料。因此,在一个实施方案中,本发明能够经济高效且稳定地供应这种潜在的麝香香料的天然前体。
在本文的实施例9中,描述了ω-5-非天然不饱和α/ω-二羧酸((z5)1,16-十六碳烯二酸)的生产。该前体可以化学转化为类似于麝香酮香料的大环酮(方法参见例如,国际专利申请公开WO 2015/157719,其通过援引以其全文并入本文)。例如,使用脱羧化学,(z5)1,16-十六碳烯二酸可以转化为15元大环酮((5z)-环十五碳-5-烯-1-酮或(4z)-环十五碳-4-烯-1-酮)。后者被称为麝香香料环十五烯酮(exaltenone)。使用非脱羧化学,(z5)1,16-十六碳烯二酸可以转化为16元大环酮((6z)-环十六碳-6-烯-1-酮或(5Z)-环十六碳-5-烯-1-酮)。后者被称为麝香香料ambrettone(也称为环十六烯酮(velvione))。因此,在另一个实施方案中,本发明能够经济高效且稳定地供应这些商业麝香香料的天然前体。
实施例
提供以下实施例来进一步说明本文所披露的本发明,但不应将以下实施例解释为以任何方式限制其范围。
实施例1:小规模发酵
使用40μL LB培养物(来自在96孔板中生长的LB培养物)接种360μL LB培养基,然后在32℃下振荡孵育约4小时。使用80μL的LB种子接种320μL N-lim培养基(表1)。在32℃下生长2小时后,用异丙基β-d-1-硫代吡喃半乳糖苷(IPTG)(终浓度1mM)诱导培养物。然后将培养物在32℃下振荡孵育20小时(除非另有说明),然后将它们用下面详述的提取方案进行提取。
表1:N-lim培养基配方
*氨基乙酰丙酸仅在ω-羟基脂肪酸或α/ω-二酸为预期产物时添加
游离脂肪酸种类的提取及分析方案:
向每个待提取孔中添加30μL的12M HCl,然后在定量脂肪醇时添加含有500mg/L1-十一烷醇作为内标的400μL乙酸丁酯,或在定量脂肪酸或ω-羟基脂肪酸时添加含有500mg/L十一烷酸作为内标的400μL乙酸丁酯。然后将96孔板热封并以2000rpm振荡30分钟。振荡后,将板在室温下以4500rpm离心10分钟,以分离水层和有机层。将50μL有机层转移到96孔板中并用50uL TMS/BSTFA衍生化。随后将板热封并储存在-20℃下,直到通过GC-FID或GC-MS进行评估。
脂肪酸或ω-羟基脂肪酸分析:用于生成色谱图和质谱来进行化合物鉴定的GC-MS参数如下:
表2
样品体积 1μL
DB-1HT,10m x250μm x0.1μm
初始温度 50℃,持续5分钟
最终温度 300℃,保持5.24分钟
温度增加速率 25℃/分钟
总运行时间 24分钟
柱流速 1.2mL/min
入口温度 300℃
分流比 20∶1
分析软件 ChemStation E.02.01.1177
质谱参数显示于表3中。
表3
传输管温度 300℃
MS源温度 230℃
MS Quad温度 CombiPAL(CTC分析)
用于定量每种化合物的GC-FID参数显示于表4中。
表4
脂肪醇分析:用于定量每种化合物的GC-FID参数显示于表5中。
表5
以上详述的方案代表标准条件,可以根据需要对其进行修改。
细胞脂肪酸分析:
使菌株在Luria-Bertani(LB)培养基中生长过夜。细胞脂肪酸(即主要来自膜磷脂的脂肪酸)的提取和分析如下:收获10-20mL培养物,并使用在50%MeOH中的1mL的15%(W/V)NaOH在70℃下皂化1小时。将溶液冷却至室温,并通过浓HCl酸化至pH为1-2。然后使用涡旋器以2500rpm用乙酸丁酯提取酸性溶液5分钟。将提取物在Eppendorf离心机中以15000rpm在室温下离心5分钟。将有机层(100uL)移液到带插入物的GC小瓶中,通过添加100μL的N,O-双(三甲基甲硅烷基)三氟乙酰胺(BSTFA)和1%三甲基氯硅烷(TMCS)衍生化,并使用涡旋器混合30秒。然后将样品注入GC-MS以生成色谱图和质谱来进行化合物鉴定。GC-MS参数与以上表2和表3相同。
实施例2:新型Δ9-十四烷酰基-ACP去饱和酶的鉴定
本实施例描述了新型Δ9-十四烷酰基-ACP去饱和酶的发现。
来自天竺葵的叶绿体去饱和酶(DES_Pxho)(SEQ ID NO:1和2)(GenBank:AAC49421,UniProtKB-Q40879)是Δ9-十四烷酰基-ACP去饱和酶(见上文)。为了鉴定另一种Δ9-十四烷酰基-ACP并与DES_Pxho进行比较,对植物酰基-ACP去饱和酶[EC 1.14.19.2]家族进行了全面的生物信息学分析。虽然酰基-ACP去饱和酶的底物特异性和区域选择性不能从其一级序列中预测,但鉴定了20种具有未知底物特异性和未知区域选择性的推定的“非经典”酰基-ACP去饱和酶。这些没有被预测为经典的Δ9-硬脂酰基-ACP去饱和酶。经典的Δ9-硬脂酰基-ACP去饱和酶是所有植物中常见且必不可少的“管家”去饱和酶,在本分析中未考虑。
将20种未知植物酰基-ACP去饱和酶的基因针对大肠杆菌进行密码子优化,并在诱导型Ptrc启动子的控制下克隆到表达载体(p15a复制子、卡那霉素抗性标记)中。将20个质粒转化到大肠杆菌MG1655衍生菌株,这些质粒含有IPTG诱导型操纵子(具有来自蓝细菌(点状念珠藻(Nostoc punctiforme)PCC73102)的铁氧还蛋白还原酶(petH)(SEQ ID NO:3和4)(UniProtKB-B2IUI2)和铁氧还蛋白(petF)(SEQ ID NO:5和6)(UniProtKB-B2J405))。此外,该菌株携带第二质粒(SC101复制子、大观霉素抗性标记),该第二质粒含有在诱导型Ptrc启动子控制下的来自拟南芥的fatA硫酯酶基因(SEQ ID NO:7和8)(UniProtKB-Q42561)(质粒pAS.033)或来自热纤梭菌的硫酯酶基因(SEQ ID NO:9和10)(UniProtKB-A3DJY9)(质粒pAZ026)。
取决于所使用的硫酯酶质粒,菌株允许鉴定由FatA硫酯酶(来自质粒pAS.033)释放的主要C16链长饱和和不饱和游离脂肪酸或由硫酯酶梭菌(Clostridium thioesterase)(来自质粒pAZ026)释放的C12-C18链长饱和和不饱和游离脂肪酸的混合物。游离脂肪酸分泌到培养液中。
如实施例1中所述,对所有菌株从葡萄糖产生非天然mUFA(例如,z9-十四碳烯酸和z11-十六碳烯酸)的能力进行分析。使用z9-十四碳烯酸和z11-十六碳烯酸的可靠标准物对非天然脂肪酸进行峰鉴定,并通过其二甲基二硫醚(DMDS)加合物的GC/MS确认双键位置(参见Nichols等人1986,J.Microbiol.Methods[微生物学方法杂志]5:49-55)。图3A、3B、4A和4B分别显示了z9-十四碳烯酸和z11-十六碳烯酸在质谱和所得光谱下的碎裂。
当与空载体(即无去饱和酶)对照菌株相比时,表达20种“非经典”未知植物酰基-ACP去饱和酶中的一种导致非天然mUFA的产生。表6显示了对照菌株和携带来自葡萄的新型去饱和酶F6HB23_VITV(GenBank XP_002274652)(SEQ ID NO:11和12)和Δ9-十四烷酰基-ACP去饱和酶DES_Pxho的菌株的游离脂肪酸组成。
随着FatA硫酯酶的表达,该菌株中产生的唯一非天然不饱和脂肪酸是z11-十六碳烯酸。F6HB23_VITV产生的z11-十六碳烯酸占总脂肪酸的百分比为66%,而DES_Pxho产生的z11-十六碳烯酸占总脂肪酸的百分比为44%。
随着来自梭菌(Clostridium)的硫酯酶的表达,用DES_F6HB23_VITV产生的非天然mUFA为z9-十四碳烯酸(总脂肪酸的22%)和z11-十六碳烯酸(总脂肪酸的16%)。该数据表明,z11-十六碳烯酸是通过Δ9-十四烷酰基-ACP延长为Δ11-十六烯酰基-ACP(通过FabB和/或FabF酶)产生的,并且新型去饱和酶作用于十四烷酰基-ACP,而不是十六烷酰基-ACP。
该实施例显示,来自葡萄的去饱和酶F6HB23_VITV是新型Δ9-十四烷酰基-ACP去饱和酶,并且当与硫酯酶在大肠杆菌等变形菌门中共表达时产生ω-5mUFA,例如z9-十四碳烯酸和z11-十六碳烯酸。
表6:携带来自葡萄的新型去饱和酶F6HB23_VITV的菌株中产生的游离脂肪酸组成
实施例3:用于主要生产非天然ω-5不饱和脂肪酸衍生物的重组大肠杆菌菌株的构建
该实施例描述了重组变形菌门的构建,其主要含有非天然ω-5不饱和细胞脂肪酸(即,在其细胞质膜内)和仅痕量的天然ω-7不饱和细胞脂肪酸。当酰基-ACP硫酯酶或其他脂肪酸衍生酶(例如,酯合酶或酰基-ACP还原酶)共表达时,该菌株具有通过脂肪酸生物合成途径的高通量,并且适合于分泌的ω-5mUFA或其衍生物的高滴度生产。
该菌株是大肠杆菌MG1655的衍生物,其基因组如下进行工程化:将酰基-CoA脱氢酶(fadE)基因缺失并且使转录调节因子FadR的变体过表达。这两种修饰都是任选的。接下来,将由组成型PT5启动子控制的操纵子整合到染色体中,该操纵子含有来自天竺葵的Δ9-十四烷酰基-ACP去饱和酶基因(无质体靶向前导序列)(DES_Pxho)和来自点状念珠藻PCC73102的黄素氧还蛋白还原酶(fpr)(SEQID NO:13和14)(UniProtKB-P28861)和铁氧还蛋白(petF)(SEQID NO:5和6),随后还整合了由组成型PT5启动子控制的来自贝氏不动杆菌的3-羟基酰基-ACP脱水酶(FabZ)(SEQID NO 15和16)(UniProtKB-A0A0M1I0X8)的基因。接下来,转化含有在IPTG诱导型启动子控制下的DES_Pxho基因的质粒pIR.074(p15a复制子、卡那霉素抗性标记),产生菌株AA.827。
AA.827中的双羟基酰基-ACP脱水酶/异构酶FabA基因如下进行缺失:转化含有在组成型启动子的控制下的温度敏感型FabA基因(FabAts,参见Johnson和Greenberg 1975,J.Bacteriol[细菌学杂志].122:570-574)的质粒pXC.006(温度敏感型SC101*复制子、氨苄青霉素抗性标记)。接下来,在30℃的允许温度下,染色体FabA基因被缺失,即质粒pXC.006被维持并且FabAts酶起作用,随后在增加的非允许温度(42℃)下从菌株中消除(即去除)携带FabAts的质粒pXC.006,产生在所有温度下都缺乏FabA活性的菌株sAS.561。对菌株sAS.561进行了适应性进化,获得菌株sAS.571。
为了确定菌株产生非天然ω-5不饱和mUFA的能力,如实施例1中所述测定细胞脂肪酸的组成,并将其与具有完整FabA基因且没有去饱和酶基因的类似对照菌株(sZR.409)进行比较。如表7中所示,含有DES_Pxho基因但FabA基因完整的菌株AA.827的不饱和脂肪酸由约40%的非天然ω-5不饱和脂肪酸组成。含有DES_Pxho并且缺失FabA基因的菌株sAS.571的不饱和细胞脂肪酸主要(约95%)由非天然ω-5不饱和脂肪酸组成,其中86%是z11-十六碳烯酸,14%是z13-十八碳烯酸。有趣的是,sAS.571中细胞质膜的不饱和度百分比高于对照菌株中细胞质膜的不饱和度百分比。
这些结果表明,Δ9-十四烷酰基-ACP去饱和酶可以在功能上替换大肠杆菌等变形菌门中的3-羟基酰基-ACP脱水酶/异构酶FabA基因,并且当FabA基因被缺失时,主要产生ω-5mUFA例如z11-十六碳烯酸和z13-十八碳烯酸。由于该实施例中所述的重组菌株具有高通量脂肪酸生物合成途径,因此可用于以高滴度产生和分泌非天然ω-5mUFA及其衍生物。
表7:重组大肠杆菌菌株的细胞脂肪酸(CFA)组成
1饱和脂肪酸:不包括来自外膜脂多糖的3-羟基十四烷酸
2不饱和脂肪酸:包括环丙烷C17:0脂肪酸,其衍生自z9-十六碳烯酸
实施例4:通过重组大肠杆菌菌株的非天然ω5-不饱和游离脂肪酸的产生
该实施例显示,表达Δ9-十四烷酰基-ACP去饱和酶和硫酯酶的重组ΔFabA大肠杆菌菌株主要产生非天然ω-5mUFA和仅痕量的天然ω-7不饱和mUFA。
用含有诱导型Ptrc启动子和操纵子(具有来自拟南芥的fatA硫酯酶基因和天然FabBβ-酮脂酰-ACP合酶基因)的质粒pKM.023(SC101复制子、大观霉素抗性标记)转化菌株sAS.571(如实施例3中制备)。所得菌株为sAS.563。具有完整FabA基因且没有去饱和酶基因的对照菌株与实施例3中用质粒pKM.023转化的对照菌株(菌株AA.804)相同。
对菌株进行小规模发酵和产物分析,如实施例1中所述。如表8中所示,菌株sAS.563在32℃和37℃下产生超过2000mg/L游离脂肪酸,具有高度的不饱和度。评估了所有菌株产生非天然mUFA的能力。通过将z9-十四碳烯酸和z11-十六碳烯酸与可靠标准物在GC/MS中的保留时间和离子碎裂模式进行比较,对它们进行峰鉴定。如图3A至3B和4A至4B中所示,通过其二甲基二硫醚(DMDS)加合物的GC/MS确认了双键位置。z13-十八碳烯酸的峰鉴定基于其相对于天然z11-十八碳烯酸的预期保留时间和离子碎裂模式。
如表8中所示,sAS.563产生的约99%的不饱和脂肪酸在非天然ω-5位置具有双键,其中大部分为z11-十六碳烯酸,产生少量的z9-十四碳烯酸和z13-十八碳烯酸。
有趣的是,大肠杆菌对照菌株产生痕量的z11-十六碳烯酸,这在大肠杆菌MG1655野生型菌株中没有观察到。这可能归因于对照菌株中的高脂肪酸生物合成通量,使FabA不仅可以将反式-2-癸烯酰基-ACP(天然底物)异构化为顺式-3-癸烯酰基-ACP(天然ω-7mUFA的前体),而且还可以将反式-2-辛烯酰基-ACP(非天然底物)少量延伸为顺式-3-辛烯酰基-ACP(非天然ω-5mUFA的前体)。类似地,在没有质粒pKM.023的对照菌株的细胞级分中也发现了痕量的z11-十六碳烯酸(参见实施例3和表7)。
该实施例表明,表达Δ9-十四烷酰基-ACP去饱和酶的重组ΔFabA大肠杆菌菌株具有高通量脂肪酸生物合成途径,并且当与硫酯酶共表达时,以高滴度产生非天然ω-5不饱和脂肪酸,以及仅痕量的天然ω-7不饱和脂肪酸。除了较少量的z9-十四碳烯酸和z13-十八碳烯酸外,z11-十六碳烯酸是产生的主要非天然脂肪酸。
表8:重组大肠杆菌菌株的游离脂肪酸(FFA)的组成和滴度
实施例5:通过重组大肠杆菌菌株的ω-5不饱和脂肪醇的产生
该实施例显示,表达Δ9-十四烷酰基-ACP去饱和酶、硫酯酶和羧酸还原酶的重组ΔFabA大肠杆菌菌株主要产生ω-5不饱和脂肪醇(例如,z11-十六碳烯醇和z9-十四碳烯醇)和仅痕量的ω-7不饱和脂肪醇(例如,z9-十六碳烯醇)。
在菌株sAS.571(如实施例3中制备)中,通过用组成型PT5启动子替换entD的天然铁调节启动子来解除对染色体entD基因的调节。EntD是一种混杂的磷酸泛酰巯基乙胺基转移酶,在该菌株中用于翻译后修饰羧酸还原酶。所得菌株sAS.619分别用质粒pSVEN.250和pSVEN.251转化,得到菌株sven.1236和sven.1237。两种质粒(SC101复制子、大观霉素抗性标记)都含有两个操纵子:第一操纵子含有在诱导型Ptrc启动子的控制下的来自拟南芥的fatA硫酯酶基因和FabBβ-酮脂酰-ACP合酶基因;第二操纵子含有在诱导型PT5启动子控制下来自耻垢分枝杆菌的carB羧酸还原酶基因(SEQ ID NO:17和18)(UniProtKB-A0A653FCI4)和来自贝氏不动杆菌的alrA醇脱氢酶基因(SEQ ID NO:19和20)(UniProtKB-Q6F6R9)。第一操纵子在质粒pSVEN.250中的表达高于pSVEN.251中的表达。该实验使用了具有完整FabA基因且没有去饱和酶的类似对照菌株(菌株sOW.006)。
对菌株进行小规模发酵和产物分析,如实施例1中所述。没有非天然ω-5不饱和脂肪醇的可靠标准物。峰鉴定基于其相对于天然ω-7不饱和脂肪醇的预期保留时间和离子碎裂模式。如表9中所示,两种菌株sven.1236和sven.1237均产生大量的z11-十六碳烯醇(约800mg/L)以及z9-十四碳烯醇(41-123mg/L),两种菌株仅产生痕量的具有天然ω-7双键的相应不饱和脂肪醇(z9-十六碳烯醇)。相比之下,对照菌株产生大量的z9-十六碳烯醇(约1400mg/1)和仅很少的z11-十六碳烯醇。
该实施例表明,表达Δ9-十四烷酰基-ACP去饱和酶的重组ΔFabA大肠杆菌菌株具有高通量脂肪酸生物合成途径,并且当与硫酯酶和羧酸还原酶共表达时,以高滴度产生ω5-不饱和脂肪醇,和仅痕量的ω7-不饱和脂肪醇。除了较少量的z9-十四碳烯醇外,z11-十六碳烯醇是产生的主要脂肪醇。
表9:重组大肠杆菌菌株的脂肪醇(FALC)的组成和滴度
实施例6:通过重组大肠杆菌菌株的ω-5不饱和ω-羟基脂肪酸的产生
该实施例显示,表达Δ9-十四烷酰基-ACP去饱和酶、硫酯酶和ω-羟化酶的重组ΔFabA大肠杆菌菌株主要产生ω-5不饱和ω-羟基脂肪酸(例如,(z11)-16-羟基十六碳烯酸)和仅痕量的ω-7不饱和ω-羟基脂肪酸(例如,(z9)-16-羟基十六碳烯酸)。
菌株sAS.571(参见实施例3)用质粒pKM.010转化,该质粒是质粒pKM.023(SC101复制子、大观霉素抗性标记)(参见实施例4)的衍生物,其除了fatA硫酯酶和FabBβ-酮脂酰-ACP合酶操纵子外,还含有在诱导型PT5启动子的控制下的杂交融合Cyp153-RhFω-羟化酶(SEQ ID NO:22和23)。所得菌株为sAS.583。
对菌株进行小规模发酵和产物分析,如实施例1中所述。没有ω-5不饱和ω-羟基脂肪酸的可靠标准物。峰鉴定基于相对于天然ω-7不饱和ω-羟基脂肪酸的预期保留时间和GC/MS碎裂模式进行。此外,如图5A-5B中所示,(z11)-16-羟基十六碳烯酸的双键位置通过其二甲基二硫醚(DMDS)加合物的GC/MS确以。
菌株sAS.583产生390mg/L的ω-羟基脂肪酸和40mg/L的游离脂肪酸。ω-羟基脂肪酸由12mg/L(z9)-14-羟基十四碳烯酸、41mg/L 14-羟基十四烷酸、211mg/L(z11)-16-羟基十六碳烯酸和126mg/L 16-羟基十六烷酸组成。该菌株仅产生痕量的(z9)-16-羟基十六碳烯酸。
该实施例表明,表达Δ9-十四烷酰基-ACP去饱和酶的重组ΔFabA大肠杆菌菌株具有高通量脂肪酸生物合成途径,并且当与硫酯酶和ω-羟化酶共表达时,产生非天然ω-5不饱和ω-羟基脂肪酸和仅痕量的天然ω-7不饱和ω-羟基脂肪酸。除了较少量的(z9)-14-羟基十四碳烯酸外,(z11)-16-羟基十六碳烯酸是产生的主要ω-羟基脂肪酸。
当(z11)-16-羟基十六碳烯酸进行化学内酯化时,产生(12z)-1-氧杂环十七烷-12-烯-2-酮,其结构上类似于麝香香料,例如黄葵内酯((8z)-1-氧杂环十七烷-8-烯-2-酮)、顺式异黄葵内酯((10z)-1-氧杂环十七烷-10-烯-2-酮)或异黄葵内酯((10e)-1-氧杂环十七烷-10-烯-2-酮)(参见例如,国际专利申请公开WO 2015/157719 A9)。
实施例7:通过重组大肠杆菌菌株的ω-5不饱和脂肪醇乙酸酯的产生
表达Δ9-十四烷酰基-ACP去饱和酶、硫酯酶、羧酸还原酶和乙酰-CoA转移酶的重组ΔFabA大肠杆菌菌株预计主要产生非天然ω-5不饱和脂肪醇乙酸酯(z11-十六碳烯基乙酸酯、z9-十四碳烯基乙酸酯和z13-十八碳烯基乙酸酯)和仅痕量的天然ω-7不饱和脂肪醇乙酸酯(例如z9-十六碳烯基乙酸酯)。
将编码乙酰-CoA转移酶[EC 2.3.1.84]的基因,例如来自酿酒酵母(Saccharomyces cerevisiae)的Atf1(SEQ ID NO:23和24)(UniProtKB-Q6XBT3)(在诱导型或组成型启动子的控制下)整合到菌株sAS.619的染色体中(如实施例5中制备)。所得菌株分别用质粒pSVEN.250和pSVEN.251(参见实施例5)或用类似的质粒转化。
对菌株进行小规模发酵,并如实施例1中所述进行产物分析。重组变形菌门预计产生非天然ω-5-不饱和脂肪醇乙酸酯(z11-十六碳烯基乙酸酯、z9-十四碳烯基乙酸酯和/或z13-十八碳烯基乙酸酯)和仅痕量的天然ω7-不饱和脂肪醇乙酸酯(例如z9-十六碳烯基乙酸酯)。
实施例8:通过缺失醇脱氢酶基因的重组大肠杆菌菌株的ω-5不饱和脂肪醛的产生
在醇脱氢酶和/或醛还原酶基因中具有多个缺失并且表达Δ9-十四烷酰基-ACP去饱和酶、硫酯酶和羧酸还原酶的重组ΔFabA大肠杆菌菌株预计主要产生非天然ω-5不饱和脂肪醛(例如,z11-十六碳烯醛、z9-十四碳烯醛和z13-十八碳烯醛)和仅痕量的天然ω-7不饱和脂肪醛(例如,z9-十六碳烯醛)。
通过从第二操纵子中缺失AlrA基因对质粒pSVEN.250和pSVEN.251(如实施例5中制备)或类似的质粒进行修饰。通过缺失或减弱yjgB、yahK、ybbO、YqhD、AdhP、EutG、YiaY、BetA、FucO、DkgA、YghA、GldA或AdhE基因中的一个或多个对菌株sAS.619(参见实施例5)进行修饰。将所得菌株用经修饰的质粒转化,并如实施例1中所述进行小规模发酵和产物分析。重组变形菌门预计主要产生非天然ω-5不饱和脂肪醛(例如,z11-十六碳烯醛、z9-十四碳烯醛和/或z13-十八碳烯醛)和仅痕量的天然ω-7不饱和脂肪醛(例如,z9-十六碳烯醛)。
实施例9:通过重组大肠杆菌菌株的ω-5不饱和α/ω-二羧酸的产生
表达Δ9-十四烷酰基-ACP去饱和酶、硫酯酶、ω-羟化酶和一种或两种异源脱氢酶(醇脱氢酶和醛脱氢酶)的重组ΔFabA大肠杆菌菌株预计主要产生非天然ω-5不饱和α/ω-二羧酸(例如,(z5)1,16-十六碳烯二酸、(z5)1,14-十四碳烯二酸和/或(z5)1,18-十八碳烯二酸)和仅痕量的天然ω-7不饱和α/ω-二羧酸(例如,(z7)1,16-十六碳烯二酸)。
将编码醇脱氢酶(例如,来自食油假单胞菌(Pseudomonas oleovorans)的UniProtKB-Q00593;SEQ ID NO:29)和醛脱氢酶(例如,来自贝氏不动杆菌的UniProtKB-Q6FAS2,SEQ ID NO:30)的两个基因(在诱导型或组成型启动子的控制下)整合到菌株sAS.619的染色体中(如实施例5中制备)。将所得菌株用质粒pKM.010(参见实施例5)或类似的质粒转化,并如实施例1中所述进行小规模发酵和产物分析。重组变形菌门预计主要产生非天然ω-5不饱和α/ω-二羧酸(例如,(z11)1,16-十六碳烯二酸、(z5)1,14-十四碳烯二酸和/或(z5)1,18-十八碳烯二酸)和仅痕量的天然ω-7不饱和α/ω-二羧酸(例如,(z7)1,16-十六碳烯二酸)。
ω-5不饱和α/ω-二羧酸可以化学转化为类似于麝香酮香料的大环酮(参见例如,国际专利申请公开WO 2015/157719A9)。例如,使用脱羧化学,(z5)1,16-十六碳烯二酸可以转化为15元大环酮((5z)-环十五碳-5-烯-1-酮或(4z)-环十五碳-4-烯-1-酮)。后者也被称为环十五烯酮。使用非脱羧化学,(z5)1,16-十六碳烯二酸可以转化为16元大环酮((6Z)-环十六碳-6-烯-1-酮或(5Z)-环十六碳-5-烯-1-酮)。后者也被称为ambrettone或环十六烯酮。
实施例10:通过表达酰基-ACP还原酶的重组大肠杆菌菌株的ω-5不饱和脂肪醇的产生
表达Δ9-十四烷酰基-ACP去饱和酶、酰基-ACP还原酶和醇脱氢酶的重组ΔFabA大肠杆菌菌株主要产生非天然ω-5不饱和脂肪醛和脂肪醇(例如,z11-十六碳烯醛和z11-十六碳烯醇)和仅痕量的ω-7不饱和脂肪醛和脂肪醇(例如,z9-十六碳烯醛和z9-十六碳烯醇)。
将菌株sAS.571(如实施例3中制备)用类似于pKM.023的质粒(如实施例4中制备)转化,其中FatA硫酯酶基因被替换为来自细长聚球藻的AAR酰基-ACP还原酶基因(SEQ IDNO:34和35)(UniProtKB-Q54765)和任选地来自贝氏不动杆菌的alrA醇脱氢酶基因(SEQ IDNO:19和20)(UniProtKB-Q6F6R9)。
对所得菌株进行小规模发酵和产物分析,如实施例1中所述。重组变形菌门主要产生非天然ω-5不饱和脂肪醛和脂肪醇,例如z9-十四碳烯醛、z11-十六碳烯醛、z13-十四碳烯醛、z9-十四碳烯醇、z11-十六碳烯醇和z13-十四碳烯醇,和仅痕量的ω-7不饱和脂肪醛和脂肪醇(例如,z9-十六碳烯醛和z9-十六碳烯醇)。
实施例11:通过表达酰基-ACP还原酶的重组大肠杆菌菌株的ω-5不饱和脂肪醇乙酸酯的产生
表达Δ9-十四烷酰基-ACP去饱和酶、酰基-ACP还原酶、醇脱氢酶和乙酰-CoA转移酶的重组ΔFabA大肠杆菌菌株主要产生非天然ω-5不饱和脂肪醇乙酸酯(例如,z11-十六碳烯基乙酸酯)和仅痕量的ω-7不饱和脂肪醇乙酸酯(例如,z9-十六碳烯基乙酸酯)。
将编码乙酰-CoA转移酶[EC 2.3.1.84]的基因,例如来自酿酒酵母的Atf1(SEQ IDNO:23和24)(UniProtKB-Q6XBT3)(在诱导型或组成型启动子的控制下)整合到菌株sAS.571的染色体中(如实施例3中制备)。将所得菌株用实施例10中制备的含有AAR酰基-ACP还原酶的质粒转化。
对所得菌株进行小规模发酵和产物分析,如实施例1中所述。重组变形菌门产生非天然ω-5-不饱和脂肪醇乙酸酯(如z11-十六碳烯基乙酸酯、z9-十四碳烯基乙酸酯和/或z13-十八碳烯基乙酸酯)和仅痕量的天然ω7-不饱和脂肪醇乙酸酯(例如z9-十六碳烯基乙酸酯)。
实施例12:通过重组大肠杆菌菌株的非天然ω5-不饱和z9-十四碳烯酸的产生
该实施例显示,表达Δ9-十四烷酰基-ACP去饱和酶和来自热纤梭菌的硫酯酶(UniProtKB-A3DJY9)的重组ΔFabA大肠杆菌菌株主要产生非天然ω-5不饱和z9-十四碳烯酸和仅痕量的天然ω-7不饱和z7-十四碳烯酸。
将菌株sAS.571的fabB基因的染色体拷贝(如实施例3中制备)替换为fabB的变体,产生菌株ECKh-16885。将菌株用含有来自热纤梭菌的硫酯酶基因(在诱导型Ptrc启动子的控制下)的质粒pG_21306(SC101复制子、大观霉素抗性标记)转化。所得菌株为L29426。
对菌株L29426进行小规模发酵和产物分析,如实施例1中所述。如表10中所示,菌株L29426在32℃下产生285mg/L的游离脂肪酸,其具有高含量的C14脂肪酸(68%)。
如表10中所示,L29426产生的100%不饱和脂肪酸在非天然ω-5位置具有双键,其中大部分为z9-十四碳烯酸和少量的z11-十六碳烯酸。通过将z9-十四碳烯酸和z11-十六碳烯酸与可靠标准物在GC/MS中的保留时间和离子碎裂模式进行比较,对它们进行峰鉴定。
该实施例表明,表达Δ9-十四烷酰基-ACP去饱和酶的重组ΔFabA大肠杆菌菌株,当与对C14链长的酰基-ACP具有高特异性的酰基-ACP硫酯酶(例如来自热纤梭菌TEA3DJY9)共表达时,主要产生非天然ω-5不饱和C14脂肪酸和仅痕量的天然ω-7不饱和C14脂肪酸。
表10:重组大肠杆菌菌株的游离脂肪酸(FFA)的组成和滴度
实施例13:通过重组大肠杆菌菌株的ω-5不饱和z9-十四碳烯醇的产生
该实施例显示,表达Δ9-十四烷酰基-ACP去饱和酶、来自热纤梭菌的硫酯酶(UniProtKB-A3DJY9)和羧酸还原酶的重组ΔFabA大肠杆菌菌株主要产生ω-5不饱和z9-十四碳烯醇和仅痕量的ω-7不饱和z7-十四碳烯醇。
将菌株sAS.619的fabB基因的染色体拷贝(如实施例5中制备)替换为fabB的变体。将所得菌株用含有来自热纤梭菌的硫酯酶基因(在诱导型Ptrc启动子的控制下)和含有第二操纵子(具有来自耻垢分枝杆菌的carB羧酸还原酶基因(SEQ ID NO:17和18)(UniProtKB-A0A653FCI4)和来自贝氏不动杆菌的alrA醇脱氢酶基因(SEQ ID NO:19和20)(UniProtKB-Q6F6R9)(在诱导型PT5启动子的控制下))的质粒(SC 101复制子、大观霉素抗性标记)转化。
对菌株进行小规模发酵和产物分析,如实施例1中所述。该菌株预计主要产生C14脂肪酸衍生物。该菌株预计主要产生ω-5不饱和z9-十四碳烯醇和仅痕量的ω-7不饱和z7-十四碳烯醇。
实施例14:通过具有减弱的FabA的重组大肠杆菌菌株的ω-5不饱和脂肪醇的产生
该实施例显示,表达Δ9-十四烷酰基-ACP去饱和酶、硫酯酶和羧酸还原酶的具有减弱的FabA的重组大肠杆菌菌株产生ω-5不饱和脂肪醇(例如,z9-十四碳烯醇、z11-十六碳烯醇和z13-十八碳烯醇)和ω-7不饱和脂肪醇(例如,z7-十四碳烯醇、z9-十六碳烯醇和z11-十八碳烯醇)的混合物。
该菌株是大肠杆菌MG1655的衍生物,其基因组如下进行工程化:将酰基-CoA脱氢酶(fadE)基因缺失并且使转录调节因子FadR的变体过表达。这两种修饰都是任选的。由组成型PT5启动子控制的操纵子被整合到染色体中,该操纵子含有来自天竺葵的Δ9-十四烷酰基-ACP去饱和酶基因(无质体靶向前导序列)(DES_Pxho)和来自点状念珠藻PCC73102的黄素氧还蛋白还原酶(fpr)(SEQ ID NO:13和14)(UniProtKB-P28861)和铁氧还蛋白(petF)(SEQ ID NO:5和6)。另外,通过用组成型PT5启动子替换entD的天然铁调节启动子来解除对染色体entD基因的调节。任选地,还整合了由组成型PT5启动子控制的来自贝氏不动杆菌的3-羟基酰基-ACP脱水酶(FabZ)(SEQ ID NO:15和16)(UniProtKB-A0A0M1I0X8)的基因。
双羟基酰基-ACP脱水酶/异构酶fabA基因如下进行减弱:将控制FabA转录或翻译起始的天然启动子或RBS修饰或替换为较弱的合成启动子或RBS,或将FabA起始密码子从ATG改变为GTG或TTG,或者将天然fabA基因替换为编码活性较低或稳定性较差的改变的FabA蛋白变体的fabA基因,例如FabAts(参见Johnson和Greenberg 1975,J.Bacteriol[细菌学杂志].122:570-574),或其组合。
将所得重组菌株用质粒pSVEN.250或pS VEN.251(参见实施例5)或含有来自拟南芥的fatA硫酯酶基因、FabB β-酮脂酰-ACP合酶基因、来自耻垢分枝杆菌的carB羧酸还原酶基因(SEQ ID NO:17和18)(UniProtKB-A0A653FCI4)和来自贝氏不动杆菌的alrA醇脱氢酶基因(SEQ ID NO:19和20)(UniProtKB-Q6F6R9)的类似表达质粒转化。
对菌株进行小规模发酵和产物分析,如实施例1中所述。测量ω-5和ω-7不饱和脂肪醇,例如z9-十四碳烯醇、z11-十六碳烯醇、z13-十八碳烯醇、z7-十四碳烯醇、z9-十六碳烯醇和z11-十八碳烯醇。取决于FabA减弱的水平,菌株产生的ω-5不饱和脂肪醇可以比ω-7不饱和脂肪醇更多,例如90%的ω-5不饱和脂肪醇和10%的ω-7不饱和脂肪醇(例如80%的z11-十六碳烯醇和10%的z13-十八碳烯醇和10%的z9-十六碳烯醇)。
本文引用的所有参考文献,包括出版物、专利申请和专利,特此通过援引并入,其程度如同每个参考文献被单独且明确指示以其全文通过援引并入本文并在本文中阐述一样。
本文描述了本发明的特定实施方案,包括诸位发明人已知的用于实施本发明的最佳模式。在阅读前述说明之后,那些特定实施方案的变型对于本领域普通技术人员而言将变得显而易见。诸位发明人期望熟练的技术人员适当地采用此类变型,并且诸位发明人打算以不同于本文具体描述的方式来实践本发明。因此,本发明包括如适用法律允许的所附权利要求书中陈述的主题的所有修改和等同物。此外,本发明涵盖以上描述的要素在其所有可能的变体中的任意组合,除非另外在本文中指出或另外明确地与上下文相矛盾。
序列表
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
/>
序列表
<110> 基因组股份公司
安德烈亚斯•席尔默
艾琳•佩里
A•I•拉默斯-索利斯
安杰莉卡•扎巴拉-保蒂斯塔
<120> 细菌中非天然单不饱和脂肪酸的产生
<130> XCH/HOLI/HDPLW-25403
<150> 63/167,355
<151> 2021-03-29
<160> 35
<170> PatentIn 3.5版
<210> 1
<211> 1056
<212> DNA
<213> 天竺葵(Pelargonium x hortorum)
<400> 1
atggcttcta cctctatctc taaagttaac cacatccgta aagttggtgt taccggtgtt 60
atggctccgc agaaaatcga aatcttcaaa tctatggaag aatggggtaa acacaacatc 120
ctgccgctgg ctaaaccggt tgaaaaatct tggcagccga ccgacttcct gccggacccg 180
tcttctgaag gtttcatgga agaatacaac gctttcaaag aacgtacccg tgaactgccg 240
gacgaatact tcgttgttct ggctggtgac atgatcaccg aagaagctct gccgacctac 300
cagaccctgg ttaaccgtcc ggacgaagtt gctgacgaaa ccggtcactc tgaatctccg 360
tgggctgttt ggtctcgtgc ttggaccgct gaagaaaacc gtcacggtga cctgctgaac 420
aaatacctgt acctgtctgg taaactggac atgcgtcagg ttgaaaaaac catccagtac 480
ctgatcgctc tgggtcagga catcggtacc gaaaaaaacc cgtaccacct gttcatctac 540
acctctttcc aggaacgtgc taccttcatc tctcacgcta acaccgctaa actggctcag 600
cagcacggtg acaaacagct ggctcagatc tgcggtacca tcgctgctga cgaaaaacgt 660
cacgaaaccg cttacacccg tatcgttgac aaactgttcg aactggaccc ggacgaaacc 720
atgtcttgcc tggctcacat gatgaaacgt aaaatcacca tgccggctca cctgatgcgt 780
gacggtcgtg acccgcacct gttccagcac ttctctgtgg ttgcttctcg taccggtgtt 840
tacaccgtta tggactacat caacatcctg gaacacttcg ttgaaaaatg gaacatcgaa 900
aaaatcaccg ctggtctgtc tgacaaaggt cgtgaagctc aggactacgt ttgcaaactg 960
ggtgaacgtc tgcgtaaagt tgaagaacgt gctcaccagc gtgttgttca ggctgacccg 1020
atcccgttct cttggatctt cgaccgtaaa gtttaa 1056
<210> 2
<211> 351
<212> PRT
<213> 天竺葵(Pelargonium x hortorum)
<400> 2
Met Ala Ser Thr Ser Ile Ser Lys Val Asn His Ile Arg Lys Val Gly
1 5 10 15
Val Thr Gly Val Met Ala Pro Gln Lys Ile Glu Ile Phe Lys Ser Met
20 25 30
Glu Glu Trp Gly Lys His Asn Ile Leu Pro Leu Ala Lys Pro Val Glu
35 40 45
Lys Ser Trp Gln Pro Thr Asp Phe Leu Pro Asp Pro Ser Ser Glu Gly
50 55 60
Phe Met Glu Glu Tyr Asn Ala Phe Lys Glu Arg Thr Arg Glu Leu Pro
65 70 75 80
Asp Glu Tyr Phe Val Val Leu Ala Gly Asp Met Ile Thr Glu Glu Ala
85 90 95
Leu Pro Thr Tyr Gln Thr Leu Val Asn Arg Pro Asp Glu Val Ala Asp
100 105 110
Glu Thr Gly His Ser Glu Ser Pro Trp Ala Val Trp Ser Arg Ala Trp
115 120 125
Thr Ala Glu Glu Asn Arg His Gly Asp Leu Leu Asn Lys Tyr Leu Tyr
130 135 140
Leu Ser Gly Lys Leu Asp Met Arg Gln Val Glu Lys Thr Ile Gln Tyr
145 150 155 160
Leu Ile Ala Leu Gly Gln Asp Ile Gly Thr Glu Lys Asn Pro Tyr His
165 170 175
Leu Phe Ile Tyr Thr Ser Phe Gln Glu Arg Ala Thr Phe Ile Ser His
180 185 190
Ala Asn Thr Ala Lys Leu Ala Gln Gln His Gly Asp Lys Gln Leu Ala
195 200 205
Gln Ile Cys Gly Thr Ile Ala Ala Asp Glu Lys Arg His Glu Thr Ala
210 215 220
Tyr Thr Arg Ile Val Asp Lys Leu Phe Glu Leu Asp Pro Asp Glu Thr
225 230 235 240
Met Ser Cys Leu Ala His Met Met Lys Arg Lys Ile Thr Met Pro Ala
245 250 255
His Leu Met Arg Asp Gly Arg Asp Pro His Leu Phe Gln His Phe Ser
260 265 270
Val Val Ala Ser Arg Thr Gly Val Tyr Thr Val Met Asp Tyr Ile Asn
275 280 285
Ile Leu Glu His Phe Val Glu Lys Trp Asn Ile Glu Lys Ile Thr Ala
290 295 300
Gly Leu Ser Asp Lys Gly Arg Glu Ala Gln Asp Tyr Val Cys Lys Leu
305 310 315 320
Gly Glu Arg Leu Arg Lys Val Glu Glu Arg Ala His Gln Arg Val Val
325 330 335
Gln Ala Asp Pro Ile Pro Phe Ser Trp Ile Phe Asp Arg Lys Val
340 345 350
<210> 3
<211> 921
<212> DNA
<213> 点状念珠藻(Nostoc punctiforme)
<400> 3
atgactcaag cgaaagccaa aaaagaccac ggtgacgttc ctgttaacac ttaccgtccc 60
aatgctccat ttattggcaa ggtaatatct aatgaaccat tagtcaaaga aggtggtatt 120
ggtattgttc aacaccttaa atttgaccta tctggtgggg atttgaagta tatagaaggt 180
caaagtattg gcattattcc gccaggttta gacaagaacg gcaagcctga aaaactcaga 240
ctatattcca tcgcctcaac tcgtcatggt gatgatgtag atgataagac agtatcactg 300
tgcgtccgcc agttggagta caagcaccca gaaactggcg aaacagtcta cggtgtttgc 360
tctacgcacc tgtgtttcct caagccaggg gaagaggtaa aaattacagg gcctgtgggt 420
aaggaaatgt tgttacccaa tgaccctgat gctaatgtta tcatgatggc tactggaaca 480
ggtattgcgc cgatgcgggc ttacttgtgg cgtcagttta aagatgcgga aagagcggct 540
aacccagaat accaatttaa aggattctct tggctaatat ttggcgtacc tacaactcca 600
aaccttttat ataaggaaga actggaagag attcaacaaa aatatcctga gaacttccgc 660
ctaactgctg ccatcagccg cgaacagaaa aatccccaag gcggtagaat gtatattcaa 720
gaccgcgtag cagaacatgc tgatgaattg tggcagttga ttaaaaatga aaaaacccac 780
acttacattt gcggtttgcg cggtatggaa gaaggtattg atgcagcctt aactgctgct 840
gctgctaagg aaggcgtaac ctggagtgat taccagaagc aactcaagaa agccggtcgc 900
tggcacgtag aaacttacta a 921
<210> 4
<211> 306
<212> PRT
<213> 点状念珠藻(Nostoc punctiforme)
<400> 4
Met Thr Gln Ala Lys Ala Lys Lys Asp His Gly Asp Val Pro Val Asn
1 5 10 15
Thr Tyr Arg Pro Asn Ala Pro Phe Ile Gly Lys Val Ile Ser Asn Glu
20 25 30
Pro Leu Val Lys Glu Gly Gly Ile Gly Ile Val Gln His Leu Lys Phe
35 40 45
Asp Leu Ser Gly Gly Asp Leu Lys Tyr Ile Glu Gly Gln Ser Ile Gly
50 55 60
Ile Ile Pro Pro Gly Leu Asp Lys Asn Gly Lys Pro Glu Lys Leu Arg
65 70 75 80
Leu Tyr Ser Ile Ala Ser Thr Arg His Gly Asp Asp Val Asp Asp Lys
85 90 95
Thr Val Ser Leu Cys Val Arg Gln Leu Glu Tyr Lys His Pro Glu Thr
100 105 110
Gly Glu Thr Val Tyr Gly Val Cys Ser Thr His Leu Cys Phe Leu Lys
115 120 125
Pro Gly Glu Glu Val Lys Ile Thr Gly Pro Val Gly Lys Glu Met Leu
130 135 140
Leu Pro Asn Asp Pro Asp Ala Asn Val Ile Met Met Ala Thr Gly Thr
145 150 155 160
Gly Ile Ala Pro Met Arg Ala Tyr Leu Trp Arg Gln Phe Lys Asp Ala
165 170 175
Glu Arg Ala Ala Asn Pro Glu Tyr Gln Phe Lys Gly Phe Ser Trp Leu
180 185 190
Ile Phe Gly Val Pro Thr Thr Pro Asn Leu Leu Tyr Lys Glu Glu Leu
195 200 205
Glu Glu Ile Gln Gln Lys Tyr Pro Glu Asn Phe Arg Leu Thr Ala Ala
210 215 220
Ile Ser Arg Glu Gln Lys Asn Pro Gln Gly Gly Arg Met Tyr Ile Gln
225 230 235 240
Asp Arg Val Ala Glu His Ala Asp Glu Leu Trp Gln Leu Ile Lys Asn
245 250 255
Glu Lys Thr His Thr Tyr Ile Cys Gly Leu Arg Gly Met Glu Glu Gly
260 265 270
Ile Asp Ala Ala Leu Thr Ala Ala Ala Ala Lys Glu Gly Val Thr Trp
275 280 285
Ser Asp Tyr Gln Lys Gln Leu Lys Lys Ala Gly Arg Trp His Val Glu
290 295 300
Thr Tyr
305
<210> 5
<211> 300
<212> DNA
<213> 点状念珠藻(Nostoc punctiforme)
<400> 5
atgccaactt ataaagtgac actaattaac gaggctgaag ggctgaacac aacccttgat 60
gttgaggacg atacctatat tctagacgca gctgaagaag ctggtattga cctgccctac 120
tcttgccgcg ctggtgcttg ctctacttgt gcaggtaaac tcgtatcagg taccgtcgat 180
caaggcgatc aatcattctt agatgacgat caaatagaag ctggatatgt actgacctgt 240
gttgcttacc caacttctaa tgtcacgatc gaaactcaca aagaagaaga actctattaa 300
<210> 6
<211> 99
<212> PRT
<213> 点状念珠藻(Nostoc punctiforme)
<400> 6
Met Pro Thr Tyr Lys Val Thr Leu Ile Asn Glu Ala Glu Gly Leu Asn
1 5 10 15
Thr Thr Leu Asp Val Glu Asp Asp Thr Tyr Ile Leu Asp Ala Ala Glu
20 25 30
Glu Ala Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ala Cys Ser
35 40 45
Thr Cys Ala Gly Lys Leu Val Ser Gly Thr Val Asp Gln Gly Asp Gln
50 55 60
Ser Phe Leu Asp Asp Asp Gln Ile Glu Ala Gly Tyr Val Leu Thr Cys
65 70 75 80
Val Ala Tyr Pro Thr Ser Asn Val Thr Ile Glu Thr His Lys Glu Glu
85 90 95
Glu Leu Tyr
<210> 7
<211> 939
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 7
atggctgttg tatctgctga tcaaggtagt gtggttcaag gtttggctac tctcgcggat 60
cagctccgat taggtagttt gactgaagat ggtttatctt ataaagagaa gtttgttgtt 120
agatcttacg aagtgggtag taacaaaacc gctactgttg aaaccattgc taatctttta 180
caggaggtgg gatgtaatca tgcacaaagt gttggttttt cgactgatgg gtttgcaaca 240
acaactacta tgaggaagtt gcatctcatt tgggttactg cgagaatgca tatcgagatc 300
tataagtacc ctgcttgggg tgatgtggtt gagatagaga cttggtgtca gagtgaagga 360
aggattggga caaggcgtga ttggattctt aaggattctg tcactggtga agtcactggc 420
cgtgctacaa gcaagtgggt gatgatgaac caagacacga gacggcttca gaaagtttct 480
gatgatgttc gggacgagta cttggtcttc tgtcctcaag aaccgaggtt agcatttccg 540
gaagagaata accgtagctt gaagaaaatc ccgaaactcg aagatccggc tcagtattca 600
atgattgggc ttaagcctag acgagctgat ctcgacatga accagcatgt caataatgtc 660
acctatattg gatgggttct ggagagcata ccacaagaaa ttgtagacac gcacgagctt 720
caggtcataa ctctggatta tagaagagaa tgtcaacaag acgatgtggt ggattcactc 780
accaccacca cctctgaaat tggtggaacc aatggctctg ccacgtctgg cacacagggc 840
cacaacgata gccagttctt gcacctcctg aggttgtctg gagatggtca ggagatcaac 900
cgcgggacaa ctctgtggag aaagaagcct tcaagttaa 939
<210> 8
<211> 312
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 8
Met Ala Val Val Ser Ala Asp Gln Gly Ser Val Val Gln Gly Leu Ala
1 5 10 15
Thr Leu Ala Asp Gln Leu Arg Leu Gly Ser Leu Thr Glu Asp Gly Leu
20 25 30
Ser Tyr Lys Glu Lys Phe Val Val Arg Ser Tyr Glu Val Gly Ser Asn
35 40 45
Lys Thr Ala Thr Val Glu Thr Ile Ala Asn Leu Leu Gln Glu Val Gly
50 55 60
Cys Asn His Ala Gln Ser Val Gly Phe Ser Thr Asp Gly Phe Ala Thr
65 70 75 80
Thr Thr Thr Met Arg Lys Leu His Leu Ile Trp Val Thr Ala Arg Met
85 90 95
His Ile Glu Ile Tyr Lys Tyr Pro Ala Trp Gly Asp Val Val Glu Ile
100 105 110
Glu Thr Trp Cys Gln Ser Glu Gly Arg Ile Gly Thr Arg Arg Asp Trp
115 120 125
Ile Leu Lys Asp Ser Val Thr Gly Glu Val Thr Gly Arg Ala Thr Ser
130 135 140
Lys Trp Val Met Met Asn Gln Asp Thr Arg Arg Leu Gln Lys Val Ser
145 150 155 160
Asp Asp Val Arg Asp Glu Tyr Leu Val Phe Cys Pro Gln Glu Pro Arg
165 170 175
Leu Ala Phe Pro Glu Glu Asn Asn Arg Ser Leu Lys Lys Ile Pro Lys
180 185 190
Leu Glu Asp Pro Ala Gln Tyr Ser Met Ile Gly Leu Lys Pro Arg Arg
195 200 205
Ala Asp Leu Asp Met Asn Gln His Val Asn Asn Val Thr Tyr Ile Gly
210 215 220
Trp Val Leu Glu Ser Ile Pro Gln Glu Ile Val Asp Thr His Glu Leu
225 230 235 240
Gln Val Ile Thr Leu Asp Tyr Arg Arg Glu Cys Gln Gln Asp Asp Val
245 250 255
Val Asp Ser Leu Thr Thr Thr Thr Ser Glu Ile Gly Gly Thr Asn Gly
260 265 270
Ser Ala Thr Ser Gly Thr Gln Gly His Asn Asp Ser Gln Phe Leu His
275 280 285
Leu Leu Arg Leu Ser Gly Asp Gly Gln Glu Ile Asn Arg Gly Thr Thr
290 295 300
Leu Trp Arg Lys Lys Pro Ser Ser
305 310
<210> 9
<211> 762
<212> DNA
<213> 热纤梭菌(Clostridium thermocellum)
<400> 9
atgcagaaga aaagattttc aaagaagtat gaagtacatt actacgaaat caactcaatg 60
caggaagcaa ctcttctctc cctgctaaac tatatggagg actgcgcaat atcccactca 120
acctctgccg gatacggtgt caacgagtta ttggctgctg acgcaggatg ggtattatac 180
cgctggttaa ttaaaataga cagacttccc aagctcggag aaacaattac tgttcagaca 240
tgggcctctt ccttcgaacg cttctacggc aacagggaat ttatcgtatt ggacggcagg 300
gataacccca ttgtcaaagc ctcatccgta tggatatatt tcaatattaa aaaaagaaaa 360
cctatgagaa tccccctcga aatgggagat gcttatggca tagacgaaac aagagctttg 420
gaagaaccct ttaccgactt cgattttgat tttgaaccca aagttattga agaatttact 480
gtaaaaagaa gtgatataga cacaaacagc cacgtaaaca acaagaaata cgttgactgg 540
attatggaaa ccgtacccca gcaaatatat gacaactaca aagttacatc tcttcagatt 600
atatacaaaa aggaatcttc tttgggttca ggcataaagg ccggatgtgt aattgatgag 660
caaaataccg ataatccgcg gctccttcac aaaatatggg acaagaatac cggtttggag 720
cttgtatccg ccgaaacaat ctggcaaaag attcagtcat aa 762
<210> 10
<211> 240
<212> PRT
<213> 热纤亨盖特梭菌(Hungateiclostridium thermocellum)
<400> 10
Met Gln Lys Lys Arg Phe Ser Lys Lys Tyr Glu Val His Tyr Tyr Glu
1 5 10 15
Ile Asn Ser Met Gln Glu Ala Thr Leu Leu Ser Leu Leu Asn Tyr Met
20 25 30
Glu Asp Cys Ala Ile Ser His Ser Thr Ser Ala Gly Tyr Gly Val Asn
35 40 45
Glu Leu Leu Ala Ala Asp Ala Gly Trp Val Leu Tyr Arg Trp Leu Ile
50 55 60
Lys Ile Asp Arg Leu Pro Lys Leu Gly Glu Thr Ile Thr Val Gln Thr
65 70 75 80
Trp Ala Ser Ser Phe Glu Arg Phe Tyr Gly Asn Arg Glu Phe Ile Val
85 90 95
Leu Asp Gly Arg Asp Asn Pro Ile Val Lys Ala Ser Ser Val Trp Ile
100 105 110
Tyr Phe Asn Ile Lys Lys Arg Lys Pro Met Arg Ile Pro Leu Glu Met
115 120 125
Gly Asp Ala Tyr Gly Ile Asp Glu Thr Arg Ala Leu Glu Glu Pro Phe
130 135 140
Thr Asp Phe Asp Phe Asp Phe Glu Pro Lys Val Ile Glu Glu Phe Thr
145 150 155 160
Val Lys Arg Ser Asp Ile Asp Thr Asn Ser His Val Asn Asn Lys Lys
165 170 175
Tyr Val Asp Trp Ile Met Glu Thr Val Pro Gln Gln Ile Tyr Asp Asn
180 185 190
Tyr Lys Val Thr Ser Leu Gln Ile Ile Tyr Lys Lys Glu Ser Ser Leu
195 200 205
Gly Ser Gly Ile Lys Ala Gly Cys Val Ile Asp Glu Gln Asn Thr Asp
210 215 220
Asn Pro Arg Leu Leu His Lys Ile Trp Asp Lys Asn Thr Gly Leu Glu
225 230 235 240
<210> 11
<211> 1089
<212> DNA
<213> 葡萄(Vitis vinifera)
<400> 11
atggcttcca tgcaccgctc tgtgtccagg gagattaaga atacaaagaa gacttctagc 60
tctcctcgca aggtgcaagt aacccattca atgccaccac acaagattga gattttcaaa 120
tccatggaga attgggttga ggagaacgtt ttaattcacc tgaagccagt tgagaaatgt 180
tggcaacctc aggattttct gcctcatcct gcttctgatg gatttcatga gcgagtcgag 240
gagctaaagg agagagcaaa ggggatcccg gatgactact ttgtcgtttt ggttggagat 300
atgatcactg aagaagccct tccaacttac caaacactgt tcaataccac tgatggaatc 360
cgtgatgaaa caggtgcaag ccccacttct tgggcaactt ggacaagggc atggaccgct 420
gaagagaaca ggcacggtga ccttcttaat aagtatctct atctgtctgg aagagtagac 480
atgaaacaaa ttgagaagac gatccagtat ttgattaggg ctggaatgga tttccagacg 540
gaaaacaatc cgtacctttt attcatctat acttcatttc aagaaagggc aaccttcata 600
tcccatggca atactgccag gctcgccaag caacatgggg acaagagctt ggctcaaata 660
tgtggcataa tagcctcaga tgagaagcgc catgaaactg cctacaccaa gatagtggaa 720
aagctctttg agattgatcc caatgggact gtcttggctt ttgcagacag gatgaggaag 780
aaaatcacca tgccggccct cttgatgtat gatggatgtg atgacgacct ttttgaacac 840
ttctcagcag ttgctcagcg gcttggtgtg tatactgcca aggactatgt tgataactta 900
gaattctttg tggaaagatg gaatgtggaa aagctaactg ggctttctag tgaggggcga 960
aaagctcagg attatgtttg tgggttagct aaaagattga gaacactgga ggagagagct 1020
caagaaaagg ctaagcaagc acccaccatt cctttcagtt ggatttttga tagagaagtg 1080
aagctctga 1089
<210> 12
<211> 360
<212> PRT
<213> 葡萄(Vitis vinifera)
<400> 12
Met Ala Ser Met His Arg Ser Val Ser Arg Glu Ile Lys Asn Thr Lys
1 5 10 15
Lys Thr Ser Ser Ser Pro Arg Lys Val Gln Val Thr His Ser Met Pro
20 25 30
Pro His Lys Ile Glu Ile Phe Lys Ser Met Glu Asn Trp Val Glu Glu
35 40 45
Asn Val Leu Ile His Leu Lys Pro Val Glu Lys Cys Trp Gln Pro Gln
50 55 60
Asp Phe Leu Pro His Pro Ala Ser Asp Gly Phe His Glu Arg Val Glu
65 70 75 80
Glu Leu Lys Glu Arg Ala Lys Gly Ile Pro Asp Asp Tyr Phe Val Val
85 90 95
Leu Val Gly Asp Met Ile Thr Glu Glu Ala Leu Pro Thr Tyr Gln Thr
100 105 110
Leu Phe Asn Thr Thr Asp Gly Ile Arg Asp Glu Thr Gly Ala Ser Pro
115 120 125
Thr Ser Trp Ala Thr Trp Thr Arg Ala Trp Thr Ala Glu Glu Asn Arg
130 135 140
His Gly Asp Leu Leu Asn Lys Tyr Leu Tyr Leu Ser Gly Arg Val Asp
145 150 155 160
Met Lys Gln Ile Glu Lys Thr Ile Gln Tyr Leu Ile Arg Ala Gly Met
165 170 175
Asp Phe Gln Thr Glu Asn Asn Pro Tyr Leu Leu Phe Ile Tyr Thr Ser
180 185 190
Phe Gln Glu Arg Ala Thr Phe Ile Ser His Gly Asn Thr Ala Arg Leu
195 200 205
Ala Lys Gln His Gly Asp Lys Ser Leu Ala Gln Ile Cys Gly Ile Ile
210 215 220
Ala Ser Asp Glu Lys Arg His Glu Thr Ala Tyr Thr Lys Ile Val Glu
225 230 235 240
Lys Leu Phe Glu Ile Asp Pro Asn Gly Thr Val Leu Ala Phe Ala Asp
245 250 255
Arg Met Arg Lys Lys Ile Thr Met Pro Ala Leu Leu Met Tyr Asp Gly
260 265 270
Cys Asp Asp Asp Leu Phe Glu His Phe Ser Ala Val Ala Gln Arg Leu
275 280 285
Gly Val Tyr Thr Ala Lys Asp Tyr Val Asp Asn Leu Glu Phe Phe Val
290 295 300
Glu Arg Trp Asn Val Glu Lys Leu Thr Gly Leu Ser Ser Glu Gly Arg
305 310 315 320
Lys Ala Gln Asp Tyr Val Cys Gly Leu Ala Lys Arg Leu Arg Thr Leu
325 330 335
Glu Glu Arg Ala Gln Glu Lys Ala Lys Gln Ala Pro Thr Ile Pro Phe
340 345 350
Ser Trp Ile Phe Asp Arg Glu Val
355 360
<210> 13
<211> 747
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 13
atggctgatt gggtaacagg caaagtcact aaagtgcaga actggaccga cgccctgttt 60
agtctcaccg ttcacgcccc cgtgcttccg tttaccgccg ggcaatttac caagcttggc 120
cttgaaatcg acggcgaacg cgtccagcgc gcctactcct atgtaaactc gcccgataat 180
cccgatctgg agttttacct ggtcaccgtc cccgatggca aattaagccc acgactggcg 240
gcactgaaac caggcgatga agtgcaggtg gttagcgaag cggcaggatt ctttgtgctc 300
gatgaagtgc cgcactgcga aacgctatgg atgctggcaa ccggtacagc gattggccct 360
tatttatcga ttctgcaact aggtaaagat ttagatcgct tcaaaaatct ggtcctggtg 420
cacgccgcac gttatgccgc cgacttaagc tatttgccac tgatgcagga actggaaaaa 480
cgctacgaag gaaaactgcg cattcagacg gtggtcagtc gggaaacggc agcggggtcg 540
ctcaccggac ggataccggc attaattgaa agtggggaac tggaaagcac gattggcctg 600
ccgatgaata aagaaaccag ccatgtgatg ctgtgcggca atccacagat ggtgcgcgat 660
acacaacagt tgctgaaaga gacccggcag atgacgaaac atttacgtcg ccgaccgggc 720
catatgacag cggagcatta ctggtaa 747
<210> 14
<211> 247
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 14
Met Ala Asp Trp Val Thr Gly Lys Val Thr Lys Val Gln Asn Trp Thr
1 5 10 15
Asp Ala Leu Phe Ser Leu Thr Val His Ala Pro Val Leu Pro Phe Thr
20 25 30
Ala Gly Gln Phe Thr Lys Leu Gly Leu Glu Ile Asp Gly Glu Arg Val
35 40 45
Gln Arg Ala Tyr Ser Tyr Val Asn Ser Pro Asp Asn Pro Asp Leu Glu
50 55 60
Phe Tyr Leu Val Thr Val Pro Asp Gly Lys Leu Ser Pro Arg Leu Ala
65 70 75 80
Ala Leu Lys Pro Gly Asp Glu Val Gln Val Val Ser Glu Ala Ala Gly
85 90 95
Phe Phe Val Leu Asp Glu Val Pro His Cys Glu Thr Leu Trp Met Leu
100 105 110
Ala Thr Gly Thr Ala Ile Gly Pro Tyr Leu Ser Ile Leu Gln Leu Gly
115 120 125
Lys Asp Leu Asp Arg Phe Lys Asn Leu Val Leu Val His Ala Ala Arg
130 135 140
Tyr Ala Ala Asp Leu Ser Tyr Leu Pro Leu Met Gln Glu Leu Glu Lys
145 150 155 160
Arg Tyr Glu Gly Lys Leu Arg Ile Gln Thr Val Val Ser Arg Glu Thr
165 170 175
Ala Ala Gly Ser Leu Thr Gly Arg Ile Pro Ala Leu Ile Glu Ser Gly
180 185 190
Glu Leu Glu Ser Thr Ile Gly Leu Pro Met Asn Lys Glu Thr Ser His
195 200 205
Val Met Leu Cys Gly Asn Pro Gln Met Val Arg Asp Thr Gln Gln Leu
210 215 220
Leu Lys Glu Thr Arg Gln Met Thr Lys His Leu Arg Arg Arg Pro Gly
225 230 235 240
His Met Thr Ala Glu His Tyr
245
<210> 15
<211> 488
<212> DNA
<213> 贝氏不动杆菌(Acinetobacter baylyi)
<400> 15
atgatgactg agtcaaacac tcctgcgttt acgatccctg aattgccaat ggacattcaa 60
aaaattcgtg aatatttgcc acatcgctat ccattcctat tggttgatcg tgtagttgaa 120
gttggtgaaa ataatattgt tggctataaa aacgtttcga ttaacgaaga gttttttcag 180
ggccattttc ctgattatcc gattatgcca ggtgtcttga ttgtagaggc tttggcacaa 240
atttctggta ttttgggttt tattatgaat aatgaaactc ctaaaccagg ttctttgttt 300
ctgttcgcag gggctgagaa agttcgtttc aaaaaacaag tggttgctgg tgatcagctc 360
gttttaaaag ctgaacttgt catgcaaaaa cgtggtatct acaaatacaa ttgtactgct 420
acggttgatg gtaaagtcgc tacaaccgct gaaattatag tttcgcattt aagaacagag 480
caggcatg 488
<210> 16
<211> 162
<212> PRT
<213> 贝氏不动杆菌(Acinetobacter baylyi)
<400> 16
Met Met Thr Glu Ser Asn Thr Pro Ala Phe Thr Ile Pro Glu Leu Pro
1 5 10 15
Met Asp Ile Gln Lys Ile Arg Glu Tyr Leu Pro His Arg Tyr Pro Phe
20 25 30
Leu Leu Val Asp Arg Val Val Glu Val Gly Glu Asn Asn Ile Val Gly
35 40 45
Tyr Lys Asn Val Ser Ile Asn Glu Glu Phe Phe Gln Gly His Phe Pro
50 55 60
Asp Tyr Pro Ile Met Pro Gly Val Leu Ile Val Glu Ala Leu Ala Gln
65 70 75 80
Ile Ser Gly Ile Leu Gly Phe Ile Met Asn Asn Glu Thr Pro Lys Pro
85 90 95
Gly Ser Leu Phe Leu Phe Ala Gly Ala Glu Lys Val Arg Phe Lys Lys
100 105 110
Gln Val Val Ala Gly Asp Gln Leu Val Leu Lys Ala Glu Leu Val Met
115 120 125
Gln Lys Arg Gly Ile Tyr Lys Tyr Asn Cys Thr Ala Thr Val Asp Gly
130 135 140
Lys Val Ala Thr Thr Ala Glu Ile Ile Val Ser His Leu Arg Thr Glu
145 150 155 160
Gln Ala
<210> 17
<211> 3525
<212> DNA
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 17
atgggcacga gcgatgttca cgacgcgacc gacggcgtta ccgagactgc actggatgat 60
gagcagagca ctcgtcgtat tgcagaactg tacgcaacgg acccagagtt cgcagcagca 120
gctcctctgc cggccgttgt cgatgcggcg cacaaaccgg gcctgcgtct ggcggaaatc 180
ctgcagaccc tgttcaccgg ctacggcgat cgtccggcgc tgggctatcg tgcacgtgag 240
ctggcgacgg acgaaggcgg tcgtacggtc acgcgtctgc tgccgcgctt cgataccctg 300
acctatgcac aggtgtggag ccgtgttcaa gcagtggctg cagcgttgcg tcacaatttc 360
gcacaaccga tttacccggg cgacgcggtc gcgactatcg gctttgcgag cccggactat 420
ttgacgctgg atctggtgtg cgcgtatctg ggcctggtca gcgttccttt gcagcataac 480
gctccggtgt ctcgcctggc cccgattctg gccgaggtgg aaccgcgtat tctgacggtg 540
agcgcagaat acctggacct ggcggttgaa tccgtccgtg atgtgaactc cgtcagccag 600
ctggttgttt tcgaccatca tccggaagtg gacgatcacc gtgacgcact ggctcgcgca 660
cgcgagcagc tggccggcaa aggtatcgca gttacgaccc tggatgcgat cgcagacgaa 720
ggcgcaggtt tgccggctga gccgatttac acggcggatc acgatcagcg tctggccatg 780
attctgtata ccagcggctc tacgggtgct ccgaaaggcg cgatgtacac cgaagcgatg 840
gtggctcgcc tgtggactat gagctttatc acgggcgacc cgaccccggt tatcaacgtg 900
aacttcatgc cgctgaacca tctgggcggt cgtatcccga ttagcaccgc cgtgcagaat 960
ggcggtacca gctacttcgt tccggaaagc gacatgagca cgctgtttga ggatctggcc 1020
ctggtccgcc ctaccgaact gggtctggtg ccgcgtgttg cggacatgct gtaccagcat 1080
catctggcga ccgtggatcg cctggtgacc cagggcgcgg acgaactgac tgcggaaaag 1140
caggccggtg cggaactgcg tgaacaggtc ttgggcggtc gtgttatcac cggttttgtt 1200
tccaccgcgc cgttggcggc agagatgcgt gcttttctgg atatcacctt gggtgcacac 1260
atcgttgacg gttacggtct gaccgaaacc ggtgcggtca cccgtgatgg tgtgattgtt 1320
cgtcctccgg tcattgatta caagctgatc gatgtgccgg agctgggtta cttctccacc 1380
gacaaaccgt acccgcgtgg cgagctgctg gttcgtagcc aaacgttgac tccgggttac 1440
tacaagcgcc cagaagtcac cgcgtccgtt ttcgatcgcg acggctatta ccacaccggc 1500
gacgtgatgg cagaaaccgc gccagaccac ctggtgtatg tggaccgccg caacaatgtt 1560
ctgaagctgg cgcaaggtga atttgtcgcc gtggctaacc tggaggccgt tttcagcggc 1620
gctgctctgg tccgccagat tttcgtgtat ggtaacagcg agcgcagctt tctgttggct 1680
gttgttgtcc ctaccccgga ggcgctggag caatacgacc ctgccgcatt gaaagcagcc 1740
ctggcggatt cgctgcagcg tacggcgcgt gatgccgagc tgcagagcta tgaagtgccg 1800
gcggacttca ttgttgagac tgagcctttt agcgctgcga acggtctgct gagcggtgtt 1860
ggcaagttgc tgcgtccgaa tttgaaggat cgctacggtc agcgtttgga gcagatgtac 1920
gcggacatcg cggctacgca ggcgaaccaa ttgcgtgaac tgcgccgtgc tgcggctact 1980
caaccggtga tcgacacgct gacgcaagct gcggcgacca tcctgggtac cggcagcgag 2040
gttgcaagcg acgcacactt tactgatttg ggcggtgatt ctctgagcgc gctgacgttg 2100
agcaacttgc tgtctgactt ctttggcttt gaagtcccgg ttggcacgat tgttaaccca 2160
gcgactaatc tggcacagct ggcgcaacat atcgaggcgc agcgcacggc gggtgaccgc 2220
cgtccatcct ttacgacggt ccacggtgcg gatgctacgg aaatccgtgc aagcgaactg 2280
actctggaca aattcatcga cgctgagact ctgcgcgcag cacctggttt gccgaaggtt 2340
acgactgagc cgcgtacggt cctgttgagc ggtgccaatg gttggttggg ccgcttcctg 2400
accctgcagt ggctggaacg tttggcaccg gttggcggta ccctgatcac cattgtgcgc 2460
ggtcgtgacg atgcagcggc acgtgcacgt ttgactcagg cttacgatac ggacccagag 2520
ctgtcccgcc gcttcgctga gttggcggat cgccacttgc gtgtggtggc aggtgatatc 2580
ggcgatccga atctgggcct gaccccggag atttggcacc gtctggcagc agaggtcgat 2640
ctggtcgttc atccagcggc cctggtcaac cacgtcctgc cgtaccgcca gctgtttggt 2700
ccgaatgttg ttggcaccgc cgaagttatc aagttggctc tgaccgagcg catcaagcct 2760
gttacctacc tgtccacggt tagcgtcgcg atgggtattc ctgattttga ggaggacggt 2820
gacattcgta ccgtcagccc ggttcgtccg ctggatggtg gctatgcaaa tggctatggc 2880
aacagcaagt gggctggcga ggtgctgctg cgcgaggcac atgacctgtg tggcctgccg 2940
gttgcgacgt ttcgtagcga catgattctg gcccacccgc gctaccgtgg ccaagtgaat 3000
gtgccggaca tgttcacccg tctgctgctg tccctgctga tcacgggtgt ggcaccgcgt 3060
tccttctaca ttggtgatgg cgagcgtccg cgtgcacact acccgggcct gaccgtcgat 3120
tttgttgcgg aagcggttac taccctgggt gctcagcaac gtgagggtta tgtctcgtat 3180
gacgttatga atccgcacga tgacggtatt agcttggatg tctttgtgga ctggctgatt 3240
cgtgcgggcc acccaattga ccgtgttgac gactatgatg actgggtgcg tcgttttgaa 3300
accgcgttga ccgccttgcc ggagaaacgt cgtgcgcaga ccgttctgcc gctgctgcat 3360
gcctttcgcg cgccacaggc gccgttgcgt ggcgcccctg aaccgaccga agtgtttcat 3420
gcagcggtgc gtaccgctaa agtcggtccg ggtgatattc cgcacctgga tgaagccctg 3480
atcgacaagt acatccgtga cctgcgcgag ttcggtctga tttag 3525
<210> 18
<211> 1174
<212> PRT
<213> 耻垢分枝杆菌(Mycobacterium smegmatis)
<400> 18
Met Gly Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr
1 5 10 15
Ala Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala
20 25 30
Thr Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp
35 40 45
Ala Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu
50 55 60
Phe Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu
65 70 75 80
Leu Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg
85 90 95
Phe Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val
100 105 110
Ala Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp
115 120 125
Ala Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp
130 135 140
Leu Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn
145 150 155 160
Ala Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg
165 170 175
Ile Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val
180 185 190
Arg Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro
195 200 205
Glu Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu
210 215 220
Ala Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu
225 230 235 240
Gly Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln
245 250 255
Arg Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys
260 265 270
Gly Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser
275 280 285
Phe Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro
290 295 300
Leu Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn
305 310 315 320
Gly Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe
325 330 335
Glu Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg
340 345 350
Val Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu
355 360 365
Val Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala
370 375 380
Glu Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val
385 390 395 400
Ser Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr
405 410 415
Leu Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala
420 425 430
Val Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys
435 440 445
Leu Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr
450 455 460
Pro Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr
465 470 475 480
Tyr Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr
485 490 495
Tyr His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val
500 505 510
Tyr Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe
515 520 525
Val Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val
530 535 540
Arg Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala
545 550 555 560
Val Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala
565 570 575
Leu Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala
580 585 590
Glu Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu
595 600 605
Pro Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu
610 615 620
Arg Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr
625 630 635 640
Ala Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg
645 650 655
Ala Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala
660 665 670
Thr Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr
675 680 685
Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu
690 695 700
Ser Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro
705 710 715 720
Ala Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr
725 730 735
Ala Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala
740 745 750
Thr Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala
755 760 765
Glu Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro
770 775 780
Arg Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu
785 790 795 800
Thr Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile
805 810 815
Thr Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr
820 825 830
Gln Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu
835 840 845
Ala Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn
850 855 860
Leu Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp
865 870 875 880
Leu Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg
885 890 895
Gln Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu
900 905 910
Ala Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser
915 920 925
Val Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr
930 935 940
Val Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly
945 950 955 960
Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu
965 970 975
Cys Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His
980 985 990
Pro Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu
995 1000 1005
Leu Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr
1010 1015 1020
Ile Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr
1025 1030 1035
Val Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln
1040 1045 1050
Arg Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp
1055 1060 1065
Gly Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly
1070 1075 1080
His Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg
1085 1090 1095
Phe Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln
1100 1105 1110
Thr Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro
1115 1120 1125
Leu Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val
1130 1135 1140
Arg Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu
1145 1150 1155
Ala Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu
1160 1165 1170
Ile
<210> 19
<211> 1026
<212> DNA
<213> 贝氏不动杆菌(Acinetobacter baylyi)
<400> 19
atggcaacaa ctaatgtgat tcatgcttat gctgcaatgc aggcaggtga agcactcgtg 60
ccttattcgt ttgatgcagg cgaactgcaa ccacatcagg ttgaagttaa agtcgaatat 120
tgtgggctgt gccattccga tgtctcggta ctcaacaacg aatggcattc ttcggtttat 180
ccagtcgtgg caggtcatga agtgattggt acgattaccc aactgggaag tgaagccaaa 240
ggactaaaaa ttggtcaacg tgttggtatt ggctggacgg cagaaagctg tcaggcctgt 300
gaccaatgca tcagtggtca gcaggtattg tgcacgggcg aaaataccgc aactattatt 360
ggtcatgctg gtggctttgc agataaggtt cgtgcaggct ggcaatgggt cattcccctg 420
cccgacgaac tcgatccgac cagtgctggt cctttgctgt gtggcggaat cacagtattt 480
gatccaattt taaaacatca gattcaggct attcatcatg ttgctgtgat tggtatcggt 540
ggtttgggac atatggccat caagctactt aaagcatggg gctgtgaaat tactgcgttt 600
agttcaaatc caaacaaaac cgatgagctc aaagctatgg gggccgatca cgtggtcaat 660
agccgtgatg atgccgaaat taaatcgcaa cagggtaaat ttgatttact gctgagtaca 720
gttaatgtgc ctttaaactg gaatgcgtat ctaaacacac tggcacccaa tggcactttc 780
cattttttgg gcgtggtgat ggaaccaatc cctgtacctg tcggtgcgct gctaggaggt 840
gccaaatcgc taacagcatc accaactggc tcgcctgctg ccttacgtaa gctgctcgaa 900
tttgcggcac gtaagaatat cgcacctcaa atcgagatgt atcctatgtc ggagctgaat 960
gaggccatcg aacgcttaca ttcgggtcaa gcacgttatc ggattgtact taaagccgat 1020
ttttaa 1026
<210> 20
<211> 341
<212> PRT
<213> 贝氏不动杆菌(Acinetobacter baylyi)
<400> 20
Met Ala Thr Thr Asn Val Ile His Ala Tyr Ala Ala Met Gln Ala Gly
1 5 10 15
Glu Ala Leu Val Pro Tyr Ser Phe Asp Ala Gly Glu Leu Gln Pro His
20 25 30
Gln Val Glu Val Lys Val Glu Tyr Cys Gly Leu Cys His Ser Asp Val
35 40 45
Ser Val Leu Asn Asn Glu Trp His Ser Ser Val Tyr Pro Val Val Ala
50 55 60
Gly His Glu Val Ile Gly Thr Ile Thr Gln Leu Gly Ser Glu Ala Lys
65 70 75 80
Gly Leu Lys Ile Gly Gln Arg Val Gly Ile Gly Trp Thr Ala Glu Ser
85 90 95
Cys Gln Ala Cys Asp Gln Cys Ile Ser Gly Gln Gln Val Leu Cys Thr
100 105 110
Gly Glu Asn Thr Ala Thr Ile Ile Gly His Ala Gly Gly Phe Ala Asp
115 120 125
Lys Val Arg Ala Gly Trp Gln Trp Val Ile Pro Leu Pro Asp Glu Leu
130 135 140
Asp Pro Thr Ser Ala Gly Pro Leu Leu Cys Gly Gly Ile Thr Val Phe
145 150 155 160
Asp Pro Ile Leu Lys His Gln Ile Gln Ala Ile His His Val Ala Val
165 170 175
Ile Gly Ile Gly Gly Leu Gly His Met Ala Ile Lys Leu Leu Lys Ala
180 185 190
Trp Gly Cys Glu Ile Thr Ala Phe Ser Ser Asn Pro Asn Lys Thr Asp
195 200 205
Glu Leu Lys Ala Met Gly Ala Asp His Val Val Asn Ser Arg Asp Asp
210 215 220
Ala Glu Ile Lys Ser Gln Gln Gly Lys Phe Asp Leu Leu Leu Ser Thr
225 230 235 240
Val Asn Val Pro Leu Asn Trp Asn Ala Tyr Leu Asn Thr Leu Ala Pro
245 250 255
Asn Gly Thr Phe His Phe Leu Gly Val Val Met Glu Pro Ile Pro Val
260 265 270
Pro Val Gly Ala Leu Leu Gly Gly Ala Lys Ser Leu Thr Ala Ser Pro
275 280 285
Thr Gly Ser Pro Ala Ala Leu Arg Lys Leu Leu Glu Phe Ala Ala Arg
290 295 300
Lys Asn Ile Ala Pro Gln Ile Glu Met Tyr Pro Met Ser Glu Leu Asn
305 310 315 320
Glu Ala Ile Glu Arg Leu His Ser Gly Gln Ala Arg Tyr Arg Ile Val
325 330 335
Leu Lys Ala Asp Phe
340
<210> 21
<211> 2400
<212> DNA
<213> 人工序列
<220>
<223> 杂交融合细胞色素P450 Cyp153A16 (G307A)
<400> 21
atgccaacac tgcccagaac atttgacgac attcagtccc gactgattaa cgccacctcc 60
agggtggtgc cgatgcagag gcaaattcag ggactgaaat tcttaatgag cgccaagagg 120
aagaccttcg gcccacgccg accgatgccc gaattcgttg aaacacccat cccggacgtt 180
aacacgctgg cccttgagga catcgatgtc agcaatccgt ttttataccg gcagggtcag 240
tggcgcgcct atttcaaacg gttgcgtgat gaggcgccgg tccattacca gaagaacagc 300
cctttcggcc ccttctggtc ggtaactcgg tttgaagaca tcctgttcgt ggataagagt 360
cacgacctgt tttccgccga gccgcaaatc attctcggtg accctccgga ggggctgtcg 420
gtggaaatgt tcatagcgat ggatccgccg aaacacgatg tgcagcgcag ctcggtgcag 480
ggagtagtgg caccgaaaaa cctgaaggag atggaggggc tgatccgatc acgcaccggc 540
gatgtgcttg acagcctgcc tacagacaaa ccctttaact gggtacctgc tgtttccaag 600
gaactcacag gccgcatgct ggcgacgctt ctggattttc cttacgagga acgccacaag 660
ctggttgagt ggtcggacag aatggcaggt gcagcatcgg ccaccggcgg ggagtttgcc 720
gatgaaaatg ccatgtttga cgacgcggca gacatggccc ggtctttctc caggctttgg 780
cgggacaagg aggcgcgccg cgcagcaggc gaggagcccg gtttcgattt gatcagcctg 840
ttgcagagca acaaagaaac gaaagacctg atcaatcggc cgatggagtt tatcggtaat 900
ttgacgctgc tcatagtcgc cggcaacgat acgacgcgca actcgatgag tggtggcctg 960
gtggccatga acgaattccc cagggaattt gaaaaattga aggcaaaacc ggagttgatt 1020
ccgaacatgg tgtcggaaat catccgctgg caaacgccgc tggcctatat gcgccgaatc 1080
gccaagcagg atgtcgaact gggcggccag accatcaaga agggtgatcg agttgtcatg 1140
tggtacgcgt cgggtaaccg ggacgagcgc aaatttgaca accccgatca gttcatcatt 1200
gatcgcaagg acgcacgaaa ccacatgtcg ttcggctatg gggttcaccg ttgcatgggc 1260
aaccgtctgg ctgaactgca actgcgcatc ctctgggaag aaatactcaa gcgttttgac 1320
aacatcgaag tcgtcgaaga gcccgagcgg gtgcagtcca acttcgtgcg gggctattcc 1380
aggttgatgg tcaaactgac accgaacagt gtactccatc gtcatcaacc tgtcaccatc 1440
ggcgagccgg ccgctcgtgc tgtgagccgc acggtgaccg ttgagcgtct tgatcgcatt 1500
gccgacgatg tccttcgcct ggtccttcgc gatgctggag gtaaaaccct cccgacgtgg 1560
acgcctggcg ctcacatcga cctggatctg ggtgctctga gccgtcagta ttcgctctgc 1620
ggcgctccgg atgctccgtc gtacgaaatc gccgtgcact tagatccgga aagccgtggt 1680
ggaagccgct atattcatga acagctggaa gttggaagtc cgctgcgtat gcgtggccca 1740
cgcaaccatt tcgccctgga tccgggtgcg gaacattacg tgtttgttgc cgggggtatc 1800
ggcatcacgc cggtgctggc aatggcggat catgcccgtg cgcgtggttg gtcgtacgaa 1860
ctgcattatt gtggtcgtaa tcgtagcggt atggcttacc tggaacgcgt cgcgggacat 1920
ggtgaccgcg ctgccttgca cgtatctgaa gaaggcaccc gcattgatct ggcggcatta 1980
cttgctgaac cggcgccggg cgtgcaaatc tacgcctgcg gtccgggccg tttattagcg 2040
ggtcttgaag acgcgtctcg taattggccg gatggcgcgc ttcatgtgga gcatttcact 2100
tcgagtttag ccgctttgga tccggatgtc gaacatgcct ttgatttgga gctgcgtgac 2160
tctggcctta ccgttcgcgt cgagccaact cagaccgttt tagacgcttt gcgtgcgaac 2220
aatatcgacg tcccgtcgga ttgcgaagag gggctgtgtg gttcttgcga agtagccgtt 2280
ctggatggcg aggttgatca ccgtgatacc gttctgacta aggccgagcg cgccgcgaat 2340
cgtcagatga tgacttgctg cagtcgtgca tgcggtgatc gtctggcgct gcgcctctaa 2400
<210> 22
<211> 799
<212> PRT
<213> 人工序列
<220>
<223> 杂交融合细胞色素P450 Cyp153A16(G307A)
<400> 22
Met Pro Thr Leu Pro Arg Thr Phe Asp Asp Ile Gln Ser Arg Leu Ile
1 5 10 15
Asn Ala Thr Ser Arg Val Val Pro Met Gln Arg Gln Ile Gln Gly Leu
20 25 30
Lys Phe Leu Met Ser Ala Lys Arg Lys Thr Phe Gly Pro Arg Arg Pro
35 40 45
Met Pro Glu Phe Val Glu Thr Pro Ile Pro Asp Val Asn Thr Leu Ala
50 55 60
Leu Glu Asp Ile Asp Val Ser Asn Pro Phe Leu Tyr Arg Gln Gly Gln
65 70 75 80
Trp Arg Ala Tyr Phe Lys Arg Leu Arg Asp Glu Ala Pro Val His Tyr
85 90 95
Gln Lys Asn Ser Pro Phe Gly Pro Phe Trp Ser Val Thr Arg Phe Glu
100 105 110
Asp Ile Leu Phe Val Asp Lys Ser His Asp Leu Phe Ser Ala Glu Pro
115 120 125
Gln Ile Ile Leu Gly Asp Pro Pro Glu Gly Leu Ser Val Glu Met Phe
130 135 140
Ile Ala Met Asp Pro Pro Lys His Asp Val Gln Arg Ser Ser Val Gln
145 150 155 160
Gly Val Val Ala Pro Lys Asn Leu Lys Glu Met Glu Gly Leu Ile Arg
165 170 175
Ser Arg Thr Gly Asp Val Leu Asp Ser Leu Pro Thr Asp Lys Pro Phe
180 185 190
Asn Trp Val Pro Ala Val Ser Lys Glu Leu Thr Gly Arg Met Leu Ala
195 200 205
Thr Leu Leu Asp Phe Pro Tyr Glu Glu Arg His Lys Leu Val Glu Trp
210 215 220
Ser Asp Arg Met Ala Gly Ala Ala Ser Ala Thr Gly Gly Glu Phe Ala
225 230 235 240
Asp Glu Asn Ala Met Phe Asp Asp Ala Ala Asp Met Ala Arg Ser Phe
245 250 255
Ser Arg Leu Trp Arg Asp Lys Glu Ala Arg Arg Ala Ala Gly Glu Glu
260 265 270
Pro Gly Phe Asp Leu Ile Ser Leu Leu Gln Ser Asn Lys Glu Thr Lys
275 280 285
Asp Leu Ile Asn Arg Pro Met Glu Phe Ile Gly Asn Leu Thr Leu Leu
290 295 300
Ile Val Ala Gly Asn Asp Thr Thr Arg Asn Ser Met Ser Gly Gly Leu
305 310 315 320
Val Ala Met Asn Glu Phe Pro Arg Glu Phe Glu Lys Leu Lys Ala Lys
325 330 335
Pro Glu Leu Ile Pro Asn Met Val Ser Glu Ile Ile Arg Trp Gln Thr
340 345 350
Pro Leu Ala Tyr Met Arg Arg Ile Ala Lys Gln Asp Val Glu Leu Gly
355 360 365
Gly Gln Thr Ile Lys Lys Gly Asp Arg Val Val Met Trp Tyr Ala Ser
370 375 380
Gly Asn Arg Asp Glu Arg Lys Phe Asp Asn Pro Asp Gln Phe Ile Ile
385 390 395 400
Asp Arg Lys Asp Ala Arg Asn His Met Ser Phe Gly Tyr Gly Val His
405 410 415
Arg Cys Met Gly Asn Arg Leu Ala Glu Leu Gln Leu Arg Ile Leu Trp
420 425 430
Glu Glu Ile Leu Lys Arg Phe Asp Asn Ile Glu Val Val Glu Glu Pro
435 440 445
Glu Arg Val Gln Ser Asn Phe Val Arg Gly Tyr Ser Arg Leu Met Val
450 455 460
Lys Leu Thr Pro Asn Ser Val Leu His Arg His Gln Pro Val Thr Ile
465 470 475 480
Gly Glu Pro Ala Ala Arg Ala Val Ser Arg Thr Val Thr Val Glu Arg
485 490 495
Leu Asp Arg Ile Ala Asp Asp Val Leu Arg Leu Val Leu Arg Asp Ala
500 505 510
Gly Gly Lys Thr Leu Pro Thr Trp Thr Pro Gly Ala His Ile Asp Leu
515 520 525
Asp Leu Gly Ala Leu Ser Arg Gln Tyr Ser Leu Cys Gly Ala Pro Asp
530 535 540
Ala Pro Ser Tyr Glu Ile Ala Val His Leu Asp Pro Glu Ser Arg Gly
545 550 555 560
Gly Ser Arg Tyr Ile His Glu Gln Leu Glu Val Gly Ser Pro Leu Arg
565 570 575
Met Arg Gly Pro Arg Asn His Phe Ala Leu Asp Pro Gly Ala Glu His
580 585 590
Tyr Val Phe Val Ala Gly Gly Ile Gly Ile Thr Pro Val Leu Ala Met
595 600 605
Ala Asp His Ala Arg Ala Arg Gly Trp Ser Tyr Glu Leu His Tyr Cys
610 615 620
Gly Arg Asn Arg Ser Gly Met Ala Tyr Leu Glu Arg Val Ala Gly His
625 630 635 640
Gly Asp Arg Ala Ala Leu His Val Ser Glu Glu Gly Thr Arg Ile Asp
645 650 655
Leu Ala Ala Leu Leu Ala Glu Pro Ala Pro Gly Val Gln Ile Tyr Ala
660 665 670
Cys Gly Pro Gly Arg Leu Leu Ala Gly Leu Glu Asp Ala Ser Arg Asn
675 680 685
Trp Pro Asp Gly Ala Leu His Val Glu His Phe Thr Ser Ser Leu Ala
690 695 700
Ala Leu Asp Pro Asp Val Glu His Ala Phe Asp Leu Glu Leu Arg Asp
705 710 715 720
Ser Gly Leu Thr Val Arg Val Glu Pro Thr Gln Thr Val Leu Asp Ala
725 730 735
Leu Arg Ala Asn Asn Ile Asp Val Pro Ser Asp Cys Glu Glu Gly Leu
740 745 750
Cys Gly Ser Cys Glu Val Ala Val Leu Asp Gly Glu Val Asp His Arg
755 760 765
Asp Thr Val Leu Thr Lys Ala Glu Arg Ala Ala Asn Arg Gln Met Met
770 775 780
Thr Cys Cys Ser Arg Ala Cys Gly Asp Arg Leu Ala Leu Arg Leu
785 790 795
<210> 23
<211> 1578
<212> DNA
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 23
atgaacgaaa tcgacgaaaa aaaccaggct ccggttcacc aggaatgcct gaaagaaatg 60
atccagaacg gtcacgctcg tcgtatgggt tctgttgaag acctgtacgt tgctctgaac 120
cgtcagaacc tgtaccgtaa cttctgcacc tacggtgaac tgtctgacta ctgcacccgt 180
gaccagctga ccctggctct gcgtgaaatc tgcctgaaaa acccgaccct gctgcacatc 240
gttctgccga cccgttggcc gaaccacgaa aactactacc gttcttctga atactactct 300
cgtccgcacc cggttcacga ctacatctct gttctgcagg aactgaaact gtctggtgtt 360
gttctgaacg aacagccgga atactctgct gttatgaaac agatcctgga agaattcaaa 420
aactctaaag gttcttacac cgctaaaatc ttcaaactga ccaccaccct gaccatcccg 480
tacttcggtc cgaccggtcc gtcttggcgt ctgatctgcc tgccggaaga acacaccgaa 540
aaatggaaaa aattcatctt cgtttctaac cactgcatgt ctgacggtcg ttcttctatc 600
cacttcttcc acgacctgcg tgacgaactg aacaacatca aaaccccgcc gaaaaaactg 660
gactacatct tcaaatacga agaagactac cagctgctgc gtaaactgcc ggaaccgatc 720
gaaaaagtta tcgacttccg tccgccgtac ctgttcatcc cgaaatctct gctgtctggt 780
ttcatctaca accacctgcg tttctcttct aaaggtgttt gcatgcgtat ggacgacgtt 840
gaaaaaaccg acgacgttgt taccgaaatc atcaacatct ctccgaccga attccaggct 900
atcaaagcta acatcaaatc taacatccag ggtaaatgca ccatcacccc gttcctgcac 960
gtttgctggt tcgtttctct gcacaaatgg ggtaaattct tcaaaccgct gaacttcgaa 1020
tggctgaccg acatcttcat cccggctgac tgccgttctc agctgccgga cgacgacgaa 1080
atgcgtcaga tgtaccgtta cggtgctaac gttggtttca tcgacttcac cccgtggatc 1140
tctgaattcg acatgaacga caacaaagaa aacttctggc cgctgatcga acactaccac 1200
gaagttatct ctgaagctct gcgtaacaaa aaacacctgc acggtctggg tttcaacatc 1260
cagggtttcg ttcagaaata cgttaacatc gacaaagtta tgtgcgaccg tgctatcggt 1320
aaacgtcgtg gtggtaccct gctgtctaac gttggtctgt tcaaccagct ggaagaaccg 1380
gacgctaaat actctatctg cgacctggct ttcggtcagt tccagggttc ttggcaccag 1440
gctttctctc tgggtgtttg ctctaccaac gttaaaggta tgaacatcgt tgttgcttct 1500
accaaaaacg ttgttggttc tcaggaatct ctggaagaac tgtgctctat ctacaaagct 1560
ctgctgctgg gtccgtag 1578
<210> 24
<211> 525
<212> PRT
<213> 酿酒酵母(Saccharomyces cerevisiae)
<400> 24
Met Asn Glu Ile Asp Glu Lys Asn Gln Ala Pro Val His Gln Glu Cys
1 5 10 15
Leu Lys Glu Met Ile Gln Asn Gly His Ala Arg Arg Met Gly Ser Val
20 25 30
Glu Asp Leu Tyr Val Ala Leu Asn Arg Gln Asn Leu Tyr Arg Asn Phe
35 40 45
Cys Thr Tyr Gly Glu Leu Ser Asp Tyr Cys Thr Arg Asp Gln Leu Thr
50 55 60
Leu Ala Leu Arg Glu Ile Cys Leu Lys Asn Pro Thr Leu Leu His Ile
65 70 75 80
Val Leu Pro Thr Arg Trp Pro Asn His Glu Asn Tyr Tyr Arg Ser Ser
85 90 95
Glu Tyr Tyr Ser Arg Pro His Pro Val His Asp Tyr Ile Ser Val Leu
100 105 110
Gln Glu Leu Lys Leu Ser Gly Val Val Leu Asn Glu Gln Pro Glu Tyr
115 120 125
Ser Ala Val Met Lys Gln Ile Leu Glu Glu Phe Lys Asn Ser Lys Gly
130 135 140
Ser Tyr Thr Ala Lys Ile Phe Lys Leu Thr Thr Thr Leu Thr Ile Pro
145 150 155 160
Tyr Phe Gly Pro Thr Gly Pro Ser Trp Arg Leu Ile Cys Leu Pro Glu
165 170 175
Glu His Thr Glu Lys Trp Lys Lys Phe Ile Phe Val Ser Asn His Cys
180 185 190
Met Ser Asp Gly Arg Ser Ser Ile His Phe Phe His Asp Leu Arg Asp
195 200 205
Glu Leu Asn Asn Ile Lys Thr Pro Pro Lys Lys Leu Asp Tyr Ile Phe
210 215 220
Lys Tyr Glu Glu Asp Tyr Gln Leu Leu Arg Lys Leu Pro Glu Pro Ile
225 230 235 240
Glu Lys Val Ile Asp Phe Arg Pro Pro Tyr Leu Phe Ile Pro Lys Ser
245 250 255
Leu Leu Ser Gly Phe Ile Tyr Asn His Leu Arg Phe Ser Ser Lys Gly
260 265 270
Val Cys Met Arg Met Asp Asp Val Glu Lys Thr Asp Asp Val Val Thr
275 280 285
Glu Ile Ile Asn Ile Ser Pro Thr Glu Phe Gln Ala Ile Lys Ala Asn
290 295 300
Ile Lys Ser Asn Ile Gln Gly Lys Cys Thr Ile Thr Pro Phe Leu His
305 310 315 320
Val Cys Trp Phe Val Ser Leu His Lys Trp Gly Lys Phe Phe Lys Pro
325 330 335
Leu Asn Phe Glu Trp Leu Thr Asp Ile Phe Ile Pro Ala Asp Cys Arg
340 345 350
Ser Gln Leu Pro Asp Asp Asp Glu Met Arg Gln Met Tyr Arg Tyr Gly
355 360 365
Ala Asn Val Gly Phe Ile Asp Phe Thr Pro Trp Ile Ser Glu Phe Asp
370 375 380
Met Asn Asp Asn Lys Glu Asn Phe Trp Pro Leu Ile Glu His Tyr His
385 390 395 400
Glu Val Ile Ser Glu Ala Leu Arg Asn Lys Lys His Leu His Gly Leu
405 410 415
Gly Phe Asn Ile Gln Gly Phe Val Gln Lys Tyr Val Asn Ile Asp Lys
420 425 430
Val Met Cys Asp Arg Ala Ile Gly Lys Arg Arg Gly Gly Thr Leu Leu
435 440 445
Ser Asn Val Gly Leu Phe Asn Gln Leu Glu Glu Pro Asp Ala Lys Tyr
450 455 460
Ser Ile Cys Asp Leu Ala Phe Gly Gln Phe Gln Gly Ser Trp His Gln
465 470 475 480
Ala Phe Ser Leu Gly Val Cys Ser Thr Asn Val Lys Gly Met Asn Ile
485 490 495
Val Val Ala Ser Thr Lys Asn Val Val Gly Ser Gln Glu Ser Leu Glu
500 505 510
Glu Leu Cys Ser Ile Tyr Lys Ala Leu Leu Leu Gly Pro
515 520 525
<210> 25
<211> 621
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 25
atgaaaacta cgcatacctc cctccccttt gccggacata cgctgcattt tgttgagttc 60
gatccggcga atttttgtga gcaggattta ctctggctgc cgcactacgc acaactgcaa 120
cacgctggac gtaaacgtaa aacagagcat ttagccggac ggatcgctgc tgtttatgct 180
ttgcgggaat atggctataa atgtgtgccc gcaatcggcg agctacgcca acctgtctgg 240
cctgcggagg tatacggcag tattagccac tgtgggacta cggcattagc cgtggtatct 300
cgtcaaccga ttggcattga tatagaagaa attttttctg tacaaaccgc aagagaattg 360
acagacaaca ttattacacc agcggaacac gagcgactcg cagactgcgg tttagccttt 420
tctctggcgc tgacactggc attttccgcc aaagagagcg catttaaggc aagtgagatc 480
caaactgatg caggttttct ggactatcag ataattagct ggaataaaca gcaggtcatc 540
attcatcgtg agaatgagat gtttgctgtg cactggcaga taaaagaaaa gatagtcata 600
acgctgtgcc aacacgatta a 621
<210> 26
<211> 206
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 26
Met Lys Thr Thr His Thr Ser Leu Pro Phe Ala Gly His Thr Leu His
1 5 10 15
Phe Val Glu Phe Asp Pro Ala Asn Phe Cys Glu Gln Asp Leu Leu Trp
20 25 30
Leu Pro His Tyr Ala Gln Leu Gln His Ala Gly Arg Lys Arg Lys Thr
35 40 45
Glu His Leu Ala Gly Arg Ile Ala Ala Val Tyr Ala Leu Arg Glu Tyr
50 55 60
Gly Tyr Lys Cys Val Pro Ala Ile Gly Glu Leu Arg Gln Pro Val Trp
65 70 75 80
Pro Ala Glu Val Tyr Gly Ser Ile Ser His Cys Gly Thr Thr Ala Leu
85 90 95
Ala Val Val Ser Arg Gln Pro Ile Gly Ile Asp Ile Glu Glu Ile Phe
100 105 110
Ser Val Gln Thr Ala Arg Glu Leu Thr Asp Asn Ile Ile Thr Pro Ala
115 120 125
Glu His Glu Arg Leu Ala Asp Cys Gly Leu Ala Phe Ser Leu Ala Leu
130 135 140
Thr Leu Ala Phe Ser Ala Lys Glu Ser Ala Phe Lys Ala Ser Glu Ile
145 150 155 160
Gln Thr Asp Ala Gly Phe Leu Asp Tyr Gln Ile Ile Ser Trp Asn Lys
165 170 175
Gln Gln Val Ile Ile His Arg Glu Asn Glu Met Phe Ala Val His Trp
180 185 190
Gln Ile Lys Glu Lys Ile Val Ile Thr Leu Cys Gln His Asp
195 200 205
<210> 27
<211> 141
<212> PRT
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 27
Met Ser Leu Ser Ile Glu Gln Ile Met Glu Ile Ile Pro His Arg Tyr
1 5 10 15
Pro Met Leu Leu Val Asp Arg Val Glu Glu Ile Glu Pro Gly Lys Arg
20 25 30
Ala Val Gly Tyr Lys Asn Val Thr Phe Asn Glu Gln Ile Phe Gln Gly
35 40 45
His Tyr Pro Gly Lys Pro Ile Met Pro Gly Val Leu Met Ile Glu Ala
50 55 60
Leu Ala Gln Leu Gly Gly Val Ala Ile Leu Ser Leu Asp Lys Tyr Lys
65 70 75 80
Gly Lys Lys Pro Ile Leu Gly Ala Val Lys Asn Ala Lys Phe Arg Arg
85 90 95
Met Val Val Pro Gly Asp Val Leu Lys Leu Glu Ile Glu Ile Val Lys
100 105 110
Val Lys Gly Pro Ala Gly Ile Gly Lys Gly Ile Ala Thr Val Asn Gly
115 120 125
Glu Lys Ala Val Glu Ala Glu Ile Thr Phe Met Ile Val
130 135 140
<210> 28
<211> 155
<212> PRT
<213> 细长聚球藻(Synechococcus elongatus)
<400> 28
Met Thr Val Asn Pro Asp Ala Pro Ala Leu Pro Thr Leu Pro Leu Ala
1 5 10 15
Val Glu Thr Ile Gln Gly Leu Leu Pro His Arg Tyr Pro Phe Ala Leu
20 25 30
Val Asp Arg Ile Ile Asp Tyr Val Pro Gly Glu Arg Ala Val Gly Ile
35 40 45
Lys Asn Val Thr Phe Asn Glu Pro Gln Phe Gln Gly His Phe Pro Gly
50 55 60
Arg Pro Leu Met Pro Gly Val Leu Ile Val Glu Ala Met Ala Gln Val
65 70 75 80
Gly Gly Val Ile Val Thr Leu Met Pro Asp Met Pro Gln Gly Leu Phe
85 90 95
Val Phe Ala Gly Ile Asp Gln Val Arg Phe Arg Arg Pro Val Val Pro
100 105 110
Gly Asp Gln Leu Val Leu Ser Ala Gln Leu Leu Ser Val Lys Arg Arg
115 120 125
Arg Phe Cys Lys Ile Gln Gly Glu Ala Met Val Asp Gly Gln Leu Ala
130 135 140
Ala Ser Gly Glu Leu Leu Phe Ser Leu Val Glu
145 150 155
<210> 29
<211> 558
<212> PRT
<213> 食油假单胞菌(Pseudomonas oleovorans)
<400> 29
Met Tyr Asp Tyr Ile Ile Val Gly Ala Gly Ser Ala Gly Cys Val Leu
1 5 10 15
Ala Asn Arg Leu Ser Ala Asp Pro Ser Lys Arg Val Cys Leu Leu Glu
20 25 30
Ala Gly Pro Arg Asp Thr Asn Pro Leu Ile His Met Pro Leu Gly Ile
35 40 45
Ala Leu Leu Ser Asn Ser Lys Lys Leu Asn Trp Ala Phe Gln Thr Ala
50 55 60
Pro Gln Gln Asn Leu Asn Gly Arg Ser Leu Phe Trp Pro Arg Gly Lys
65 70 75 80
Thr Leu Gly Gly Ser Ser Ser Ile Asn Ala Met Val Tyr Ile Arg Gly
85 90 95
His Glu Asp Asp Tyr His Ala Trp Glu Gln Ala Ala Gly Arg Tyr Trp
100 105 110
Gly Trp Tyr Arg Ala Leu Glu Leu Phe Lys Arg Leu Glu Cys Asn Gln
115 120 125
Arg Phe Asp Lys Ser Glu His His Gly Val Asp Gly Glu Leu Ala Val
130 135 140
Ser Asp Leu Lys Tyr Ile Asn Pro Leu Ser Lys Ala Phe Val Gln Ala
145 150 155 160
Gly Met Glu Ala Asn Ile Asn Phe Asn Gly Asp Phe Asn Gly Glu Tyr
165 170 175
Gln Asp Gly Val Gly Phe Tyr Gln Val Thr Gln Lys Asn Gly Gln Arg
180 185 190
Trp Ser Ser Ala Arg Ala Phe Leu His Gly Val Leu Ser Arg Pro Asn
195 200 205
Leu Asp Ile Ile Thr Asp Ala His Ala Ser Lys Ile Leu Phe Glu Asp
210 215 220
Arg Lys Ala Val Gly Val Ser Tyr Ile Lys Lys Asn Met His His Gln
225 230 235 240
Val Lys Thr Thr Ser Gly Gly Glu Val Leu Leu Ser Leu Gly Ala Val
245 250 255
Gly Thr Pro His Leu Leu Met Leu Ser Gly Val Gly Ala Ala Ala Glu
260 265 270
Leu Lys Glu His Gly Val Ser Leu Val His Asp Leu Pro Glu Val Gly
275 280 285
Lys Asn Leu Gln Asp His Leu Asp Ile Thr Leu Met Cys Ala Ala Asn
290 295 300
Ser Arg Glu Pro Ile Gly Val Ala Leu Ser Phe Ile Pro Arg Gly Val
305 310 315 320
Ser Gly Leu Phe Ser Tyr Val Phe Lys Arg Glu Gly Phe Leu Thr Ser
325 330 335
Asn Val Ala Glu Ser Gly Gly Phe Val Lys Ser Ser Pro Asp Arg Asp
340 345 350
Arg Pro Asn Leu Gln Phe His Phe Leu Pro Thr Tyr Leu Lys Asp His
355 360 365
Gly Arg Lys Ile Ala Gly Gly Tyr Gly Tyr Thr Leu His Ile Cys Asp
370 375 380
Leu Leu Pro Lys Ser Arg Gly Arg Ile Gly Leu Lys Ser Ala Asn Pro
385 390 395 400
Leu Gln Pro Pro Leu Ile Asp Pro Asn Tyr Leu Ser Asp His Glu Asp
405 410 415
Ile Lys Thr Met Ile Ala Gly Ile Lys Ile Gly Arg Ala Ile Leu Gln
420 425 430
Ala Pro Ser Met Ala Lys His Phe Lys His Glu Val Val Pro Gly Gln
435 440 445
Ala Val Lys Thr Asp Asp Glu Ile Ile Glu Asp Ile Arg Arg Arg Ala
450 455 460
Glu Thr Ile Tyr His Pro Val Gly Thr Cys Arg Met Gly Lys Asp Pro
465 470 475 480
Ala Ser Val Val Asp Pro Cys Leu Lys Ile Arg Gly Leu Ala Asn Ile
485 490 495
Arg Val Val Asp Ala Ser Ile Met Pro His Leu Val Ala Gly Asn Thr
500 505 510
Asn Ala Pro Thr Ile Met Ile Ala Glu Asn Ala Ala Glu Ile Ile Met
515 520 525
Arg Asn Leu Asp Val Glu Ala Leu Glu Ala Ser Ala Glu Phe Ala Arg
530 535 540
Glu Gly Ala Glu Leu Glu Leu Ala Met Ile Ala Val Cys Met
545 550 555
<210> 30
<211> 503
<212> PRT
<213> 贝氏不动杆菌(Acinetobacter baylyi)
<400> 30
Met Arg Tyr Ile Asp Pro Asn Gln Pro Gly Ser Lys Val Gln Phe Lys
1 5 10 15
Ala Gln Tyr Glu Asn Phe Ile Gly Gly Gln Trp Val Pro Pro Val Lys
20 25 30
Gly Glu Tyr Phe Gly Asn Ser Ser Pro Val Asp Gly Lys Val Phe Thr
35 40 45
Gln Ile Pro Arg Ser Ser Val Glu Asp Ile Glu Leu Ala Leu Asp Ala
50 55 60
Ala His Lys Ala Lys Ala Asp Trp Asn Lys Ala Ser Pro Thr Val Arg
65 70 75 80
Ser Asn Val Leu Leu Lys Ile Ala Asp Arg Leu Glu Glu Asn Leu Glu
85 90 95
Leu Leu Ala Val Ala Glu Thr Trp Glu Asn Gly Lys Pro Ile Arg Glu
100 105 110
Thr Leu Ala Ala Asp Ile Pro Leu Ala Ile Asp His Phe Arg Tyr Phe
115 120 125
Ala Gly Cys Ile Arg Ala Gln Glu Gly Gly Ile Ser Glu Ile Asp Glu
130 135 140
Asp Thr Ile Ala Tyr His Phe His Glu Pro Leu Gly Val Val Gly Gln
145 150 155 160
Ile Ile Pro Trp Asn Phe Pro Ile Leu Met Ala Ala Trp Lys Leu Ala
165 170 175
Pro Ala Leu Ala Ala Gly Asn Cys Ile Val Leu Lys Pro Ala Glu Gln
180 185 190
Thr Pro Ser Ser Ile Leu Val Leu Ala Glu Leu Ile Gln Asp Leu Leu
195 200 205
Pro Pro Gly Val Leu Asn Ile Val Asn Gly Tyr Gly Ala Glu Val Gly
210 215 220
Arg Pro Leu Ala Thr Asn Pro Arg Ile Ser Lys Ile Ala Phe Thr Gly
225 230 235 240
Ser Thr Lys Val Gly Gln Met Ile Met Gln Tyr Ala Thr Glu Asn Ile
245 250 255
Ile Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Asn Ile Phe Phe
260 265 270
Glu Asp Ile Leu Asp Lys Glu Asp Asp Tyr Leu Glu Lys Thr Leu Glu
275 280 285
Gly Phe Ala Met Phe Ala Leu Asn Gln Gly Glu Val Cys Thr Cys Pro
290 295 300
Ser Arg Ala Leu Val Gln Glu Ser Ile Ala Asp Lys Phe Leu Glu Met
305 310 315 320
Ala Val Glu Arg Val Lys Arg Ile Lys Thr Gly His Pro Leu Asp Thr
325 330 335
Glu Thr Met Ile Gly Ala Gln Ala Ser Lys Gln Gln Phe Asp Lys Ile
340 345 350
Leu Gly Cys Ile Asp Thr Gly Arg Asn Glu Gly Ala Gln Leu Leu Thr
355 360 365
Gly Gly Asp Ala Arg His Asp Val Asp Gly Gly Phe Tyr Ile Glu Pro
370 375 380
Thr Ile Phe Lys Gly Asn Asn Ser Met Lys Ile Phe Gln Glu Glu Ile
385 390 395 400
Phe Gly Pro Val Leu Ser Val Thr Thr Phe Lys Asp Phe Asp Asp Ala
405 410 415
Met Arg Ile Ala Asn Asp Thr Ile Tyr Gly Leu Gly Ala Gly Val Trp
420 425 430
Ser Arg Ser Ala His Thr Ser Tyr Arg Ala Gly Arg Ala Ile Glu Ala
435 440 445
Gly Arg Val Trp Thr Asn Cys Tyr His Leu Tyr Pro Ala His Ala Ala
450 455 460
Phe Gly Gly Tyr Lys Gln Ser Gly Ile Gly Arg Glu Asn His Arg Met
465 470 475 480
Met Leu Asp His Tyr Gln Gln Thr Lys Asn Leu Leu Val Ser Tyr Ser
485 490 495
Thr Lys Pro Met Gly Phe Phe
500
<210> 31
<211> 506
<212> PRT
<213> 埃氏海杆菌(Marinobacter aquaeoli)
<400> 31
Met Ile Tyr Ala Gln Pro Gly Gln Glu Gly Ser Val Val Ser Phe Lys
1 5 10 15
Ser Arg Tyr Glu Asn Tyr Ile Gly Gly Glu Trp Val Ala Pro Val Lys
20 25 30
Gly Gln Tyr Phe Asp Asn Ile Thr Pro Val Thr Gly Ala Val Phe Cys
35 40 45
Glu Val Pro Arg Ser Thr Ala Glu Asp Ile Asp Leu Ala Leu Asp Ala
50 55 60
Ala His Lys Ala Ala Pro Ala Trp Gly Lys Thr Ser Pro Thr Glu Arg
65 70 75 80
Ser Asn Ile Leu Leu Lys Ile Ala Asp Arg Ile Glu Ala Asn Leu Glu
85 90 95
Lys Leu Ala Val Ala Glu Thr Trp Asp Asn Gly Lys Ala Val Arg Glu
100 105 110
Thr Leu Asn Ala Asp Val Pro Leu Ala Ala Asp His Leu Arg Tyr Phe
115 120 125
Ala Gly Cys Ile Arg Ala Gln Glu Gly His Met Ser Glu Ile Asp His
130 135 140
Asn Thr Val Ala Tyr His Phe His Glu Pro Leu Gly Val Val Gly Gln
145 150 155 160
Ile Ile Pro Trp Asn Phe Pro Leu Leu Met Ala Ala Trp Lys Leu Gly
165 170 175
Pro Cys Leu Ala Ser Gly Asn Cys Thr Val Leu Lys Pro Ala Glu Gln
180 185 190
Thr Pro Ala Ser Ile Leu Val Leu Met Asp Ile Ile Gly Asp Leu Leu
195 200 205
Pro Pro Gly Val Ile Asn Ile Val Asn Gly Tyr Gly Ile Glu Ala Gly
210 215 220
Gln Ala Leu Ala Thr Ser Lys Arg Ile Ala Lys Ile Ala Phe Thr Gly
225 230 235 240
Ser Thr Pro Val Gly Ser His Ile Leu Lys Cys Ala Ala Glu Asn Ile
245 250 255
Ile Pro Ser Thr Val Glu Leu Gly Gly Lys Ser Pro Asn Ile Tyr Phe
260 265 270
Ser Asp Val Met Lys Ala Glu Pro Glu Phe Val Asp Lys Cys Val Glu
275 280 285
Gly Leu Val Leu Ala Phe Phe Asn Gln Gly Glu Ile Cys Thr Cys Pro
290 295 300
Ser Arg Ala Leu Val Gln Glu Asp Met Phe Glu Glu Phe Met Gln Lys
305 310 315 320
Val Val Glu Arg Thr Lys Ser Ile Lys Arg Gly Asn Pro Leu Asp Thr
325 330 335
Asp Val Gln Val Gly Ala Gln Ala Ser Lys Glu Gln Phe Asp Lys Ile
340 345 350
Met Ser Tyr Met Glu Ile Gly Arg Gln Glu Gly Ala Val Val Leu Thr
355 360 365
Gly Gly Asp Arg Glu His Leu Glu Gly Glu Phe Asn Asn Gly Phe Tyr
370 375 380
Ile Gln Pro Thr Leu Phe Lys Gly Asp Asn Lys Met Arg Val Phe Gln
385 390 395 400
Glu Glu Ile Phe Gly Pro Val Val Gly Val Thr Thr Phe Lys Thr Glu
405 410 415
Glu Glu Ala Leu Ala Ile Ala Asn Asp Thr Glu Phe Gly Leu Gly Ala
420 425 430
Gly Val Trp Thr Arg Asp Thr Asn Leu Ala Tyr Arg Met Gly Arg Asn
435 440 445
Ile Gln Ala Gly Arg Val Trp Met Asn Cys Tyr His Ala Tyr Pro Ala
450 455 460
His Ala Ala Phe Gly Gly Tyr Lys Lys Ser Gly Ile Gly Arg Glu Asn
465 470 475 480
His Lys Met Ala Leu Glu His Tyr Gln Gln Thr Lys Cys Met Leu Thr
485 490 495
Ser Tyr Asp Thr Asn Pro Leu Gly Phe Phe
500 505
<210> 32
<211> 483
<212> PRT
<213> 食油假单胞菌(Pseudomonas oleovorans)
<400> 32
Met Thr Ile Pro Ile Ser Leu Ala Lys Leu Asn Ser Ser Ala Asp Thr
1 5 10 15
His Ser Ala Leu Glu Val Phe Asn Leu Gln Lys Val Ala Ser Ser Ala
20 25 30
Arg Arg Gly Lys Phe Gly Ile Ala Glu Arg Ile Ala Ala Leu Asn Leu
35 40 45
Leu Lys Glu Thr Ile Gln Arg Arg Glu Pro Glu Ile Ile Ala Ala Leu
50 55 60
Ala Ala Asp Phe Arg Lys Pro Ala Ser Glu Val Lys Leu Thr Glu Ile
65 70 75 80
Phe Pro Val Leu Gln Glu Ile Asn His Ala Lys Arg Asn Leu Lys Asp
85 90 95
Trp Met Lys Pro Arg Arg Val Arg Ala Ala Leu Ser Val Ala Gly Thr
100 105 110
Arg Ala Gly Leu Arg Tyr Glu Pro Lys Gly Val Cys Leu Ile Ile Ala
115 120 125
Pro Trp Asn Tyr Pro Phe Asn Leu Ser Phe Gly Pro Leu Val Ser Ala
130 135 140
Leu Ala Ala Gly Asn Ser Val Val Ile Lys Pro Ser Glu Leu Thr Pro
145 150 155 160
His Thr Ala Thr Leu Ile Gly Ser Ile Val Arg Glu Ala Phe Ser Val
165 170 175
Asp Leu Val Ala Val Val Glu Gly Asp Ala Ala Val Ser Gln Glu Leu
180 185 190
Leu Ala Leu Pro Phe Asp His Ile Phe Phe Thr Gly Ser Pro Arg Val
195 200 205
Gly Lys Leu Val Met Glu Ala Ala Ser Lys Thr Leu Ala Ser Val Thr
210 215 220
Leu Glu Leu Gly Gly Lys Ser Pro Thr Ile Ile Gly Pro Thr Ala Asn
225 230 235 240
Leu Pro Lys Ala Ala Arg Asn Ile Val Trp Gly Lys Phe Ser Asn Asn
245 250 255
Gly Gln Thr Cys Ile Ala Pro Asp His Val Phe Val His Arg Cys Ile
260 265 270
Ala Gln Lys Phe Asn Glu Ile Leu Val Lys Glu Ile Val Arg Val Tyr
275 280 285
Gly Lys Asp Phe Ala Ala Gln Arg Arg Ser Ala Asp Tyr Cys Arg Ile
290 295 300
Val Asn Asp Gln His Phe Asn Arg Ile Asn Lys Leu Leu Thr Asp Ala
305 310 315 320
Lys Ala Lys Gly Ala Lys Ile Leu Gln Gly Gly Gln Val Asp Ala Thr
325 330 335
Glu Arg Leu Val Val Pro Thr Val Leu Ser Asn Val Thr Ala Ala Met
340 345 350
Asp Ile Asn His Glu Glu Ile Phe Gly Pro Leu Leu Pro Ile Ile Glu
355 360 365
Tyr Asp Asp Ile Asp Ser Val Ile Lys Arg Val Asn Asp Gly Asp Lys
370 375 380
Pro Leu Ala Leu Tyr Val Phe Ser Glu Asp Lys Gln Phe Val Asn Asn
385 390 395 400
Ile Val Ala Arg Thr Ser Ser Gly Ser Val Gly Val Asn Leu Ser Val
405 410 415
Val His Phe Leu His Pro Asn Leu Pro Phe Gly Gly Val Asn Asn Ser
420 425 430
Gly Ile Gly Ser Ala His Gly Val Tyr Gly Phe Arg Ala Phe Ser His
435 440 445
Glu Lys Pro Val Leu Ile Asp Lys Phe Ser Ile Thr His Trp Leu Phe
450 455 460
Pro Pro Tyr Thr Lys Lys Val Lys Gln Leu Ile Gly Ile Thr Val Lys
465 470 475 480
Tyr Leu Ser
<210> 33
<211> 406
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 33
Met Lys Arg Ala Val Ile Thr Gly Leu Gly Ile Val Ser Ser Ile Gly
1 5 10 15
Asn Asn Gln Gln Glu Val Leu Ala Ser Leu Arg Glu Gly Arg Ser Gly
20 25 30
Ile Thr Phe Ser Gln Glu Leu Lys Asp Ser Gly Met Arg Ser His Val
35 40 45
Trp Gly Asn Val Lys Leu Asp Thr Thr Gly Leu Ile Asp Arg Lys Val
50 55 60
Val Arg Phe Met Ser Asp Ala Ser Ile Tyr Ala Phe Leu Ser Met Glu
65 70 75 80
Gln Ala Ile Ala Asp Ala Gly Leu Ser Pro Glu Ala Tyr Gln Asn Asn
85 90 95
Pro Arg Val Gly Leu Ile Ala Gly Ser Gly Gly Gly Ser Pro Arg Phe
100 105 110
Gln Val Phe Gly Ala Asp Ala Met Arg Gly Pro Arg Gly Leu Lys Ala
115 120 125
Val Gly Pro Tyr Val Val Thr Lys Ala Met Ala Ser Gly Val Ser Ala
130 135 140
Cys Leu Ala Thr Pro Phe Lys Ile His Gly Val Asn Tyr Ser Ile Ser
145 150 155 160
Ser Ala Cys Ala Thr Ser Ala His Cys Ile Gly Asn Ala Val Glu Gln
165 170 175
Ile Gln Leu Gly Lys Gln Asp Ile Val Phe Ala Gly Gly Gly Glu Glu
180 185 190
Leu Cys Trp Glu Met Ala Cys Glu Phe Asp Ala Met Gly Ala Leu Ser
195 200 205
Thr Lys Tyr Asn Asp Thr Pro Glu Lys Ala Ser Arg Thr Tyr Asp Ala
210 215 220
His Arg Asp Gly Phe Val Ile Ala Gly Gly Gly Gly Met Val Val Val
225 230 235 240
Glu Glu Leu Glu His Ala Leu Ala Arg Gly Ala His Ile Tyr Ala Glu
245 250 255
Ile Val Gly Tyr Gly Ala Thr Ser Asp Gly Ala Asp Met Val Ala Pro
260 265 270
Ser Gly Glu Gly Ala Val Arg Cys Met Lys Met Ala Met His Gly Val
275 280 285
Asp Thr Pro Ile Asp Tyr Leu Asn Ser His Gly Thr Ser Thr Pro Val
290 295 300
Gly Asp Val Lys Glu Leu Ala Ala Ile Arg Glu Val Phe Gly Asp Lys
305 310 315 320
Ser Pro Ala Ile Ser Ala Thr Lys Ala Met Thr Gly His Ser Leu Gly
325 330 335
Ala Ala Gly Val Gln Glu Ala Ile Tyr Ser Leu Leu Met Leu Glu His
340 345 350
Gly Phe Ile Ala Pro Ser Ile Asn Ile Glu Glu Leu Asp Glu Gln Ala
355 360 365
Ala Gly Leu Asn Ile Val Thr Glu Thr Thr Asp Arg Glu Leu Thr Thr
370 375 380
Val Met Ser Asn Ser Phe Gly Phe Gly Gly Thr Asn Ala Thr Leu Val
385 390 395 400
Met Arg Lys Leu Lys Asp
405
<210> 34
<211> 1026
<212> DNA
<213> 细长聚球藻(Synechococcus elongatus)
<400> 34
atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60
atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120
atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180
gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240
gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300
tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360
accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420
caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480
gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540
gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600
ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660
tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720
gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780
tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840
gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900
ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960
aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020
atttga 1026
<210> 35
<211> 341
<212> PRT
<213> 细长聚球藻(Synechococcus elongatus)
<400> 35
Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp
1 5 10 15
Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu
20 25 30
Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr
35 40 45
Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe
50 55 60
Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys
65 70 75 80
Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser
85 90 95
Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala
100 105 110
Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr
115 120 125
Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala
130 135 140
Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val
145 150 155 160
Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp
165 170 175
Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu
180 185 190
Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro
195 200 205
Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser
210 215 220
Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys
225 230 235 240
Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln
245 250 255
Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe
260 265 270
Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu
275 280 285
Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu
290 295 300
Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu
305 310 315 320
Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro
325 330 335
Leu Ala Leu Ala Ile
340

Claims (70)

1.一种包含异源酰基-ACP去饱和酶和异源酰基-ACP硫酯酶的重组变形菌门;其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱;并且其中该重组变形菌门产生非天然单不饱和游离脂肪酸或其衍生物。
2.如权利要求1所述的重组变形菌门,其中该重组细菌为γ-变形菌纲。
3.如权利要求1或2所述的重组变形菌门,其中该重组变形菌门选自由大肠杆菌、沙门氏菌属物种、需钠弧菌、铜绿假单胞菌、恶臭假单胞菌、荧光假单胞菌、地毯草黄单胞菌、丁香假单胞菌、苛养木杆菌和水油海杆菌组成的组。
4.如前述权利要求中任一项所述的重组变形菌门,其中该异源酰基-ACP-去饱和酶为Δ9-十四烷酰基-酰基-ACP去饱和酶。
5.如前述权利要求中任一项所述的重组变形菌门,其中该异源酰基-ACP去饱和酶与SEQ ID NO:2或SEQ ID NO:12具有约85%的序列同一性。
6.如前述权利要求中任一项所述的重组变形菌门,其中该异源酰基-ACP硫酯酶为植物FatA型硫酯酶、植物FatB型硫酯酶或细菌酰基-ACP硫酯酶。
7.如前述权利要求中任一项所述的重组变形菌门,其中该异源酰基-ACP硫酯酶与SEQID NO:8具有约85%的序列同一性。
8.如前述权利要求中任一项所述的重组变形菌门,其中该非天然单不饱和游离脂肪酸为ω5-单不饱和游离脂肪酸或其衍生物。
9.如前述权利要求中任一项所述的重组变形菌门,其中由该重组变形菌门产生的非天然单不饱和游离脂肪酸或其衍生物的量大于由该重组变形菌门产生的天然和非天然单不饱和游离脂肪酸或其衍生物总量的90%。
10.如前述权利要求中任一项所述的重组变形菌门,其中该非天然单不饱和游离脂肪酸选自由z9-十四碳烯酸、z11-十六碳烯酸、z13-十八碳烯酸及其组合组成的组。
11.如前述权利要求中任一项所述的重组变形菌门,该重组变形菌门进一步包含异源铁氧还蛋白。
12.如前述权利要求中任一项所述的重组变形菌门,其中该重组细菌过表达内源黄素氧还蛋白还原酶或铁氧还蛋白还原酶或表达异源铁氧还蛋白还原酶或异源黄素氧还蛋白还原酶。
13.如前述权利要求中任一项所述的重组变形菌门,其中该重组变形菌门进一步包含异源3-羟基酰基-ACP-脱水酶(FabZ)。
14.如前述权利要求中任一项所述的重组变形菌门,其中与相应的野生型变形菌门相比,该重组变形菌门进一步包含(1)增加水平的FadR多肽的表达,和/或(2)增加水平的DNA结合活性。
15.如前述权利要求中任一项所述的重组变形菌门,其中该重组变形菌门进一步包含异源羧酸还原酶。
16.如权利要求15所述的重组变形菌门,其中该重组变形菌门产生不饱和脂肪醛或不饱和脂肪醇。
17.如权利要求16所述的重组变形菌门,其中该不饱和脂肪醛或不饱和脂肪醇选自由z9-十四碳烯醛、z11-十六碳烯醛、z13-十八碳烯醛、z9-十四碳烯醇、z11-十六碳烯醇、z13-十八碳烯醇及其组合组成的组。
18.如权利要求15-17中任一项所述的重组变形菌门,其中该异源羧酸还原酶与SEQ IDNO:18具有约85%的序列同一性。
19.如前述权利要求中任一项所述的重组变形菌门,其中该重组细菌进一步包含异源醇脱氢酶。
20.如权利要求19所述的重组变形菌门,其中该异源醇脱氢酶与SEQ ID NO:20具有约85%的序列同一性。
21.如权利要求15-20中任一项所述的重组变形菌门,其中该重组细菌进一步包含异源磷酸泛酰巯基乙胺基转移酶。
22.如权利要求21所述的重组变形菌门,其中该异源磷酸泛酰巯基乙胺基转移酶与SEQID NO:26具有约85%的序列同一性。
23.如权利要求15-22中任一项所述的重组变形菌门,其中该重组变形菌门进一步包含异源醇乙酰-CoA转移酶。
24.如权利要求23所述的重组变形菌门,其中该异源醇乙酰-CoA转移酶与SEQ ID NO:24具有约85%的序列同一性。
25.如权利要求23或24所述的重组变形菌门,其中该重组细菌产生不饱和脂肪醇乙酸酯。
26.如权利要求25所述的重组变形菌门,其中该不饱和脂肪醇乙酸酯选自由z9-十四碳烯基乙酸酯、z11-十六碳烯基乙酸酯、z13-十八碳烯基乙酸酯及其组合组成的组。
27.如前述权利要求中任一项所述的重组变形菌门,其中该重组细菌进一步包含异源ω-羟化酶。
28.如权利要求27所述的重组变形菌门,其中该异源ω-羟化酶与SEQ ID NO:22具有约85%的序列同一性。
29.如权利要求27或28所述的重组变形菌门,其中该重组变形菌门产生不饱和ω-羟基脂肪酸。
30.如权利要求29所述的重组变形菌门,其中该不饱和ω-羟基脂肪酸选自由(z9)14-羟基-十四碳烯酸、(z11)16-羟基-十六碳烯酸、(z13)18-羟基-十八碳烯酸及其组合组成的组。
31.如权利要求27-29中任一项所述的重组变形菌门,其中该重组变形菌门进一步包含异源醇氧化酶/脱氢酶和/或异源醛脱氢酶。
32.如权利要求31所述的重组变形菌门,其中该重组变形菌门产生不饱和α/ω-二羧酸。
33.如权利要求32所述的重组变形菌门,其中该异源α/ω-二羧酸选自由(z5)1,14-十四碳烯二酸、(z5)1,16-十六碳烯二酸、(z5)1,18-十八碳烯二酸及其组合组成的组。
34.如前述权利要求中任一项所述的重组变形菌门,其中该脂肪酸衍生物包含脂肪醇、ω-羟基脂肪酸、脂肪醇乙酸酯、脂肪醛或α/ω-二羧酸。
35.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含异源3-羟基酰基-ACP-脱水酶、异源铁氧还蛋白和异源黄素氧还蛋白还原酶。
36.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含异源β-酮脂酰-ACP-合酶和/或与相应的野生型变形菌门相比,该重组变形菌门具有增加水平的内源β-酮脂酰-ACP-合酶的表达。
37.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含异源羧酸还原酶、异源醇脱氢酶、异源磷酸泛酰巯基乙胺基转移酶和异源β-酮脂酰-ACP-合酶。
38.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含异源ω-羟化酶和异源β-酮脂酰-ACP-合酶。
39.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含异源羧酸还原酶和异源乙酰-CoA转移酶。
40.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含羧酸还原酶以及该重组变形菌门在内源醇脱氢酶和/或内源醛还原酶基因中具有一个或多个缺失。
41.如权利要求1所述的重组变形菌门,该重组变形菌门进一步包含异源醇脱氢酶、异源ω-羟化酶和异源醛脱氢酶。
42.一种用于生产非天然单不饱和游离脂肪酸或其衍生物的方法,该方法包括培养如权利要求1至41中任一项所述的重组变形菌门。
43.如权利要求41所述的方法,该方法进一步包括分离该非天然单不饱和游离脂肪酸或其衍生物。
44.一种单不饱和游离脂肪酸或其衍生物,该单不饱和游离脂肪酸或其衍生物通过如权利要求42和43中任一项所述的方法制备。
45.如权利要求44所述的单不饱和游离脂肪酸或其衍生物,其中该单不饱和游离脂肪酸或其衍生物是纯化的。
46.如权利要求44和45中任一项所述的单不饱和游离脂肪酸或其衍生物,其中该单不饱和游离脂肪酸或其衍生物通过选自由以下组成的组的方法纯化:两步离心和水洗;倾析离心和从生物质中进行溶剂提取;以及用水不混溶溶剂进行全培养液提取。
47.一种由如权利要求44-46中任一项所述的单不饱和游离脂肪酸或其衍生物制备的产品。
48.如权利要求46所述的产品,其中该产品是信息素香料或营养补充剂。
49.一种制备如权利要求47和48中任一项所述的产品的方法。
50.一种编码Δ9-十四烷酰基-酰基-ACP去饱和酶的核苷酸序列,该Δ9-十四烷酰基-酰基-ACP去饱和酶与SEQ ID NO:12具有至少85%的序列同一性。
51.如权利要求50所述的核苷酸序列,其中该核苷酸序列可操作地连接到一种或多种异源调节元件。
52.一种载体,该载体包含编码Δ9-十四烷酰基-酰基-ACP去饱和酶的核苷酸序列,该Δ9-十四烷酰基-酰基-ACP去饱和酶与SEQ ID NO:12具有至少85%的序列同一性。
53.一种重组宿主细胞,该重组宿主细胞包含编码Δ9-十四烷酰基-酰基-ACP去饱和酶的核苷酸序列,该Δ9-十四烷酰基-酰基-ACP去饱和酶与SEQ ID NO:12具有至少85%的序列同一性。
54.一种组合物,该组合物包含通过培养如权利要求1至41中任一项所述的重组变形菌门的方法制备的单不饱和游离脂肪酸或其衍生物。
55.如权利要求54所述的组合物,其中该组合物是该重组变形菌门的发酵产物。
56.如权利要求54或55中任一项所述的组合物,其中该组合物是昆虫信息素或昆虫信息素前体。
57.如权利要求54或55中任一项所述的组合物,其中该组合物是香料或香料前体。
58.如权利要求54至57中任一项所述的组合物,其中该单不饱和游离脂肪酸或其衍生物是纯化的。
59.如权利要求57所述的组合物,其中该单不饱和游离脂肪酸或其衍生物通过选自由以下组成的组的方法纯化:两步离心和水洗;倾析离心和从生物质中进行溶剂提取;以及用水不混溶溶剂进行全培养液提取。
60.一种用于制备昆虫信息素或昆虫信息素前体的方法,该方法包括培养如权利要求1至41中任一项所述的重组变形菌门以及分离该非天然单不饱和游离脂肪酸或其衍生物。
61.一种用于制备香料或香料前体的方法,该方法包括培养如权利要求1至41中任一项所述的重组变形菌门以及分离该非天然单不饱和游离脂肪酸或其衍生物。
62.如权利要求1至41中任一项所述的重组变形菌门的用途。
63.如权利要求62所述的用途,其中该变形菌门用于生产(1)昆虫信息素或信息素前体或(2)香料或香料前体。
64.包含单不饱和游离脂肪酸或其衍生物的组合物的用途,该单不饱和游离脂肪酸或其衍生物通过培养如权利要求1至41中任一项所述的重组变形菌门制备。
65.如权利要求64所述的用途,其中该组合物是发酵产物。
66.一种重组变形菌门,该重组变形菌门包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源羧酸还原酶和异源3-羟基酰基-ACP-脱水酶;其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱;并且其中该重组变形菌门产生非天然单不饱和游离脂肪酸或其衍生物。
67.一种重组变形菌门,该重组变形菌门包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源酰基-ACP还原酶和异源醇脱氢酶;其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱;其中该重组变形菌门产生非天然单不饱和脂肪醛和/或脂肪醇。
68.如权利要求66所述的重组变形菌门,该重组变形菌门进一步包含异源乙酰-COA转移酶。
69.一种重组变形菌门,该重组变形菌门包含异源酰基-ACP去饱和酶、异源铁氧还蛋白、异源黄素氧还蛋白还原酶或异源铁氧还蛋白还原酶、异源ω-羟化酶和异源3-羟基酰基-ACP脱水酶;其中天然双3-羟基酰基-ACP脱水酶/异构酶(FabA)被缺失或减弱;并且其中该重组变形菌门产生非天然单不饱和ω-羟基脂肪酸或其衍生物。
70.如权利要求69所述的重组变形菌门,该重组变形菌门进一步包含异源醇脱氢酶和/或异源醛脱氢酶。
CN202280025239.7A 2021-03-29 2022-03-22 细菌中非天然单不饱和脂肪酸的产生 Pending CN117083382A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163167355P 2021-03-29 2021-03-29
US63/167,355 2021-03-29
PCT/US2022/021290 WO2022212119A1 (en) 2021-03-29 2022-03-22 Production of non-native monounsaturated fatty acids in bacteria

Publications (1)

Publication Number Publication Date
CN117083382A true CN117083382A (zh) 2023-11-17

Family

ID=83459840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280025239.7A Pending CN117083382A (zh) 2021-03-29 2022-03-22 细菌中非天然单不饱和脂肪酸的产生

Country Status (3)

Country Link
EP (1) EP4314274A1 (zh)
CN (1) CN117083382A (zh)
WO (1) WO2022212119A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023178211A1 (en) 2022-03-16 2023-09-21 Genomatica, Inc. Microorganisms and methods for production of fatty acid derivatives with reduced levels of byproducts
WO2023178193A1 (en) * 2022-03-16 2023-09-21 Genomatica, Inc. Acyl-acp thioesterase variants and uses thereof

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100298612A1 (en) * 2009-05-22 2010-11-25 Codexis, Inc. Engineered biosynthesis of fatty alcohols
US20150050708A1 (en) * 2013-03-15 2015-02-19 Genomatica, Inc. Microorganisms and methods for producing butadiene and related compounds by formate assimilation
CA2915229A1 (en) * 2013-06-14 2014-12-18 REG Life Sciences, LLC Methods of producing omega-hydroxylated fatty acid derivatives
AR110606A1 (es) * 2016-06-06 2019-04-17 Provivi Inc Producción semi-biosintética de alcoholes grasos y aldehídos grasos

Also Published As

Publication number Publication date
EP4314274A1 (en) 2024-02-07
WO2022212119A1 (en) 2022-10-06

Similar Documents

Publication Publication Date Title
US20240150774A1 (en) Production of fatty acid derivatives
JP6603658B2 (ja) 脂肪酸及び脂肪酸誘導体の製造のための微生物及び方法
US11359216B2 (en) Microbial production of fatty diols
Song et al. Improving alkane synthesis in Escherichia coli via metabolic engineering
CN117083382A (zh) 细菌中非天然单不饱和脂肪酸的产生
AU2013243602A1 (en) Car enzymes and improved production of fatty alcohols
US20150125933A1 (en) Production of fatty acids and derivatives thereof having improved aliphatic chain length and saturation characteristics
US20220243185A1 (en) Thioesterase Variants Having Improved Activity For The Production Of Medium-Chain Fatty Acid Derivatives
DK2465868T3 (en) Enhancement of lipid production
JP2019103507A (ja) 改善されたアセチル−CoAカルボキシラーゼ変種
US20210189373A1 (en) Production Of Non-Native Monounsaturated Fatty Acids In Bacteria
US20220064684A1 (en) Enzymatic Biosynthesis Of Lactones
US20150068108A1 (en) Production of biodiesel from glycerine
WO2023178261A1 (en) Microbial production of z3-hexenol, z3-hexenal and z3-hexenyl acetate
WO2023178197A1 (en) Recombinant microbes for production of trans-2 unsaturated fatty acids and derivatives thereof
WO2023178193A1 (en) Acyl-acp thioesterase variants and uses thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination