CN110418642A - 用于生产化合物的组合物和方法 - Google Patents

用于生产化合物的组合物和方法 Download PDF

Info

Publication number
CN110418642A
CN110418642A CN201780081161.XA CN201780081161A CN110418642A CN 110418642 A CN110418642 A CN 110418642A CN 201780081161 A CN201780081161 A CN 201780081161A CN 110418642 A CN110418642 A CN 110418642A
Authority
CN
China
Prior art keywords
polyketide synthase
module
lal
nucleic acid
transformation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780081161.XA
Other languages
English (en)
Inventor
D.C.格雷
E.李
B.R.鲍曼
G.L.韦尔丁
K.罗比森
M.谢弗雷特
D.尤沃里
P.S.王
A.李
J.P.摩尔根斯特恩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Gingko Bioworks Inc
Original Assignee
Gingko Bioworks Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Gingko Bioworks Inc filed Critical Gingko Bioworks Inc
Publication of CN110418642A publication Critical patent/CN110418642A/zh
Pending legal-status Critical Current

Links

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P17/00Drugs for dermatological disorders
    • A61P17/06Antipsoriatics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • C12N1/205Bacterial isolates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/76Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Actinomyces; for Streptomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/188Heterocyclic compound containing in the condensed system at least one hetero ring having nitrogen atoms and oxygen atoms as the only ring heteroatoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/60Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin
    • C12P19/62Preparation of O-glycosides, e.g. glucosides having an oxygen of the saccharide radical directly bound to a non-saccharide heterocyclic ring or a condensed ring system containing a non-saccharide heterocyclic ring, e.g. coumermycin, novobiocin the hetero ring having eight or more ring members and only oxygen as ring hetero atoms, e.g. erythromycin, spiramycin, nystatin
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/02Libraries contained in or displayed by microorganisms, e.g. bacteria or animal cells; Libraries contained in or displayed by vectors, e.g. plasmids; Libraries containing only microorganisms or vectors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/465Streptomyces
    • C12R2001/485Streptomyces aureofaciens
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/465Streptomyces
    • C12R2001/55Streptomyces hygroscopicus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Dermatology (AREA)
  • Neurology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Neurosurgery (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了可用于产生目标化合物的蛋白质、核酸、载体和宿主分子,及其使用方法。

Description

用于生产化合物的组合物和方法
发明背景
聚酮天然产物通过与其它修饰酶(tailoring enzyme)结合的聚酮合酶(PKS),例如I型聚酮合酶而生物合成产生。聚酮合酶(PKS)是大型多结构域蛋白质家族,其催化功能被组构成模块以产生聚酮。聚酮合酶簇的基本功能单元是模块,其编码例如衍生自丙二酰基-CoA的2-碳延伸单元。一般存在于聚酮合酶中的模块包括i)加载模块;ii)延伸模块;以及iii)释放模块。在该模块内,聚酮链延伸和延长所需的最小结构域体系结构包括酮合酶(KS)、酰基转移酶(AT)和ACP(酰基-载体蛋白)结构域,并且每个模块的特定化学由AT结构域和存在的β-酮加工结构域编码:酮还原酶(KR)、脱水酶(DH)和烯酰还原酶(ER)结构域。聚酮合酶生物合成通过两个关键机制进行:由聚酮合酶延伸模块的聚酮链延长和聚酮中间产物在模块之间的转运。生产链延长取决于模块内和模块之间的众多催化结构域的协调功能。
组合生物合成是通用策略,其已用于改造的聚酮合酶(PKS)基因簇,以产生新型药物候选物(Weissman和Leadlay,Nature Reviews Microbiology,2005)。迄今为止,这些策略已依赖改造PKS结构域缺失和/或模块内的结构域交换或通过交换来自另一个簇的整个模块以产生嵌合簇。该方法的问题在于经由大批结构域和/或模块替换、插入或缺失的聚酮巨型合酶(megasynthases)的蛋白质改造可能扰乱PKS的“装配线”体系结构,因此急剧减少了合成的聚酮的量。
发明概述
本发明提供了通过聚酮合酶基因之间的模块交换,用于聚酮的组合生物合成而无化合物产生的显著损失的组合物和方法。生物信息学方法可以用于预测模块界面相容性,并且因此预测可以将异源模块交换到PKS基因内的可能性。所得到的相容性信息可以用于改造的聚酮合酶,伴随装配线聚酮生物合成中增加的功能可能性。
因此,在一个方面,本发明提供了改造的聚酮合酶,其包括相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述改造的聚酮合酶能够在适合于允许通过改造的聚酮合酶表达化合物的条件下表达时产生聚酮,并且其中一个或多个异源模块在聚酮生物合成期间基本上不抑制聚酮转运。
在另一个方面,本发明提供了改造的聚酮合酶,其包括相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述改造的聚酮合酶能够在适合于允许通过改造的聚酮合酶表达化合物的条件下表达时产生聚酮,并且其中一个或多个异源模块包括与其相邻的模块的连接序列相容的连接序列。
在另一个方面,本发明提供了改造的聚酮合酶,其包括相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述改造的聚酮合酶能够在适合于允许通过改造的聚酮合酶表达化合物的条件下表达时产生聚酮,并且其中所述改造的聚酮合酶的聚酮表达水平为参考聚酮合酶的聚酮表达水平的至少1%(例如,至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%、至少110%、至少120%、至少130%、至少140%、至少150%)。
在一些实施方案中,改造的聚酮合酶的聚酮表达水平为至少1-10%(例如至少1-10%、至少11-20%、至少21-30%、至少31-40%、至少41-50%、至少51-60%、至少61-70%、至少71-80%、至少81-90%、至少91-100%、至少101-110%、至少1111-120%、至少121-130%、至少131-140%、至少141-150%)。在一些实施方案中,改造的聚酮合酶包括具有天然连接序列的一个或多个异源模块。
在一些实施方案中,改造的聚酮合酶可以包括一个、两个、三个或更多个异源模块。在其中改造的聚酮合酶含有多个异源模块的一些实施方案中,异源模块可以在改造的聚酮合酶中相邻。在其中聚酮合酶含有多个异源模块的一些实施方案中,任何模块都可以通过改造的聚酮合酶中的一个或多个天然模块分开。
在任何上述方面的一些实施方案中,一个或多个异源模块中的至少一个是延伸模块,其修饰聚酮的可变区中的β-羰基单元。
在任何上述方面的一些实施方案中,一个或多个异源模块中的至少一个包括与SEQ ID NO:1-174中任何一个具有至少90%同一性的部分。
在任何上述方面的一些实施方案中,一个或多个异源模块中的至少一个包括具有SEQ ID NO:1-174中任何一个的序列的部分。
在另一个方面,本发明提供了嵌合聚酮合酶,其中与具有SEQ ID NO:175-176的序列的聚酮合酶相比,所述嵌合聚酮合酶的至少一个模块已进行修饰。
在一些实施方案中,本发明提供了嵌合聚酮合酶,其中至少一个模块包括与SEQID NO:1-174中任何一个具有至少90%同一性的部分。
在另一个方面,本发明提供了编码上述聚酮合酶中任何一种的核酸。
在任何上述方面的一些实施方案中,编码上述聚酮合酶中任何一种的核酸进一步编码LAL,其中编码LAL的序列与编码聚酮合酶的序列可操作地连接。
在一些实施方案中,LAL可以是异源LAL。
在一些实施方案中,LAL可以包括与SEQ ID NO:177具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少99%)序列同一性的部分。在一些实施方案中,LAL可以包括具有SEQ ID NO:177的序列的部分。在一些实施方案中,本发明提供了其中LAL具有SEQ IDNO:177的序列的核酸。在一些实施方案中,LAL在开放读码框中缺乏TTA抑制密码子。
在任何前述核酸的一些实施方案中,核酸包括LAL结合位点,其中编码LAL结合位点的序列与编码聚酮合酶的序列可操作地连接。
在一些实施方案中,LAL结合位点包括与SEQ ID NO:178(CTAGGGGGTTGC)的序列具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少99%)序列同一性的部分。在一些实施方案中,LAL结合位点包括具有SEQ ID NO:178(CTAGGGGGTTGC)的序列的部分。在一些实施方案中,LAL结合位点具有SEQ ID NO:178(CTAGGGGGTTGC)的序列。在上述方面的一些实施方案中,LAL结合位点具有SEQ ID NO:179(GGGGGT)的序列。
在任何前述核酸的一些实施方案中,LAL与LAL结合位点的结合促进聚酮合酶的表达。
在任何前述核酸的一些实施方案中,编码上述聚酮合酶中任何一种的核酸进一步编码非核糖体肽合酶。
在任何前述核酸的一些实施方案中,编码上述聚酮合酶中任何一种的核酸进一步编码P450酶。
在任何前述核酸的一些实施方案中,编码上述聚酮中任何一种和第一P450酶的核酸进一步编码第二P450酶。
在另一个方面,本发明提供了包括任何前述核酸的表达载体。在一些实施方案中,表达载体可以是人工染色体,例如细菌人工染色体。
在另一个方面,本发明提供了包括任何上述表达载体的宿主细胞。
在另一个方面,本发明提供了包括任何前述聚酮合酶的宿主细胞,其中所述聚酮合酶对于宿主细胞是异源的。
在任何前述宿主细胞的一些实施方案中,宿主细胞天然缺乏LAL和/或LAL结合位点。
在任何前述宿主细胞的一些实施方案中,宿主细胞包括能够结合LAL结合位点且调节聚酮合酶表达的LAL。在一些实施方案中,LAL和/或LAL结合位点对于细胞可以是异源的。在一些实施方案中,宿主细胞包括LAL,其具有与SEQ ID NO:177的序列具有至少80%(例如,至少80%、至少85%、至少90%、至少95%、至少99%)序列同一性的部分。
在任何前述宿主细胞的一些实施方案中,宿主细胞是细菌,例如放线菌(actinobacterium),例如选自生二素链霉菌(Streptomyces ambofaciens)、吸水链霉菌(Streptomyces hygroscopicus)或马来亚链霉菌(Streptomyces malayensis)的放线菌。在其中宿主细胞是放线菌的一些实施方案中,放线菌是S1391、S1496或S2441。
在任何前述宿主细胞的一些实施方案中,宿主细胞已进行修饰,以增强聚酮合酶的表达。例如,宿主细胞已通过以下进行修饰,以增强产生化合物的蛋白质的表达:(i)缺失表达产生化合物的蛋白质的内源基因簇;(ii)插入表达产生化合物的蛋白质的异源基因簇;(iii)宿主细胞暴露于抗生素攻击;和/或(iv)引入异源启动子,与同源启动子相比,所述异源启动子导致化合物的表达中的至少2倍增加。
在另一个方面,本发明提供了通过在合适的条件下培养任何前述宿主细胞来产生聚酮的方法。
在另一个方面,本发明提供了通过在适合于聚酮合酶产生聚酮的条件下,培养改造为表达任何前述聚酮合酶的宿主细胞来产生聚酮的方法。
在另一个方面,本发明提供了产生化合物的方法,该方法包括:(a)提供能够产生化合物的亲本聚酮合酶序列;(b)确定第二聚酮合酶的至少一个模块与亲本聚酮合酶的至少两个模块的相容性;(c)产生编码修饰的聚酮合酶的核酸,其中所述修饰的聚酮合酶包括第二聚酮合酶的至少一个模块,其已确定为与亲本聚酮合酶的至少两个模块相容。
在另一个方面,本发明提供了产生化合物的方法,该方法包括:(a)提供编码亲本聚酮合酶的亲本核酸;(b)修饰亲本核酸,以产生编码能够产生化合物的修饰的聚酮合酶的修饰核酸,其中所述修饰产生包括至少一个异源模块的修饰的聚酮合酶。
在另一个方面,本发明提供了产生化合物的方法,该方法包括:(a)提供能够产生化合物的亲本多核苷酸序列;(b)鉴定适合于替换亲本多核苷酸序列中的一个或多个模块的一个或多个异源模块;(c)产生编码修饰的聚酮合酶的核酸,其中所述修饰的聚酮合酶包括步骤(b)中鉴定的至少一个异源模块。
在另一个方面,本发明提供了产生多种改造的聚酮合酶的方法,其中所述多种多核苷酸各自对应于改造的聚酮合酶,并且其中所述多种多核苷酸各自包括相对于参考聚酮具有改变的酶促活性的一个或多个异源模块。该方法包括以下步骤:(a)提供编码聚酮合酶的亲本多核苷酸序列;(b)在亲本多核苷酸序列中鉴定用于替换的一个或多个模块;(c)鉴定适合于替换步骤(b)中鉴定的每个模块的两个或更多个异源模块;(d)生成多种多核苷酸,其中所述多种多核苷酸各自对应于改造的聚酮合酶,并且其中所述多种多核苷酸各自包括选自步骤(c)中鉴定的两个或更多个异源模块的异源模块替换步骤(b)中鉴定的待替换的一个或多个模块中的每一个。
定义
“聚酮合酶”指属于能够产生聚酮的多结构域酶家族的酶。聚酮合酶可以在细菌、真菌、植物或动物中天然表达。
如本文使用的,术语“改造的聚酮合酶”用于描述其设计和/或生产涉及人为动作的非天然聚酮合酶。例如,在一些实施方案中,通过产生编码聚酮合酶的非天然多核苷酸来制备“改造的”聚酮合酶。
“改造以包含”和/或“改造以表达”的细胞指已进行修饰以包含和/或表达在细胞中并非天然存在的蛋白质的细胞。例如通过引入包括核酸的载体,通过引入编码蛋白质的核酸,可以将细胞改造为含有蛋白质。
如本文使用的,术语“产生小分子的基因簇”或“产生化合物的基因簇”指编码一种或多种产生化合物的蛋白质的基因簇。
如本文使用的,术语“异源的”指并非天然存在的两种或更多种蛋白质、核酸、化合物和/或细胞之间的关系。例如,具有SEQ ID NO:177序列的LAL天然存在于S18链霉菌属(Streptomyces)菌株中,并且因此对于该菌株是同源的,因此对于S12链霉菌属菌株是异源的。
如本文可互换使用的,术语“同源的”或“天然的”指天然存在的两种或更多种蛋白质、核酸、化合物和/或细胞之间的关系。例如,具有SEQ ID NO:177序列的LAL天然存在于S18链霉菌属菌株中,并且因此对于该菌株是同源的。
如本文使用的,术语“重组”指使用合成方法产生的蛋白质。
如本文使用的,术语“参考聚酮合酶”指与改造的聚酮合酶的序列(除了其被修饰的一个或多个模块的序列)具有至少80%同一性(例如,至少80%同一性、至少85%同一性、至少90%同一性、至少95%同一性、至少99%同一性或100%同一性)的序列的聚酮合酶。
如此处使用的,术语“相容性”指两个相邻模块形成足够的模块-模块连接的可能性的量度,其中基本上不抑制聚酮转运。如果异源模块满足下述标准中的至少一个,则它可以视为相容的:1)模块存在于与参考PKS的一个或多个相邻模块相同的模块进化枝中,如通过本发明的详细描述中描述的模块水平系统发生分类所确定的;2)在本发明的详细描述中描述的模块间协方差分析算法中,模块被分配大于或等于0.90的得分;或者3)该模块属于与参考PKS的一个或多个相邻模块相同的功能进化枝或子进化枝,如通过本发明的详细描述中概述的进化跟踪方法所确定的。
如此处使用的,术语“连接序列”指模块间连接的直接上游或下游的序列。例如,在单模块交换中,关于上游同源模块的ACP、插入的异源模块的ACP和KS-AT双结构域、以及下游同源模块的KS都可以被视为连接序列。
如本文使用的,术语“模块”指包括多重结构域的聚酮合酶的区域。存在于聚酮合酶中的模块可以包括i)加载模块;ii)延伸模块;以及iii)取决于最终的聚酮是线性的还是环状的释放和/或环化模块。可以包括在给定模块中的结构域包括但不限于酰基转移酶(AT)、酰基载体蛋白(ACP)、酮合酶(KS)、酮还原酶(KR)、脱水酶(DH)、烯酰还原酶(ER)、甲基转移酶(MT)、磺基水解酶(SH)和硫酯酶(TE)。
如此处使用的,术语“受体模块”指PKS簇内的同源模块,其经受通过模块交换的改造。在所得到的改造的PKS簇中,不存在受体模块。
如此处使用的,术语“供体模块”指引入改造的PKS簇内的异源模块。
如此处使用的,术语“模块交换”指一个或多个同源供体模块与一个或多个同源受体模块的交换。
如此处使用的,术语“基本上不抑制聚酮转运”指异源PKS模块在生物合成装配线中起作用的能力。例如,如果加载模块能够将起始单元加载到其ACP结构域上,并且将起始单元传递到相邻的(n+1)延伸模块的KS结构域,则异源加载模块基本上不抑制聚酮转运。如果延伸模块能够从前一个(n-1)模块接收起始单元或聚酮链,催化延伸单元的添加,并且将延长的聚酮链传递到相邻的(n+1)模块,则异源延伸模块基本上不抑制聚酮转运。在一些实施方案中,如果包括异源模块的改造的PKS产生其水平可通过高灵敏度检测方法(例如LC-TOF质谱法)检测的化合物,则异源模块基本上不抑制聚酮转运。
将延伸单元例如丙二酰辅酶A加载到由另一个酰基转移酶结构域催化的当前模块的酰基载体蛋白结构域上。然后,在从模块n的酰基载体蛋白结构域传递到n+1模块的酮合酶结构域之后,聚酮链通过后续延伸模块延长。酰基载体蛋白结合的延伸单元与结合到酮合酶结构域的聚酮链反应,伴随CO2的排出,以产生与酰基载体蛋白结合的延长的聚酮链。每个添加的延伸单元然后可以通过β-酮加工结构域,即酮还原酶(其将延伸基团的羰基还原为羟基)、脱水酶(其放出H2O以产生烯烃)和烯酰还原酶(其使烯烃还原以产生饱和烃)进行修饰。
附图简述
图1A和1B是示出通过其进行PKS生物合成的机制的示意图。图1A描绘了模块内的聚酮链延长和β-羰基加工。图1B描绘了模块之间的平移。
图2A是描绘用于预测在模块-模块连接处的功能性蛋白质-蛋白质相互作用的互补生物信息学方法的图解。
图2B是由完全FK家族模块的多重序列比对产生的系统发生树。
图2C-2E描绘了如何使用模块间残基协方差来生成将模块-模块连接相容性排序的算法。图2C是示出用于确定给定异源模块的相容性的上游和下游模块-模块连接的图解。2D是描绘给定模块的ACP结构域与第二模块的KS-AT双结构域的比对的关联图。图2E描绘了由关于一系列异源模块的结构域间残基协方差分析产生的相容性得分。得分针对其给予1.00得分的所讨论的聚酮合酶的同源模块进行归一化。
图2F和2G描述了如何使用进化跟踪分析来预测模块-模块连接相容性。图2F是通过FK家族KS和ACP结构域的多重序列比对生成的系统发生树,其中组特异性残基已连接至功能性进化枝或子进化枝中。模块之间的距离可以用于预测模块-模块连接相容性。图2G是描绘通过关于FK家族的KS和ACP结构域之间的进化跟踪分析预测的相容性关系的示意图。
图3A是描绘单模块交换的示意图,其中供体模块替换产生化合物1的PKS基因簇的模块3或模块4。
图3B是改造的PKS的图像,所述改造的PKS包括来自S17链霉菌属菌株的异源模块3代替产生化合物1的PKS中的同源模块3。改造的PKS模块3现在包括ER结构域,并且因此通过改造的PKS产生的所得到的化合物(化合物2),其相对于化合物1是减少的。
图3C是描绘通过用相容的异源模块单模块交换产生化合物1的PKS中的模块3或模块4而产生的化合物,例如化合物2、化合物3、化合物4和化合物5的图像。
图4A是描绘双模块单元的组合交换的示意图。
图4B是描绘通过第一轮Gibson装配从外源供体模块合成双模块单元的示意图。如通过DNA凝胶电泳分析的显示双模块产物。
图4C是描绘穿梭载体中的双模块捕获、扩增和富集的示意图。由第一轮Gibson装配产生的双模块单元通过第二轮Gibson装配在穿梭载体中捕获。这允许将双模块装配扩增、富集且连接到预期的PKS内。
图4D是描绘通过组合合成构建双模块文库的示意图。
图4E是描绘可能产生的化合物的图像,所述化合物可以通过交换到产生化合物1的PKS的模块3和模块4内的示例性双模块文库生成。
图4F描绘了对于大型组合双模块文库的充分覆盖所需的过采样。图4F是实现225个成员的双模块组合库的90%或更大覆盖率所需的过采样的图形表示。如通过LC-TOF质谱分析测定的,发现650个取样克隆中的18%已产生起因于改造的PKS簇的聚酮化合物。
图4G是描绘制备组合双模块文库和使用纳米孔测序表征所得到的文库的方法的示意图。
图4H是描绘通过纳米孔测序用于组合双模块文库的序列的解卷积的核心信息学工作流的示意图。
图5A和5B描绘了通过组合合成构建三模块文库。图5A是示出产生化合物7的PKS簇的模块4、5和6的三模块交换的示意图,以产生2,197个改造的聚酮合酶的理论文库大小。图5b是如通过DNA凝胶电泳分析的Gibson装配的高效三模块装配的图像。
图6A是示出通过将单模块受体更换为双模块供体而导致扩环的模块交换的示意图。还描绘了通过改造的PKS产生的所得到的扩环化合物,化合物8。
图6B是显示如通过LC-TOF质谱法分析的扩环化合物,化合物8的产生的光谱图。
图7A是描绘五种PKS加载模块(包括雷帕霉素和新型PKS簇X23)的酶促结构域的示意图。还显示的是与每个加载模块相关的起始单元。
图7B描绘了通过起因于X23 PKS簇中的单模块交换的改造的PKS簇产生的化合物。产物包括通过含有异源加载模块的改造的氨基PKS产生的化合物11和12。
发明详述
本发明描述了通过包括一个或多个异源模块的改造的聚酮合酶,用于产生聚酮化合物的组合物和方法。本发明还描述了用于预测异源模块-模块连接的连接序列的相容性以产生改造的聚酮合酶的方法,所述改造的聚酮合酶在聚酮生物合成期间基本上不抑制转运。
化合物
可以用本发明的方法产生的化合物包括但不限于聚酮和聚酮大环内酯类抗生素如红霉素;杂合聚酮/非核糖体肽如雷帕霉素和FK506;碳水化合物包括氨基糖苷类抗生素如庆大霉素、卡那霉素、新霉素、妥布霉素;苯并呋喃类化合物(benzofuranoids);苯并吡喃类化合物(benzopyranoids);黄酮类化合物;糖肽包括万古霉素;脂肽包括达托霉素;单宁类;木脂素类;多环芳香族天然产物、萜类化合物、甾类、甾醇类、噁唑烷酮类包括利奈唑胺;氨基酸、肽和肽抗生素包括多粘菌素、非核糖体肽、β-内酰胺类抗生素包括碳青霉烯、头孢菌素和青霉素;嘌呤、蝶啶、聚吡咯、四环素、喹诺酮和氟喹诺酮;和磺胺类。
蛋白质
聚酮合酶
聚酮合酶(PKS)是产生聚酮的多结构域酶家族。I型聚酮合酶是大型模块化蛋白质,其包括组构成模块的几个结构域。一般存在于聚酮合酶中的模块包括i)加载模块;ii)延伸模块;以及iii)取决于最终的聚酮是线性还是环状的释放和/或环化模块。一般在模块中发现的结构域是酰基转移酶(AT)、酰基载体蛋白(ACP)、酮合酶(KS)、酮还原酶(KR)、脱水酶(DH)、烯酰还原酶(ER)、甲基转移酶(MT)、磺基水解酶(SH)和硫酯酶(TE)。
聚酮链和起始基团一般通过硫酯键与酮合酶结构域(聚酮链)和酰基转移酶结构域(加载基团和丙二酰基延伸单元)中的活性位点半胱氨酸的硫醇基团结合。与酰基载体蛋白(ACP)的结合由磷酸泛酰巯基基团的硫醇介导,其与ACP的丝氨酸羟基结合,以形成与生长的聚酮链的硫酯键。生长的聚酮链通过反式酰化从一个硫醇基团移交给另一个硫醇基团,并且在合成后通过水解或环化释放。
聚酮的合成由起始单元开始,所述起始单元加载到加载模块中由酰基转移酶催化的PKS的酰基载体蛋白结构域上。将延伸单元例如丙二酰辅酶A加载到由另一个酰基转移酶结构域催化的当前模块的酰基载体蛋白结构域上。然后,在从模块n的酰基载体蛋白结构域传递到n+1模块的酮合酶结构域之后,聚酮链通过后续延伸模块延长。酰基载体蛋白结合的延伸单元与结合到酮合酶结构域的聚酮链反应,伴随CO2的排出,以产生与酰基载体蛋白结合的延长的聚酮链。每个添加的延伸单元然后可以通过β-酮加工结构域,即酮还原酶(其将延伸基团的羰基还原为羟基)、脱水酶(其放出H2O以产生烯烃)和烯酰还原酶(其使烯烃还原以产生饱和烃)进行修饰。一旦聚酮的合成完成,释放模块中的硫酯酶结构域就从最后延伸模块的酰基载体蛋白水解完成的聚酮链。然后可以通过其它蛋白质(例如非核糖体肽合酶)进一步修饰从PKS释放的化合物。在一些情况下,生物合成簇包含聚酮合酶和非核糖体肽合酶(NRPS)。该杂合体系结构被称为杂合PKS/NRPS。
聚酮合酶延伸模块
PKS生物合成通过两个关键机制进行:模块内的聚酮链延伸和模块之间的转运(图1A和1B)。聚酮合酶簇的基本功能单元是延伸模块,其编码衍生自丙二酰-CoA的2-碳延伸单元。在延伸模块内,聚酮链延伸所需的最小结构域体系结构包括酮合酶(KS)、酰基转移酶(AT)和ACP(酰基-载体蛋白)结构域,并且每个模块的特定化学由AT结构域以及通过β-羰基加工结构域的存在编码:酮还原酶(KR)、脱水酶(DH)和烯酰还原酶(ER)结构域。生产链延长取决于众多结构域的协同功能。
β-酮加工结构域
β-酮加工结构域是PKS中的结构域,其导致在聚酮合成期间添加的延伸基团的修饰。每个β-酮加工结构域能够改变延长基团的氧化状态。β-酮加工结构域包括酮还原酶(其将延伸基团的羰基还原为羟基)、脱水酶(其放出H2O以产生烯烃)和烯酰还原酶(其使烯烃还原以产生饱和烃)。
模块交换以产生改造的聚酮合酶
本发明提供了与通过在相关PKS簇之间交换模块产生的改造的聚酮合酶相关的方法和组合物。聚酮转运通过在模块间连接处的蛋白质-蛋白质相互作用控制。在一些实施方案中,模块交换通过生物信息学预测指导,以确定哪些模块在装配线聚酮生物合成中具有最高的功能概率。多重生物信息学方法用于确定PKS序列比对中的结构信息,以预测介导在模块间连接处的聚酮转运的蛋白质-蛋白质相互作用。本发明包括用于将一个或多个异源供体模块交换一个或多个受体模块,以生成杂合PKS簇的DNA装配策略。
在一些实施方案中,通过单模块、二模块、或三模块或多模块捕获来实现模块交换。在一些实施方案中,可以通过加载模块的交换来执行模块交换。在一些实施方案中,可以通过一个或多个延伸模块的交换来执行模块交换。在一些实施方案中,可以通过一个或多个释放或环化模块的交换来执行模块交换。在一些实施方案中,两个或更多个异源供体模块可以替换单个受体模块,其可以导致扩环化合物的产生。在一些实施方案中,单个异源供体模块可以替换两个或更多个受体模块,其可以导致缩环化合物。在一些实施方案中,改造的聚酮合酶可以产生新型化合物。
改造的聚酮合酶的组合文库
在一些实施方案中,单模块、二模块、或三模块或多模块单元的合并捕获和转移允许产生改造的聚酮合酶的组合文库。例如,双模块单元由两个异源模块组成,所述异源模块各自可以独立地选自异源模块集合。例如,三模块单元由三个异源模块组成,所述异源模块各自可以独立地选自异源模块集合。聚酮合酶的一个或多个模块可以替换为单模块、二模块、三模块或多模块单元,其中所述单模块、二模块、三模块或多模块单元选自通过组合合成产生的单模块、二模块、三模块或多模块单元集合。在实施例2和4中提供了用于产生改造的聚酮合酶的组合文库(例如,双模块和三模块组合文库)的示例性方法。
通过单分子长读测序表征改造的PKS文库
在本发明的一些实施方案中,单分子长读测序技术(例如,纳米孔测序或SMRT测序)可以用于表征通过本文所述的任何方法产生的改造的聚酮合酶的文库。特别地,单分子长读测序(例如,纳米孔测序或SMRT测序)可以用于表征(例如,解卷积)改造的聚酮合酶的组合文库(例如,通过单模块、二模块、或三模块或多模块单元的合并捕获和转移产生的改造的聚酮合酶的组合文库)。单分子长读测序允许鉴定掺入组合文库内的一个或多个模块。这进一步允许预测所得到的多种改造的聚酮合酶的化学。预测的酶促化学因此可以与由改造的聚酮合酶产生的化合物相关联。可以通过本领域技术人员已知的化学分析方法(例如,质谱法或高效液相层析)鉴定所得到的化合物。此外,预测的酶促化学可以与所得到的化合物的功能(例如,与靶蛋白结合或诱导表型,例如基于细胞的表型)相关联。相应地,遗传编码分子的长读测序可以允许基因型-表型连锁。
单分子长读测序技术可以被认为包括任何测序技术,其允许测序单分子生物聚合物(例如多核苷酸如DNA或RNA),并且允许大于2千碱基(例如,大于5千碱基、大于10千碱基、大于20千碱基、大于50千碱基、或大于100千碱基)的读取长度。单分子长读测序技术可以允许并行地测序DNA或RNA的多个单分子。单分子长读测序技术可以包括依赖待测序的每个DNA或RNA分子的个别区室化的测序技术。
纳米孔测序是示例性单分子长读测序技术,其可以用于表征通过本文描述的任何方法制备的改造的聚酮合酶的文库。纳米孔测序允许单分子生物聚合物(例如多核苷酸如DNA或RNA)的长读测序。纳米孔测序依赖设置在电阻聚合物膜中的蛋白质纳米孔。通过跨越该膜设定电压使离子电流穿过纳米孔。如果分析物(例如生物聚合物如DNA或RNA)穿过孔或在其小孔附近穿过,则该事件产生特征性的电流中断。跨越纳米孔表面的电流密度的幅度取决于占据纳米孔的DNA或RNA(例如,特定碱基)的组成。因此,电流的测量使得能够鉴定所讨论的分子的序列。在实施例3中提供了使用纳米孔测序来表征改造的聚酮合酶的组合文库的示例性方法。
单分子实时(SMRT)测序(PacBio)是示例性单分子长读测序技术,其可以用于表征通过本文所述的任何方法制备的改造的聚酮合酶的文库。SMRT是并行化的单分子DNA测序方法。SMRT利用零模式波导(ZMW)。将单个DNA聚合酶附着在ZMW的底部,用DNA的单分子作为模板。ZMW是这样的结构,其产生的照明观察体积足够小,仅能观察到通过DNA聚合酶掺入的DNA的单个核苷酸。四种DNA碱基各自与四种不同荧光染料之一附着。当通过DNA聚合酶掺入核苷酸时,荧光标签被切除并且扩散出ZMW的观察区域,其中其荧光不再可观察。检测器检测核苷酸掺入的荧光信号,并且根据染料的相应荧光进行碱基调用。
用于预测功能性模块间连接的计算方法
本发明提供了用于预测在模块-模块连接处的功能性蛋白质-蛋白质相互作用的互补生物信息学方法(图2A)。在一些实施方案中,这些生物信息学方法充当通过模块交换用于设计嵌合PKS蛋白的预测基础。
模块水平系统发生
聚酮模块和模块间接头之间的序列差异提示模块-模块相容性的重要性。在一些实施方案中,可以通过PKS模块的多重序列比对来构建模块水平系统发生图。例如,通过完全FK家族模块的多重序列比对生成模块水平系统发生图(图2B)。这允许鉴定10个模块进化枝,包括8个延长、1个加载和1个卸载。在一些实施方案中,如果异源模块存在于与相邻模块相同的模块进化枝中,则它是相容的。
模块间残基协方差
计算跨越模块间连接的模块间残基协方差,以生成将模块间模块相容性排序的算法(图2C-2E)。使用在酮合酶(KS)和酰基载体蛋白(ACP)结构域上训练的隐马尔可夫模型,从Genbank和内部数据库中提取I型聚酮合酶蛋白序列。提取从模块的ACP开始并延伸通过随后模块的KS和酰基转移酶(AT)的较短肽序列,以生成多重比对。去除与来自PDB条目2JU1(对于ACP)或2HG4(对于KS和AT以及相关接头)的氨基酸未比对的位置,以压缩多重比对。然后使用FreeContact包计算进化偶联。这些偶联采用具有两个指数的得分矩阵的形式:多重比对中的第一个氨基酸位置(I)和多重比对中的第二个氨基酸位置(J,其总是大于I)和在位置J处的氨基酸。保存得分高于指定的截断,并且I在ACP中且J在KS-AT双结构域内的I,J对。
为了生成关于潜在单模块取代的得分,从原始多重比对中检索下述比对:关于上游结构域的ACP,关于插入模块的ACP和KS-AT双结构域,以及关于下游模块的KS。这些用于合成与原始多重比对相容的两行:一行具有上游模块的ACP和插入模块的KS-AT,并且第二行具有插入模块的ACP和下游模块的KS-AT。对于保存的偶联矩阵中的每个I,J对,检索在合成比对中的位置I和J处的氨基酸(aaI,aaJ)。将关于比对内的该氨基酸对的交互信息乘以偶联得分,以生成原始得分。对于保存的偶联矩阵中的每个I,J对以及对于两个合成比对中的每一个计算原始得分。将关于异源供体结构域的原始得分之和除以关于同源天然结构域的原始得分之和,以生成归一化的百分比得分。具有相同化学的候选交换按此得分排序。在多重模块交换的情况下,该过程被扩展,例如,如果要交换N个供体结构域,则对于前一个模块的ACP结构域和第一个供体模块的KS-AT结构域生成一个合成比对,对于第一个供体模块的ACP结构域和第二个供体模块的KS-AT结构域生成另一个合成比对,依此类推,以最后的供体结构域的ACP和断点下游的受体合酶的第一个模块结束。得分以相同的方式进行计算且归一化:关于交换模块的得分对于天然模块计算的得分进行归一化。在一些实施方案中,如果模块在本文所述的模块间协方差分析算法中分配大于或等于0.90的得分,则异源模块是相容的。
进化跟踪分析以鉴定功能进化枝或子进化枝内的模块
作为模块相容性的另外测试,进化跟踪分析可以用于鉴定属于相同功能性进化枝或子进化枝的模块(图2F-2G)。例如,基于FK家族KS和ACP的多重序列比对构建具有均匀分支长度的系统发生树。对于树中的每个非末端节点,应用通过其基于在截断处的共享亲本节点将末端节点划分成组的垂直截断。跨越所有组中总体保守的残基和在组内局部保守但对特定组特异性的残基,被鉴定为功能残基。总体保守的残基提示了对于FK家族的所有成员可能必须观察到的规则。组特异性的残基提示可以对于FK类别内的改造提供预测力的指导。对于每棵树,选择在其处组特异性残基数目超过总体保守的残基数目标最早截断用于进一步分析。将组特异性残基级联成功能性进化枝,并且构建进化枝的无根系统发生树。系统发生树中的末端节点之间的距离用于创建进化距离得分(EDS)。计算同源受体模块和提议的异源供体模块之间的KS和ACP EDS,并且用于预测改造相容性。KS和ACP进化枝分类然后用于产生邻近KS和ACP的网络图,其通过在FK家族聚酮中观察到的给定KS-ACP或ACP-KS对的频率加权。将提议的模块交换叠加到网络图上用于预测与上游ACP和下游KS的改造相容性。在一些实施方案中,如果模块属于与参考PKS中的一个或多个相邻模块相同的功能进化的进化枝或子进化枝,则异源模块是相容的。
聚酮合酶表达的调节
转录激活因子的LuxR家族(LAL)的大ATP结合调节剂是聚酮的已知转录调节剂,例如FK506或雷帕霉素。LAL家族已发现在诱导某些类型的天然产物基因簇的表达中具有积极作用,例如用于苦霉素生产的PikD和用于雷帕霉素生产的RapH。复合物中的LAL或多个LAL与产生小分子的基因簇(例如,聚酮合酶基因簇)内的基因启动子中的特定位点结合,加强基因簇的表达且因此促进了化合物(例如聚酮)的产生。在一些实施方案中,LAL可以用于调节改造的PKS簇的表达。
LAL
LAL包括三个结构域:核苷酸结合结构域、诱导剂结合结构域和DNA结合结构域。包括LAL的调节蛋白结构类别的定义特征是AAA+ ATP酶结构域的存在。核苷酸水解与蛋白质和/或多聚化中的大构象变化偶联,并且核苷酸结合和水解代表控制LAL活性的“分子计时器”(例如,LAL活性的持续时间)。LAL通过小分子配体与诱导剂结合位点的结合激活。在大多数情况下,LAL的变构诱导剂是未知的。在相关蛋白质MalT的情况下,变构诱导剂是麦芽三糖。LAL蛋白的可能诱导剂包括在环境中发现的触发化合物(例如,聚酮)生物合成的小分子。LAL的调节控制产生化合物的蛋白质(例如,聚酮合酶)的产生,导致在外部环境刺激的存在下化合物(例如,聚酮)生产的活化。因此,产生小分子的基因簇(例如,PKS基因簇)虽然存在于菌株中,但不产生化合物,因为(i)LAL未被激活,(ii)该菌株具有不同于共有区的LAL结合位点,(iii)该菌株缺乏LAL调节剂,或(iv)LAL调节剂在实验室条件下可能表达不佳或不表达。由于已知PKS LAL的LAL的DNA结合区是高度保守的,因此已知的LAL可以互换使用以激活PKS基因簇,而不是它们天然调节的那些。在一些实施方案中,LAL是融合蛋白。
在一些实施方案中,可以修饰LAL以包括非LAL DNA结合结构域,从而形成包括LAL核苷酸结合结构域和非LAL DNA结合结构域的融合蛋白。在某些实施方案中,非LAL DNA结合结构域能够结合启动子,所述启动子包括这样定位的蛋白质结合位点,使得DNA结合结构域与启动子的蛋白质结合位点的结合促进目标基因(例如,编码产生化合物的蛋白质的基因,如本文所述)的表达。非LAL DNA结合结构域可以包括本领域已知的任何DNA结合结构域。在一些情况下,非LAL DNA结合结构域是转录因子DNA结合结构域。非LAL DNA结合结构域的实例包括但不限于基本的螺旋-环-螺旋(bHLH)结构域、亮氨酸拉链结构域(例如基本的亮氨酸拉链结构域)、GCC盒结构域、螺旋-转角-螺旋结构域、同源结构域、srf样结构域、配对盒结构域、翼状螺旋结构域、锌指结构域、HMG-盒结构域、Wor3结构域、OB-折叠结构域、免疫球蛋白结构域、B3结构域、TAL效应结构域、Cas9 DNA结合结构域、GAL4 DNA结合结构域和本领域已知的任何其它DNA结合结构域。在一些情况下,启动子定位于目标基因的上游,使得融合蛋白可以与启动子结合,并且诱导或抑制目标基因的表达。在某些情况下,启动子是引入含有目标基因的核酸(例如,染色体、质粒、F粘粒或本领域已知的任何其它核酸构建体)的异源启动子。在其它情况下,启动子是定位于目标基因上游的预先存在的启动子。启动子内的蛋白质结合位点可以是例如非LAL蛋白质结合位点。在某些实施方案中,蛋白质结合位点结合非LAL DNA结合结构域,从而形成同源DNA结合结构域/蛋白质结合位点对。
在一些实施方案中,LAL由与SEQ ID No:180-212中任何一个具有至少70%(例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%)序列同一性的核酸编码,或具有与SEQ ID No:180-212中任何一个具有至少70%(例如,至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%)序列同一性的序列。
LAL结合位点
在一些实施方案中,基因簇(例如,PKS基因簇)包括包含一个或多个LAL结合位点的一个或多个启动子。LAL结合位点可以包括多核苷酸共有LAL结合位点序列(例如,如本文所述)。在一些情况下,LAL结合位点包括核心AGGGGG(SEQ ID NO:213)基序。在某些情况下,LAL结合位点包括与SEQ ID NO:213具有至少80%(例如,80%、85%、90%、95%、97%、98%、99%或100%)同源性的序列。LAL结合位点可以包括已恢复以与共有区或优化的LAL结合位点的序列匹配的突变位点。在一些实施方案中,LAL结合位点是合成的LAL结合位点。在一些实施方案中,合成的LAL结合位点可以通过以下进行鉴定:(a)提供包括至少八个核苷酸的多种合成核酸;(b)使包括至少八个核苷酸的多种核苷酸中的一种或多种与一种或多种LAL接触;(c)确定步骤(a)的核酸与步骤(b)的LAL之间的结合亲和力,其中如果合成核酸和LAL之间的亲和力大于X,则合成核酸被鉴定为合成的LAL结合位点。然后可以将鉴定的合成LAL结合位点引入宿主细胞内产生化合物的簇(例如,PKS簇)中。
在一些实施方案中,可以通过以下来鉴定与天然对相比具有增加的表达的一对LAL结合位点和异源LAL或异源LAL结合位点和LAL:(a)提供一个或多个LAL结合位点,(b)使一个或多个LAL结合位点与一种或多种LAL接触;(c)确定LAL结合位点和LAL之间的结合亲和力,其中如果LAL结合位点与LAL之间的亲和力大于LAL结合位点与其同源LAL和/或在其同源LAL结合位点处的LAL之间的亲和力,则鉴定具有增加的表达的对。在一些实施方案中,LAL结合位点和LAL之间的结合亲和力通过确定包括LAL和LAL结合位点两者的细胞的蛋白质或化合物的表达来确定。
组成型活性LAL
在一些实施方案中,重组LAL是组成型活性LAL。例如,LAL的氨基酸序列已以这样的方式进行修饰,使得它不需要诱导剂化合物的存在,用于改变的LAL接合其同源结合位点,并且激活产生化合物的蛋白质(例如,聚酮合酶)的转录。组成型活性LAL对宿主细胞的引入可能导致产生化合物的蛋白质(例如,聚酮合酶)的表达增加,并且依次又增加相应化合物(例如聚酮)的产生。
改造单向LAL
FK基因簇排列有由多重双向启动子-操纵子驱动的多顺反子体系结构,所述双向启动子-操纵子具有假定为LAL结合位点的保守的(以单个或多重,并且彼此反转和/或直接重复)GGGGGT(SEQ ID NO:179)基序。通过策略性地缺失相反的启动子之一,但维持串联LAL结合位点(如果天然启动子中LAL的结合是协调的,如对于MalT所证实的),可以将双向LAL启动子转换为单向的那种(UniLAL)。在功能上,这通过去除反义链(可能含有-35和-10启动子序列)上存在的保守GGGGGT(SEQ ID NO:179)基序3'的所有序列来实现,但使有义链上的整个序列完整留下。作为该缺失的结果,转录仅在一个方向上被激活。该前馈回路体系结构的优点是在链霉菌属营养和发酵生长条件的复杂生命周期期间调节和/或最大化LAL表达。
宿主细胞
在一些实施方案中,宿主细胞是细菌,例如放线菌。例如,在一些实施方案中,宿主细胞是链霉菌属菌株。在一些实施方案中,宿主细胞是环圈链霉菌(Streptomyces anulatus)、抗菌素链霉菌(Streptomyces antibioticus)、天蓝色链霉菌(Streptomyces coelicolor)、波赛链霉菌(Streptomyces peucetius)、链球菌属物种ATCC 700974、暗灰链霉菌(Streptomyces canus)、结节链霉菌(Streptomyces nodosus)、链霉菌属(多个物种)、Streptoalloteicus hindustanus、吸水链霉菌、阿维链霉菌(Streptomyces avermitilis)、产绿色链霉菌(Streptomyces viridochromogenes)、轮枝链霉菌(Streptomyces verticillus)、教酒链霉菌(Streptomyces chartruensis)、链霉菌属(多个物种)、易变糖丝菌(Saccharothrix mutabilis)、郝氏链霉菌(Streptomyces halstedii)、棒状链霉菌(Streptomyces clavuligerus)、委内瑞拉链霉菌(Streptomyces venezuelae)、产玫瑰色链霉菌(Strteptomyces roseochromogenes)、东方拟无枝菌酸菌(Amycolatopsis orientalis)、棒状链霉菌、利尻链霉菌(Streptomyces rishiriensis)、淡紫灰链霉菌(Streptomyces lavendulae)、玫瑰孢链霉菌(Streptomyces roseosporus)、野野村氏菌属菌种(Nonomuraea sp.)、波赛链霉菌、红色糖多孢菌(Saccharopolyspora erythraea)、菲律宾链霉菌(Streptomyces filipinensis)、吸水链霉菌、绛红色小单孢菌(Micromonospora purpurea)、吸水链霉菌、那波链霉菌(Streptomyces narbonensis)、卡那霉素链霉菌(Streptomyces kanamyceticus)、山丘链霉菌(Streptomyces collinus)、拉沙里链霉菌(Streptomyces lasaliensis)、林肯链霉菌(Streptomyces lincolnensis)、桔橙指孢囊菌(Dactosporangium aurantiacum)、毒三素链霉菌(Streptomyces toxitricini)、吸水链霉菌、褶皱链霉菌(Streptomyces plicatus)、淡紫灰链霉菌、加纳链霉菌(Streptomyces ghanaensis)、肉桂地链霉菌(Streptomyces cinnamonensis)、金色链霉菌(Streptomyces aureofaciens)、纳塔尔链霉菌(Streptomyces natalensis)、恰塔努加链霉菌L10(Streptomyces chattanoogensis)、利迪链霉菌A02(Streptomyces lydicus)、弗氏链霉菌(Streptomyces fradiae)、生二素链霉菌、唐德链霉菌(Streptomyces tendae)、诺尔斯链霉菌(Streptomyces noursei)、阿维链霉菌、龟裂链霉菌(Streptomyces rimosus)、威德摩尔链霉菌(Streptomyces wedmorensis)、可可链霉菌(Streptomyces cacaoi)、始旋链霉菌(Streptomyces pristinaespiralis)、始旋链霉菌、游动放线菌属物种(Actinoplanes sp.)ATCC 33076、吸水链霉菌、产气列契瓦尼尔氏菌(Lechevalieria aerocolonegenes)、地中海氏拟无枝菌酸菌(Amycolatopsis mediterranei)、苍黄拟无枝菌酸菌(Amycolatopsis lurida)、白色链霉菌(Streptomyces albus)、灰色链霉菌(Streptomyces griseolus)、壮观链霉菌(Streptomyces spectabilis)、刺糖多胞菌(Saccharopolyspora spinosa)、生二素链霉菌、Streptomyces staurosporeus、灰色链霉菌、链霉菌属(多个物种)、Streptomyces acromogenes、筑波链霉菌(Streptomyces tsukubaensis)、垣霉素游动放线菌(Actinoplanes teichomyceticus)、淡青链霉菌(Streptomyces glaucescens)、龟裂链霉菌、牲畜链霉菌(Streptomyces cattleya)、远青链霉菌(Streptomyces azureus)、印度异壁链霉菌(Streptoalloteicus hindustanus)、教酒链霉菌、弗氏链霉菌、天蓝色链霉菌、吸水链霉菌、链霉菌属11861、弗吉尼亚链霉菌(Streptomyces virginiae)、Amycolatopsis japonicum、糖肽霉素拟无枝菌酸菌(Amycolatopsis balhimycini)、白色链霉菌J1074、天蓝色链霉菌M1146、变铅青链霉菌(Streptomyces lividans)、因卡那特链霉菌(Streptomyces incarnates)、紫红链霉菌(Streptomyces violaceoruber)或灰褐链霉菌(Streptomyces griseofuscus)。在一些实施方案中,宿主细胞是埃希氏菌属(Escherichia)菌株,例如大肠杆菌(Escherichia coli)。在一些实施方案中,宿主细胞是芽孢杆菌属(Bacillus)菌株,例如枯草芽孢杆菌(Bacillus subtilis)。在一些实施方案中,宿主细胞是假单胞菌属(Pseudomonas)菌株,例如恶臭假单胞菌(Pseudomonas putitda)。在一些实施方案中,宿主细胞是粘液球菌属(Myxococcus)菌株,例如黄色粘球菌(Myxococcus xanthus)。
实施例
实施例1. 单模块交换以产生改造的PKS
模块间残基协方差分析和进化跟踪分析用于预测10个异源供体模块,其将成功替换产生化合物1的PKS的模块3(图3A)。使用富含GC的长PCR方法进行整体选择性扩增。并行地,通过将限制性位点AflII和SpeI引入模块3的侧翼模块序列长度范围为4-6kb的10个预测的供体模块中的7个,将携带产生化合物1的PKS的细菌人工染色体(BAC)转换为用于异源供体模块的模块交换受体。修饰的受体BAC通过用AflII和SpeI消化进行线性化,并且将7个供体模块凝胶纯化且通过Gibson克隆进行亚克隆。使所得到的构建体经受目标区域的Sanger测序,基于PCR的分析以确认簇完整性,和Illumina NGS以测序整个BAC。模块扩增方案的PCR介导的错误率被确定为大约1bp/5000bp,或大约1个突变/模块。
通过用链霉菌属菌株S317的模块3替换产生化合物1的PKS的模块3来交换单模块,以产生改造的PKS。供体S317模块3进行PCR扩增,并且Gibson克隆到产生化合物1的PKS的位置3内(图3B)。将所得到的克隆缀合到链霉菌属表达宿主内且发酵。通过LC-TOF质谱法分析,通过共注射纯化的天然FKBP12(预期两种化合物均与之结合的蛋白质)与天然PKS的产物,化合物1或由改造的PKS簇产生的化合物,化合物2,来分析化合物的产生。比较LC-TOF分析指示化合物2具有611.38的预期质量,对应于模块3烯烃转换为在该位置处完全还原的模块。将化合物2在大规模下再发酵,纯化至同质性,并且通过NMR光谱确认结构。
为了替换产生化合物1的PKS中的模块4,基于模块间协方差的模块交换预测算法用于生成编码4种化学的16个模块的列表。基于Gibson的亚克隆到模块4内不如模块3一样有效。涉及ssDNA中间产物的Gibson克隆,在富含高GC的区域中很难进行,并且供体模块直接连接到具有4bp突出端的限制性位点对于局部GC含量可能不敏感。因此,在模块间侧翼区域中的新位置处引入AflII和SpeI位点,以生成直接连接受体BAC。该直接连接受体BAC通过用AflII和SpeI消化进行线性化,并且12个供体模块进行凝胶纯化,用AflII和XbaI消化并且通过连接亚克隆。
产生化合物1的PKS中的模块3或模块4的单模块交换生成新型化合物2-5(图3C)。因此,单模块交换用于引入一系列模块编码的化学物质并且生成新型化合物。LC-TOF质谱法分析指示具有在模块3和模块4处的模块交换,所得到的杂交簇产生一系列化合物表达。
实施例2. 通过组合双模块交换的文库构建
双模块文库的合并转移用于同时替换产生化合物1的PKS中的模块3和4,并且生成多个改造的PKS簇(图4A)。总共31个模块被扩增用于转移到模块3位置,并且25个模块被扩增用于转移到模块4位置。为了优化Gibson双模块装配克隆,合成了硫代磷酸酯修饰的DNA寡核苷酸用于供体模块的PCR扩增。硫代磷酸酯封端的模块端部通过约束Gibson克隆方案的核酸外切酶步骤而起作用,所述核酸外切酶步骤导致富含GC的DNA的Gibson捕获的急剧增加(图4B)。开发了基于中间产物质粒的双模块捕获方案,以装配、捕获、扩增且富集双模块单元(图4C)。将合并的模块3和模块4扩增子与基于pBR322的线性主链扩增子混合,用于3部分Gibson装配反应。含有双模块组件的穿梭载体可以通过在制备性0.4%琼脂糖凝胶上分级而从空载体中分辨。在双模块捕获后,通过用AfllI和XbaI消化将装配的双模块片段从穿梭载体中释放,并且通过直接连接到含有产生化合物1的PKS的表达载体进行亚克隆,其中PKS缺乏天然模块3和模块4。
将编码单模块和双模块交换的重复BAC与优化的链霉菌属生产菌株S2441缀合,并且使固相提取的样品经受用预期的蛋白质结合配偶体(纯化的FKBP12蛋白质)的LC-TOF质谱法。进一步分析确认,双模块文库生成能够改造以高产率表达新型化合物的PKS簇(图4D)。作为代表性实例,化合物6通过在模块3处的编码mDEK化学的模块和在产生化合物1的PKS的模块4处的K化学的双模块交换而生成。通过LC-TOF分析观察化合物6的预期质量,确认双模块装配方案产生改造的衍生物化合物1。
通过双模块交换产生650个成员的产生化合物1的PKS改造衍生物的组合文库。总共31个模块被扩增用于转移模块3位置,并且25个模块被扩增用于转移产生化合物1的PKS的模块4位置(图4E)。将簇克隆到BAC上,并且克隆的BAC随后用作来自多重异源供体的不同来源的PCR模块的模板。
对应于在模块3位置处的15个不同供体模块和在模块4位置处的15个不同供体模块的文库子集产生225个新型PKS簇和所得到的新型化合物的潜在组合文库(15x15双模块文库)。因为双模块文库被装配为集合,所以执行稀疏性分析以确定需要缀合、发酵且提取多少克隆以有效地采样>90%的文库多样性。稀释性分析指示650个克隆对应于>90%的双模块文库的统计采样(图4F)。对650个克隆进行起诉(prosecuted)并且经受LC-TOF质谱法分析。650个采样克隆中的115个表达具有新质量的化合物。
实施例3. 通过单分子长读测序表征组合双模块文库
根据实施例2的方法产生对应于在模块3位置处的15个不同供体模块和在模块4位置处的15个不同供体模块的文库(15x15双模块文库),所述文库通过纳米孔测序进行表征(图4G)。使用CRISPR/Cas9(NEB)从PKS簇中切除15x15双模块文库中存在的双模块。所得到的切除的双模块各自具有大约7-12千碱基的长度。通过96孔柱纯化来纯化双模块,并且将孔特异性的衔接子连接到双模块。将所得到的双模块归一化且合并,并且根据用于寡核苷酸的纳米孔测序的标准连接制备方案制备用于测序。通过纳米孔对九个96孔板(总共864个双模块克隆)进行测序,并且根据图4H中提供的信息学工作流分析所得到的测序数据,其中调用73.1%的克隆。所得到的测序数据针对供体模块的输入表的比较允许通过鉴定所得到的双模块解卷积所得到的组合文库。表1中提供了15x15双模块文库的纳米孔测序结果。
表1.
文库板ID 调用数目 模糊的 单个读数 调用的 合计
163846 45 4 11 36 96
163848 14 10 14 58 96
163851 16 80 96
163896 5 8 5 78 96
163897 21 1 74 96
163898 3 10 11 72 96
163899 4 6 2 84 96
163900 1 26 3 66 96
50066321 12 84 96
合计 72 113 47 632 864
% 8.3% 13.1% 5.4% 73.1%
实施例4. 通过组合三模块交换的文库构建
修改组合模块交换方案以在产生化合物7的PKS中生成三模块组件(图5A)。增加模块交换的数目增加PKS文库的大小,从而增加其多样性。例如,给定13种不同模块编码的化学的集合,增加的大小和多样性是基于交换的模块数目,使得单模块交换的最大文库大小为13;对于双模块交换,最大文库大小为132=169;并且对于三模块交换,最大文库为133 = 2197。
三模块装配利用双模块方案的技术进步与另外的“校正读码” Gibson克隆步骤,以将捕获的三模块组件插入产生化合物7的PKS内(图5B)。如前,硫代磷酸酯化学用于约束第一轮Gibson克隆到穿梭载体内的ssDNA中间产物。通过制备凝胶分级和分离来富集携带三模块组件的穿梭载体克隆。最后,Gibson介导的“错误校正”用于修剪表达载体中的无痕克隆的限制性位点。首先,在模块3和模块4之间以及模块6和模块7之间的接头区域内引入侧翼PmeI限制性位点。选择具有减少的GC含量和二级结构的位点(如通过DNA倍数预测的;<8 kcal/ml),用于最佳Gibson同源臂。Gibson Assembly Ultra Kit(SGI-DNA)用于将三模块组件克隆到产生化合物7的PKS内,允许替换模块4、5和6且同时去除消化后保留的另外的外来PmeI序列。这导致对于通过三模块交换的PKS簇产生的化合物的工业规模生产(>200/周)>95%的正确装配。
实施例5. 通过将单模块受体与双模块供体交换的扩环
通过上述方法将编码mDEK化学和K化学的异源双模块供体组件交换到产生化合物1的PKS的模块3,单模块受体内(图6A)。通过改造PKS产生的化合物(化合物8)以高产率观察到,并且如通过LC-TOF分析测定的,具有655.41的质量(图6B)。这对应于其中化合物8含有另外的2-碳延伸单元的扩环化合物产物。因此,通过插入双模块组件以替换单模块,经由模块交换的重编程PKS生物合成可以产生功能性PKS表达。
实施例6. PKS加载模块的模块交换
雷帕霉素是由混合的聚酮合酶(PKS)/非核糖体肽合酶(NRPS)系统合成的天然产物。雷帕霉素与相关的天然产物FK506共享共同的结构基序,其负责结合FK506结合蛋白(FKBP)。在雷帕霉素的生物发生过程中,加载模块经由CaiC结构域结合并且加载4,5-二羟基环己-1,5-二烯羧酸起始单元(其充当羧酸连接酶(CL)样结构域)(图7A)。加载模块可以具有与常规延长PKS模块类似的结构域结构,包括酮还原酶样结构域和烯酰还原酶结构域,其可以是或不是催化活性的。起始单元的最终化学取决于加载模块中结构域的存在和顺序,因此可以通过交换加载模块来改造所得到的“起始单元”。
X23 PKS簇产生化合物9和化合物10(图7B)。来自链霉菌属菌株S303的雷帕霉素加载模块通过先前对于单模块交换描述的方法交换到X23簇内。改造的PKS产生化合物11和12,其中起始单元替换为雷帕霉素的起始单元。X23的模块2和模块7的另外单延长模块交换分别产生化合物13和14。
其它实施方案
应当理解,虽然本发明已结合其详细描述进行描述,但前述描述旨在说明而不是限制本发明的范围,所述本发明的范围由所附权利要求的范围限定。其它方面、优点和改变在下述权利要求的范围内。
本领域技术人员将认识到或者能够使用不超过例行实验确定根据本文所述的本发明的具体实施方案的许多等价物。本发明的范围并非旨在限制于上文描述,而是如所附权利要求中所述。
在权利要求中,冠词如“一个”、“一种”和“该/所述”可以意指一个/种或多于一个/种,除非上下文指出相反或在其它方面显而易见。如果一个、多于一个或所有组成员在给定产物或过程中存在、采用或以其它方式相关,则认为在组中的一个或多个成员之间包括“或”的权利要求或描述被认为是满足的,除非上下文指出相反或在其它方面显而易见。本发明包括其中该组的恰好一个成员在给定产物或过程中存在、采用或以其它方式相关的实施方案。本发明包括其中多于一个或所有组成员在给定产物或过程中存在、采用或以其它方式相关的实施方案。
还应注意,术语“包含”旨在是开放的并且允许但不要求包括另外的元件或步骤。当术语“包含”在本文中使用时,因此也涵盖且公开了术语“由……组成”。
当给出范围时,包括端点。此外,应理解,除非上下文和本领域普通技术人员的理解指出相反或在其它方面显而易见,否则表示为范围的值可以采取在本发明的不同实施方案中的所述范围内的任何特定值或子范围,至范围下限单位的十分之一,除非上下文另有明确规定。
另外,应理解,落入现有技术内的本发明的任何特定实施例可以明确地从任何一个或多个权利要求中排除。由于此类实施例被认为是本领域普通技术人员已知的,因此即使在本文中未明确阐述排除,也可排除它们。出于任何原因,本发明的组合物的任何特定实施例(例如,由其编码的任何多核苷酸或蛋白;任何生产方法;任何使用方法)可以从任何一个或多个权利要求中排除,无论是否与现有技术的存在相关。

Claims (51)

1.一种改造的聚酮合酶,其包含相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述改造的聚酮合酶能够在适合于允许通过改造的聚酮合酶表达化合物的条件下表达时产生聚酮,并且其中所述一个或多个异源模块在聚酮生物合成期间基本上不抑制聚酮转运。
2.一种改造的聚酮合酶,其包含相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述改造的聚酮合酶能够在适合于允许通过改造的聚酮合酶表达化合物的条件下表达时产生聚酮,并且其中一个或多个异源模块包含和与其相邻的模块的连接序列相容的连接序列。
3.一种改造的聚酮合酶,其包含相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述改造的聚酮合酶能够在适合于允许通过改造的聚酮合酶表达化合物的条件下表达时产生聚酮,并且其中所述改造的聚酮合酶的聚酮表达水平为所述参考聚酮合酶的聚酮表达水平的至少1%。
4.权利要求1至3中任一项的改造的聚酮合酶,其中所述一个或多个异源模块包含天然连接序列。
5.权利要求1至4中任一项的改造的聚酮合酶,其中所述改造的聚酮合酶包含两个或更多个异源模块。
6.权利要求5的改造的聚酮合酶,其中所述两个或更多个异源模块是相邻的。
7.权利要求1至6中任一项的改造的聚酮合酶,其中所述改造的聚酮合酶包含三个或更多个异源模块。
8.权利要求7的改造的聚酮合酶,其中所述三个或更多个异源模块是相邻的。
9.权利要求1至8中任一项的改造的聚酮合酶,其中所述异源模块是修饰所述聚酮的可变区中的β-羰基单元的延长模块。
10.权利要求1至9中任一项的改造的聚酮合酶,其中所述一个或多个异源模块中的至少一个包含与SEQ ID NO:1-174中任何一个具有至少90%同一性的部分。
11.权利要求1至10中任一项的改造的聚酮合酶,其中所述一个或多个异源模块中的至少一个包含具有SEQ ID NO:1-174中任何一个的序列的部分。
12.一种嵌合聚酮合酶,其中与具有SEQ ID NO:175-176的序列的聚酮合酶相比,所述嵌合聚酮合酶的至少一个模块已进行修饰。
13.权利要求12的嵌合聚酮合酶,其中所述至少一个模块包含与SEQ ID NO:1-174中任一个具有至少90%同一性的部分。
14.一种核酸,其编码权利要求1-13中任一项的聚酮合酶。
15.权利要求15的核酸,其中所述核酸进一步编码LAL,其中编码所述LAL的序列与编码所述聚酮合酶的序列可操作地连接。
16.权利要求15的核酸,其中所述LAL是异源LAL。
17.权利要求15或16的核酸,其中所述LAL包含与SEQ ID NO:177具有至少80%同一性的部分。
18.权利要求17的核酸,其中所述LAL包含具有SEQ ID NO:177的序列的部分。
19.权利要求18的核酸,其中所述LAL具有SEQ ID NO:177的序列。
20.权利要求14至19中任一项的核酸,其中编码所述LAL的核酸在开放读码框中缺乏TTA抑制密码子。
21.权利要求14至20中任一项的核酸,其中所述核酸进一步包含LAL结合位点,其中编码所述LAL结合位点的序列与编码所述聚酮合酶的序列可操作地连接。
22.权利要求21的核酸,其中所述LAL结合位点包含与SEQ ID NO:178的序列具有至少80%序列同一性的部分。
23.权利要求22的核酸,其中所述LAL结合位点包含具有SEQ ID NO:178的序列的部分。
24.权利要求23的核酸,其中所述LAL结合位点具有SEQ ID NO:178的序列。
25.权利要求21的核酸,其中所述LAL结合位点具有序列GGGGGT(SEQ ID NO:179)。
26.权利要求21至25中任一项的核酸,其中所述LAL与所述LAL结合位点的结合促进所述聚酮合酶的表达。
27.权利要求14至26中任一项的核酸,其中所述核酸进一步编码非核糖体肽合酶。
28.权利要求14至27中任一项的核酸,其中所述核酸进一步编码第一P450酶。
29.权利要求28的核酸,其中所述核酸进一步编码第二P450酶。
30.一种表达载体,其包含权利要求14至29中任一项的核酸。
31.权利要求30的表达载体,其中所述表达载体是人工染色体。
32.权利要求31的表达载体,其中所述人工染色体是细菌人工染色体。
33.一种宿主细胞,其包含权利要求30至32中任一项的表达载体。
34.一种宿主细胞,其包含权利要求1至13中任一项的聚酮合酶,其中所述聚酮对于所述宿主细胞是异源的。
35.权利要求33或34的宿主细胞,其中所述宿主细胞天然缺乏LAL。
36.权利要求33至35中任一项的宿主细胞,其中所述宿主细胞天然缺乏LAL结合位点。
37.权利要求33至36中任一项的宿主细胞,其中所述宿主细胞包含能够结合LAL结合位点且调节聚酮合酶表达的LAL。
38.权利要求37的宿主细胞,其中所述LAL是异源的。
39.权利要求37或38的宿主细胞,其中所述LAL包含与SEQ ID NO:177的序列具有至少80%同一性的部分。
40.权利要求33至39中任一项的宿主细胞,其中所述宿主细胞是细菌。
41.权利要求40的宿主细胞,其中所述细菌是放线菌。
42.权利要求41的宿主细胞,其中所述放线菌是生二素链霉菌、吸水链霉菌或马来亚链霉菌。
43.权利要求42的宿主细胞,其中所述放线菌是S1391、S1496或S2441。
44.权利要求33至43中任一项的宿主细胞,其中所述宿主细胞已进行修饰以增强聚酮合酶的表达。
45.权利要求44的宿主细胞,其中所述宿主细胞已通过以下进行修饰,以增强产生化合物的蛋白质的表达:(i)缺失表达产生化合物的蛋白质的内源基因簇;(ii)插入表达产生化合物的蛋白质的异源基因簇;(iii)宿主细胞暴露于抗生素攻击;和/或(iv)引入异源启动子,与同源启动子相比,所述异源启动子导致化合物的表达中的至少2倍增加。
46.一种产生聚酮的方法,所述方法包括在合适的条件下培养权利要求33至45中任一项的宿主细胞。
47.一种产生聚酮的方法,所述方法包括在适合于聚酮合酶产生聚酮的条件下,培养改造为表达权利要求1至13中任一项的聚酮合酶的宿主细胞。
48.一种产生化合物的方法,所述方法包括:
(a)提供能够产生化合物的亲本聚酮合酶序列;
(b)确定第二聚酮合酶的至少一个模块与所述亲本聚酮合酶的至少两个模块的相容性;
(c)产生编码修饰的聚酮合酶的核酸,其中所述修饰的聚酮合酶包含第二聚酮合酶的至少一个模块,其已确定为与所述亲本聚酮合酶的至少两个模块相容。
49.一种产生化合物的方法,所述方法包括:
(a)提供编码亲本聚酮合酶的亲本核酸;
(b)修饰所述亲本核酸,以产生编码能够产生化合物的修饰的聚酮合酶的修饰核酸,其中所述修饰产生包含至少一个异源模块的修饰的聚酮合酶。
50.一种产生化合物的方法,所述方法包括:
(a)提供能够产生化合物的亲本多核苷酸序列;
(b)鉴定适合于替换所述亲本多核苷酸序列中的一个或多个模块的一个或多个异源模块;
(c)产生编码修饰的聚酮合酶的核酸,其中所述修饰的聚酮合酶包含步骤(b)中鉴定的至少一个异源模块。
51.一种产生多种多核苷酸的方法,其中所述多种多核苷酸各自对应于改造的聚酮合酶,并且其中所述多种多核苷酸各自包含相对于参考聚酮具有改变的酶促活性的一个或多个异源模块,其中所述方法包括:
(a)提供编码聚酮合酶的亲本多核苷酸序列;
(b)在所述亲本多核苷酸序列中鉴定用于替换的一个或多个模块;
(c)鉴定适合于替换步骤(b)中鉴定的每个模块的两个或更多个异源模块;
(d)生成多种多核苷酸,其中所述多种多核苷酸各自对应于改造的聚酮合酶,并且其中所述多种多核苷酸各自包含选自步骤(c)中鉴定的两个或更多个异源模块的异源模块替换步骤(b)中鉴定的待替换的一个或多个模块中的每一个。
CN201780081161.XA 2016-10-28 2017-10-27 用于生产化合物的组合物和方法 Pending CN110418642A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662414410P 2016-10-28 2016-10-28
US62/414410 2016-10-28
PCT/US2017/058800 WO2018081590A1 (en) 2016-10-28 2017-10-27 Compositions and methods for the production of compounds

Publications (1)

Publication Number Publication Date
CN110418642A true CN110418642A (zh) 2019-11-05

Family

ID=62025506

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780081161.XA Pending CN110418642A (zh) 2016-10-28 2017-10-27 用于生产化合物的组合物和方法

Country Status (8)

Country Link
US (1) US20190264184A1 (zh)
EP (1) EP3532055A4 (zh)
JP (1) JP2019533470A (zh)
KR (1) KR102561694B1 (zh)
CN (1) CN110418642A (zh)
AU (1) AU2017350898A1 (zh)
CA (1) CA3042246A1 (zh)
WO (1) WO2018081590A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021241593A1 (zh) * 2020-05-26 2021-12-02
CA3191387A1 (en) 2020-09-30 2022-04-07 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
WO2022250068A1 (ja) * 2021-05-25 2022-12-01 Spiber株式会社 プラスミドの製造方法及びプラスミド

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998001546A2 (en) * 1996-07-05 1998-01-15 Biotica Technology Limited Polyketides and their synthesis
WO2000047724A2 (en) * 1999-02-09 2000-08-17 Board Of Trustees Of The Leland Stanford Junior University Methods to mediate polyketide synthase module effectiveness
US20030175901A1 (en) * 1998-10-02 2003-09-18 Christopher Reeves Polynucleotides encoding the fkbA gene of the FK-520 polyketide synthase gene cluster
US20150307855A1 (en) * 2014-02-26 2015-10-29 The Regents Of The University Of California Producing 3-Hydroxycarboxylic Acid and Ketone Using Polyketide Synthases

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6960453B1 (en) * 1996-07-05 2005-11-01 Biotica Technology Limited Hybrid polyketide synthases combining heterologous loading and extender modules
US7217856B2 (en) * 1999-01-14 2007-05-15 Martek Biosciences Corporation PUFA polyketide synthase systems and uses thereof
US20030153053A1 (en) * 2001-08-06 2003-08-14 Ralph Reid Methods for altering polyketide synthase genes

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1998001546A2 (en) * 1996-07-05 1998-01-15 Biotica Technology Limited Polyketides and their synthesis
US20030175901A1 (en) * 1998-10-02 2003-09-18 Christopher Reeves Polynucleotides encoding the fkbA gene of the FK-520 polyketide synthase gene cluster
WO2000047724A2 (en) * 1999-02-09 2000-08-17 Board Of Trustees Of The Leland Stanford Junior University Methods to mediate polyketide synthase module effectiveness
US20150307855A1 (en) * 2014-02-26 2015-10-29 The Regents Of The University Of California Producing 3-Hydroxycarboxylic Acid and Ketone Using Polyketide Synthases

Also Published As

Publication number Publication date
KR102561694B1 (ko) 2023-07-28
JP2019533470A (ja) 2019-11-21
US20190264184A1 (en) 2019-08-29
EP3532055A4 (en) 2020-10-21
CA3042246A1 (en) 2018-05-03
KR20190099397A (ko) 2019-08-27
AU2017350898A1 (en) 2019-06-13
EP3532055A1 (en) 2019-09-04
WO2018081590A1 (en) 2018-05-03

Similar Documents

Publication Publication Date Title
CN110418642A (zh) 用于生产化合物的组合物和方法
CN110506120A (zh) 用于生产化合物的组合物和方法
Amin et al. Microbiological and molecular insights on rare Actinobacteria harboring bioactive prospective
Walsh Combinatorial biosynthesis of antibiotics: challenges and opportunities
Cortes et al. An unusually large multifunctional polypeptide in the erythromycin-producing polyketide synthase of Saccharopolyspora erythraea
Weissman The structural basis for docking in modular polyketide biosynthesis
US11390882B2 (en) Expression vector
Pidot et al. Deciphering the genetic basis for polyketide variation among mycobacteria producing mycolactones
Emmerich et al. Evidence for a functional similarity between the two-component regulatory systems RegSR, ActSR, and RegBA (PrrBA) in α-Proteobacteria
Zalacain et al. Methylation of 23S ribosomal RNA due to carB, an antibiotic‐resistance determinant from the carbomycin producer, Streptomyces thermotolerans
DE69736673T2 (de) Rifamycin biosynthese genkluster
De Boer et al. Recent efforts in engineering microbial cells to produce new chemical compounds
Baltz et al. Microbial genome mining for natural product drug discovery
EP1539952B1 (en) Method for the expression of unknown environmental dna into adapted host cells
Tomich Streptomyces cloning: possible construction of novel compounds and regulation of antibiotic biosynthetic genes
US7680601B1 (en) Design of polyketide synthase genes
CN114836360B (zh) 一种用于检测耐药基因适应性代价的大肠杆菌基因工程菌及其构建方法
Tang Synthetic biology to revive microbial natural product discovery
Teufel Chromosomal Architecture and its Influence on Gene Expression in Native and Engineered Bacteria
Hou Mining the Genomes of Lichen Associated Bacteria for Biosynthetic Gene Clusters Encoding New Secondary Metabolites
Tan et al. Application of Cas12j for Streptomyces Editing
Long et al. The investigation on metabolites, genes and open chromatins involved in colored leaves of Eucommia ulmoides ‘Ziye’
Lasch New natural products from Actinobacteria: Potential and constraints of heterologous expression in Streptomyces hosts
Udwary Natural Product Combinatorial Biosynthesis: Promises and Realities
Gifford Evolutionary Implications of Actinobacterial Genetics for Frankia spp., Nitrogen-fixing Plant Endosymbionts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20191105