CN103732735A - 具有改善蔗糖利用的重组细菌 - Google Patents

具有改善蔗糖利用的重组细菌 Download PDF

Info

Publication number
CN103732735A
CN103732735A CN201280039101.9A CN201280039101A CN103732735A CN 103732735 A CN103732735 A CN 103732735A CN 201280039101 A CN201280039101 A CN 201280039101A CN 103732735 A CN103732735 A CN 103732735A
Authority
CN
China
Prior art keywords
gene
sequence
seq
sucrose
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201280039101.9A
Other languages
English (en)
Inventor
Q.陈
Q.程
J.P.赖
K.鲁伊布林格-贾斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EIDP Inc
Original Assignee
EI Du Pont de Nemours and Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EI Du Pont de Nemours and Co filed Critical EI Du Pont de Nemours and Co
Publication of CN103732735A publication Critical patent/CN103732735A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2431Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • C12P7/20Glycerol
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了具有改善的利用蔗糖的能力的重组细菌。这些重组细菌具有编码利用蔗糖的多肽的核苷酸序列,所述核苷酸序列在yihP基因或其同源物与yihO基因或其同源物之间被整合到它们的基因组中。另外,还提供了利用所述重组细菌来生产诸如甘油和甘油衍生产物的产物的方法。

Description

具有改善蔗糖利用的重组细菌
技术领域
本发明涉及微生物学和分子生物学领域。更具体地,提供了具有改善的利用蔗糖的能力的重组细菌。
背景技术
许多在商业上有用的微生物可利用葡萄糖作为其主要碳水化合物来源。然而,所开发的用于产生商业上所需的产物的微生物利用葡萄糖的缺点是葡萄糖的高费用。使用蔗糖和含有蔗糖和其他糖类的混合原料作为微生物生产系统的碳水化物来源将会是在商业上可取的,因为这些材料可容易以较低成本获得。
当生产微生物可利用混合原料中存在的任何蔗糖时,其可更高效地运行。因而,当生产微生物不具有高效利用蔗糖作为主要碳源的能力时,其不能如此有效地工作。例如,细菌细胞通常显示出偏好的糖利用,以葡萄糖为最优选的。在含有糖混合物的人造培养基中,葡萄糖通常先于其他糖类被完全代谢。此外,许多细菌缺少利用蔗糖的能力。例如,不到50%的大肠杆菌(Escherichia coli)菌株具有利用蔗糖的能力。因而,当生产微生物不能利用蔗糖作为碳水化合物来源时,希望对该微生物进行工程改造而使得其可利用蔗糖。
已通过整合利用蔗糖的基因来工程改造而可利用蔗糖的重组细菌已有报道。例如,Livshits等人(美国专利6,960,455)描述了利用大肠杆菌菌株来生产氨基酸,所述菌株含有编码利用蔗糖的代谢途径的基因。此外,Olson等人(Appl.Microbiol.Biotechnol.74:1031-1040,2007)描述了携带负责蔗糖降解的基因的大肠杆菌菌株,其可利用蔗糖作为碳源来生产L-酪氨酸或L-苯丙氨酸。此外,Eliot等人(美国专利申请公布2011/0136190)描述了能够从蔗糖生产甘油和甘油衍生产物的重组细菌。然而,仍然存在对具有改善的利用蔗糖能力的细菌菌株的需求。此外,还存在着对具有改善的利用蔗糖作为碳源生产甘油和甘油衍生产物的能力的细菌菌株的需要。
发明内容
一个实施例提供了重组细菌,所述重组细菌在其基因组中包含:
(a)一种或多种编码具有蔗糖转运蛋白活性的多肽或多肽复合物的核苷酸序列;
(b)编码具有果糖激酶活性的多肽的核苷酸序列;和
(c)编码具有蔗糖水解酶活性的多肽的核苷酸序列;
其中:
(i)(a)、(b)和(c)各自可操作地连接至相同的或不同的启动子;
(ii)(a)、(b)和(c)在yihP基因或其同源物与yihO基因或其同源物之间被整合到基因组中;并且
(iii)所述细菌以比包含整合在基因组中不同位置处的(a)、(b)和(c)的细菌更高的速率代谢蔗糖。
另一个实施例提供了由蔗糖制备甘油、1,3-丙二醇和/或3-羟基丙酸的方法,所述方法包括:
a)在蔗糖存在下培养本文所公开的重组细菌;以及
b)回收产生的甘油、1,3-丙二醇和/或3-羟基丙酸。
附图说明和序列说明
通过下面的具体实施方式、附图和随附的序列描述可以更全面地理解本发明,这些详细描述、附图和序列描述形成了本专利申请的一部分。
图1是显示蔗糖基因簇在其处被整合的染色体位置的图。染色体基因以带条纹的箭头显示。所述蔗糖基因以开放的箭头显示。箭头的方向表示基因表达的方向。
下列序列符合37C.F.R.1.8211.825(“对含有核酸序列和/或氨基酸序列公开的专利申请的要求一序列规则”),并且符合世界知识产权组织(WIPO)标准ST.25(2009)和EPO和PCT的序列表要求(规则5.2和49.5(a bis),以及行政指令的208节和附录C)。核苷酸的符号和格式以及氨基酸序列数据符合如37C.F.R.§1.822所示的规则。
表A
基因和蛋白质SEQ ID NO概述
Figure BDA0000464725940000031
Figure BDA0000464725940000041
SEQ ID NO:71是来自肺炎克雷伯氏菌(Klebsiella pneumoniae)的dhaX基因的编码区的核苷酸序列。
SEQ ID NO:72是质粒pSYCO101的核苷酸序列。
SEQ ID NO:73是质粒pSYCO103的核苷酸序列。
SEQ ID NO:74是质粒pSYCO106的核苷酸序列。
SEQ ID NO:75是质粒pSYCO109的核苷酸序列。
SEQ ID NO:76是质粒pSYCO400/AGRO的核苷酸序列。
SEQ ID NO:85是编码弗氏志贺菌(Shigella flexneri)的推定的透性酶YP_690957的核苷酸序列。
SEQ ID NO:86是编码肠道沙门氏菌(Salmonella enterica)的GPH家族转运蛋白NP_462898的核苷酸序列。
SEQ ID NO:87是编码生癌肠杆菌(Enterobacter cancerogenus)
Figure BDA0000464725940000051
35316的假定蛋白ENCANT_09547的核苷酸序列。
SEQ ID NO:88是编码克氏柠檬酸杆菌(Citrobacter koseri)
Figure BDA0000464725940000052
BAA-895的假定蛋白CKO_03136的核苷酸序列。
SEQ ID NO:89是编码弗氏志贺菌(Shigella flexneri)的推定的透性酶YP_690958的核苷酸序列。
SEQ ID NO:90是编码肠道沙门氏菌(Salmonella enterica)的GPH家族转运蛋白NP_462897的核苷酸序列。
SEQ ID NO:91是编码生癌肠杆菌(Enterobacter cancerogenus)35316的假定蛋白ENCANT_09546的核苷酸序列。
SEQ ID NO:92是编码克氏柠檬酸杆菌(Citrobacter koseri)
Figure BDA0000464725940000054
BAA-895的假定蛋白CKO_03137的核苷酸序列。
SEQ ID NO:115-122是在本文的例子中使用的引物的核苷酸序列。
SEQ ID NO:123是大肠杆菌(Escherichia coli)
Figure BDA0000464725940000055
13281的cscAKB基因簇的核苷酸序列。
SEQ ID NO:124是质粒pBHR-cscBKA的核苷酸序列。
具体实施方式
本文中所列出的每篇参考文献的公开内容均全文以引用方式并入本文。
如本文所用的并在所附的权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另有指明。因此,例如提及“细胞”包括一个或多个细胞及其本领域技术人员已知的等同物,等等。
在本公开的上下文中使用了若干术语和缩写。给出了如下定义。
“开放阅读框”缩写为“ORF”。
“聚合酶链反应”缩写为“PCR”。
“美国典型培养物保藏中心”缩写为“ATCC”。
术语“产重组甘油细菌”指已经遗传工程改造而能产生甘油和/或甘油衍生产物例如1,3-丙二醇和3-羟基丙酸的细菌。
术语“具有蔗糖转运蛋白活性的多肽或多肽复合物”指能够介导蔗糖转运到微生物细胞内的多肽或多肽复合物。具有蔗糖转运蛋白活性的多肽的例子包括但不限于蔗糖-质子共运输蛋白。具有蔗糖转运蛋白活性的多肽复合物的例子包括但不限于ABC型转运蛋白。蔗糖:H+共运输蛋白是由,例如,存在于诸如EC3132(Jahreis等人,J. Bacteriol.184:5307-5316,2002)或13281(Olson等人,Appl.Microbiol.Biotechnol.74:1031-1040,2007)的大肠杆菌菌株、和乳双歧杆菌菌株DSM10140T(Ehrmann等人,Curr.Microbiol.46(6):391-397,2003)中的cscB基因编码的。具有针对蔗糖的活性的ABC型转运蛋白的例子是由肺炎链球菌菌株TIGR4中的基因susTl、susT2和susX编码的复合物(Iyer和Camilli,Molecular Microbiology66:1-13,2007)。具有蔗糖转运蛋白活性的多肽或多肽复合物也具有针对其他糖类的活性。一个例子是由malEFGK编码的变异链球菌的麦芽糖转运复合物(Kilic等人,FEMSMicrobiol Lett.266:218,2007)。
术语“变体蔗糖转运蛋白多肽”是指具有不同于野生型蔗糖转运蛋白多肽序列的氨基酸序列的、具有蔗糖转运蛋白活性的多肽。所述变体蔗糖转运蛋白多肽的序列中的不同之处可以是下列中的任何一种:(i)野生型序列的至少一个位置处的氨基酸替换,(ii)所述变体蔗糖转运蛋白多肽的序列可以是从野生型序列缩短的,或(iii)所述变体蔗糖转运蛋白多肽的序列可以是从野生型序列缩短的并且包含野生型序列的至少一个位置处的氨基酸替换。
术语“具有果糖激酶活性的多肽”指具有催化D-果糖+ATP转化成磷酸果糖+ADP的能力的多肽。代表性的果糖激酶是EC2.7.1.4。具有一定的使果糖磷酸化的能力的酶,无论该活性是否为其主要活性,均可称为果糖激酶。用于编码果糖激酶的基因和具有果糖激酶活性的蛋白质的缩写包括,例如,“Frk”、“scrK”、“cscK”、“FK”、和“KHK”。果糖激酶在根癌农杆菌(Agrobacterium tumefacienns)和变异链球菌(Streptococcusmutans)中由scrK基因编码;并且在某些大肠杆菌(Escherichia coli)菌株中由cscK基因编码。
术语“具有蔗糖水解酶活性的多肽”指具有催化蔗糖水解产生葡萄糖和果糖的能力的多肽。此类多肽经常被称作“转化酶”或“β-呋喃果糖苷酶”。这些酶的典型是EC3.2.1.26。编码具有蔗糖水解酶活性的多肽的基因的例子为存在于大肠杆菌菌株EC3132(Jahreis等人,同上)或菌株
Figure BDA0000464725940000071
13281(Olson等人,同上)的cscA基因、来自乳双歧杆菌菌株DSM10140T的bfrA基因和来自啤酒糖酵母的SUC2基因(Carlson和Botstein,Cell28∶145,1982。具有蔗糖水解酶活性的多肽也可具有磷酸蔗糖水解酶活性。此类肽的一个例子由谷氨酸棒状杆菌中的scrB编码(Engels等人,FEMS Microbiol Lett.289:80-89,2008)。具有蔗糖水解酶活性的多肽还可具有蔗糖磷酸化酶活性。典型的这种酶是EC2.4.1.7。编码具有蔗糖水解酶活性的蔗糖磷酸化酶的基因的例子存在于肠膜明串珠菌DSM20193(Goedl等人,Journal of Biotechnology129:77-86,2007)和青春双歧杆菌DSM20083(van den Broek等人,Appl.Microbiol.Biotechnol.65:219-227,2004)以及其他之中。
术语“甘油衍生物”和“甘油衍生产物”在本文中可互换使用,指从甘油合成的化合物和在包括甘油的途径中合成的化合物。这种产物的例子包括3-羟基丙酸、甲基乙二醛、1,2-丙二醇和1,3-丙二醇。
术语“微生物产物”指由微生物产生的产物,即微生物代谢物质的结果。该产物可由微生物天然产生,或可对微生物进行遗传改造以产生所述产物。
术语“磷酸烯醇式丙酮酸-糖磷酸转移酶系统”、“PTS系统”和“PTS”在本文中可互换使用,指磷酸烯醇式丙酮酸依赖性糖摄取系统。
术语“磷酸载体蛋白HPr”和“PtsH”指由大肠杆菌中的ptsH编码的磷酸载体蛋白。术语“磷酸烯醇式丙酮酸-蛋白质磷酸转移酶”和“PtsI”指由大肠杆菌中的ptsI编码的磷酸转移酶EC2.7.3.9。术语“葡萄糖特异性IIA组分”和“Grr”指命名为EC2.7.1.69的酶,其由大肠杆菌中的crr编码。PtsH、PtsI和Crr包含PTS系统。
术语“PTS-”指其天然状态下不含PTS系统的微生物或其中已通过PTS基因失活而使PTS系统失活的微生物。
术语“3-磷酸甘油脱氢酶”和“G3PDH”指负责催化磷酸二羟基丙酮(DHAP)转化为3-磷酸甘油(G3P)的酶活性的多肽。体内G3PDH可以是NAD依赖性或NADP依赖性的。当具体提及辅因子特异性3-磷酸甘油脱氢酶时,将使用术语“NAD依赖性3-磷酸甘油脱氢酶”和“NADP依赖性3-磷酸甘油脱氢酶”。因为通常情况是NAD依赖性和NADP依赖性3-磷酸甘油脱氢酶能够互换利用NAD和NADP(例如通过由gpsA编码的酶),所以术语NAD依赖性和NADP依赖性3-磷酸甘油脱氢酶将互换使用。NAD依赖性酶(EC1.1.1.8)由,例如,包括GPD1(本文也称为DAR1)(编码序列如SEQ ID NO:1所示;编码的蛋白质序列如SEQ ID NO:2所示)、或GPD2(编码序列如SEQ ID NO:3所示;编码的蛋白质序列如SEQ ID NO:4所示)、或GPD3的多个基因编码。NADP依赖性酶(EC1.1.1.94),例如由gpsA编码。
术语“甘油-3-磷酸酶”、“sn-甘油-3-磷酸酶”、“D,L-甘油磷酸酶”和“G3P磷酸酶”指具有能催化3-磷酸甘油和水转化为甘油和无机磷酸的酶活性的多肽。G3P磷酸酶由,例如,GPP1(编码序列如SEQ ID NO:5所示;编码的蛋白质序列如SEQ ID NO:6所示)、或GPP2(编码序列如SEQID NO:7所示;编码的蛋白质序列如SEQ ID NO:8所示)编码。
术语“甘油脱水酶”或“脱水酶”指具有能催化甘油分子转化为产物3-羟基丙醛(3-HPA)的酶活性的多肽。
出于本发明的目的,所示脱水酶包括分别具有优选的底物甘油和1,2-丙二醇的甘油脱水酶(E.C.4.2.1.30)和二醇脱水酶(E.C.4.2.1.28)。脱水酶的基因已经在肺炎克雷伯氏菌(Klebsiella pneumoniae)、弗氏柠檬酸杆菌(Citrobacter freundii)、巴氏梭状芽孢杆菌(Clostridium pasteurianum)、鼠伤寒沙门氏菌(Salmonella typhimurium)、产酸克雷伯氏菌(Klebsiellaoxytoca)和罗伊氏乳杆菌(Lactobacillus reuteri)等中得以鉴定。在每种情况下,脱水酶均由三个亚基组成:大亚基或“α亚基”、中等亚基或“β亚基”和小亚基或“γ”亚基。所述基因还描述于,例如Daniel等人(FEMSMicrobiol.Rev.22,553(1999))以及Toraya和Mori(J. Biol.Chem.274,3372(1999))中。编码甘油脱水酶的大亚基或“α亚基”的基因包括dhaBl(编码序列如SEQ ID NO:9所示;编码的蛋白质序列如SEQ IDNO:10所示)、gldA和dhaB;编码中等亚基或“β亚基”的基因包括dhaB2(编码序列如SEQ ID NO:11所示;编码的蛋白质序列如SEQ ID NO:12所示)、gldB和ahaC;编码小亚基或“γ亚基”的基因包括dhaB3(编码序列如SEQ ID NO:13所示;编码的蛋白质序列如SEQ ID NO:14所示)、gldC和dhaE。其他编码二醇脱水酶的大亚基或“α亚基”的基因包括pduC和pddA;其他编码中等亚基或“β亚基”的基因包括pduD和PddB;其他编码小亚基或“γ亚基”的基因包括pduE和pddC。
甘油脱水酶和二醇脱水酶受甘油和其他底物的机理性的自杀式失活影响(Daniel等人,FEMS Microbiol.Rev.22,553(1999))。术语“脱水酶复活因子”指负责使脱水酶活性复活的那些蛋白质。术语“脱水酶复活活性”或“使脱水酶活性复活”以及“使脱水酶活性再生”可互换使用,指将不能催化反应的脱水酶转化为能催化反应的脱水酶的现象或者抑制脱水酶失活的现象或延长体内脱水酶的可用半衰期的现象。两种蛋白质已经被鉴定为涉及作为脱水酶复活因子(参见例如美国专利6,013,494和其中的参考文献;Daniel等人,同上;Toraya和Mori,J. Biol.Chem.274,3372(1999);和Tobimatsu等人,J. Bacteriol.181,4110(1999))。编码其中一种蛋白质的基因包括,例如orfZ、dhaB4、gdrA、pduG和ddrA。编码这两种蛋白质中的第二种的基因包括,例如orfX、orf2b、gdrB、pduH和ddrB。
术语“1,3-丙二醇氧化还原酶”、“1,3-丙二醇脱氢酶”和“DhaT”在本文中可互换使用,指具有能催化3-HPA和1,3-丙二醇互变的酶活性的多肽,前提条件是编码这种活性的基因在其天然(即野生型)环境下以在物理上或在转录方面连接至脱水酶的情形存在;例如,该基因存在于dha调节子中,来自肺炎克雷伯氏菌的dhaT也是如此。编码1,3-丙二醇氧化还原酶的基因包括但不限于来自肺炎克雷伯氏菌、弗氏柠檬酸杆菌和巴氏梭状芽孢杆菌的dhaT。这些基因每一个编码属于III型醇脱氢酶家族的多肽,其显示具有保守的铁结合基序,并且具有对NAD+/NADH偶联的3-HPA与1,3-丙二醇互变的偏好(Johnson和Lin,J. Bacteriol.169,2050(1987);Daniel等人,J. Bacteriol.177,2151(1995);和Leurs等人,FEMS Microbiol.Lett.154,337(1997))。已从短乳杆菌(Lactobacillus brevis)和布氏乳杆菌(Lactobacillus buchneri)分离出了具有类似物理特性的酶(Veiga da Dunha和Foster,Appl.Environ.Microbiol.58,2005(1992))。
术语“dha调节子”指一组编码具有多种生物学活性的多肽(包括但不限于脱水酶活性、复活活性和1,3-丙二醇氧化还原酶活性)的相关联的多核苷酸或开放阅读框。通常,dha调节子包含开放阅读框dhaR、orfY、dhaT、orfX、orfW、dhaBl、dhaB2、dhaB3和orfZ,如美国专利7,371,558中所述。
术语“醛脱氢酶”和“Ald”指催化醛转化为羧酸的多肽。醛脱氢酶可利用氧化还原辅因子例如NAD、NADP、FAD或PQQ。典型的醛脱氢酶是EC1.2.1.3(NAD依赖性);EC1.2.1.4(NADP依赖性);EC1.2.99.3(PQQ依赖性);或EC1.2.99.7(FAD依赖性)。NADP依赖性醛脱氢酶的一个例子是由大肠杆菌基因aldB(编码序列如SEQ ID NO:15所示)编码的AldB(SEQ ID NO:16)。NAD依赖性醛脱氢酶的例子包括由大肠杆菌基因aldA(编码序列如SEQ ID NO:17所示)编码的AldA(SEQ IDNO:18);和由大肠杆菌基因aldH(编码序列如SEQ ID NO:19所示)编码的AldH(SEQ ID NO:20)。
术语“葡萄糖激酶”和“Glk”在本文中互换使用,指催化D-葡萄糖+ATP转化为6-磷酸葡萄糖+ADP的蛋白质。典型的葡萄糖激酶是EC2.7.1.2。葡萄糖激酶由大肠杆菌中的glk编码。
术语“磷酸烯醇式丙酮酸羧化酶”和“Ppc”在本文中可互换使用,指催化磷酸烯醇式丙酮酸+H2O+CO2转化为磷酸+草酰乙酸的蛋白质。典型的磷酸烯醇式丙酮酸羧化酶是EC4.1.1.31。磷酸烯醇式丙酮酸羧化酶由大肠杆菌中的ppc编码。
术语“3-磷酸甘油醛脱氢酶”和“GapA”在本文中可互换使用,指具有能催化3-磷酸甘油醛+磷酸+NAD+转化为3-磷酸-D-甘油酰-磷酸+NADH+H+的酶活性的蛋白质。典型的3-磷酸甘油醛脱氢酶是EC1.2.1.12。3-磷酸甘油醛脱氢酶由大肠杆菌中的gapA编码。
术语“有氧呼吸控制蛋白”和“ArcA”在本文中可互换使用,指全局调控蛋白。有氧呼吸控制蛋白由大肠杆菌中的arcA编码。
术语“甲基乙二醛合酶”和“MgsA”在本文中可互换使用,指具有能催化磷酸二羟丙酮转化为甲基乙二醛+磷酸的酶活性的蛋白质。典型的甲基乙二醛合酶是EC4.2.3.3。甲基乙二醛合酶由大肠杆菌中的mgsA编码。
术语“磷酸葡萄糖酸脱水酶”和“Edd”在本文中可互换使用,指具有能催化6-磷酸-葡萄糖酸至2-酮-3-脱氧-6-磷酸-葡糖酸+H2O的转化的酶活性的蛋白质。典型的磷酸葡萄糖酸脱水酶是EC4.2.1.12。磷酸葡萄糖酸脱水酶由大肠杆菌中的edd编码。
术语“YciK”指由yciK编码的推定的酶,yciK在翻译方面偶联至btuR基因,后者为大肠杆菌中编码钴胺素腺苷转移酶的基因。
术语“钴胺素腺苷转移酶”指能将脱氧腺苷基部分从ATP转移至还原类咕啉的酶。典型的钴胺素腺苷转移酶是EC2.5.1.17。钴胺素腺苷转移酶由大肠杆菌中的基因“btuR”、鼠伤寒沙门氏菌中的“cobA”和脱氮假单孢杆菌(Pseudomonas denitrificans)中的“cobO”编码。
术语“半乳糖-质子共运输蛋白”和“GalP”在本文中可互换使用,指具有将糖和质子从周质运输至胞质的酶活性的蛋白质。D-葡萄糖是GalP的优选底物。半乳糖-质子共运输蛋白由大肠杆菌中的galP(编码序列如SEQID NO:21所示,编码的蛋白质序列如SEQ ID NO:22所示)编码。
术语“非特异性催化活性”指具有能催化3-HPA与1,3-丙二醇互变的酶活性的多肽,并且特别是排除1,3-丙二醇氧化还原酶。通常,这些酶是醇脱氢酶。这类酶可利用除NAD+/NADH之外的辅因子,包括但不限于诸如FAD或FMN之类的黄素。非特异性醇脱氢酶的基因(yqhD),例如据发现在大肠杆菌K-12菌株内源性编码并功能性表达。
术语“1.6长GI启动子”、“1.20短/长GI启动子”和“1.5长GI启动子”指含有来自如美国专利7,132,527所述的变铅青链霉菌(Streptomyceslividans)葡萄糖异构酶基因的启动子的多核苷酸或片段。这些启动子片段包括与野性型变铅青链霉菌葡萄糖异构酶基因启动子相比降低其活性的突变。
术语“功能”和“酶功能”在本文中可互换使用,指酶在其未被反应消耗的情况下改变特定化学反应发生的速率的催化活性。应该理解,这种活性可应用于处于产物或底物的产生可在合适的条件下完成的平衡的反应。
术语“多肽”和“蛋白质”在本文中可互换使用。
术语“碳底物”和“碳源”在本文中可互换使用,指能由本文所公开的重组细菌代谢的碳源,具体地,碳源包括葡萄糖。碳源还可以包括单糖、其他二塘、低聚糖;或多糖。
术语“宿主细胞”和“宿主细菌”在本文中可互换使用,指能接受外源或异源性基因并且能表达这些基因以产生活性基因产物的细菌。
本文所用的术语“生产微生物”指微生物,包括但不限于重组、用于制备特定产物例如1,3-丙二醇、甘油、3-羟基丙酸、多不饱和的脂肪酸等的那些微生物。
本文所用的“核酸”意指多核苷酸,并包括单链或双链的脱氧核糖核苷酸或核糖核苷酸碱基聚合物。核酸也可包括片段和经修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”在本文中可互换使用,指作为单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以它们的5′-单磷酸形式存在)可以用如下它们的单字母名称指代:“A”为腺苷酸或脱氧腺苷酸(分别对应RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示乌苷酸或脱氧乌苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任意核苷酸。
多核苷酸可以是RNA或DNA的聚合物,它们可以是单链或双链,任选地包含合成的、非天然的或改性的核苷酸碱基。DNA聚合物形式的多核苷酸可由cDNA、基因组DNA、合成DNA或它门的昆合物的一个或多个片段构成。
“基因”指可表达特定蛋白质的核酸片段,并且其可以指单独的编码区或可包括在编码序列之前的调控序列(5′非编码序列)和在编码序列之后的调控序列(3′非编码序列)。“天然基因”指自然状态下与其自身的调控序列一起的基因。“嵌合基因”指为非天然基因的任何基因,包含天然状态下不一起存在的调控序列和编码序列。因此,嵌合基因可包含源自不同来源的调控序列和编码序列,或者源自相同来源、但排列方式与天然存在的排列方式不同的调控序列和编码序列。“内源性基因”指在生物体基因组中处于其天然位置的天然基因。“外来”基因指通过基因转移导入至宿主生物内的基因。外来基因可包含插入到非天然生物体内的基因、导入到天然宿主内的新位置的基因,或嵌合基因。
术语“天然核苷酸序列”指正常存在于宿主微生物中的核苷酸序列。
术语“非天然核苷酸序列”指非正常存在于宿主微生物中的核苷酸序列。
术语“天然多肽”指正常存在于宿主微生物中的多肽。
术语“非天然多肽”指非正常存在于宿主微生物中的多肽。
术语“编码”和“译码”在本文中可互换使用,指基因通过转录和翻译机制产生氨基酸序列的过程。
术语“编码序列”指编码特定氨基酸序列的核苷酸序列。
“合适的调控序列”指位于编码序列的上游(5′非编码序列)、中间或下游(3′非编码序列)的核苷酸序列,其可影响相关编码序列的转录、RNA加工或稳定性或翻译。调控序列可包括启动子、增强子、沉默子、5′非翻译前导序列(例如在转录起始位点和翻译起始密码子之间的序列)、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎-环结构。
术语“表达盒”指DNA片段,所述DNA片段包含:所选基因的编码序列和所选基因产物表达所需的位于该编码序列之前(5′非编码序列)和之后(3′非编码序列)的调控序列。因此,表达盒通常由如下序列构成:1)启动子序列;2)编码序列(即ORF)和3)3′非翻译区域(即终止子),它在真核细胞中通常包含多聚腺苷酸化位点。表达盒通常包含于载体中,以有利于克隆和转化。可用不同表达盒转化包括细菌、酵母和真菌在内的不同生物体,只要针对各宿主使用正确的调控序列。
“转化”指将核酸分子转移进宿主生物体中,从而导致在遗传上稳定的遗传。例如,核酸分子可以是自主复制的质粒,或者其可以整合进宿主生物体的基因组中。用核酸片段转化的宿主生物被称为“重组的”或“转化的”生物或“转化体”。“稳定转化”是指核酸片段向宿主生物基因组(既包括核基因组又包括细胞器基因组)内的转移,导致遗传上稳定的遗传。相反“瞬时转化”指将核酸片段转入宿主生物的核中或包含DNA的细胞器中,在无整合或无稳定的遗传特性的情况下引起基因表达。
“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的性质。技术人员非常了解具体宿主细胞在使用核苷酸密码子来确定给定氨基酸时所表现出的“密码子偏倚性”。因此,当合成基因用以改善在宿主细胞中的表达时,期望对基因进行设计,使得其密码子使用频率接近该宿主细胞优选的密码子使用频率。
术语“具有相当功能的亚片段”和“功能上相当的亚片段”在本文中可互换使用。这些术语是指分离的核酸片段的一个部分或亚序列,其中无论所述片段或亚片段是否编码有活性的酶,其都保留着改变基因表达或导致某种表型的能力。可通过将核酸片段或子片段(无论其是否编码活性酶)以相对于启动子序列的有义或反义方向与所述启动子序列连接来设计出用于抑制的嵌合基因。
术语“保守结构域”或“基序”指进化上相关的蛋白质的比对序列中在特定位置处保守的一组氨基酸。虽然同源蛋白质之间在其它位置的氨基酸可以发生变化,但在特定位置高度保守的氨基酸表明对蛋白质的结构、稳定性或活性来说是必需的氨基酸。
术语“基本相似”和“基本对应”在本文中可互换使用。它们指这样的核酸片段,即其中一个或多个核苷酸碱基改变并不会影响该核酸片段介导基因表达或产生某种表型的能力。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核苷酸),相对于初始的未经修饰的核酸片段,该修饰基本上不会改变所得核酸片段的功能特性。因此,正如本领域的技术人员应当理解的,本发明涵盖的不仅仅是具体的示例性序列。此外,技术人员认识到,本发明所涵盖的基本相似的核苷酸序列也通过它们(在中等严格条件如0.5×SSC(标准柠檬酸钠),0.1%SDS,60℃下)与本文所示例的序列杂交的能力,或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。可以调节严格条件以筛选中度相似的片段例如来自远缘生物的同源序列,到筛选高度相似的片段例如从近缘生物复制功能性酶的基因。杂交后的洗涤确定严格条件。
术语“选择性杂交”包括指在严格杂交条件下,核酸序列与特定核酸靶序列杂交至比其与非靶核酸序列的杂交更高的可检测程度(例如至少2倍于背景技术),并指基本排除了非靶核酸。选择性杂交序列是其中所述核苷酸序列之一的互补序列通常与另一所述核苷酸具有约至少80%的序列同一性或90%的序列同一性,最高至并且包括100%的序列同一性(即完全互补)。
术语“严格条件”或“严格杂交条件”包括指探针将会选择性杂交至其靶序列的条件。探针通常是与待检测核酸序列互补的单链核酸序列。探针与待检测的核酸序列是“可杂交的”。通常,探针的长度少于约1000个核苷酸,任选长度少于500个核苷酸。
杂交方法是有严格规定的。通常探针和样品在允许核酸杂交的条件下混合。这涉及在正确浓度和温度条件下在存在无机或有机盐时使探针和样品接触。任选地,可以加入离液剂。核酸杂交可适用于多种测定形式。最合适的形式之一是夹心测定形式。夹心型测定的主要组分是固体支持体。固体支持体具有吸附或共价连接至其上的固定化核酸探针,该探针未经标记并且与序列的一部分互补。
严格条件是序列依赖性的并将因不同的环境而异。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。作为另一种选择,可调节严格条件以允许序列中的一些错配,以便检测到更低程度的相似性(异源探测)。
通常,严格条件将是如下那些条件:在pH7.0至8.3下盐浓度低于约1.5M钠离子,通常约0.01至1.0M钠离子浓度(或其它盐),并且对于短探针(例如10至50个核苷酸)温度为至少约30℃,而对于长的探针(例如多于50个核苷酸)温度为至少约60℃。严格条件也可以通过加入诸如甲酰胺之类的去稳定剂来实现。示例性的低严格条件包括在37℃于含有30至35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲液中杂交,以及在50至55℃用1×至2×SSC(20×SSC=3.0M NaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包括在37℃下于40%至45%甲酰胺、1MNaCl、1%SDS中杂交,以及在55℃至60℃下用0.5×至1×SSC洗涤。示例性的高严格条件包括在37℃下于50%甲酰胺、1M NaCl、1%SDS中杂交,以及在60℃至65℃下用0.1×SSC洗涤。
特异性通常取决于杂交后洗涤,最后的洗涤溶液的离子强度和温度是关键因素。就DNA-DNA杂交体而言,热解链温度(Tm)可以用Meinkoth等人,Anal.Biochem.138:267-284(1984)中的等式估算:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M为单价阳离子的体积摩尔浓度,%GC为DNA中乌苷和胞嘧啶核苷酸的百分比,%form为杂交溶液中甲酰胺的百分比,并且L为以碱基对表示的杂交体的长度。Tm指(在确定的离子强度和pH下)50%的互补靶序列与完全匹配的探针杂交时的温度。每出现1%的错配,Tm降低约1℃;因此,可调节Tm杂交和/或洗涤条件以与具有期望同一性的序列杂交。例如,如果要寻求具有≥90%同一性的序列,则可将Tm降低10℃。通常,在确定的离子强度和pH下,严格条件选择为比特定序列及其互补序列的Tm低约5℃。然而,极严格条件可采用在Tm低1、2、3或4℃的温度下的杂交和/或洗涤;中等严格条件可采用在比Tm低6、7、8、9或10℃的温度下的杂交和/或洗涤;低严格条件可采用在比Tm低11、12、13、14、15或20℃的温度下的杂交和/或洗涤。利用上述等式、杂交和洗涤组合物以及所需的Tm,一般技术人员将会理解,杂交和/或洗涤溶液的严格性的变化已经在本质上得以描述。如果所需的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选增加SSC的浓度以便能使用更高的温度。对核酸杂交的详尽指导可在见于下列文献:Tijssen,Laboratory Techniques in Biochemistry and MolecularBiology--Hybridization with Nucleic Acid Probes,第I部分,第2章“Overviewof principles of hybridization and the strategy of nucleic acid probe assays”,Elsevier,New York(1993);以及Current Protocols in Molecular Biology,第2章,Ausubel等人编辑,Greene Publishing and wiley-Interscience,NewYork(1995)。杂交和/或洗涤条件可进行至少10、30、60、90、120或240分钟。
在核酸或多肽序列上下文中的“序列同一性”或“同一性”是指两序列中的核酸碱基或氨基酸残基当在指定比较窗口中比对最大匹配时是相同的。
因此,“序列同一性百分比”是指通过在一个比对窗口上比较两段最大化匹配的序列所决定的值,其中在所述比对窗口中的多核苷酸或多肽序列的部分与(不包含附加或缺失)的参考序列相比可以包含附加或缺失(即间隙),以获得两段序列之间的最大匹配。所述百分比的计算方法是,统计相同的核酸碱基或氨基酸残基在两段序列中同时出现的位点的数量以得到匹配位点数,将此匹配位点数除以比对窗口中的总位点数,再将结果乘以100,从而得到序列同一性百分比。序列同一性百分比的有用的例子包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或50%至100%的任何整数百分比。这些同一性能够使用本文所述的任何程序确定。
序列比对和百分比同一性或相似性的计算可以用设计用于检测同源序列的多种比较方法来确定,这些方法包括但不限于LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,wI)的MegAlignTM程序。在本申请的上下文中应当理解,使用序列分析软件进行分析时,分析结果将基于所参考程序的“默认值”,除非另外指明。在此所用的“默认值”将指在首次初始化软件时软件最初加载的任何值或参数集。
“Clustal V序列比对方法”对应于被称为Clustal V的比对方法(在Higgins和Sharp,CABIOS.5:151-153(1989);Higgins,D.G.等人,Comput.Appl.Biosci.8:189-191(1992)中有所描述),并且可见于LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM程序中。对于多重比对,默认值对应于GAP PENALTY=10、以及GAP LENGTH PENALTY=10。使用Clustal V方法进行逐对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=1、GAP PENALTY=3、WINDOW=5、以及DIAGONALS SAVED=5。对于核酸,这些参数为KTUPLE=2、GAP PENALTY=5、WINDOW=4、以及DIAGONALSSAVED=4。在用Clustal V程序进行序列比对后,有可能通过观察相同程序中的“序列距离”表来获得“百分比同一性”。
“Clustal W序列比对方法”对应于标记Clustal W的比对方法(在Higgins和Sharp,同上;Higgins,D.G.等人,同上中有所描述),并且可见于LASERGENE生物信息学计算软件包(DNASTAR Inc.,Madison,WI)的MegAlignTM v6.1程序中。用于多重比对的默认参数对应于GAPPENALTY=10、GAP LENGTH PENALTY=0.2、Delay Divergen Seqs(%)=30、DNA Transition Weight=0.5、Protein Weight Matrix=Gonnet系列、DNAWeight Matrix=IUB。在使用Clustal W程序对序列进行比对之后,可通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
“BLASTN比对方法”是由国家生物技术信息中心(National Center forBiotechnology Information,NCBI)提供的用以采用默认参数比较核苷酸序列的算法。
本领域的技术人员非常清楚,多种程度的序列同一性可用于从其它菌种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。百分比同一性的可用的例子包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%或95%,或50%至100%的任何整数百分比。实际上,50%至100%的任何整数氨基酸同一性可用于描述本发明,例如51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。而且,所关注的是这种分离核苷酸片段的任何全长的或部分的互补序列。
因而,本发明不仅仅涵盖本文所公开的具体示例性核苷酸序列。例如,考虑反映遗传密码的简并性的基因序列改变。而且,本领域所熟知的是,导致在给定位点产生化学等价的氨基酸,但不影响所编码的蛋白质的功能特性的基因改变是常见的。针对本文论述将替换定义为如下五个组中任一者内的交换:
1.小的脂族非极性残基或稍微极性的残基:Ala、Ser、Thr(Pro、Gly);
2.极性的、带负电荷的残基和它们的酰胺:Asp、Asn、Glu、Gln;
3.极性的、带正电荷的残基:His、Arg、Lys;
4.大的脂族非极性残基:Met、Leu、Ile、Val(Cys);以及
5.大的芳族残基:Phe、Tyr、Trp。
因此,氨基酸丙氨酸(疏水性氨基酸)的密码子可被编码另一种疏水性较弱的残基(例如甘氨酸)或疏水性较强的残基(例如缬氨酸、亮氨酸或异亮氨酸)的密码子替换。类似地,导致一个带负电荷的残基替换为另一个带负电荷的残基(例如,天冬氨酸替代谷氨酸)或者一个带正电荷的残基替换为另一个带正电荷的残基(例如,赖氨酸替换精氨酸)的改变也可以预期产生功能上等价的产物。导致蛋白质分子的N末端和C末端部分改变的核苷酸变化也将预计不会改变该蛋白质的活性。
所提出的修饰中的每一种均完全在本领域常规技术内,如测定编码产物生物活性的保留情况。此外,技术人员认识到,本发明所涵盖的基本相似的序列也由它们在上面所定义的严格条件下杂交的能力限定。
本发明优选的基本相似的核酸片段是这样的核酸片段:其核苷酸序列与本文所报道的核酸片段的核苷酸序列具有至少70%的同一性。更优选的核苷酸序列与本文所报道的核酸片段的核苷酸序列具有至少90%的同一性。最优选的核苷酸序列与本文所报道的核酸片段的核苷酸序列具有至少95%的同一性。
氨基酸或核苷酸序列的“基本部分”指这样的部分,该部分包括的多肽的氨基酸序列或基因的核苷酸序列足以推定鉴定所述多肽或基因,所述鉴定或者可以由本领域技术人员通过人工评价序列来完成,或者可以利用诸如BLAST(Basic Local Alignment Search Tool;Altschul,S.F.等人,J.Mol.Biol.,215:403-410(1993))的算法通过计算机自动化的序列比对和鉴定进行。一般来讲,为了推测鉴定多肽或核酸序列是否与已知的蛋白质或基因同源,需要有10个或更多邻接的氨基酸或30个或更多核苷酸的序列。此外,对于核苷酸序列,包含20-30个邻接核苷酸的基因特异性寡核苷酸探针可用于序列依赖性的基因鉴定(如Southern杂交)和基因分离(如细菌菌落或噬斑的原位杂交)的方法中。此外,12-15个碱基的短寡核苷酸可在PCR中用作扩增引物,以便获得包含该引物的特定核酸片段。因此,核苷酸序列的“主要部分”包含的序列足以特异性地鉴定和/或分离包含该序列的核酸片段。本说明书教导了编码特定蛋白质的完整氨基酸和核苷酸序列。具有如本文报道序列的有益效果,技术人员现在可使用全部公布序列或它们的主要部分用于本领域技术人员已知的目的。
术语“互补”描述了在以反向平行取向对齐时能以Watson-Crick法则进行碱基配对的两条核苷酸碱基序列之间的关系。例如,就DNA而言,腺苷能与胸腺嘧啶碱基配对,胞嘧啶能与乌嘌呤碱基配对。因此,本发明可利用与所附序列表以及说明书中报道的完整序列互补的分离的核酸分子,以及那些基本相似的核酸序列。
术语“分离的”指从至少一种与其天然相关联的组分移出的多肽核苷酸序列。
“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。启动子序列由近侧和较远端上游元件组成,后者经常指增强子。因此,“增强子”是能刺激启动子活性的DNA序列,并且可以是启动子的固有的元件或插入的异源元件,用以增强启动子的水平或组织特异性。启动子可整个源于天然基因,或者由源于天然存在的不同启动子的不同元件构成,或者甚至包含合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。还应认识到因为在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。
“3′非编码序列”、“转录终止子”和“终止序列”在本文中可互换使用,指位于编码序列下游,包括能够影响mRNA加工或基因表达的多腺苷酸化识别序列和编码调节信号的其他序列的DNA序列。多腺苷酸化信号的特征通常在于影响多腺苷酸片至mRNA前体的3′端的添加。
术语“可操作地连接”是指单个核酸片段上的核酸序列的关联,以使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如,当启动子能够影响编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列有效连接。编码序列可以有义或反义取向可操作地连接至调控序列。在另一个例子中,本发明的互补RNA区域,无论直接或间接连接、5′端与目标mRNA或3′端与目标mRNA连接、或者位于目标mRNA内、或者第一互补区域以5′端而其互补序列以3′端与目标mRNA连接,均可构成可用的连接。
本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual;Cold Spring Harbor Laboratory:Cold Spring Harbor,NY(1989)。转化方法是本领域技术人员熟知的并且在下文中有描述。
“PCR”或“聚合酶链反应”是用于合成大量的特定DNA片段的技术,并且由一系列重复的循环构成(Perkin Elmer Cetus Instruments,Norwalk,CT)。通常,使双链DNA热变性,两种与目标片段的3′端边界区互补的引物在较低温度下与之退火,然后在中间温度下延伸。一组的上述三个连续的步骤被称为一个“循环”。
“质粒”或“载体”是通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组进一种独特构建体中,该独特构建体能够将表达盒导入细胞中。
术语“遗传改变的”指通过遗传工程改造、转化和/或突变来改变遗传物质的过程。
术语“重组”指两个原本分离的序列片段的人工组合,例如通过化学合成或通过以遗传工程技术操纵分离的核酸片段实现人工合成。“重组体”也包括指已通过导入异源核酸进行改变的细胞或载体,或来源于经如此改变的细胞的细胞,但不涵盖由自然发生事件(例如自发突变、自然转化、自然转导、自然转座)对细胞或载体的改变,例如那些无蓄意的人为干预产生的细胞或载体。
术语“变体细菌”是指经历了自发突变、天然转化、天然转导、或天然转座;或者通过诱变被修饰过的野生型细菌。
术语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文可互换使用。重组构建体包括核酸片段的人工组合,例如天然条件下不一起存在的调控序列和编码序列。例如重组构造可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体,则载体的选择取决于用以转化宿主细胞的方法,该宿主细胞是本领域的技术人员所熟知的。例如可以使用质粒载体。技术人员熟知为了成功地转化、筛选和繁殖包括本发明任何分离的核酸片段的宿主细胞,必须存在于载体上的遗传元件。技术人员也将认识到不同的独立转化事件可以导致不同水平和不同模式的表达(Jones等人,EMBO J.4:2411-2418(1985);De Almeida等人,Mol.Gen.Genetics,218:78-86(1989)),因此为了获得显示所需表达水平和模式的细胞系,可能需要对多个事件进行筛选。这种筛选可通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等完成。
本文所用的术语“表达”指产生功能性的终产物(例如mRNA或蛋白质[前体或成熟体])。
术语“导入”指将核酸(例如表达构建体)或蛋白质提供至细胞中的手段。导入包括指将核酸整合进真核或原核细胞中,在该细胞中核酸可整合进细胞的基因组内,并且包括指将核酸或蛋白质暂时提供给细胞。导入包括指稳定的或瞬时的转化方法以及有性杂交。因此,将核酸片段(例如重组DNA构建体/表达构建体)插入细胞内的情况下的“导入”意指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内、转变成自主的复制子或瞬时表达(例如转染的mRNA)。
术语“同源”指具有相似催化功能的共同进化起源的蛋白质或多肽。本发明可包括通过重组技术而产生同源蛋白质的细菌。
本文公开了在它们的基因组中包含下列的重组细菌:编码具有蔗糖转运蛋白活性的多肽或多肽复合物的一种或多种核苷酸序列;编码具有果糖激酶活性的多肽的核苷酸序列;编码具有蔗糖水解酶活性的多肽的核苷酸序列。这些核苷酸序列各自可操作地连接至相同的或不同的启动子。此外,这些核苷酸序列在yihP基因或其同源物与yihO基因或其同源物之间被整合到基因组中,如图1中所示。在基因组中的这个特定位点的整合导致了与在基因组中的其他位点,例如,在aldH(编码序列如SEQ ID NO:19所示)的整合相比,重组细菌的更高的蔗糖代谢速率,如本文的实例5和7-10中所示。
大肠杆菌的yihP基因(编码序列如SEQ ID NO:77所示)编码推定的内膜转运蛋白(SEQ ID NO:78),其似乎是糖利用基因座的组成部分。上游yihQ基因(编码序列如SEQ ID NO:79所示)编码α-糖苷酶(SEQ IDNO:80)。下游yihO基因(编码序列如SEQ ID NO:81所示)和ompL基因(编码序列如SEQ ID NO:83所示)分别编码推定的内膜转运蛋白(SEQ IDNO:82)和外膜孔蛋白(SEQ ID NO:84)。aldH基因(编码序列如SEQ IDNO:19所示,也被称为puuC)编码γ-谷酰基-γ-氨基丁酸醛脱氢酶(SEQ IDNO:20),它是腐胺利用途径的部分。下游puuB和puuE基因分别编码γ-谷氨酰腐胺氧化酶和4-氨基丁酸氨基转移酶。
可使用本领域中已知的方法鉴定大肠杆菌yihP和yihO基因在其他宿主细菌中的同源物。例如,yihP和yihO基因的同源物可用序列分析软件,例如BLASTN来搜索可公开获得的核酸序列数据库来鉴定。此外,使用序列依赖性方法来分离同源基因是本领域熟知的。序列依赖性规程的例子包括但不限于核酸杂交方法、以及如多种核酸扩增技术的使用所例示的DNA和RNA扩增方法(例如聚合酶链反应(PCR),Mullis等人,美国专利4,683,202;连接酶链反应(LCR),Tabor,S.等人,Proc.Acad. Sci.USA82,1074,1985);或链置换扩增反应(SDA),Walker等人,Proc.Natl.Acad. Sci.U.S.A.,89:392,(1992))。例如,可采用编码上述多肽的核苷酸序列作为用于同源物鉴定的杂交探针。
yihP的同源物的例子包括但不限于弗氏志贺菌(Shigella flexneri)的推定的透性酶YP_690957(编码序列如SEQ ID NO:85所示),肠道沙门氏菌(Salmonella enterica)的GPH家族转运蛋白NP_462898(编码序列如SEQID NO:86所示),生癌肠杆菌(Enterobacter cancerogenus)
Figure BDA0000464725940000231
35316的假定蛋白ENTCAN_09547(编码序列如SEQ ID NO:87所示),和克氏柠檬酸杆菌(Cttrobacter koseri)BAA-895的假定蛋白CKO_03136(编码序列如SEQ ID NO:88所示)。yihO的同源物的例子包括但不限于弗氏志贺菌(Shigella flexneri)的推定的透性酶YP_690958(编码序列如SEQID NO:89所示),肠道沙门氏菌(Salmonella enterica)的GPH家族转运蛋白NP_462897(编码序列如SEQ ID NO:90所示),生癌肠杆菌(Enterobacter cancerogenus)
Figure BDA0000464725940000233
35316的假定蛋白ENTCAN_09546(编码序列如SEQ ID NO:91所示),和克氏柠檬酸杆菌(Cttrobacterkoseri)
Figure BDA0000464725940000234
BAA-895的假定蛋白CKO_03137(编码序列如SEQ IDNO:92所示)。这些yihP和yihO同源物在每一宿主染色体中彼此邻近,如在大肠杆菌中一样。
适合用于构建本文所公开的重组细菌的宿主细菌包括但不限于属于下列属的生物:埃希氏菌属(Escherichia)、链球菌属(Streptococcus)、农杆菌属(Agrobacterium)、芽孢杆菌属(Bacillus)、棒状杆菌属(Corynebacterium)、乳杆菌属(Lactobacillus)、梭菌属(Clostridium)、葡糖杆菌属(Gluconobacter)、柠檬酸杆菌属(Citrobacter)、肠杆菌属(Enterobacter)、克雷伯氏菌属(Klebsiella)、气杆菌属(Aerobacter)、甲基细菌属(Methylobacter)、沙门氏菌属(Salmonella)、链霉菌属(Streptomyces)、和假单胞菌属(Pseudomonas)。
在一个实施例中,宿主细菌选自如下属:埃希氏菌属、克雷伯氏菌属、柠檬酸杆菌属和气杆菌属。
在另一个实施例中,所述宿主细菌是大肠杆菌。在一些实施例中,所述宿主细菌是PTS-的。在这些实施例中,宿主细菌在其天然状态下是PTS-,或可如下所述通过使PTS基因失活而实现PTS-。
在生产微生物中,有时候期望使糖的转运和磷酸烯醇式丙酮酸(PEP)用于使被转运的糖磷酸化去偶联。
术语“下调”指与野生型蛋白质相比较,活性蛋白质的活性降低或消失。可通过使一种或多种编码该类型转运所需的蛋白质的内源性基因下调而使PTS失活(导致“PTS-”生物体)。下调通常在这些基因中的一种或多种具有“破坏”(指所述基因的一部分内的插入、缺失或靶向沉默)时发生,该破坏导致完全基因敲除使得所述基因从基因组缺失并且没有蛋白质被翻译,或者导致蛋白质已经被翻译使得其具有插入、缺失、氨基酸替换或其他靶向沉默。蛋白质中的破坏位置可以是在,例如蛋白质的N-末端部分内或在蛋白质的C-末端部分内。相对于未受破坏的蛋白质,受破坏的蛋白质将具有削弱的活性,并且可能是无功能的。导致蛋白质表达降低或缺失的下调也可通过如下方式引起:操纵调控序列、转录和翻译因子和/或信号转导途径,或通过使用有义、反义或RNAi技术等。
蔗糖转运蛋白多肽或多肽复合物是能够介导蔗糖向微生物细胞内的转运的多肽或多肽复合物。蔗糖转运蛋白多肽和多肽复合物是已知的,如上文所述。具有蔗糖转运蛋白活性的多肽的例子包括但不限于:来自大肠杆菌野生型菌株EC3132的CscB(如SEQ ID NO:24所示),其由基因cscB(编码序列如SEQ ID NO:23所示)编码;来自大肠杆菌
Figure BDA0000464725940000252
13281的CscB(如SEQ ID NO:26所示),其由基因cscB(编码序列如SEQ ID NO:25所示)编码;和来自乳双歧杆菌的CscB(如SEQ ID NO:28所示),其由基因cscB(编码序列如SEQ ID NO:27所示)编码。具有蔗糖转运蛋白活性的多肽复合物的例子包括但不限于:来自肺炎链球菌(Streptococcuspneumoniae)菌株TIGR4的蔗糖ABC型转运复合物,其包含如SEQ IDNO:30、32和34所示的三个多肽亚基,SEQ ID NO:30、32和34分别由基因susT1(编码序列如SEQ ID NO:29所示)、susT2(编码序列如SEQ IDNO:31所示)和susX(编码序列如SEQ ID NO:33所示);和来自变异链球菌的麦芽糖转运复合物,其包含SEQ ID NO:36、38、40和42中示出的四个多肽亚基,它们分别由基因malE(编码序列如SEQ ID NO:35所示)、malF(编码序列如SEQ ID NO:37所示)、malG(编码序列如SEQ IDNO:39所示)和malK(编码序列如SEQ ID NO:41所示)编码。
在一个实施例中,根据Clustal w比对方法,具有蔗糖转运蛋白活性的多肽与SEQ ID NO:24、SEQ ID NO:26或SEQ ID NO:28所列氨基酸序列具有至少95%的序列同一性。
在另一个实施例中,所述蔗糖转运蛋白多肽是来自大肠杆菌
Figure BDA0000464725940000251
13281的野生型蔗糖转运蛋白多肽CscB(如SEQ ID NO:26所示,核苷酸编码序列如SEQ ID NO:25所示)的变体,其使得在细菌中能够更快地利用蔗糖。这些变体蔗糖转运蛋白多肽是从表现出在蔗糖上更快的生长的变体大肠杆菌菌株分离的,或者是通过饱和诱变鉴定的,如在共同拥有和共同未决的美国专利申请13/210,488中所描述的。基于Clustal W比对方法,所述变体蔗糖转运蛋白多肽具有与如SEQ ID NO:26所示的氨基酸序列有至少95%同一性的氨基酸序列,并且具有至少一种选自下列的氨基酸改变:
(i)在位置61处亮氨酸至脯氨酸;
(ii)在位置159处苯丙氨酸至亮氨酸;
(iii)在位置162处甘氨酸至半胱氨酸;
(iv)在位置169处脯氨酸至组氨酸;
(v)在位置61处亮氨酸至色氨酸;
(vi)在位置61处亮氨酸至组氨酸;
(vii)在位置61处亮氨酸至苯丙氨酸;以及
(viii)在位置61处亮氨酸至酪氨酸。
在另一个实施例中,基于Clustal W比对方法,所述变体蔗糖转运蛋白多肽具有与如SEQ ID NO:94所示的氨基酸序列(编码序列如SEQ ID NO:93所示)有至少95%同一性的氨基酸序列,并且从N端具有402至407个氨基酸的长度。
在另一个实施例中,基于Clustal W比对方法,所述变体蔗糖转运蛋白多肽具有与如SEQ ID NO:94所示的氨基酸序列有至少95%同一性的氨基酸序列,并且从N端具有402至407个氨基酸的长度,并且具有上文所列的至少一种氨基酸改变。
在另一个实施例中,所述变体蔗糖转运蛋白多肽具有选自SEQ IDNO:94、SEQ ID NO:96、SEQ ID NO:98、SEQ ID NO:100、SEQ IDNO:102、SEQ ID NO:104、SEQ ID NO:106、SEQ ID NO:108、和SEQ IDNO:110的氨基酸序列。
在另一个实施例中,具有蔗糖转运蛋白活性的多肽复合物包含:第一亚基,其中基于Clustal W比对方法,在与如SEQ ID NO:30所示的氨基酸序列比较时,所述第一亚基具有至少95%的序列同一性;第二亚基,其中基于Clustal W比对方法,在与如SEQ ID NO:32所示的氨基酸序列比较时,所述第二亚基具有至少95%的序列同一性;和第三亚基,其中基于Clustal W比对方法,在与如SEQ ID NO:34所示的氨基酸序列比较时,所述第三亚基具有至少95%的序列同一性。
在另一个实施例中,具有蔗糖转运蛋白活性的多肽复合物包含:第一亚基,其中基于Clustal W比对方法,在与如SEQ ID NO:36所示的氨基酸序列比较时,所述第一亚基具有至少95%的序列同一性;第二亚基,其中基于Clustal W比对方法,在与如SEQ ID NO:38所示的氨基酸序列比较时,所述第二亚基具有至少95%的序列同一性;第三亚基,其中基于Clustal W比对方法,在与如SEQ ID NO:40所示的氨基酸序列比较时,所述第三亚基具有至少95%的序列同一性;和第四亚基,其中基于Clustal w比对方法,在与如SEQ ID NO:42所示的氨基酸序列比较时,所述第四亚基具有至少95%的序列同一性。
在另一个实施例中,具有蔗糖转运蛋白活性的多肽基本上对应于如SEQ ID NO:26或SEQ ID NO:96所示的氨基酸序列。
具有果糖激酶活性的多肽包括果糖激酶(命名为EC2.7.1.4)和多种具有果糖磷酸化活性的己糖激酶(EC2.7.1.3和EC2.7.1.1)。果糖磷酸化活性可由己糖激酶和已酮糖激酶展示。表1列出了可用于构建本文所公开的重组细菌的、来自多种微生物的编码多肽的代表性基因。本领域技术人员将认识到,可使用基本类似于能使果糖磷酸化的蛋白质(例如由表1所列基因编码的蛋白质)的蛋白质。
表1
编码具有果糖激酶活性的酶的序列
Figure BDA0000464725940000271
在一个实施例中,根据Clustal w比对方法,具有果糖激酶活性的多肽与如SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48、SEQ ID NO:50、SEQID NO:52、SEQ ID NO:54、SEQ ID NO:112或SEQ ID NO:114所示的氨基酸序列具有至少95%的序列同一性。
在另一个实施例中,具有果糖激酶活性的多肽基本上对应于SEQ IDNO:48中所示的氨基酸序列。
具有蔗糖水解酶活性的多肽具有催化蔗糖水解而产生果糖和葡萄糖的能力。具有蔗糖水解酶活性的多肽是已知的,如上文所述,并且包括但不限于:来自大肠杆菌野生型菌株EC3132的CscA(如SEQ ID NO:56所示),其由基因cscA(编码序列如SEQ ID NO:55所示)编码;来自大肠杆菌
Figure BDA0000464725940000281
13821的CscA(如SEQ ID NO:58所示),其由基因cscA(编码序列如SEQ ID NO:57所示)编码;来自乳双歧杆菌菌株DSM10140T的BfrA(如SEQ ID NO:60所示),其由基因bfrA(编码序列如SEQ ID NO:59所示)编码;来自啤酒糖酵母的Suc2p(如SEQ ID NO:62所示),其由基因SUC2(编码序列如SEQ ID NO:61所示)编码;来自谷氨酸棒状杆菌的ScrB(如SEQ ID NO:64所示),其由基因scrB(编码序列如SEQ IDNO:63所示)编码;来自肠膜明串珠菌DSM20193的蔗糖磷酸化酶(如SEQ ID NO:66所示),编码基因的编码序列如SEQ ID NO:65所示;和来自青春双歧杆菌DSM20083的蔗糖磷酸化酶(如SEQ ID NO:68所示),其由基因sucP(编码序列如SEQ ID NO:67所示)编码。
在一个实施例中,根据Clustal W比对方法,具有蔗糖水解酶活性的多肽与如SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62、SEQ ID NO:64、SEQ ID NO:66或SEQ ID NO:68所示的氨基酸序列具有至少95%的序列同一性。
在另一个实施例中,具有蔗糖水解酶活性的多肽基本上对应于SEQ IDNO:58中所示的氨基酸序列。
编码具有蔗糖转运蛋白活性的多肽或多肽复合物、具有果糖激酶活性的多肽以及具有蔗糖水解酶活性的多肽可用于从相同或其它微生物菌种分离编码同源多肽的核苷酸序列。例如,所述基因的同源物可使用本领域中已知的方法鉴定,如上文所述。
本领域普通技术人员将理解,分离自其他来源的编码这些多肽的基因也可用于本文所公开的重组细菌。另外,由于密码子简并性可对编码所述多肽的核苷酸序列作出改变而不影响所编码的多肽的氨基酸序列,并且产生基本相似的蛋白质的氨基酸替换、缺失或添加可包括在所编码的蛋白质内。
编码具有蔗糖转运蛋白活性的多肽或多肽复合物、具有果糖激酶活性的多肽和具有蔗糖水解酶活性的多肽的核苷酸序列可用PCR(参见例如美国专利4,683,202)和设计用于结合所需序列(如果该序列已知的话)的引物来分离。其他的基因分离方法是本领域技术人员所熟知的,例如通过使用简并引物或异源探针杂交来分离。核苷酸序列也可以化学方法合成或购自供应商例如DNA2.0Inc.(Menlo Park,CA)。此外,完整的野生型csc操纵子可以被从大肠杆菌菌株
Figure BDA0000464725940000291
13281的基因组DNA分离,或者变体csc操纵子可以被从变体细菌分离,并且在yihP基因或其同源物与yihO基因或其同源物之间被整合进宿主细菌的基因组,如本文的实例1和3中所详述的。
使用本领域中已知的位点特异性重组体系,通过将编码序列的一个或多个拷贝在yihP基因或其同源物与yihO基因或其同源物之间整合进宿主基因组,将编码上文所述的多肽的核苷酸序列导入宿主细菌,如例如,本文的实例1-4和7-10中所描述的。在基因组中的所导入的编码区可从至少一个高活性启动子表达。整合的编码区可作为具有其自身启动子的嵌合基因的一部分导入,或者其可以整合邻近基因组内源性的高活性启动子或整合进高度表达的操纵子中。合适的启动子包括但不限于:CYC1、HIS3、GAL1、GAL10、ADH1、PGK、PHO5、GAPDH、ADC1、TRPi、URA3、LEU2、ENO及lac、ara、tet、trp、lPL、lPR、T7、tac和trc(可用于在大肠杆菌中表达)以及amy、apr、npr启动子和可用于在芽孢杆菌中表达的多种噬菌体启动子。启动子也可以为变铅青链霉菌葡萄糖异构酶启动子或其变体,该变体由Payne等人(美国专利7,132,527)描述。
在一个实施例中,本文所公开的重组细菌能够产生甘油。利用碳水化合物或糖类制备甘油的生物学过程在酵母以及在某些细菌、其他真菌和藻类中是已知的。细菌和酵母两者均在糖酵解中通过1,6--二磷酸果糖途径转化葡萄糖或其它碳水化物来产生甘油。在本文所公开的产生甘油的方法中,可使用天然产生甘油的宿主细菌。此外,可对细菌进行工程改造以产生甘油和甘油衍生物。从多种底物产生甘油的能力可通过表达酶活性3-磷酸甘油脱氢酶(G3PDH)和/或甘油-3-磷酸酶来提供,如美国专利7,005,291中所述。美国专利7,005,291中描述了可用于在宿主细菌中表达所述酶活性的编码这些蛋白质的基因。编码具有3-磷酸甘油脱氢酶活性的多肽的基因的合适例子包括但不限于:来自啤酒糖酵母的GPD1(编码序列如SEQ ID NO:1所示,编码的蛋白质序列如SEQ ID NO:2所示)和来自啤酒糖酵母的GPD2(编码序列如SEQ ID NO:3所示,编码的蛋白质序列如SEQ ID NO:4所示)。编码具有甘油3-磷酸酶活性的多肽的基因的合适例子包括但不限于:来自啤酒糖酵母的GPP1(编码序列如SEQ ID NO:5所示,编码的蛋白质序列如SEQ ID NO:6所示)和来自啤酒糖酵母的GPP2(编码序列如SEQID NO:7所示,编码的蛋白质序列如SEQ ID NO:8所示)。
可通过减少靶内源性基因的表达而达到甘油产生增加。编码甘油激酶和甘油脱氢酶活性的内源性基因的下调可进一步增强甘油产生,如美国专利7,005,291中所述。提高的碳至甘油的流动可以通过降低编码3-磷酸甘油醛脱氢酶的内源性基因的表达实现,如美国专利7,371,558中所述。下调可以通过使用任何本领域已知的方法实现,例如,上文所描述的用于PTS系统的基因的下调的方法。
甘油提供了微生物产生有用产物的底物。这种产物(即甘油衍生物)的例子包括但不限于3-羟基丙酸、甲基乙二醛、1,2-丙二醇和1,3-丙二醇。
在另一个实施例中,本文所公开的重组细菌能够产生1,3-丙二醇。甘油衍生物1,3-丙二醇是在聚酯纤维的制备及聚氨酯和环状化合物的制造中具有潜在用途的单体。1,3-丙二醇可由单种微生物通过对除甘油或二羟基丙酮之外的碳底物进行生物转化来产生,如美国专利5,686,276中所述。在该生物转化中,从如上所述的碳底物产生甘油。甘油通过脱水酶转化为中间体3-羟基丙醛,该脱水酶可由宿主细菌编码或可通过重组导入宿主中。脱水酶可以为甘油脱水酶(E.C.4.2.1.30)、二醇脱水酶(E.C.4.2.1.28)或能够催化该转化的任何其他酶。编码甘油脱水酶的“α”、“β”和“γ”亚基的基因的合适例子包括但不限于分别来自肺炎克雷伯氏菌的dhaBl(编码序列如SEQ ID NO:9所示)、dhaB2(编码序列如SEQ ID NO:11所示)和dhaB3(编码序列如SEQ ID NO:13所示)。3-羟基丙醛至1,3-丙二醇的进一步转化可由1,3-丙二醇脱氢酶(E.C.1.1.1.202)或其他醇脱氢酶催化。编码1,3-丙二醇脱氢酶的基因的合适例子是来自肺炎克雷伯氏菌的dhaT(编码序列如SEQ ID NO:69所示,编码的蛋白质序列如SEQ ID NO:70所示)。
可通过重组方法对细菌进行工程改造以更有效地产生甘油或甘油衍生物1,3-丙二醇。例如,美国专利7,005,291公开了用于产生甘油和1,3-丙二醇的转化的微生物和方法,其优势来自于表达3-磷酸甘油脱氢酶和3-磷酸甘油磷酸酶其中之一或全部两者的外源活性同时破坏内源活性甘油激酶和甘油脱氢酶其中之一或全部两者。
美国专利6,013,494描述了使用单种微生物来产生1,3-丙二醇的方法,所述单种微生物包含外源3-磷酸甘油脱氢酶、3-磷酸甘油磷酸酶、脱水酶和1,3-丙二醇氧化还原酶(如,dhaT)。美国专利6,136,576公开了用于产生1,3-丙二醇的方法,所述方法包括重组微生物,所述重组微生物还包含脱水酶和蛋白X(后来被鉴定为脱水酶再活化因子肽)。
美国专利6,514,733描述了对该方法的改进,其中依靠非特异性催化活性(区别于由dhaT编码的1,3-丙二醇氧化还原酶)将3-羟基丙醛转化为1,3-丙二醇而获得滴度(每升的产物克数)的显著提高。另外,美国专利7,132,527公开了可用于产生1,3-丙二醇的载体和质粒。
1,3-丙二醇产生的增加可通过对宿主细菌进行进一步修饰来实现,包括下调某些靶基因的表达和上调某些靶基因的表达,如美国专利7,371,558所述。为了在PTS-宿主中将葡萄糖作为碳源利用,可增加葡萄糖激酶活性的表达。
其增加或上调的表达可增加1,3-丙二醇产生的其他基因包括编码如下酶的基因:
·磷酸烯醇式丙酮酸羧化酶,通常称为EC4.1.1.31
·钴胺素腺苷转移酶,通常称为EC2.5.1.17
·足以催化3-HPA和1,3-丙二醇互变的非特异性催化活性,特别是排除1,3-丙二醇氧化还原酶,通常这些酶为醇脱氢酶
其降低或下调的表达可增加1,3-丙二醇产生的基因包括编码如下蛋白或酶的基因:
·有氧呼吸控制蛋白
·甲基乙二醛合酶
·乙酸激酶
·磷酸转乙酰酶
·醛脱氢酶A
·醛脱氢酶B
·磷酸丙糖异构酶
·磷酸葡糖酸脱水酶
在另一个实施例中,本文所公开的重组细菌能够产生3-羟基丙酸。3-羟基丙酸具有在特殊合成方面的用途,并且可通过化学工业中已知的技术转化成商业上重要的中间体,例如通过脱水转化为丙烯酸、通过氧化转化为丙二酸、通过与醇的酯化反应转化为酯以及通过还原转化为1,3-丙二醇。3-羟基丙酸可由单种微生物从发酵性碳源生物制备,如共同未决且共同拥有的美国专利申请61/187476中所述。在一个代表性的生物合成途径中,可将碳底物转化为3-羟基丙醛,如上面关于1,3-丙二醇制备所描述的。3-羟基丙醛通过醛脱氢酶转化为3-羟基丙酸。醛脱氢酶的合适例子包括但不限于:由大肠杆菌基因aldB(编码序列如SEQ ID NO:15所示)编码的AldB(SEQ IDNO:16);由大肠杆菌基因基因aldA(编码序列如SEQ ID NO:17所示)编码的AldA(SEQ ID NO:18);和由大肠杆菌基因aldH(编码序列如SEQID NO:19所示)编码的AldH(SEQ ID NO:20)。
也可进行上面描述用于改善重组细菌的1,3-丙二醇产生的许多修饰来提高3-羟基丙酸产量。例如,除去甘油激酶可防止甘油(通过G3P磷酸酶的作用从G3P形成)消耗ATP而重新转化为G3P。另外,除去甘油脱氢酶(例如gldA)可防止甘油(由NAD依赖性3-磷酸甘油脱氢酶作用从DHAP形成)转化为二羟基丙酮。可对结构基因进行突变以削弱或改善酶活性的活性或可对调控基因(包括启动子区和核糖体结合位点)进行突变,以调节酶活性的表达水平。
上调或下调可通过多种本领域技术人员已知的方法实现。众所周知的是,基因的上调或下调指细胞内存在的源自由所述基因编码的蛋白质的活性水平相对于对照活性(例如由对应的(或未改变的)野生型基因所编码的蛋白质的活性)的水平的改变。
可上调涉及酶途径的特定基因来增加它们所编码的功能的活性。例如,可将所选基因的额外拷贝导入宿主细胞中的多拷贝质粒(例如pBR322)上。这些基因可与导致其所编码的功能活性增加的合适调控序列整合进染色体中。可修饰靶基因以处于非天然启动子或改变的天然启动子的控制下。可通过突变、缺失和/或替换体内改变内源启动子。
或者,相对于给定活性水平降低或消除某些基因的表达可能是有用的。下调(破坏)基因的方法是本领域技术人员已知的。
下调可通过编码区和/或调控(启动子)区的缺失、插入或改变来进行。特定的下调可通过这样获得:进行随机突变,然后进行筛选或选择,或如果基因序列是已知的话,通过本领域技术人员已知的分子生物学方法进行直接干预。实现下调的一种特别有用的但不是排他性的方法是改变启动子的强度。
此外,基因表达的下调可用于防止所关注蛋白质的表达或导致非功能性的蛋白质的表达。这可通过例如下面的方法来完成:1)删除编码区和/或调控(启动子)区,2)将外源核酸序列插入编码区和/或调控(启动子)区,以及3)改变编码区和/或调控(启动子)区(例如,通过改变DNA碱基对)。特定的破坏可通过这样获得:进行随机突变,然后进行筛选或选择,或如果基因序列是已知的话,使用本领域技术人员已知的分子生物学方法进行直接干预。一特别有用的方法是删除大量的编码区和/或调控(调节)区。
改变重组蛋白表达的方法是本领域的技术人员已知的,在Baneyx,Curr.Opin.Biotechnol.(1999)10:411;Ross等人,J. Bacteriol.(1998)180:5375;deHaseth等人,J. Bacteriol.(1998)180:3019;Smolke和Keasling,Biotechnol.Bioeng.(2002)80:762;Swartz,Curr.Opin.Biotech.(2001)12:195;和Ma等人,J. Bacteriol.(2002)184:5733中部分地有所讨论。
包含如上所述的用于在产生微生物产物(包括甘油和甘油衍生物)中代谢蔗糖的基因表达的必要改变的重组细菌可用本领域熟知的技术构建,在本文的实例中对某些所述技术进行示例说明。
本文所公开的重组细菌的构建可用多种适于编码区的克隆、转化和表达的载体及转化和表达盒来完成,所述编码区可在合适的宿主微生物中赋予在产生甘油及其衍生物中利用蔗糖的能力。合适的载体是与所采用的细菌相容的那些。合适的载体可,例如源于细菌、病毒(例如噬菌体T7或M-13衍生的噬菌体)、粘粒、酵母或植物。用于获得和使用这些载体的方法是本领域技术人员已知的(Sambrook等人,同上)。
可用于驱动本发明的编码区在所需宿主细胞中表达的起始控制区或启动子有很多,并且为本领域技术人员所熟悉。事实上,任何能驱动表达的启动子均适用于本发明。例如,可使用任何上文列出的启动子。
终止控制区也可以源于对优选宿主天然的多种基因。任选地,终止位点可以是非必需的;然而,如果包括则是最优选的。
为了本发明多肽有效表达,将编码所述多肽的核苷酸序列通过起始密码子有效连接至所选表达控制区,使得表达导致形成合适的信使RNA。
在本发明中特别有用的是美国专利7,371,558中描述的载体pSYCO101、pSYCO103、pSYCO106和pSYCO109以及美国专利7,524,660中描述的pSYCO400/AGRO。这些载体的必要元件源自分离自肺炎克雷伯氏菌和分离自啤酒糖酵母dha调节子。每一载体含有开放阅读框dhaBl、dhaB2、dhaB3、dhaX(编码序列如SEQ ID NO:71所示)、排列在三个独立操纵子中的orfX、DAR1和GPP2。pSYCO101、pSYCO103、pSYCO106、pSYCO109和pSYCO400/AGRO的核苷酸序列分别在SEQ ID NO:72、SEQID NO:73、SEQ ID NO:74、SEQ ID NO:75和SEQ ID NO:76中示出。所述载体之间的不同在下面的一览表中说明[前缀“p-”指启动子;包括在每个“()”中的开放阅读框表示操纵子的组成]:
pSYCO101(SEQ ID NO:72):
p-trc(Dar1_GPP2),与另外两个途径操纵子相比取向相反,
p-1.6长GI(dhaB1_dhaB2_dhaB3_dhaX)和
p-1.6长GI(orfY_orⅨ_orfW)。
pSYCO103(SEQ ID NO:73):
p-trc(Dar1_GPP2),与另外两个途径操纵子相比取向相同,
p-1.5长GI(dhaB1_dhaB2_dhaB3_dhaX)和
p-1.5长GI(orfY_orfX_orfW)。
pSYCO106(SEQ ID NO:74):
p-trc(Dar1_GPP2),与另外两个途径操纵子相比取向相同,
p-1.6长GI(dhaB1_dhaB2_dhaB3_dhaX)和
p-1.6长GI(orfY_orⅨ_orfW)。
pSYCO109(SEQ ID NO:75):
p-trc(Dar1_GPP2),与另外两个途径操纵子相比取向相同,
p-1.6长GI(dhaB1_dhaB2_dhaB3_dhaX)和
p-1.6长GI(orfY_orⅨ)。
pSYCO400/AGRO(SEQ ID NO:76):
p-trc(Dar1_GPP2),与另外两个途径操纵子相比取向相同,
p-1.6长GI(dhaB1_dhaB2_dhaB3_dhaX)和
p-1.6长GI(orfY_orⅨ)。
p-1.20短/长GI(scrK),与所述途径操纵子相比取向相反。
一旦构建了合适的表达盒,则将它们用于转化合适的宿主细菌。含有所述编码区的表达盒导入宿主细菌可通过已知的步骤完成,例如通过转化(如使用钙透化细胞或电穿孔)或通过用重组噬菌体病毒转染(Sambrook等人,同上)。表达盒可在宿主细胞中维持在稳定质粒上。此外,可使用本领域技术人员熟知的载体和方法,通过同源或随机重组将表达盒整合进宿主细菌的基因组中。也可将位点特异性重组系统用于表达盒的基因组整合。
除了举例说明的细胞,还可使用经特别设计以增强微生物产物(包括甘油和/或其衍生物)的产量的具有单突变或多突变的细胞。可使正常将碳原料分流至非生产性途径的细胞或表现出显著分解代谢阻遏的细胞突变以避免这些表型缺陷。
产生突变体的方法是通用的并且为本领域所熟知。美国专利7,371,558给出了关于某些方法的概述。利用辐射或化学剂产生突变体的具体方法在本领域中得到很好评述。参见,例如,Thomas D.Brock,Biotechnology:ATextbook ofIndustrial Microbiology,第二版(1989)Sinauer Associates,Inc.,Sunderland,MA.,或Deshpande,Mukund V.,Appl.Biochem.Biotechnol.36,227(1992)。
在发生诱变后,可通过多种方法选择具有所需表型的突变体。随机筛选是最通用的,在该方法中针对经诱变处理的细胞产生所需产物或中间体的能力对其进行筛选。或者,可通过使经诱变处理的群体在选择培养基上生长而进行对突变体的选择性分离,其中仅抗性菌落可生长。突变体选择的方法是高度发展的并且为工业微生物学领域所熟知。参见,例如Brock,同上;DeMancilha等人,Food Chem.14,313(1984)。
本发明的发酵培养基包含蔗糖作为碳底物。其他碳底物例如葡萄糖和果糖也可以存在。
除了碳底物,合适的发酵培养基还含有例如本领域技术人员已知的合适矿物质、盐、辅因子、缓冲液和其他组分,其适于培养物的生长和产生甘油及其衍生物(例如1,3-丙二醇)所必需的酶途径的促进。在1,3-丙二醇的产生中,特别要注意Co(II)盐和/或维生素B12或其前体。
腺苷钴胺素(辅酶B12)是脱水酶活性的重要辅因子。辅酶B12的合成存在于原核生物中,某些原核生物能够从头合成该化合物,例如蟑螂埃希氏菌(Escherichia blattae)、克雷伯氏菌属(Klebsiella)菌种、柠檬酸杆菌属(Citrobacter)菌种和梭菌属(Clostridium)菌种,而其他菌种则能够进行部分反应。大肠杆菌,例如不能产生咕啉环结构,但能够催化钴啉醇酰胺转化为类咕啉并且可导入5′-脱氧腺苷基团。因而,本领域已知的是在大肠杆菌发酵中需要提供辅酶B12前体(例如维生素B12)。维生素B12可以以恒定速率连续添加给大肠杆菌发酵或分阶段添加以与细胞群体的产生相符,或可以单次或多次团注添加。
尽管维生素B12添加至本文所述的转化大肠杆菌,但考虑能从头生物合成维生素B12的其他细菌也将是合适的生产细胞,向这些细菌添加维生素B12将是不必要的。
通常,细菌在含有蔗糖的合适培养基中于25至40℃下生长。适用于本例子的生长培养基是普通的商业制备的培养基,例如Luria Bertani(LB)肉汤、Sabouraud Dextrose(SD)肉汤或酵母培养基(YM)肉汤。也可以使用其他确定的或合成的生长培养基,微生物学或发酵科学领域的技术人员将知道用于具体细菌生长的合适培养基。已知可直接或间接调节分解代谢物阻遏的试剂,如环腺苷2′:3′-单磷酸,也可以掺入反应培养基中。类似地,可将已知可调节导致1,3-丙二醇产生增加的酶活性的试剂(如甲基紫精)与产1,3-丙二醇菌株的遗传操纵结合使用或作为对产1,3-丙二醇菌株的遗传操纵的替代。
适于发酵的pH范围在pH5.0至pH9.0之间,其中pH6.0至pH8.0通常作为起始条件。
取决于重组细菌的要求,可在有氧、缺氧或无氧条件下进行反应。分批补料发酵可用有限的或过量的碳源例如碳底物来进行。
分批发酵是通常使用的方法。经典的分批发酵是封闭系统,其中培养基的组成在发酵开始时设定并且在发酵过程中不进行人工改变。因此,在发酵开始时,用所需细菌对培养基进行接种,在不向系统添加物质的情况下进行发酵。然而,通常来说,“分批”发酵是指碳源的添加是分批的,但经常试图控制诸如pH和氧浓度之类的因素。在分批发酵系统中,代谢产物和生物质组成持续改变直至发酵结束。在分批培养物内,细胞缓慢通过静态延滞期到达高速生长对数期,并最后达到稳定期,此时生长速率减缓或终止。如果不加以处理,稳定期中的细胞将最终死亡。通常,对数期中的细胞负责产生大部分终产物或中间产物。
标准分批式系统的一种变型是补料分批系统。补料分批发酵工艺也适用于本发明,并且包括典型的分批式系统,不同的是随着发酵进程递增地添加底物。在分解代谢阻遏往往抑制细胞的代谢作用以及在期望培养基中具有有限量的底物的情况下,补料分批式系统是有用的。补料分批式系统中的实际底物浓度难于测量并因而可根据一些可测量因素例如pH、溶解氧以及废气如CO2的分压进行评估。分批发酵和补料分批发酵在本领域内是常用的且众所周知,并且例子可见于Brock(同上)。
连续发酵是一种开放式系统,其中将设定好的发酵培养基连续加入生物反应器中,并同时移出等量条件培养基用于加工。连续发酵一般使培养物维持在其中细胞主要处于对数生长期的恒定高密度。
连续发酵允许调节一种因素或任意数目的因素,这些因素影响细胞生长或终产物浓度。例如,一种方法将维持限制性营养物质例如碳源或氮水平处于固定速率并允许所有其它参数适度。在其他系统中,可连续改变影响生长的许多因素,而细胞浓度保持不变,细胞浓度通过培养基浊度测量。连续系统力求维持稳态的生长条件,并因而在发酵过程中由于培养基被取出而导致的细胞损失必须与细胞的生长率保持平衡。用于调节连续发酵工艺中的营养物质和生长因子的方法以及使产物形成速率保持最高水平的方法是工业微生物学领域众所周知的,并且多种方法已由Brock(同上)详细描述。
考虑可采用分批发酵、补料分批发酵或连续发酵工艺来实施本发明,并且任何已知的发酵模式均将适用。另外,考虑可将细胞固定在基材上作为整细胞催化剂并处于发酵条件下,用于产生甘油和甘油衍生物,例如1,3-丙二醇。
在一个实施例中,提供了用于从蔗糖制备甘油、1,3-丙二醇和/或3-羟基丙酸的工艺。该工艺包括如下步骤:在蔗糖存在下培养如上所述的重组细菌,以及任选回收产生的甘油、1,3-丙二醇和/或3-羟基丙酸。所述产物可用本领域已知的方法回收。例如,可通过离心、过滤、滗析等方法从发酵培养基中移除固体。然后,可使用诸如蒸馏、液-液萃取或基于膜的分离从发酵培养基分离产物,所述培养基已如上所述经处理而移除了固体。
实例
本发明将在下面的实例中得到进一步阐述。应该理解,这些实例尽管说明了本发明的优选实施例,但仅是以例证的方式给出的。从上文的讨论和这些实例中,本领域的技术人员能够确定本发明的特性,并且在不脱离其实质和范围的情况下,能对本发明进行各种变化和修改以适应不同的用途和条件。
一般方法
本文所用的标准的重组DNA和分子克隆技术为本领域所熟知,并且描述于Sambrook,J.和Russell,D.,Molecular Cloning:ALaboratory Manual,第三版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(2001);和Silhavy,T.J.,Bennan,M.L.和Enquist,L. W.,Experimentswith Gene Fusions,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY(1984);以及Ausubel,F.M.等人,Short Protocols inMolecular Biology,第五版,Current Protocols,John Wiley and Sons,Inc.,N.Y.,2002。
适用于微生物培养物的维持和生长的材料和方法是本领域熟知的。适用于下列实例的技术可在如下文献列出的内容中找到:Manual of Me thodsfor General Bacteriology(Phillipp Gerhardt,R.G.E.Murray,Ralph N.CostiloW,Eugene W.Nester,Willis A.Wood,Noel R.Krieg和G.BriggsPhillips编辑),American Societyfor Microbiology:Washington,D.C.(1994));或Manual of Industrial Microbiology and Biotechnology,第三版(Richard H.Baltz,Julian E.Davies和Arnold L. Demain编辑),ASMPress,washington,DC,2010。所描述的用于细菌细胞生长和维持的所有试剂、限制性酶和材料可从Aldrich Chemicals(Milwaukee,WI)、BDDiagnostic Systems(Sparks,MD)、Life Technologies(Rockville,MD)、New England Biolabs(Beverly,MA)或Sigma Chemical Company(St.Louis,MO)获得。
缩写的含义如下:“sec”表示秒,“min”表示分钟,“h”表示小时,“nm”表示纳米,“μL”表示微米,“mL”表示毫升,“L”表示升,“mM”表示纳摩尔,“M”表示摩尔,“g”表示克,“μg”表示微克,“ng”表示纳克,“bp”表示碱基对,“kbp”表示千碱基对,“rpm”表示转每分钟,“ATCC”表示美国典型培养物保藏中心(American Type Culture Collection)(Manassas,VA)“OD”表示光密度,“g”表示引力常数,“HPLC”表示高效液相色谱法。
表2
实例中使用的引物
Figure BDA0000464725940000401
实例1至4
蔗糖基因簇在大肠杆菌染色体中的整合
这些实例描述了蔗糖基因簇在大肠杆菌(E.coli)基因组内的两个位置,即aldH基因处或yihP基因和yihO基因之间的整合,以允许蔗糖的利用。
来自大肠杆菌
Figure BDA0000464725940000402
13281的野生型或变体cscAKB基因簇被导入PDO生产菌株TTab pSYCO400/AGRO中,使得能够由蔗糖产生PDO。大肠杆菌菌株TTab pSYCO400/AGRO(一种PTS-菌株)被构建如下。通过从描述于美国专利7,371,558(实例17)中的菌株TT aldA缺失aldB基因产生了菌株TTab。简而言之,通过首先用pKD3质粒(Datsenko和Wanner,Proc.Natl.Acad. Sci.USA97:6640-6645,2000)的FRT-CmR-FRT盒置换大肠杆菌菌株MG1655中aldB的1.5kbp编码区,制备了aldB的缺失。以pKD3作为模板,用引物对SEQ ID NO:58和SEQ ID NO:59扩增了置换盒。引物SEQ ID NO:58含有80bp的aldB5’端的同源序列和20bp的pKD3的同源序列。引物SEQ ID NO:59含有80bp的aldB3’端的同源序列和20bp的pKD3的同源序列。将该PCR产物用凝胶纯化并电穿孔进MG1655/pKD46感受态细胞内(美国专利7,371,558)。在具有12.5mg/L氯霉素的LB板上选择重组株。使用引物对SEQ ID NO:60和SEQ ID NO:61,通过PCR确认aldB基因的缺失。野生型菌株产生1.5kbp PCR产物,而重组株产生特征性的1.1kbp PCR产物。制备了P1溶胞产物并用于将所述突变移至TT aldA菌株,以形成TT aldAAaldB::Cm菌株。用采用引物对SEQ ID NO:60和SEQID NO:61的基因组PCR检验氯霉素抗性克隆以确保存在所述突变。用FLP重组酶(Datsenko和Wanner,同上)移除氯霉素抗性标记以产生TTab。然后用美国专利7,524,660(实例4)中描述的pSYCO400/AGRO(如SEQ IDNO:55所示)转化菌株TTab,以产生菌株TTab pSYCO400/AGRO。
如所引用的参考文献中所述,菌株TTab是大肠杆菌菌株FM5(
Figure BDA0000464725940000411
No.53911)的衍生菌株,包含如下修饰:
glpK、gldA、ptsHI、crr、edd、arcA、mgsA、qor、ackA、pta、aldA和aldB基因缺失;
galP、glk、btuR、ppc和yqhD基因上调;以及
gapA基因下调。
质粒pSYCO400/AGRO包含编码甘油生产途径的基因(DAR1和GPP2)和编码甘油脱水酶及相关再活化因子的基因(dhaB123、dhaX、orfX、orfY)、以及编码果糖激酶的基因(scrK)。
通过Lambda Red方法,来自大肠杆菌
Figure BDA0000464725940000412
13281的野生型或变体蔗糖基因簇在aldH基因或yihP基因处被整合进TTab pSYCO400/AGRO。图1显示了蔗糖基因簇被整合的染色体区域。从如美国专利申请公布201I/0136190A1的实例1中所述构建的质粒pBHR-cscBKA(SEQ IDNO:124)扩增了野生型cscAKB基因簇(SEQ ID NO:123)。从在aldH基因处用来自大肠杆菌
Figure BDA0000464725940000413
13281的cscAKB基因簇转化的TTabpSYCO400/AGRO菌株的分离株(其表现出在蔗糖上提高的生长),扩增了在cscB基因中的密码子61处包含亮氨酸至脯氨酸的替换(L61P)的变体蔗糖基因簇(SEQ ID NO:95)。
使用包含与染色体中aldH基因两个外侧区域的侧翼同源性的aldH cscA引物(SEQ ID NO:115)和aldH cscB引物(SEQ ID NO:116),实现了在aldH基因处的整合。蔗糖基因簇在aldH基因处的整合用所述蔗糖基因簇置换aldH基因。使用包含与yihP基因的侧翼同源性的yihP cscA引物(SEQID NO:119)和yihP cscB引物(SEQ ID NO:120),实现了在yihP基因和yihO基因之间的整合。蔗糖基因簇在靠近yihP的C末端的位点被插入,而没有从染色体移除yihP序列。用PstI线性化的质粒pBHR-cscBKA被用作针对野生型簇的PCR模板。在蔗糖基因簇的cscB中包含L61P替换的细胞被用作针对变体簇的PCR模板。High fidelity 
Figure BDA0000464725940000421
II Fusion HS DNA聚合酶(Stratagene;La Jolla,CA)被用于PCR反应中。PCR使用下列循环条件进行:95℃2min;35个循环的95℃30sec、60℃30sec、和72℃4min;然后是72℃7min。所得到的PCR产物被储存在4℃。使用QIAquick PCRPurification试剂盒(Qiagen,Valencia,CA)纯化了PCR产物。PCR产物被电穿孔进包含编码λ重组酶的pKD46质粒(Red重组酶质粒,GenBank登录号AY048746)的TTab pSYCO400/AGRO菌株中,按照lambda red重组方法(Datsenko,K.A.和Wanner,B.L.,2000,Proc.Natl.Acad.Sci.USA97:6640-6645)进行。转化混合物被涂布在包含10g/L蔗糖和100μg/mL奇放线菌素的MOPS基本培养基平板上。MOPS基本培养基平板包含1XMOPS缓冲液(Technova,Hollister,CA)、1.32mM KH2PO4(Technova)、50μg/L尿嘧啶和1.5g/L Bacto琼脂。在37℃孵育平板2-3天。挑取在基本蔗糖平板上生长的菌落并通过在LB奇放线菌素平板上划线进行纯化。使用引物aldH_check_up(SEQ ID NO:117)和引物aldH_check_dn(SEQ_IDNO:118),通过PCR确认了蔗糖基因簇在aldH基因处的整合。使用引物yihPA For(SEQ ID NO:121)和引物yihPB Rev(SEQ ID NO:122),通过PCR确认了蔗糖基因簇在yihP基因和yihO基因之间的整合。通过测序确认了整合的蔗糖基因簇,以确保所分离的菌株不包含意料之外的突变。所构建的菌株总结在表3中。
表3
包含整合的蔗糖基因簇的重组大肠杆菌(E.colu)菌株
实例 菌株 cscAKB 基因组中的位置
1 PDO3083 野生型 yihP和yihO之间
2,对比的 PDO3084 野生型 aldH
3 PDO3096 L61P变体 yihP和yihO之间
4,对比的 PDO3097 L61P变体 aldH
实例5
重组大肠杆菌菌株的生长速率
本实例展示了具有在yihP基因和yihO基因之间整合的蔗糖基因簇的大肠杆菌菌株与具有在aldH基因处整合的蔗糖基因簇的大肠杆菌菌株相比,在蔗糖上的提高的生长。
使用Bioscreen C仪器(Bioscreen,Helsinki,Finland)测定了整合的大肠杆菌菌株在包含蔗糖的基本培养基上的最大生长速率。挑取了来自每一整合的菌株的两个分离株用于测定。大肠杆菌菌株各自在包含100μg/mL奇放线菌素的3mL LA培养基(1%胰蛋白胨,0.5%酵母提取物,0.05%氯化钠)中于37℃生长16小时。对于Bioscreen测定,在Bioscreen蜂巢式平板中,将新鲜的过夜培养物1:100稀释在包含2.5g/L、5g/L或10g/L蔗糖和100μg/mL奇放线菌素的MOPS基本培养基中。维生素B12被添加至培养基中,至0.1mg/L的浓度。还包括了包含生长培养基的空白孔。按照生产商的说明书,将蜂巢式平板置于Bioscreen C仪器中。在持续摇动下于33℃孵育平板,并且每15分钟记录一次OD值。使用下述方法估算了最大生长速率(μmax)。首先,通过从非空白的孔的OD值减去空白孔的平均OD值,去除了背景。然后,通过将数据点拟合至采用非线性回归的指数曲线,使用由8个数据点(覆盖了2小时的生长)组成的滑动窗口估算了生长速率参数。在每一滑动窗口中,仅当拟合良好(即,R2≥0.95)时记录估算的生长速率。来自全部记录的生长速率的最大值即是μmax。表4中给出了每一菌株的两个分离株的μmax。包含在yihP基因和yihO基因之间整合的蔗糖基因簇的菌株显示出比在aldH基因处包含所述簇的菌株更快的在蔗糖上的生长,尤其是在低的蔗糖水平。
实例6
在蔗糖上生长的大肠杆菌菌株的PDO和甘油生产
本实例描述了实例1-4中描述的大肠杆菌菌株当在蔗糖上生长时的PDO和甘油生产。
在摇瓶实验中测定了生产PDO和甘油的摩尔收率。大肠杆菌分离株的新鲜过夜培养物被接种至包含l0g/L蔗糖加上100ng/mL维生素B12和100μg/mL奇放线菌素的12.5mL MOPS培养基中,至初始OD为0.01。细胞在250rpm摇动下于33℃生长44小时。培养物被离心,上清液被添加至0.22μm Spin-X离心管过滤器(Coming Inc.,Coming,NY),并在10,000g离心lmin。使用配备了Aminex HPX-87C HPLC碳水化合物分析柱(Bio-RadLaboratories,Hercules,CA,Cat#125-0095)的Waters Alliance2690HPLC系统(Waters Corp.,Milford,MA),在分离的Waters TCM加热室中加热至85℃,通过HPLC分析了滤液。在分析柱前使用了Bio-Rad carbo-C micro-guard柱(Bio-Rad,Cat#125-0128)。移动目由0.05mM CaO(Sigma,#208159)、0.5mM MES(Sigma,#M3671)、0.05mm HNO3(EMDChemicals,Gibbstown,NJ,Cat#NX0409)组成,pH5.3。流量为0.5mL/min。通常,PDO和甘油的保留时间分别是17.5min和19.3min。蔗糖、葡萄糖和果糖的保留时间分别是10.3min、12.5min和15.9min。
对于野生型基因簇和变体基因簇,包含在yihP基因和yihO基因之间整合的蔗糖基因簇的大肠杆菌(E.coll)菌株均表现出比包含在aldH基因处整合的蔗糖基因簇的菌株略高的生产PDO和甘油的摩尔收率(即,每摩尔蔗糖的PDO和甘油摩尔数),如表4中所示。
表4
重组大肠杆菌(E.coll)菌株的生长速率和生产PDO和甘油的摩尔收
Figure BDA0000464725940000441
Figure BDA0000464725940000451
实例7-10
蔗糖基因簇在野生型大肠杆菌菌株中的整合
这些实例描述了蔗糖基因簇在非生产PDO的野生型大肠杆菌中的整合。在这种大肠杆菌菌株中,在yihP基因和yihO基因之间的整合同样导致了比在aldH基因处的整合更快的在蔗糖中的生长。
如实例1-4中所述在大肠杆菌菌株FM5(
Figure BDA0000464725940000453
No.53911)中进行了野生型或变体蔗糖基因簇在aldH或yihP基因处的整合,不同之处在于大肠杆菌菌株FM5被用作整合的宿主。同样纯化了菌落并消除了pKD46。通过PCR确认了整合位点,并对整合的簇进行了测序,以确保没有意料之外的突变发生。如实例5中所述,使用Bioscreen测定法测定了FM5来源的菌株在蔗糖上的生长速率。结果(即,一式三份测定的平均值和标准偏差)显示在表5中。对于野生型和变体基因簇,具有在yihP基因和yihO基因之间整合的蔗糖基因簇的菌株均表现出比具有在aldH基因处整合的蔗糖基因簇的菌株更高的生长速率。
表5
包含在aldH基因处或在yihP基因和yihO基因之间整合的蔗糖基因簇 的大肠杆菌(E.coli)菌株FM5来源的菌株的生长速率
Figure BDA0000464725940000452
Figure BDA0000464725940000461
Figure IDA0000464725990000011
Figure IDA0000464725990000021
Figure IDA0000464725990000031
Figure IDA0000464725990000041
Figure IDA0000464725990000051
Figure IDA0000464725990000061
Figure IDA0000464725990000071
Figure IDA0000464725990000081
Figure IDA0000464725990000091
Figure IDA0000464725990000101
Figure IDA0000464725990000111
Figure IDA0000464725990000121
Figure IDA0000464725990000131
Figure IDA0000464725990000141
Figure IDA0000464725990000151
Figure IDA0000464725990000161
Figure IDA0000464725990000171
Figure IDA0000464725990000191
Figure IDA0000464725990000211
Figure IDA0000464725990000221
Figure IDA0000464725990000231
Figure IDA0000464725990000241
Figure IDA0000464725990000251
Figure IDA0000464725990000261
Figure IDA0000464725990000271
Figure IDA0000464725990000281
Figure IDA0000464725990000291
Figure IDA0000464725990000301
Figure IDA0000464725990000311
Figure IDA0000464725990000331
Figure IDA0000464725990000341
Figure IDA0000464725990000351
Figure IDA0000464725990000371
Figure IDA0000464725990000381
Figure IDA0000464725990000401
Figure IDA0000464725990000411
Figure IDA0000464725990000421
Figure IDA0000464725990000431
Figure IDA0000464725990000441
Figure IDA0000464725990000451
Figure IDA0000464725990000461
Figure IDA0000464725990000471
Figure IDA0000464725990000481
Figure IDA0000464725990000491
Figure IDA0000464725990000501
Figure IDA0000464725990000521
Figure IDA0000464725990000531
Figure IDA0000464725990000551
Figure IDA0000464725990000561
Figure IDA0000464725990000571
Figure IDA0000464725990000581
Figure IDA0000464725990000601
Figure IDA0000464725990000611
Figure IDA0000464725990000621
Figure IDA0000464725990000631
Figure IDA0000464725990000641
Figure IDA0000464725990000661
Figure IDA0000464725990000671
Figure IDA0000464725990000691
Figure IDA0000464725990000701
Figure IDA0000464725990000711
Figure IDA0000464725990000721
Figure IDA0000464725990000731
Figure IDA0000464725990000741
Figure IDA0000464725990000751
Figure IDA0000464725990000761
Figure IDA0000464725990000781
Figure IDA0000464725990000801
Figure IDA0000464725990000811
Figure IDA0000464725990000821
Figure IDA0000464725990000831
Figure IDA0000464725990000841
Figure IDA0000464725990000851
Figure IDA0000464725990000861
Figure IDA0000464725990000871
Figure IDA0000464725990000881
Figure IDA0000464725990000891
Figure IDA0000464725990000911
Figure IDA0000464725990000921
Figure IDA0000464725990000931
Figure IDA0000464725990000951
Figure IDA0000464725990000961
Figure IDA0000464725990000971
Figure IDA0000464725990000991
Figure IDA0000464725990001001
Figure IDA0000464725990001011
Figure IDA0000464725990001021
Figure IDA0000464725990001031
Figure IDA0000464725990001041
Figure IDA0000464725990001061
Figure IDA0000464725990001071
Figure IDA0000464725990001091
Figure IDA0000464725990001101
Figure IDA0000464725990001111
Figure IDA0000464725990001121
Figure IDA0000464725990001131
Figure IDA0000464725990001141
Figure IDA0000464725990001151
Figure IDA0000464725990001161
Figure IDA0000464725990001171
Figure IDA0000464725990001191
Figure IDA0000464725990001201
Figure IDA0000464725990001211
Figure IDA0000464725990001221
Figure IDA0000464725990001231
Figure IDA0000464725990001241
Figure IDA0000464725990001251
Figure IDA0000464725990001261
Figure IDA0000464725990001271
Figure IDA0000464725990001281
Figure IDA0000464725990001291
Figure IDA0000464725990001301
Figure IDA0000464725990001311
Figure IDA0000464725990001321
Figure IDA0000464725990001331
Figure IDA0000464725990001341
Figure IDA0000464725990001351
Figure IDA0000464725990001361
Figure IDA0000464725990001381
Figure IDA0000464725990001391
Figure IDA0000464725990001411
Figure IDA0000464725990001441
Figure IDA0000464725990001451
Figure IDA0000464725990001461
Figure IDA0000464725990001471
Figure IDA0000464725990001481
Figure IDA0000464725990001491
Figure IDA0000464725990001501
Figure IDA0000464725990001511
Figure IDA0000464725990001521
Figure IDA0000464725990001531
Figure IDA0000464725990001541
Figure IDA0000464725990001551
Figure IDA0000464725990001561

Claims (7)

1.重组细菌,所述重组细菌在其基因组中包含:
(a)一种或多种编码具有蔗糖转运蛋白活性的多肽或多肽复合物的核苷酸序列;
(b)编码具有果糖激酶活性的多肽的核苷酸序列;和
(c)编码具有蔗糖水解酶活性的多肽的核苷酸序列;
其中:
(i)(a)、(b)和(c)各自可操作地连接至相同的或不同的启动子;
(ii)(a)、(b)和(c)在yihP基因或其同源物与yihO基因或其同源物之间被整合到基因组中;并且
(iii)所述细菌以比包含整合在基因组中不同位置处的(a)、(b)和(c)的细菌更高的速率代谢蔗糖。
2.根据权利要求1所述的重组细菌,其中所述具有蔗糖水解酶活性的多肽归类为EC3.2.1.26或EC2.4.1.7。
3.根据权利要求1所述的重组细菌,其中所述具有果糖激酶活性的多肽归类为EC2.7.1.4、EC2.7.1.3或EC2.7.1.1。
4.根据权利要求1所述的重组细菌,其中所述细菌选自下列属:埃希氏菌属(Escherichia)、克雷伯氏菌属(Klebsiella)、柠檬酸杆菌属(Citrobacter)和气杆菌属(Aerobacter)。
5.根据权利要求4所述的重组细菌,其中所述细菌是大肠杆菌(Escherichia coli)。
6.根据权利要求1所述的重组细菌,其中所述细菌产生1,3-丙二醇、甘油和/或3-羟基丙酸。
7.由蔗糖制备甘油、1,3-丙二醇和/或3-羟基丙酸的方法,包括:
a)在蔗糖存在下培养权利要求6的重组细菌;以及
b)回收产生的甘油、1,3-丙二醇和/或3-羟基丙酸。
CN201280039101.9A 2011-08-16 2012-06-25 具有改善蔗糖利用的重组细菌 Pending CN103732735A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/210,550 2011-08-16
US13/210,550 US8673602B2 (en) 2011-08-16 2011-08-16 Recombinant bacteria having improved sucrose utilization
PCT/US2012/044088 WO2013025286A1 (en) 2011-08-16 2012-06-25 Recombinant bacteria having improved sucrose utilization

Publications (1)

Publication Number Publication Date
CN103732735A true CN103732735A (zh) 2014-04-16

Family

ID=47712909

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280039101.9A Pending CN103732735A (zh) 2011-08-16 2012-06-25 具有改善蔗糖利用的重组细菌

Country Status (7)

Country Link
US (1) US8673602B2 (zh)
JP (1) JP2014524255A (zh)
KR (1) KR20140054232A (zh)
CN (1) CN103732735A (zh)
AU (1) AU2012295505A1 (zh)
BR (1) BR112014003486A2 (zh)
WO (1) WO2013025286A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108384796A (zh) * 2018-03-05 2018-08-10 北京化工大学 一种利用蔗糖生物合成d-葡萄糖二酸的方法
CN117074699A (zh) * 2023-10-17 2023-11-17 中国农业大学 一种筛选代谢蔗糖的干酪乳杆菌发酵剂的方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8686114B2 (en) * 2012-03-05 2014-04-01 E I Du Pont De Nemours And Company Variant sucrose transporter polypeptides
US9017961B2 (en) * 2012-03-05 2015-04-28 E.I. Du Pont De Nemours And Company Recombinant bacteria comprising novel sucrose transporters
US20180371509A1 (en) * 2015-12-16 2018-12-27 Kaneka Corporation Pha-producing microorganism having sucrose assimilability, and method for producing pha using said microorganism
WO2022129470A1 (en) * 2020-12-18 2022-06-23 Inbiose N.V. Variant sucrose permease polypeptides

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1300321A (zh) * 1998-05-12 2001-06-20 纳幕尔杜邦公司 用含有维生素b12转运基因的重组生物体生产1,3-丙二醇的方法,
US20030175916A1 (en) * 1999-07-09 2003-09-18 Institut National De Le Recherche Agronomique (Inra) Method for preparing 1,3-propanediol by a recombinant micro-organism in the absence of coenzyme B12 or one of its precursors
WO2011069033A1 (en) * 2009-12-04 2011-06-09 E. I. Du Pont De Nemours And Company Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2212447C2 (ru) 2000-04-26 2003-09-20 Закрытое акционерное общество "Научно-исследовательский институт Аджиномото-Генетика" Штамм escherichia coli - продуцент аминокислоты (варианты) и способ получения аминокислот (варианты)
KR101037354B1 (ko) * 2007-09-07 2011-05-26 한국과학기술원 수크로스로부터 폴리락틱산 또는 폴리락틱산 공중합체를제조할 수 있는 재조합 미생물 및 이러한 미생물을이용하여 수크로스로부터 폴리락틱산 또는 락틱산공중합체를 제조하는 방법
JP2011505869A (ja) 2007-12-18 2011-03-03 コリア アドバンスド インスティチュート オブ サイエンス アンド テクノロジィ スクロース代謝能を有する遺伝子組み換え微生物
ES2429305T3 (es) 2008-11-07 2013-11-14 Metabolic Explorer Utilización de la sacarosa como sustrato para la producción fermentativa de 1,2-propanodiol
US8222000B2 (en) * 2010-12-06 2012-07-17 E I Du Pont De Nemours And Company Recombinant bacteria having the ability to metabolize sucrose
US8129170B1 (en) * 2010-12-06 2012-03-06 E.I. Du Pont De Nemours And Company Recombinant bacteria having the ability to metabolize sucrose

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1300321A (zh) * 1998-05-12 2001-06-20 纳幕尔杜邦公司 用含有维生素b12转运基因的重组生物体生产1,3-丙二醇的方法,
US20030175916A1 (en) * 1999-07-09 2003-09-18 Institut National De Le Recherche Agronomique (Inra) Method for preparing 1,3-propanediol by a recombinant micro-organism in the absence of coenzyme B12 or one of its precursors
WO2011069033A1 (en) * 2009-12-04 2011-06-09 E. I. Du Pont De Nemours And Company Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
D. L. GIBSON等: "Salmonella Produces an O-Antigen Capsule Regulated by AgfD and Important for Environmental Persistence", 《JOURNAL OF BACTERIOLOGY》, vol. 188, no. 22, 30 November 2006 (2006-11-30), pages 7722 - 7730 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108384796A (zh) * 2018-03-05 2018-08-10 北京化工大学 一种利用蔗糖生物合成d-葡萄糖二酸的方法
CN108384796B (zh) * 2018-03-05 2021-11-26 北京化工大学 一种利用蔗糖生物合成d-葡萄糖二酸的方法
CN117074699A (zh) * 2023-10-17 2023-11-17 中国农业大学 一种筛选代谢蔗糖的干酪乳杆菌发酵剂的方法
CN117074699B (zh) * 2023-10-17 2024-01-12 中国农业大学 一种筛选代谢蔗糖的干酪乳杆菌发酵剂的方法

Also Published As

Publication number Publication date
US8673602B2 (en) 2014-03-18
JP2014524255A (ja) 2014-09-22
KR20140054232A (ko) 2014-05-08
WO2013025286A1 (en) 2013-02-21
US20130045519A1 (en) 2013-02-21
AU2012295505A1 (en) 2014-01-23
BR112014003486A2 (pt) 2018-06-19

Similar Documents

Publication Publication Date Title
CN103620026A (zh) 具有代谢蔗糖能力的重组细菌
CN103717611A (zh) 使得在细菌中能够更快地利用蔗糖的变体蔗糖转运蛋白多肽
CN104302661A (zh) 包含新型蔗糖转运蛋白的重组细菌
CN103732735A (zh) 具有改善蔗糖利用的重组细菌
CN103080326A (zh) 用于从蔗糖产生甘油和甘油衍生产物的重组细菌
TWI515293B (zh) 用於生產甘油及甘油衍生產物且具有增強乙醯輔酶a合成酶活性之重組大腸桿菌
US8222000B2 (en) Recombinant bacteria having the ability to metabolize sucrose
CN104245723A (zh) 变体蔗糖转运蛋白多肽
AU2014274643B2 (en) Recombinant bacteria for producing glycerol and glycerol-derived products from sucrose

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140416